[논문리뷰] LTD-Bench: Evaluating Large Language Models by Letting Them Draw이 [arXiv]에 게시한 'LTD-Bench: Evaluating Large Language Models by Letting Them Draw' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] LiveSecBench: A Dynamic and Culturally-Relevant AI Safety Benchmark for LLMs in Chinese ContextTianxin Zhang이 [arXiv]에 게시한 'LiveSecBench: A Dynamic and Culturally-Relevant AI Safety Benchmark for LLMs in Chinese Context' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] iFlyBot-VLA Technical ReportJiajia wu이 [arXiv]에 게시한 'iFlyBot-VLA Technical Report' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Forget BIT, It is All about TOKEN: Towards Semantic Information Theory for LLMsBo Bai이 [arXiv]에 게시한 'Forget BIT, It is All about TOKEN: Towards Semantic Information Theory for LLMs' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Don't Blind Your VLA: Aligning Visual Representations for OOD GeneralizationAleksandr I. Panov이 [arXiv]에 게시한 'Don't Blind Your VLA: Aligning Visual Representations for OOD Generalization' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Discriminately Treating Motion Components Evolves Joint Depth and Ego-Motion LearningZuyi Xiong이 [arXiv]에 게시한 'Discriminately Treating Motion Components Evolves Joint Depth and Ego-Motion Learning' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] CodeClash: Benchmarking Goal-Oriented Software Engineering이 [arXiv]에 게시한 'CodeClash: Benchmarking Goal-Oriented Software Engineering' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] ChartM^3: A Multi-Stage Code-Driven Pipeline for Constructing Multi-Dimensional and Multi-Step Visual Reasoning Data in Chart ComprehensionHao Wang이 [arXiv]에 게시한 'ChartM^3: A Multi-Stage Code-Driven Pipeline for Constructing Multi-Dimensional and Multi-Step Visual Reasoning Data in Chart Comprehension' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Can Visual Input Be Compressed? A Visual Token Compression Benchmark for Large Multimodal ModelsShijie Dong이 [arXiv]에 게시한 'Can Visual Input Be Compressed? A Visual Token Compression Benchmark for Large Multimodal Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] BRAINS: A Retrieval-Augmented System for Alzheimer's Detection and Monitoring이 [arXiv]에 게시한 'BRAINS: A Retrieval-Augmented System for Alzheimer's Detection and Monitoring' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Brain-IT: Image Reconstruction from fMRI via Brain-Interaction Transformer이 [arXiv]에 게시한 'Brain-IT: Image Reconstruction from fMRI via Brain-Interaction Transformer' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] AyurParam: A State-of-the-Art Bilingual Language Model for Ayurveda이 [arXiv]에 게시한 'AyurParam: A State-of-the-Art Bilingual Language Model for Ayurveda' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] World Simulation with Video Foundation Models for Physical AIJunjie Bai이 [arXiv]에 게시한 'World Simulation with Video Foundation Models for Physical AI' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Vote-in-Context: Turning VLMs into Zero-Shot Rank Fusers이 [arXiv]에 게시한 'Vote-in-Context: Turning VLMs into Zero-Shot Rank Fusers' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] UniREditBench: A Unified Reasoning-based Image Editing Benchmark이 [arXiv]에 게시한 'UniREditBench: A Unified Reasoning-based Image Editing Benchmark' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] UniLumos: Fast and Unified Image and Video Relighting with Physics-Plausible Feedback이 [arXiv]에 게시한 'UniLumos: Fast and Unified Image and Video Relighting with Physics-Plausible Feedback' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Unified Diffusion VLA: Vision-Language-Action Model via Joint Discrete Denoising Diffusion Process이 [arXiv]에 게시한 'Unified Diffusion VLA: Vision-Language-Action Model via Joint Discrete Denoising Diffusion Process' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] UME-R1: Exploring Reasoning-Driven Generative Multimodal EmbeddingsJinsong Su이 [arXiv]에 게시한 'UME-R1: Exploring Reasoning-Driven Generative Multimodal Embeddings' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Trove: A Flexible Toolkit for Dense Retrieval이 [arXiv]에 게시한 'Trove: A Flexible Toolkit for Dense Retrieval' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Towards Universal Video Retrieval: Generalizing Video Embedding via Synthesized Multimodal Pyramid Curriculum이 [arXiv]에 게시한 'Towards Universal Video Retrieval: Generalizing Video Embedding via Synthesized Multimodal Pyramid Curriculum' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일