[논문리뷰] V-Thinker: Interactive Thinking with ImagesPeiqing Yang이 [arXiv]에 게시한 'V-Thinker: Interactive Thinking with Images' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm이 [arXiv]에 게시한 'Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] The Strong Lottery Ticket Hypothesis for Multi-Head Attention MechanismsSusumu Takeuchi이 [arXiv]에 게시한 'The Strong Lottery Ticket Hypothesis for Multi-Head Attention Mechanisms' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding이 [arXiv]에 게시한 'SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Scaling Agent Learning via Experience Synthesis이 [arXiv]에 게시한 'Scaling Agent Learning via Experience Synthesis' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] SAIL-RL: Guiding MLLMs in When and How to Think via Dual-Reward RL Tuning이 [arXiv]에 게시한 'SAIL-RL: Guiding MLLMs in When and How to Think via Dual-Reward RL Tuning' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] RDMA Point-to-Point Communication for LLM Systems이 [arXiv]에 게시한 'RDMA Point-to-Point Communication for LLM Systems' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] NVIDIA Nemotron Nano V2 VL이 [arXiv]에 게시한 'NVIDIA Nemotron Nano V2 VL' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots이 [arXiv]에 게시한 'Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] How to Evaluate Speech Translation with Source-Aware Neural MT MetricsLuisa Bentivogli이 [arXiv]에 게시한 'How to Evaluate Speech Translation with Source-Aware Neural MT Metrics' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] GUI-360: A Comprehensive Dataset and Benchmark for Computer-Using Agents이 [arXiv]에 게시한 'GUI-360: A Comprehensive Dataset and Benchmark for Computer-Using Agents' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] EVTAR: End-to-End Try on with Additional Unpaired Visual Reference이 [arXiv]에 게시한 'EVTAR: End-to-End Try on with Additional Unpaired Visual Reference' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Contamination Detection for VLMs using Multi-Modal Semantic Perturbation이 [arXiv]에 게시한 'Contamination Detection for VLMs using Multi-Modal Semantic Perturbation' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Cambrian-S: Towards Spatial Supersensing in VideoZihao Yang이 [arXiv]에 게시한 'Cambrian-S: Towards Spatial Supersensing in Video' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Benchmark Designers Should 'Train on the Test Set' to Expose Exploitable Non-Visual Shortcuts이 [arXiv]에 게시한 'Benchmark Designers Should 'Train on the Test Set' to Expose Exploitable Non-Visual Shortcuts' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions이 [arXiv]에 게시한 'UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] The Sequential Edge: Inverse-Entropy Voting Beats Parallel Self-Consistency at Matched Compute이 [arXiv]에 게시한 'The Sequential Edge: Inverse-Entropy Voting Beats Parallel Self-Consistency at Matched Compute' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] TabTune: A Unified Library for Inference and Fine-Tuning Tabular Foundation Models이 [arXiv]에 게시한 'TabTune: A Unified Library for Inference and Fine-Tuning Tabular Foundation Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] Orion-MSP: Multi-Scale Sparse Attention for Tabular In-Context Learning이 [arXiv]에 게시한 'Orion-MSP: Multi-Scale Sparse Attention for Tabular In-Context Learning' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일
[논문리뷰] MME-CC: A Challenging Multi-Modal Evaluation Benchmark of Cognitive Capacity이 [arXiv]에 게시한 'MME-CC: A Challenging Multi-Modal Evaluation Benchmark of Cognitive Capacity' 논문에 대한 자세한 리뷰입니다.2025년 11월 9일