Review

[논문리뷰] V-Thinker: Interactive Thinking with Images

Peiqing Yang이 [arXiv]에 게시한 'V-Thinker: Interactive Thinking with Images' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

이 [arXiv]에 게시한 'Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] The Strong Lottery Ticket Hypothesis for Multi-Head Attention Mechanisms

Susumu Takeuchi이 [arXiv]에 게시한 'The Strong Lottery Ticket Hypothesis for Multi-Head Attention Mechanisms' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding

이 [arXiv]에 게시한 'SIMS-V: Simulated Instruction-Tuning for Spatial Video Understanding' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Scaling Agent Learning via Experience Synthesis

이 [arXiv]에 게시한 'Scaling Agent Learning via Experience Synthesis' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] SAIL-RL: Guiding MLLMs in When and How to Think via Dual-Reward RL Tuning

이 [arXiv]에 게시한 'SAIL-RL: Guiding MLLMs in When and How to Think via Dual-Reward RL Tuning' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] RDMA Point-to-Point Communication for LLM Systems

이 [arXiv]에 게시한 'RDMA Point-to-Point Communication for LLM Systems' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] NVIDIA Nemotron Nano V2 VL

이 [arXiv]에 게시한 'NVIDIA Nemotron Nano V2 VL' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots

이 [arXiv]에 게시한 'Learning Vision-Driven Reactive Soccer Skills for Humanoid Robots' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] How to Evaluate Speech Translation with Source-Aware Neural MT Metrics

Luisa Bentivogli이 [arXiv]에 게시한 'How to Evaluate Speech Translation with Source-Aware Neural MT Metrics' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] GUI-360: A Comprehensive Dataset and Benchmark for Computer-Using Agents

이 [arXiv]에 게시한 'GUI-360: A Comprehensive Dataset and Benchmark for Computer-Using Agents' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] EVTAR: End-to-End Try on with Additional Unpaired Visual Reference

이 [arXiv]에 게시한 'EVTAR: End-to-End Try on with Additional Unpaired Visual Reference' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Contamination Detection for VLMs using Multi-Modal Semantic Perturbation

이 [arXiv]에 게시한 'Contamination Detection for VLMs using Multi-Modal Semantic Perturbation' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Cambrian-S: Towards Spatial Supersensing in Video

Zihao Yang이 [arXiv]에 게시한 'Cambrian-S: Towards Spatial Supersensing in Video' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Benchmark Designers Should 'Train on the Test Set' to Expose Exploitable Non-Visual Shortcuts

이 [arXiv]에 게시한 'Benchmark Designers Should 'Train on the Test Set' to Expose Exploitable Non-Visual Shortcuts' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions

이 [arXiv]에 게시한 'UniAVGen: Unified Audio and Video Generation with Asymmetric Cross-Modal Interactions' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] The Sequential Edge: Inverse-Entropy Voting Beats Parallel Self-Consistency at Matched Compute

이 [arXiv]에 게시한 'The Sequential Edge: Inverse-Entropy Voting Beats Parallel Self-Consistency at Matched Compute' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] TabTune: A Unified Library for Inference and Fine-Tuning Tabular Foundation Models

이 [arXiv]에 게시한 'TabTune: A Unified Library for Inference and Fine-Tuning Tabular Foundation Models' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] Orion-MSP: Multi-Scale Sparse Attention for Tabular In-Context Learning

이 [arXiv]에 게시한 'Orion-MSP: Multi-Scale Sparse Attention for Tabular In-Context Learning' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일

[논문리뷰] MME-CC: A Challenging Multi-Modal Evaluation Benchmark of Cognitive Capacity

이 [arXiv]에 게시한 'MME-CC: A Challenging Multi-Modal Evaluation Benchmark of Cognitive Capacity' 논문에 대한 자세한 리뷰입니다.

2025년 11월 9일