[논문리뷰] UI-Level Evaluation of ALLaM 34B: Measuring an Arabic-Centric LLM via HUMAIN ChatOmartificial-Intelligence-Space이 [arXiv]에 게시한 'UI-Level Evaluation of ALLaM 34B: Measuring an Arabic-Centric LLM via HUMAIN Chat' 논문에 대한 자세한 리뷰입니다.2025년 9월 2일
[논문리뷰] T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial TablesYu Zhao이 [arXiv]에 게시한 'T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables' 논문에 대한 자세한 리뷰입니다.2025년 9월 2일
[논문리뷰] PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic ReasoningYuewei Zhang이 [arXiv]에 게시한 'PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic Reasoning' 논문에 대한 자세한 리뷰입니다.2025년 9월 2일
[논문리뷰] No Label Left Behind: A Unified Surface Defect Detection Model for all Supervision RegimesDanijel Skočaj이 [arXiv]에 게시한 'No Label Left Behind: A Unified Surface Defect Detection Model for all Supervision Regimes' 논문에 대한 자세한 리뷰입니다.2025년 9월 2일
[논문리뷰] How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on τ-benchJayanth Srinivasa이 [arXiv]에 게시한 'How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on τ-bench' 논문에 대한 자세한 리뷰입니다.2025년 9월 2일
[논문리뷰] From reactive to cognitive: brain-inspired spatial intelligence for embodied agentsSongming Liu이 [arXiv]에 게시한 'From reactive to cognitive: brain-inspired spatial intelligence for embodied agents' 논문에 대한 자세한 리뷰입니다.2025년 9월 2일
[논문리뷰] UItron: Foundational GUI Agent with Advanced Perception and PlanningYufeng Zhong이 [arXiv]에 게시한 'UItron: Foundational GUI Agent with Advanced Perception and Planning' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-trainingJiyao Deng이 [arXiv]에 게시한 'TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language ModelsYifan Lu이 [arXiv]에 게시한 'Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head SynthesisPengcheng Chen이 [arXiv]에 게시한 'TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce LearningHan Hu이 [arXiv]에 게시한 'R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce Learning' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] Morae: Proactively Pausing UI Agents for User ChoicesAmy Pavel이 [arXiv]에 게시한 'Morae: Proactively Pausing UI Agents for User Choices' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula DiscoveryWenjie Zhou이 [arXiv]에 게시한 'Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula Discovery' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] HERMES: Human-to-Robot Embodied Learning from Multi-Source Motion Data for Mobile Dexterous ManipulationTianhai Liang이 [arXiv]에 게시한 'HERMES: Human-to-Robot Embodied Learning from Multi-Source Motion Data for Mobile Dexterous Manipulation' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot ControlZhaoqing Chen이 [arXiv]에 게시한 'EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] Efficient Code Embeddings from Code Generation ModelsHan Xiao이 [arXiv]에 게시한 'Efficient Code Embeddings from Code Generation Models' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] Droplet3D: Commonsense Priors from Videos Facilitate 3D GenerationQi Jia이 [arXiv]에 게시한 'Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] CLIPSym: Delving into Symmetry Detection with CLIPRaymond A. Yeh이 [arXiv]에 게시한 'CLIPSym: Delving into Symmetry Detection with CLIP' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] A Survey of Scientific Large Language Models: From Data Foundations to Agent FrontiersJiamin Wu이 [arXiv]에 게시한 'A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일
[논문리뷰] AHELM: A Holistic Evaluation of Audio-Language ModelsSiwei Yang이 [arXiv]에 게시한 'AHELM: A Holistic Evaluation of Audio-Language Models' 논문에 대한 자세한 리뷰입니다.2025년 9월 1일