[논문리뷰] jina-reranker-v3: Last but Not Late Interaction for Document Reranking
이 [arXiv]에 게시한 ‘jina-reranker-v3: Last but Not Late Interaction for Document Reranking’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘jina-reranker-v3: Last but Not Late Interaction for Document Reranking’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘dParallel: Learnable Parallel Decoding for dLLMs’ 논문에 대한 자세한 리뷰입니다.
Jiarui Wang이 [arXiv]에 게시한 ‘d^2Cache: Accelerating Diffusion-Based LLMs via Dual Adaptive Caching’ 논문에 대한 자세한 리뷰입니다.
Yue Min이 [arXiv]에 게시한 ‘Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Who’s Your Judge? On the Detectability of LLM-Generated Judgments’ 논문에 대한 자세한 리뷰입니다.
Juergen Schmidhuber이 [arXiv]에 게시한 ‘Who invented deep residual learning?’ 논문에 대한 자세한 리뷰입니다.
Hengfan Zhang이 [arXiv]에 게시한 ‘Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications’ 논문에 대한 자세한 리뷰입니다.
Muhammad Huzaifa이 [arXiv]에 게시한 ‘VisualOverload: Probing Visual Understanding of VLMs in Really Dense Scenes’ 논문에 대한 자세한 리뷰입니다.
Jing Shi이 [arXiv]에 게시한 ‘Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Thinking Sparks!: Emergent Attention Heads in Reasoning Models During Post Training’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain’ 논문에 대한 자세한 리뷰입니다.
Yao Shu이 [arXiv]에 게시한 ‘Test-Time Policy Adaptation for Enhanced Multi-Turn Interactions with LLMs’ 논문에 대한 자세한 리뷰입니다.
Anpei Chen이 [arXiv]에 게시한 ‘TTT3R: 3D Reconstruction as Test-Time Training’ 논문에 대한 자세한 리뷰입니다.
Szu-Chi Chen이 [arXiv]에 게시한 ‘TAU: A Benchmark for Cultural Sound Understanding Beyond Semantics’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Stable Cinemetrics : Structured Taxonomy and Evaluation for Professional Video Generation’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Specialization after Generalization: Towards Understanding Test-Time Training in Foundation Models’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Regression Language Models for Code’ 논문에 대한 자세한 리뷰입니다.
Antonio Liotta이 [arXiv]에 게시한 ‘ProfVLM: A Lightweight Video-Language Model for Multi-View Proficiency Estimation’ 논문에 대한 자세한 리뷰입니다.
Penghao Zhu이 [arXiv]에 게시한 ‘Probing the Critical Point (CritPt) of AI Reasoning: a Frontier Physics Research Benchmark’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always!’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘OceanGym: A Benchmark Environment for Underwater Embodied Agents’ 논문에 대한 자세한 리뷰입니다.
Limin Wang이 [arXiv]에 게시한 ‘MotionRAG: Motion Retrieval-Augmented Image-to-Video Generation’ 논문에 대한 자세한 리뷰입니다.
Fabian Waschkowski이 [arXiv]에 게시한 ‘More Thought, Less Accuracy? On the Dual Nature of Reasoning in Vision-Language Models’ 논문에 대한 자세한 리뷰입니다.
Yuzhen Mao이 [arXiv]에 게시한 ‘Mem-α: Learning Memory Construction via Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use’ 논문에 대한 자세한 리뷰입니다.
Zhiming Luo이 [arXiv]에 게시한 ‘MANI-Pure: Magnitude-Adaptive Noise Injection for Adversarial Purification’ 논문에 대한 자세한 리뷰입니다.
Koustuv Sinha이 [arXiv]에 게시한 ‘Learning to See Before Seeing: Demystifying LLM Visual Priors from Language Pre-training’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Learning Human-Perceived Fakeness in AI-Generated Videos via Multimodal LLMs’ 논문에 대한 자세한 리뷰입니다.
Kota Yamaguchi이 [arXiv]에 게시한 ‘LayerD: Decomposing Raster Graphic Designs into Layers’ 논문에 대한 자세한 리뷰입니다.
Nedim Lipka이 [arXiv]에 게시한 ‘Knowledge Homophily in Large Language Models’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘InfoAgent: Advancing Autonomous Information-Seeking Agents’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘IMG: Calibrating Diffusion Models via Implicit Multimodal Guidance’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Humanline: Online Alignment as Perceptual Loss’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents’ 논문에 대한 자세한 리뷰입니다.
Jun Qi이 [arXiv]에 게시한 ‘Estimating Time Series Foundation Model Transferability via In-Context Learning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘EntroPE: Entropy-Guided Dynamic Patch Encoder for Time Series Forecasting’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘DC-VideoGen: Efficient Video Generation with Deep Compression Video Autoencoder’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘DA^2: Depth Anything in Any Direction’ 논문에 대한 자세한 리뷰입니다.
normanpaulsen이 [arXiv]에 게시한 ‘Context Is What You Need: The Maximum Effective Context Window for Real World Limits of LLMs’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘BuildBench: Benchmarking LLM Agents on Compiling Real-World Open-Source Software’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Attention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Models’ 논문에 대한 자세한 리뷰입니다.
Jennifer Ding이 [arXiv]에 게시한 ‘A Cartography of Open Collaboration in Open Source AI: Mapping Practices, Motivations, and Governance in 14 Open Large Language ...
Lewei Lu이 [arXiv]에 게시한 ‘Visual Jigsaw Post-Training Improves MLLMs’ 논문에 대한 자세한 리뷰입니다.
Wei Jia이 [arXiv]에 게시한 ‘StableToken: A Noise-Robust Semantic Speech Tokenizer for Resilient SpeechLLMs’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘SLA: Beyond Sparsity in Diffusion Transformers via Fine-Tunable Sparse-Linear Attention’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.
Yuran Wang이 [arXiv]에 게시한 ‘RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark’ 논문에 대한 자세한 리뷰입니다.
Binxing Jiao이 [arXiv]에 게시한 ‘Random Policy Valuation is Enough for LLM Reasoning with Verifiable Rewards’ 논문에 대한 자세한 리뷰입니다.
Huanyu Zhang이 [arXiv]에 게시한 ‘OpenGPT-4o-Image: A Comprehensive Dataset for Advanced Image Generation and Editing’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Multiplayer Nash Preference Optimization’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘EditScore: Unlocking Online RL for Image Editing via High-Fidelity Reward Modeling’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘EasySteer: A Unified Framework for High-Performance and Extensible LLM Steering’ 논문에 대한 자세한 리뷰입니다.
Guoxian Song이 [arXiv]에 게시한 ‘X-Streamer: Unified Human World Modeling with Audiovisual Interaction’ 논문에 대한 자세한 리뷰입니다.
Raghuveer Rao이 [arXiv]에 게시한 ‘X-CoT: Explainable Text-to-Video Retrieval via LLM-based Chain-of-Thought Reasoning’ 논문에 대한 자세한 리뷰입니다.
Weishi Mi이 [arXiv]에 게시한 ‘WoW: Towards a World omniscient World model Through Embodied Interaction’ 논문에 대한 자세한 리뷰입니다.
Shiming Liu이 [arXiv]에 게시한 ‘Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation’ 논문에 대한 자세한 리뷰입니다.
Zhuofan Zong이 [arXiv]에 게시한 ‘WebGen-Agent: Enhancing Interactive Website Generation with Multi-Level Feedback and Step-Level Reinforcement Learning’ 논문에 대한 자세...
이 [arXiv]에 게시한 ‘VoiceAssistant-Eval: Benchmarking AI Assistants across Listening, Speaking, and Viewing’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Variational Reasoning for Language Models’ 논문에 대한 자세한 리뷰입니다.
Yuchao Gu이 [arXiv]에 게시한 ‘UniVid: Unifying Vision Tasks with Pre-trained Video Generation Models’ 논문에 대한 자세한 리뷰입니다.
Zeyu Qin이 [arXiv]에 게시한 ‘UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Think-on-Graph 3.0: Efficient and Adaptive LLM Reasoning on Heterogeneous Graphs via Multi-Agent Dual-Evolving Context Retrieval’ 논문에 대한 자세한 ...
Anna Vorontsova이 [arXiv]에 게시한 ‘TUN3D: Towards Real-World Scene Understanding from Unposed Images’ 논문에 대한 자세한 리뷰입니다.
Zhiyuan Liu이 [arXiv]에 게시한 ‘StateX: Enhancing RNN Recall via Post-training State Expansion’ 논문에 대한 자세한 리뷰입니다.
Chih-Hai Su이 [arXiv]에 게시한 ‘See, Point, Fly: A Learning-Free VLM Framework for Universal Unmanned Aerial Navigation’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘SPARK: Synergistic Policy And Reward Co-Evolving Framework’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘ReviewScore: Misinformed Peer Review Detection with Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Federico Tombari이 [arXiv]에 게시한 ‘RefAM: Attention Magnets for Zero-Shot Referral Segmentation’ 논문에 대한 자세한 리뷰입니다.
Xi Shen이 [arXiv]에 게시한 ‘Real-Time Object Detection Meets DINOv3’ 논문에 대한 자세한 리뷰입니다.
An Zhang이 [arXiv]에 게시한 ‘Quantile Advantage Estimation for Entropy-Safe Reasoning’ 논문에 대한 자세한 리뷰입니다.
Lingpeng Kong이 [arXiv]에 게시한 ‘PromptCoT 2.0: Scaling Prompt Synthesis for Large Language Model Reasoning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping’ 논문에 대한 자세한 리뷰입니다.
SunYuefeng이 [arXiv]에 게시한 ‘MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing’ 논문에 대한 자세한 리뷰입니다.
Peter Wonka이 [arXiv]에 게시한 ‘Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation’ 논문에 대한 자세한 리뷰입니다.
Weipeng Zhong이 [arXiv]에 게시한 ‘MesaTask: Towards Task-Driven Tabletop Scene Generation via 3D Spatial Reasoning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘LongLive: Real-time Interactive Long Video Generation’ 논문에 대한 자세한 리뷰입니다.
Gang Li이 [arXiv]에 게시한 ‘Learn the Ropes, Then Trust the Wins: Self-imitation with Progressive Exploration for Agentic Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Language Models Can Learn from Verbal Feedback Without Scalar Rewards’ 논문에 대한 자세한 리뷰입니다.
NikolaiSkripko이 [arXiv]에 게시한 ‘Instruction-Following Evaluation in Function Calling for Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Romann M. Weber이 [arXiv]에 게시한 ‘HiGS: History-Guided Sampling for Plug-and-Play Enhancement of Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Linghe Kong이 [arXiv]에 게시한 ‘FlashEdit: Decoupling Speed, Structure, and Semantics for Precise Image Editing’ 논문에 대한 자세한 리뷰입니다.
Du Su이 [arXiv]에 게시한 ‘Fine-tuning Done Right in Model Editing’ 논문에 대한 자세한 리뷰입니다.
Eija Honkavaara이 [arXiv]에 게시한 ‘Finding 3D Positions of Distant Objects from Noisy Camera Movement and Semantic Segmentation Sequences’ 논문에 대한 자세한 리뷰입니다.
Ki-Ung Song이 [arXiv]에 게시한 ‘ERGO: Efficient High-Resolution Visual Understanding for Vision-Language Models’ 논문에 대한 자세한 리뷰입니다.
Li Yu-Jhe이 [arXiv]에 게시한 ‘EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Jinyuan Li이 [arXiv]에 게시한 ‘D-Artemis: A Deliberative Cognitive Framework for Mobile GUI Multi-Agents’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Chasing the Tail: Effective Rubric-based Reward Modeling for Large Language Model Post-Training’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘CapRL: Stimulating Dense Image Caption Capabilities via Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘CHURRO: Making History Readable with an Open-Weight Large Vision-Language Model for High-Accuracy, Low-Cost Historical Text Recognition’ 논문에 ...
John P Dickerson이 [arXiv]에 게시한 ‘When Judgment Becomes Noise: How Design Failures in LLM Judge Benchmarks Silently Undermine Validity’ 논문에 대한 자세한 리뷰입니다.
Yuewei Zhang이 [arXiv]에 게시한 ‘VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Shawn Guo이 [arXiv]에 게시한 ‘V-GameGym: Visual Game Generation for Code Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Yanbin Fu이 [arXiv]에 게시한 ‘Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld’s Episode Theory’ 논문에 대한 자세한 리뷰입니다.
Zhuohao Yu이 [arXiv]에 게시한 ‘TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them’ 논문에 대한 자세한 리뷰입니다.
Xiangxiang Chu이 [arXiv]에 게시한 ‘Tree Search for LLM Agent Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Mert Pilanci이 [arXiv]에 게시한 ‘Thinking While Listening: Simple Test Time Scaling For Audio Classification’ 논문에 대한 자세한 리뷰입니다.
Furu Wei이 [arXiv]에 게시한 ‘Thinking Augmented Pre-training’ 논문에 대한 자세한 리뷰입니다.
Du Chen이 [arXiv]에 게시한 ‘The Unanticipated Asymmetry Between Perceptual Optimization and Assessment’ 논문에 대한 자세한 리뷰입니다.
Javad Lavaei이 [arXiv]에 게시한 ‘StyleBench: Evaluating thinking styles in Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Yunpeng Chen이 [arXiv]에 게시한 ‘Seedream 4.0: Toward Next-generation Multimodal Image Generation’ 논문에 대한 자세한 리뷰입니다.
Jiabei Xiao이 [arXiv]에 게시한 ‘SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines’ 논문에 대한 자세한 리뷰입니다.
Siyuan Huang이 [arXiv]에 게시한 ‘SceneWeaver: All-in-One 3D Scene Synthesis with an Extensible and Self-Reflective Agent’ 논문에 대한 자세한 리뷰입니다.
Yu Li이 [arXiv]에 게시한 ‘ScaleDiff: Scaling Difficult Problems for Advanced Mathematical Reasoning’ 논문에 대한 자세한 리뷰입니다.
Yi-Zhe Song이 [arXiv]에 게시한 ‘SD3.5-Flash: Distribution-Guided Distillation of Generative Flows’ 논문에 대한 자세한 리뷰입니다.
Pieter Abbeel이 [arXiv]에 게시한 ‘Residual Off-Policy RL for Finetuning Behavior Cloning Policies’ 논문에 대한 자세한 리뷰입니다.
Jinjie Gu이 [arXiv]에 게시한 ‘Recon-Act: A Self-Evolving Multi-Agent Browser-Use System via Web Reconnaissance, Tool Generation, and Task Execution’ 논문에 대한 자세한 리뷰...
Yuqi Li이 [arXiv]에 게시한 ‘Quantized Visual Geometry Grounded Transformer’ 논문에 대한 자세한 리뷰입니다.
Junyan Zhang이 [arXiv]에 게시한 ‘MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning’ 논문에 대한 자세한 리뷰입니다.
Jing Wang이 [arXiv]에 게시한 ‘MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources’ 논문에 대한 자세한 리뷰입니다.
Hung-yi Lee이 [arXiv]에 게시한 ‘MI-Fuse: Label Fusion for Unsupervised Domain Adaptation with Closed-Source Large-Audio Language Model’ 논문에 대한 자세한 리뷰입니다.
Xueyang Feng이 [arXiv]에 게시한 ‘Interactive Recommendation Agent with Active User Commands’ 논문에 대한 자세한 리뷰입니다.
Bowen Zhang이 [arXiv]에 게시한 ‘Hunyuan3D-Omni: A Unified Framework for Controllable Generation of 3D Assets’ 논문에 대한 자세한 리뷰입니다.
Chen Zhao이 [arXiv]에 게시한 ‘Does FLUX Already Know How to Perform Physically Plausible Image Composition?’ 논문에 대한 자세한 리뷰입니다.
Hang Zhao이 [arXiv]에 게시한 ‘Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving’ 논문에 대한 자세한 리뷰입니다.
Yushi Bai이 [arXiv]에 게시한 ‘CHARM: Control-point-based 3D Anime Hairstyle Auto-Regressive Modeling’ 논문에 대한 자세한 리뷰입니다.
Wenping Hu이 [arXiv]에 게시한 ‘CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Roman Zhukov이 [arXiv]에 게시한 ‘Blueprints of Trust: AI System Cards for End to End Transparency and Governance’ 논문에 대한 자세한 리뷰입니다.
Yeyun Gong이 [arXiv]에 게시한 ‘Behind RoPE: How Does Causal Mask Encode Positional Information?’ 논문에 대한 자세한 리뷰입니다.
Dongha Lee이 [arXiv]에 게시한 ‘BESPOKE: Benchmark for Search-Augmented Large Language Model Personalization via Diagnostic Feedback’ 논문에 대한 자세한 리뷰입니다.
Denis Kuznetsov이 [arXiv]에 게시한 ‘AutoIntent: AutoML for Text Classification’ 논문에 대한 자세한 리뷰입니다.
rgeirhos이 [arXiv]에 게시한 ‘Video models are zero-shot learners and reasoners’ 논문에 대한 자세한 리뷰입니다.
Yuhang Cao이 [arXiv]에 게시한 ‘SIM-CoT: Supervised Implicit Chain-of-Thought’ 논문에 대한 자세한 리뷰입니다.
Yiming Huang이 [arXiv]에 게시한 ‘PhysCtrl: Generative Physics for Controllable and Physics-Grounded Video Generation’ 논문에 대한 자세한 리뷰입니다.
Hajimu Iida이 [arXiv]에 게시한 ‘On the Use of Agentic Coding: An Empirical Study of Pull Requests on GitHub’ 논문에 대한 자세한 리뷰입니다.
Fan Yang이 [arXiv]에 게시한 ‘Logics-Parsing Technical Report’ 논문에 대한 자세한 리뷰입니다.
Zhe Lin이 [arXiv]에 게시한 ‘Lavida-O: Elastic Large Masked Diffusion Models for Unified Multimodal Understanding and Generation’ 논문에 대한 자세한 리뷰입니다.
Yanfang이 [arXiv]에 게시한 ‘LLMs4All: A Review on Large Language Models for Research and Applications in Academic Disciplines’ 논문에 대한 자세한 리뷰입니다.
Marksherwood이 [arXiv]에 게시한 ‘EmbeddingGemma: Powerful and Lightweight Text Representations’ 논문에 대한 자세한 리뷰입니다.
Tianyu Wang이 [arXiv]에 게시한 ‘EditVerse: Unifying Image and Video Editing and Generation with In-Context Learning’ 논문에 대한 자세한 리뷰입니다.
Avihu이 [arXiv]에 게시한 ‘Advancing Speech Understanding in Speech-Aware Language Models with GRPO’ 논문에 대한 자세한 리뷰입니다.
Genady Beryozkin이 [arXiv]에 게시한 ‘Zero-Shot Multi-Spectral Learning: Reimagining a Generalist Multimodal Gemini 2.5 Model for Remote Sensing Applications’ 논문에 ...
Anthony Hartshorn이 [arXiv]에 게시한 ‘What Characterizes Effective Reasoning? Revisiting Length, Review, and Structure of CoT’ 논문에 대한 자세한 리뷰입니다.
Haoxiao Wang이 [arXiv]에 게시한 ‘VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction’ 논문에 대한 자세한 리뷰입니다.
So Fukuda이 [arXiv]에 게시한 ‘VIR-Bench: Evaluating Geospatial and Temporal Understanding of MLLMs via Travel Video Itinerary Reconstruction’ 논문에 대한 자세한 리뷰입니다.
Evander Yang이 [arXiv]에 게시한 ‘Reinforcement Learning on Pre-Training Data’ 논문에 대한 자세한 리뷰입니다.
Viktor Petrenko이 [arXiv]에 게시한 ‘OpenGVL - Benchmarking Visual Temporal Progress for Data Curation’ 논문에 대한 자세한 리뷰입니다.
Wenshuo Ma이 [arXiv]에 게시한 ‘MiniCPM-V 4.5: Cooking Efficient MLLMs via Architecture, Data, and Training Recipe’ 논문에 대한 자세한 리뷰입니다.
Xuankun Rong이 [arXiv]에 게시한 ‘MAPO: Mixed Advantage Policy Optimization’ 논문에 대한 자세한 리뷰입니다.
Yifeng Jiang이 [arXiv]에 게시한 ‘Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation’ 논문에 대한 자세한 리뷰입니다.
Katharina von der Wense이 [arXiv]에 게시한 ‘Large Language Models Discriminate Against Speakers of German Dialects’ 논문에 대한 자세한 리뷰입니다.
Jianbin Zheng이 [arXiv]에 게시한 ‘Hyper-Bagel: A Unified Acceleration Framework for Multimodal Understanding and Generation’ 논문에 대한 자세한 리뷰입니다.
Dan Xu이 [arXiv]에 게시한 ‘HyRF: Hybrid Radiance Fields for Memory-efficient and High-quality Novel View Synthesis’ 논문에 대한 자세한 리뷰입니다.
Jin Zheng이 [arXiv]에 게시한 ‘GeoSVR: Taming Sparse Voxels for Geometrically Accurate Surface Reconstruction’ 논문에 대한 자세한 리뷰입니다.
Yushen Liang이 [arXiv]에 게시한 ‘Do You Need Proprioceptive States in Visuomotor Policies?’ 논문에 대한 자세한 리뷰입니다.
Rui Qian이 [arXiv]에 게시한 ‘CAR-Flow: Condition-Aware Reparameterization Aligns Source and Target for Better Flow Matching’ 논문에 대한 자세한 리뷰입니다.
Zeina Aldallal이 [arXiv]에 게시한 ‘Baseer: A Vision-Language Model for Arabic Document-to-Markdown OCR’ 논문에 대한 자세한 리뷰입니다.
Anand Mishra이 [arXiv]에 게시한 ‘When Big Models Train Small Ones: Label-Free Model Parity Alignment for Efficient Visual Question Answering using Small VLMs’ 논문에...
Sunghyun Cho이 [arXiv]에 게시한 ‘VideoFrom3D: 3D Scene Video Generation via Complementary Image and Video Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Shiya Huang이 [arXiv]에 게시한 ‘VaseVQA: Multimodal Agent and Benchmark for Ancient Greek Pottery’ 논문에 대한 자세한 리뷰입니다.
Yonghui Yang이 [arXiv]에 게시한 ‘Understanding Embedding Scaling in Collaborative Filtering’ 논문에 대한 자세한 리뷰입니다.
Fatma Betül Terzioğlu이 [arXiv]에 게시한 ‘Turk-LettuceDetect: A Hallucination Detection Models for Turkish RAG Applications’ 논문에 대한 자세한 리뷰입니다.
Shaohui Jiao이 [arXiv]에 게시한 ‘TempSamp-R1: Effective Temporal Sampling with Reinforcement Fine-Tuning for Video LLMs’ 논문에 대한 자세한 리뷰입니다.
Emmanuel Candès이 [arXiv]에 게시한 ‘Synthetic bootstrapped pretraining’ 논문에 대한 자세한 리뷰입니다.
Yannis Yiming He이 [arXiv]에 게시한 ‘SWE-Bench Pro: Can AI Agents Solve Long-Horizon Software Engineering Tasks?’ 논문에 대한 자세한 리뷰입니다.
Zhaopeng Tu이 [arXiv]에 게시한 ‘SCAN: Self-Denoising Monte Carlo Annotation for Robust Process Reward Learning’ 논문에 대한 자세한 리뷰입니다.
Damien Sileo이 [arXiv]에 게시한 ‘Reasoning Core: A Scalable RL Environment for LLM Symbolic Reasoning’ 논문에 대한 자세한 리뷰입니다.
Lhma-aslp이 [arXiv]에 게시한 ‘Qwen3-Omni Technical Report’ 논문에 대한 자세한 리뷰입니다.
Jae-Joon Kim이 [arXiv]에 게시한 ‘QWHA: Quantization-Aware Walsh-Hadamard Adaptation for Parameter-Efficient Fine-Tuning on Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Pengze Zhang이 [arXiv]에 게시한 ‘OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models’ 논문에 대한 자세한 리뷰입니다.
Xintao Chen이 [arXiv]에 게시한 ‘MetaEmbed: Scaling Multimodal Retrieval at Test-Time with Flexible Late Interaction’ 논문에 대한 자세한 리뷰입니다.
Minghui Wu이 [arXiv]에 게시한 ‘Mano Report’ 논문에 대한 자세한 리뷰입니다.
happyZYM이 [arXiv]에 게시한 ‘LIMI: Less is More for Agency’ 논문에 대한 자세한 리뷰입니다.
Hou Pong Chan이 [arXiv]에 게시한 ‘GeoPQA: Bridging the Visual Perception Gap in MLLMs for Geometric Reasoning’ 논문에 대한 자세한 리뷰입니다.
Bin Cui이 [arXiv]에 게시한 ‘From Uniform to Heterogeneous: Tailoring Policy Optimization to Every Token’s Nature’ 논문에 대한 자세한 리뷰입니다.
Ahmed E. Hassan이 [arXiv]에 게시한 ‘From Hugging Face to GitHub: Tracing License Drift in the Open-Source AI Ecosystem’ 논문에 대한 자세한 리뷰입니다.
tengdai722이 [arXiv]에 게시한 ‘FlagEval Findings Report: A Preliminary Evaluation of Large Reasoning Models on Automatically Verifiable Textual and Visual Questio...
Minsik Cho이 [arXiv]에 게시한 ‘EpiCache: Episodic KV Cache Management for Long Conversational Question Answering’ 논문에 대한 자세한 리뷰입니다.
Qinsheng Zhang이 [arXiv]에 게시한 ‘DiffusionNFT: Online Diffusion Reinforcement with Forward Process’ 논문에 대한 자세한 리뷰입니다.
Maunendra Sankar Desarkar이 [arXiv]에 게시한 ‘DIWALI - Diversity and Inclusivity aWare cuLture specific Items for India: Dataset and Assessment of LLMs for Cultur...
Luisa Bentivogli이 [arXiv]에 게시한 ‘Cross-Attention is Half Explanation in Speech-to-Text Models’ 논문에 대한 자세한 리뷰입니다.
Yue Ma이 [arXiv]에 게시한 ‘ContextFlow: Training-Free Video Object Editing via Adaptive Context Enrichment’ 논문에 대한 자세한 리뷰입니다.
Hang Yu이 [arXiv]에 게시한 ‘CodeFuse-CR-Bench: A Comprehensiveness-aware Benchmark for End-to-End Code Review Evaluation in Python Projects’ 논문에 대한 자세한 리뷰입니다.
Jiafeng Xu이 [arXiv]에 게시한 ‘ByteWrist: A Parallel Robotic Wrist Enabling Flexible and Anthropomorphic Motion for Confined Spaces’ 논문에 대한 자세한 리뷰입니다.
Jaeho Lee이 [arXiv]에 게시한 ‘AuditoryBench++: Can Language Models Understand Auditory Knowledge without Hearing?’ 논문에 대한 자세한 리뷰입니다.
Qi Zhang이 [arXiv]에 게시한 ‘Analyzing the Effects of Supervised Fine-Tuning on Model Knowledge from Token and Parameter Levels’ 논문에 대한 자세한 리뷰입니다.
Matteo Bettini이 [arXiv]에 게시한 ‘ARE: Scaling Up Agent Environments and Evaluations’ 논문에 대한 자세한 리뷰입니다.
Karun Kumar이 [arXiv]에 게시한 ‘WhisTLE: Deeply Supervised, Text-Only Domain Adaptation for Pretrained Speech Recognition Transformers’ 논문에 대한 자세한 리뷰입니다.
Chao Zhang이 [arXiv]에 게시한 ‘Video2Roleplay: A Multimodal Dataset and Framework for Video-Guided Role-playing Agents’ 논문에 대한 자세한 리뷰입니다.
Yongsen Mao이 [arXiv]에 게시한 ‘SPATIALGEN: Layout-guided 3D Indoor Scene Generation’ 논문에 대한 자세한 리뷰입니다.
Steven Liu이 [arXiv]에 게시한 ‘RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation’ 논문에 대한 자세한 리뷰입니다.
Narendra Ahuja이 [arXiv]에 게시한 ‘RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes’ 논문에 대한 자세한 리뷰입니다.
jialingt이 [arXiv]에 게시한 ‘MANZANO: A Simple and Scalable Unified Multimodal Model with a Hybrid Vision Tokenizer’ 논문에 대한 자세한 리뷰입니다.
Linjie Luo이 [arXiv]에 게시한 ‘Lynx: Towards High-Fidelity Personalized Video Generation’ 논문에 대한 자세한 리뷰입니다.
Wenyu Wang이 [arXiv]에 게시한 ‘Latent Zoning Network: A Unified Principle for Generative Modeling, Representation Learning, and Classification’ 논문에 대한 자세한 리뷰입니다.
Hung-yi Lee이 [arXiv]에 게시한 ‘Do You Hear What I Mean? Quantifying the Instruction-Perception Gap in Instruction-Guided Expressive Text-To-Speech Systems’ 논문에 대...
jianfeipan이 [arXiv]에 게시한 ‘BaseReward: A Strong Baseline for Multimodal Reward Model’ 논문에 대한 자세한 리뷰입니다.
Jiahui Yang이 [arXiv]에 게시한 ‘BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent’ 논문에 대한 자세한 리뷰입니다.
Hui Zhang이 [arXiv]에 게시한 ‘Ask-to-Clarify: Resolving Instruction Ambiguity through Multi-turn Dialogue’ 논문에 대한 자세한 리뷰입니다.
Jiangmiao이 [arXiv]에 게시한 ‘A Vision-Language-Action-Critic Model for Robotic Real-World Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Ruibo Li이 [arXiv]에 게시한 ‘WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance’ 논문에 대한 자세한 리뷰입니다.
Rynson W. H. Lau이 [arXiv]에 게시한 ‘Unleashing the Potential of Multimodal LLMs for Zero-Shot Spatio-Temporal Video Grounding’ 논문에 대한 자세한 리뷰입니다.
Xihui Liu이 [arXiv]에 게시한 ‘Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation’ 논문에 대한 자세한 리뷰입니다.
Zehao Li이 [arXiv]에 게시한 ‘ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data’ 논문에 대한 자세한 리뷰입니다.
SpaceProduct이 [arXiv]에 게시한 ‘RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation’ 논문에 대한 자세한 리뷰입니다.
Mingyuan Wu이 [arXiv]에 게시한 ‘RecoWorld: Building Simulated Environments for Agentic Recommender Systems’ 논문에 대한 자세한 리뷰입니다.
Zhilin Wang이 [arXiv]에 게시한 ‘Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration’ 논문에 대한 자세한 리뷰입니다.
Xijun Gu이 [arXiv]에 게시한 ‘MultiEdit: Advancing Instruction-based Image Editing on Diverse and Challenging Tasks’ 논문에 대한 자세한 리뷰입니다.
Katharina von der Wense이 [arXiv]에 게시한 ‘Mind the Gap: A Closer Look at Tokenization for Multiple-Choice Question Answering with LLMs’ 논문에 대한 자세한 리뷰입니다.
Hengli Li이 [arXiv]에 게시한 ‘FlowRL: Matching Reward Distributions for LLM Reasoning’ 논문에 대한 자세한 리뷰입니다.
Jiashuo Liu이 [arXiv]에 게시한 ‘FinSearchComp: Towards a Realistic, Expert-Level Evaluation of Financial Search and Reasoning’ 논문에 대한 자세한 리뷰입니다.
Zhewei Zhang이 [arXiv]에 게시한 ‘FSG-Net: Frequency-Spatial Synergistic Gated Network for High-Resolution Remote Sensing Change Detection’ 논문에 대한 자세한 리뷰입니다.
Kishan Panaganti이 [arXiv]에 게시한 ‘Evolving Language Models without Labels: Majority Drives Selection, Novelty Promotes Variation’ 논문에 대한 자세한 리뷰입니다.
Qinghua Huang이 [arXiv]에 게시한 ‘EchoVLM: Dynamic Mixture-of-Experts Vision-Language Model for Universal Ultrasound Intelligence’ 논문에 대한 자세한 리뷰입니다.
Mingze Xu이 [arXiv]에 게시한 ‘AToken: A Unified Tokenizer for Vision’ 논문에 대한 자세한 리뷰입니다.
Mingyang Huang이 [arXiv]에 게시한 ‘Wan-Animate: Unified Character Animation and Replacement with Holistic Replication’ 논문에 대한 자세한 리뷰입니다.
Yicheng Pan이 [arXiv]에 게시한 ‘THOR: Tool-Integrated Hierarchical Optimization via RL for Mathematical Reasoning’ 논문에 대한 자세한 리뷰입니다.
Zhun Wang이 [arXiv]에 게시한 ‘SteeringControl: Holistic Evaluation of Alignment Steering in LLMs’ 논문에 대한 자세한 리뷰입니다.
Zhou Yang이 [arXiv]에 게시한 ‘Scrub It Out! Erasing Sensitive Memorization in Code Language Models via Machine Unlearning’ 논문에 대한 자세한 리뷰입니다.
Zijian Kang이 [arXiv]에 게시한 ‘SAIL-VL2 Technical Report’ 논문에 대한 자세한 리뷰입니다.
Zihao Dongfang이 [arXiv]에 게시한 ‘PANORAMA: The Rise of Omnidirectional Vision in the Embodied AI Era’ 논문에 대한 자세한 리뷰입니다.
Bowen Zhou이 [arXiv]에 게시한 ‘MARS2 2025 Challenge on Multimodal Reasoning: Datasets, Methods, Results, Discussion, and Outlook’ 논문에 대한 자세한 리뷰입니다.
Xiangru Tang이 [arXiv]에 게시한 ‘Improving Context Fidelity via Native Retrieval-Augmented Reasoning’ 논문에 대한 자세한 리뷰입니다.
Bernard Ghanem이 [arXiv]에 게시한 ‘Hala Technical Report: Building Arabic-Centric Instruction & Translation Models at Scale’ 논문에 대한 자세한 리뷰입니다.
Yu Qiao이 [arXiv]에 게시한 ‘GenExam: A Multidisciplinary Text-to-Image Exam’ 논문에 대한 자세한 리뷰입니다.
Houquan Zhou이 [arXiv]에 게시한 ‘WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research’ 논문에 대한 자세한 리뷰입니다.
Huifeng Yin이 [arXiv]에 게시한 ‘WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Wenbiao Yin이 [arXiv]에 게시한 ‘WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents’ 논문에 대한 자세한 리뷰입니다.
Guangyu Li이 [arXiv]에 게시한 ‘Towards General Agentic Intelligence via Environment Scaling’ 논문에 대한 자세한 리뷰입니다.
Zihan Ding이 [arXiv]에 게시한 ‘Single-stream Policy Optimization’ 논문에 대한 자세한 리뷰입니다.
Guangyu Li이 [arXiv]에 게시한 ‘Scaling Agents via Continual Pre-training’ 논문에 대한 자세한 리뷰입니다.
Litu Ou이 [arXiv]에 게시한 ‘ReSum: Unlocking Long-Horizon Search Intelligence via Context Summarization’ 논문에 대한 자세한 리뷰입니다.
Luca Benini이 [arXiv]에 게시한 ‘Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs’ 논문에 대한 자세한 리뷰입니다.
Bo Liu이 [arXiv]에 게시한 ‘Multiple Instance Learning Framework with Masked Hard Instance Mining for Gigapixel Histopathology Image Analysis’ 논문에 대한 자세한 리뷰입니다.
Wentao Zhang이 [arXiv]에 게시한 ‘Multimodal Reasoning for Science: Technical Report and 1st Place Solution to the ICML 2025 SeePhys Challenge’ 논문에 대한 자세한 리뷰입니다.
Lixin Xu이 [arXiv]에 게시한 ‘Hunyuan3D Studio: End-to-End AI Pipeline for Game-Ready 3D Asset Generation’ 논문에 대한 자세한 리뷰입니다.
Yifan Zhang이 [arXiv]에 게시한 ‘Exact Coset Sampling for Quantum Lattice Algorithms’ 논문에 대한 자세한 리뷰입니다.
Shansan Gong이 [arXiv]에 게시한 ‘EconProver: Towards More Economical Test-Time Scaling for Automated Theorem Proving’ 논문에 대한 자세한 리뷰입니다.
Xiaolong Li이 [arXiv]에 게시한 ‘3D Aware Region Prompted Vision Language Model’ 논문에 대한 자세한 리뷰입니다.
Yongliang Shen이 [arXiv]에 게시한 ‘UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Heshaam Faili이 [arXiv]에 게시한 ‘SearchInstruct: Enhancing Domain Adaptation via Retrieval-Based Instruction Dataset Creation’ 논문에 대한 자세한 리뷰입니다.
Zhenhao Chen이 [arXiv]에 게시한 ‘PersonaX: Multimodal Datasets with LLM-Inferred Behavior Traits’ 논문에 대한 자세한 리뷰입니다.
Yang Zhou이 [arXiv]에 게시한 ‘OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling’ 논문에 대한 자세한 리뷰입니다.
Kaiyang Zhou이 [arXiv]에 게시한 ‘Measuring Epistemic Humility in Multimodal Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Ivan Vulić이 [arXiv]에 게시한 ‘Lost in Embeddings: Information Loss in Vision-Language Models’ 논문에 대한 자세한 리뷰입니다.
Shuo Ren이 [arXiv]에 게시한 ‘Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models’ 논문에 대한 자세한 리뷰입니다.
Vincent Sitzmann이 [arXiv]에 게시한 ‘Locality in Image Diffusion Models Emerges from Data Statistics’ 논문에 대한 자세한 리뷰입니다.
Changlong Yu이 [arXiv]에 게시한 ‘Learning to Optimize Multi-Objective Alignment Through Dynamic Reward Weighting’ 논문에 대한 자세한 리뷰입니다.
Lionel M. Ni이 [arXiv]에 게시한 ‘LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence’ 논문에 대한 자세한 리뷰입니다.
Wenzhe Cai이 [arXiv]에 게시한 ‘InternScenes: A Large-scale Simulatable Indoor Scene Dataset with Realistic Layouts’ 논문에 대한 자세한 리뷰입니다.
Yixuan Tang이 [arXiv]에 게시한 ‘GAPrune: Gradient-Alignment Pruning for Domain-Aware Embeddings’ 논문에 대한 자세한 리뷰입니다.
UVSKKR이 [arXiv]에 게시한 ‘EthicsMH: A Pilot Benchmark for Ethical Reasoning in Mental Health AI’ 논문에 대한 자세한 리뷰입니다.
Li Zheng이 [arXiv]에 게시한 ‘Dr.V: A Hierarchical Perception-Temporal-Cognition Framework to Diagnose Video Hallucination by Fine-grained Spatial-Temporal Groundi...
Subasish Das이 [arXiv]에 게시한 ‘CognitiveSky: Scalable Sentiment and Narrative Analysis for Decentralized Social Media’ 논문에 대한 자세한 리뷰입니다.
Yunhan Yang이 [arXiv]에 게시한 ‘X-Part: high fidelity and structure coherent shape decomposition’ 논문에 대한 자세한 리뷰입니다.
William A. Cunningham이 [arXiv]에 게시한 ‘Virtual Agent Economies’ 논문에 대한 자세한 리뷰입니다.
Dong Zhang이 [arXiv]에 게시한 ‘VStyle: A Benchmark for Voice Style Adaptation with Spoken Instructions’ 논문에 대한 자세한 리뷰입니다.
Jonas Geiping이 [arXiv]에 게시한 ‘The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs’ 논문에 대한 자세한 리뷰입니다.
Chenyu You이 [arXiv]에 게시한 ‘QuantAgent: Price-Driven Multi-Agent LLMs for High-Frequency Trading’ 논문에 대한 자세한 리뷰입니다.
Xiaorui Wang이 [arXiv]에 게시한 ‘MCP-AgentBench: Evaluating Real-World Language Agent Performance with MCP-Mediated Tools’ 논문에 대한 자세한 리뷰입니다.
Bing Su이 [arXiv]에 게시한 ‘LoFT: Parameter-Efficient Fine-Tuning for Long-tailed Semi-Supervised Learning in Open-World Scenarios’ 논문에 대한 자세한 리뷰입니다.
Gabriele Pergola이 [arXiv]에 게시한 ‘IntrEx: A Dataset for Modeling Engagement in Educational Conversations’ 논문에 대한 자세한 리뷰입니다.
Chenyu Wang이 [arXiv]에 게시한 ‘Inpainting-Guided Policy Optimization for Diffusion Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Song Guo이 [arXiv]에 게시한 ‘InfGen: A Resolution-Agnostic Paradigm for Scalable Image Synthesis’ 논문에 대한 자세한 리뷰입니다.
Zhehao Tan이 [arXiv]에 게시한 ‘HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Multi-hop Question Answering’ 논문에 대한 자세한 리뷰입니다.
Fabian Otto이 [arXiv]에 게시한 ‘FLOWER: Democratizing Generalist Robot Policies with Efficient Vision-Language-Action Flow Policies’ 논문에 대한 자세한 리뷰입니다.
XU Han이 [arXiv]에 게시한 ‘CMHG: A Dataset and Benchmark for Headline Generation of Minority Languages in China’ 논문에 대한 자세한 리뷰입니다.
Ethan Chern이 [arXiv]에 게시한 ‘Visual Programmability: A Guide for Code-as-Thought in Chart Understanding’ 논문에 대한 자세한 리뷰입니다.
Zirui Ge이 [arXiv]에 게시한 ‘VLA-Adapter: An Effective Paradigm for Tiny-Scale Vision-Language-Action Model’ 논문에 대한 자세한 리뷰입니다.
Xiaoyu Tan이 [arXiv]에 게시한 ‘The Choice of Divergence: A Neglected Key to Mitigating Diversity Collapse in Reinforcement Learning with Verifiable Reward’ 논문에 대한...
Jian Gao이 [arXiv]에 게시한 ‘SpatialVID: A Large-Scale Video Dataset with Spatial Annotations’ 논문에 대한 자세한 리뷰입니다.
Zhaohui Yang이 [arXiv]에 게시한 ‘SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Jamie Hayes이 [arXiv]에 게시한 ‘Reasoning Introduces New Poisoning Attacks Yet Makes Them More Complicated’ 논문에 대한 자세한 리뷰입니다.
Yuzheng Zhuang이 [arXiv]에 게시한 ‘OmniEVA: Embodied Versatile Planner via Task-Adaptive 3D-Grounded and Embodiment-aware Reasoning’ 논문에 대한 자세한 리뷰입니다.
Dong-Ho Lee이 [arXiv]에 게시한 ‘Modality Alignment with Multi-scale Bilateral Attention for Multimodal Recommendation’ 논문에 대한 자세한 리뷰입니다.
Jianguo Zhang이 [arXiv]에 게시한 ‘LoCoBench: A Benchmark for Long-Context Large Language Models in Complex Software Engineering’ 논문에 대한 자세한 리뷰입니다.
Wentao Hu이 [arXiv]에 게시한 ‘Kling-Avatar: Grounding Multimodal Instructions for Cascaded Long-Duration Avatar Animation Synthesis’ 논문에 대한 자세한 리뷰입니다.
Zhuowei Chen이 [arXiv]에 게시한 ‘HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning’ 논문에 대한 자세한 리뷰입니다.
Xintao Wang이 [arXiv]에 게시한 ‘Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents’ 논문에 대한 자세한 리뷰입니다.
Kaicheng Yang이 [arXiv]에 게시한 ‘Gradient-Attention Guided Dual-Masking Synergetic Framework for Robust Text-based Person Retrieval’ 논문에 대한 자세한 리뷰입니다.
Shuai Bai이 [arXiv]에 게시한 ‘FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark’ 논문에 대한 자세한 리뷰입니다.
Kaiqi Kou이 [arXiv]에 게시한 ‘EchoX: Towards Mitigating Acoustic-Semantic Gap via Echo Training for Speech-to-Speech LLMs’ 논문에 대한 자세한 리뷰입니다.
Hui Han이 [arXiv]에 게시한 ‘Can Understanding and Generation Truly Benefit Together – or Just Coexist?’ 논문에 대한 자세한 리뷰입니다.
Guangming Lu이 [arXiv]에 게시한 ‘2D Gaussian Splatting with Semantic Alignment for Image Inpainting’ 논문에 대한 자세한 리뷰입니다.
Alexander Panchenko이 [arXiv]에 게시한 ‘ So let's replace this phrase with insult... Lessons learned from generation of toxic texts with LLMs’ 논문에 대한 자세한 리뷰입니다.
Liang Li이 [arXiv]에 게시한 ‘RewardDance: Reward Scaling in Visual Generation’ 논문에 대한 자세한 리뷰입니다.
Yunhan Yang이 [arXiv]에 게시한 ‘P3-SAM: Native 3D Part Segmentation’ 논문에 대한 자세한 리뷰입니다.
Yang Du이 [arXiv]에 게시한 ‘Hunyuan-MT Technical Report’ 논문에 대한 자세한 리뷰입니다.
Jacy Reese Anthis이 [arXiv]에 게시한 ‘HumanAgencyBench: Scalable Evaluation of Human Agency Support in AI Assistants’ 논문에 대한 자세한 리뷰입니다.
Wenzheng Tom Tang이 [arXiv]에 게시한 ‘EnvX: Agentize Everything with Agentic AI’ 논문에 대한 자세한 리뷰입니다.
Honglin Guo이 [arXiv]에 게시한 ‘AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Runze Liu이 [arXiv]에 게시한 ‘A Survey of Reinforcement Learning for Large Reasoning Models’ 논문에 대한 자세한 리뷰입니다.
Ao Liang이 [arXiv]에 게시한 ‘3D and 4D World Modeling: A Survey’ 논문에 대한 자세한 리뷰입니다.
Lili Qiu이 [arXiv]에 게시한 ‘ΔL Normalization: Rethink Loss Aggregation in RLVR’ 논문에 대한 자세한 리뷰입니다.
Heeseong Shin이 [arXiv]에 게시한 ‘Visual Representation Alignment for Multimodal Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Fei Ding이 [arXiv]에 게시한 ‘UMO: Scaling Multi-Identity Consistency for Image Customization via Matching Reward’ 논문에 대한 자세한 리뷰입니다.
Yongcheng Zeng이 [arXiv]에 게시한 ‘Staying in the Sweet Spot: Responsive Reasoning Evolution via Capability-Adaptive Hint Scaffolding’ 논문에 대한 자세한 리뷰입니다.
Dipanjan Das이 [arXiv]에 게시한 ‘SimpleQA Verified: A Reliable Factuality Benchmark to Measure Parametric Knowledge’ 논문에 대한 자세한 리뷰입니다.
XuDong Wang이 [arXiv]에 게시한 ‘Reconstruction Alignment Improves Unified Multimodal Models’ 논문에 대한 자세한 리뷰입니다.
Diana Marculescu이 [arXiv]에 게시한 ‘Q-Sched: Pushing the Boundaries of Few-Step Diffusion Models with Quantization-Aware Scheduling’ 논문에 대한 자세한 리뷰입니다.
Xinyu Yang이 [arXiv]에 게시한 ‘Parallel-R1: Towards Parallel Thinking via Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Tianjian Li이 [arXiv]에 게시한 ‘Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search’ 논문에 대한 자세한 리뷰입니다.
Vijai Mohan이 [arXiv]에 게시한 ‘Language Self-Play For Data-Free Training’ 논문에 대한 자세한 리뷰입니다.
Zherui Qiu이 [arXiv]에 게시한 ‘F1: A Vision-Language-Action Model Bridging Understanding and Generation to Actions’ 논문에 대한 자세한 리뷰입니다.
Yingfang Zhang이 [arXiv]에 게시한 ‘Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference’ 논문에 대한 자세한 리뷰입니다.
Elodie Ferreres이 [arXiv]에 게시한 ‘Curia: A Multi-Modal Foundation Model for Radiology’ 논문에 대한 자세한 리뷰입니다.
Quanquan Gu이 [arXiv]에 게시한 ‘Causal Attention with Lookahead Keys’ 논문에 대한 자세한 리뷰입니다.
Aili Chen이 [arXiv]에 게시한 ‘WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents’ 논문에 대한 자세한 리뷰입니다.
Xinyao Liao이 [arXiv]에 게시한 ‘UniVerse-1: Unified Audio-Video Generation via Stitching of Experts’ 논문에 대한 자세한 리뷰입니다.
See-Kiong Ng이 [arXiv]에 게시한 ‘Test-Time Scaling in Reasoning Models Is Not Effective for Knowledge-Intensive Tasks Yet’ 논문에 대한 자세한 리뷰입니다.
Xia Xiao이 [arXiv]에 게시한 ‘Scaling up Multi-Turn Off-Policy RL and Multi-Agent Tree Search for LLM Step-Provers’ 논문에 대한 자세한 리뷰입니다.
Damien Sileo이 [arXiv]에 게시한 ‘Saturation-Driven Dataset Generation for LLM Mathematical Reasoning in the TPTP Ecosystem’ 논문에 대한 자세한 리뷰입니다.
Bowen Zhou이 [arXiv]에 게시한 ‘R^textbf{2AI}: Towards Resistant and Resilient AI in an Evolving World’ 논문에 대한 자세한 리뷰입니다.
Ke Shen이 [arXiv]에 게시한 ‘Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Wangchunshu Zhou이 [arXiv]에 게시한 ‘Reverse-Engineered Reasoning for Open-Ended Generation’ 논문에 대한 자세한 리뷰입니다.
Wei Han이 [arXiv]에 게시한 ‘Reinforcement Learning Foundations for Deep Research Systems: A Survey’ 논문에 대한 자세한 리뷰입니다.
Mingyang Fu이 [arXiv]에 게시한 ‘Reinforced Visual Perception with Tools’ 논문에 대한 자세한 리뷰입니다.
James Zou이 [arXiv]에 게시한 ‘Paper2Agent: Reimagining Research Papers As Interactive and Reliable AI Agents’ 논문에 대한 자세한 리뷰입니다.
Zhengxi Lu이 [arXiv]에 게시한 ‘MAS-Bench: A Unified Benchmark for Shortcut-Augmented Hybrid Mobile GUI Agents’ 논문에 대한 자세한 리뷰입니다.
Hoi-Fong Mak이 [arXiv]에 게시한 ‘Llama-GENBA-10B: A Trilingual Large Language Model for German, English and Bavarian’ 논문에 대한 자세한 리뷰입니다.
Shixiang Tang이 [arXiv]에 게시한 ‘Interleaving Reasoning for Better Text-to-Image Generation’ 논문에 대한 자세한 리뷰입니다.
Baolong Bi이 [arXiv]에 게시한 ‘Focusing by Contrastive Attention: Enhancing VLMs’ Visual Reasoning’ 논문에 대한 자세한 리뷰입니다.
Rui Chen이 [arXiv]에 게시한 ‘Easier Painting Than Thinking: Can Text-to-Image Models Set the Stage, but Not Direct the Play?’ 논문에 대한 자세한 리뷰입니다.
Bailiang Jian이 [arXiv]에 게시한 ‘Does DINOv3 Set a New Medical Vision Standard?’ 논문에 대한 자세한 리뷰입니다.
Dhanvin Sanjay Namboodiri이 [arXiv]에 게시한 ‘D-HUMOR: Dark Humor Understanding via Multimodal Open-ended Reasoning’ 논문에 대한 자세한 리뷰입니다.
Wenzheng Chang이 [arXiv]에 게시한 ‘WinT3R: Window-Based Streaming Reconstruction with Camera Token Pool’ 논문에 대한 자세한 리뷰입니다.
Amit Namburi이 [arXiv]에 게시한 ‘WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning’ 논문에 대한 자세한 리뷰입니다.
Edwin Zhang이 [arXiv]에 게시한 ‘Why Language Models Hallucinate’ 논문에 대한 자세한 리뷰입니다.
Junda Huang이 [arXiv]에 게시한 ‘U-ARM : Ultra low-cost general teleoperation interface for robot manipulation’ 논문에 대한 자세한 리뷰입니다.
Kaipeng Zhang이 [arXiv]에 게시한 ‘Symbolic Graphics Programming with Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Jeremy Reizenstein이 [arXiv]에 게시한 ‘Set Block Decoding is a Language Model Inference Accelerator’ 논문에 대한 자세한 리뷰입니다.
Kevin Roitero이 [arXiv]에 게시한 ‘On Robustness and Reliability of Benchmark-Based Evaluation of LLMs’ 논문에 대한 자세한 리뷰입니다.
Vanessa Wildman이 [arXiv]에 게시한 ‘MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting’ 논...
Sanja Fidler이 [arXiv]에 게시한 ‘LuxDiT: Lighting Estimation with Video Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.
Zhan Zhao이 [arXiv]에 게시한 ‘LatticeWorld: A Multimodal Large Language Model-Empowered Framework for Interactive Complex World Generation’ 논문에 대한 자세한 리뷰입니다.
Yoram Bachrach이 [arXiv]에 게시한 ‘Bootstrapping Task Spaces for Self-Improvement’ 논문에 대한 자세한 리뷰입니다.
Xing Li이 [arXiv]에 게시한 ‘Behavioral Fingerprinting of Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Lionel Ni이 [arXiv]에 게시한 ‘Video-MTR: Reinforced Multi-Turn Reasoning for Long Video Understanding’ 논문에 대한 자세한 리뷰입니다.
Yangguang Li이 [arXiv]에 게시한 ‘Transition Models: Rethinking the Generative Learning Objective’ 논문에 대한 자세한 리뷰입니다.
Hongyi Liu이 [arXiv]에 게시한 ‘Towards a Unified View of Large Language Model Post-Training’ 논문에 대한 자세한 리뷰입니다.
Oren Glickman이 [arXiv]에 게시한 ‘NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware Embeddings’ 논문에 대한 자세한 리뷰입니다.
Yu Fu이 [arXiv]에 게시한 ‘Inverse IFEval: Can LLMs Unlearn Stubborn Training Conventions to Follow Real Instructions?’ 논문에 대한 자세한 리뷰입니다.
Lang Nie이 [arXiv]에 게시한 ‘From Editor to Dense Geometry Estimator’ 논문에 대한 자세한 리뷰입니다.
Lingxi Xie이 [arXiv]에 게시한 ‘Few-step Flow for 3D Generation via Marginal-Data Transport Distillation’ 논문에 대한 자세한 리뷰입니다.
Muhao Chen이 [arXiv]에 게시한 ‘False Sense of Security: Why Probing-based Malicious Input Detection Fails to Generalize’ 논문에 대한 자세한 리뷰입니다.
Hanbyul Joo이 [arXiv]에 게시한 ‘Durian: Dual Reference-guided Portrait Animation with Attribute Transfer’ 논문에 대한 자세한 리뷰입니다.
Chi-Li Chen이 [arXiv]에 게시한 ‘Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth’ 논문에 대한 자세한 리뷰입니다.
Meie Fang이 [arXiv]에 게시한 ‘Drawing2CAD: Sequence-to-Sequence Learning for CAD Generation from Vector Drawings’ 논문에 대한 자세한 리뷰입니다.
Ser-Nam Lim이 [arXiv]에 게시한 ‘Delta Activations: A Representation for Finetuned Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Jiaxuan Lu이 [arXiv]에 게시한 ‘DeepResearch Arena: The First Exam of LLMs’ Research Abilities via Seminar-Grounded Tasks’ 논문에 대한 자세한 리뷰입니다.
Zixuan Wang이 [arXiv]에 게시한 ‘Robix: A Unified Model for Robot Interaction, Reasoning and Planning’ 논문에 대한 자세한 리뷰입니다.
Zheng Liu이 [arXiv]에 게시한 ‘Open Data Synthesis For Deep Research’ 논문에 대한 자세한 리뷰입니다.
Kai Li이 [arXiv]에 게시한 ‘Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation’ 논문에 대한 자세한 리뷰입니다.
Hualiang Wang이 [arXiv]에 게시한 ‘MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement’ 논문에 대한 자세한 리뷰입니다.
Yoav Gur-Arieh이 [arXiv]에 게시한 ‘LMEnt: A Suite for Analyzing Knowledge in Language Models from Pretraining Data to Representations’ 논문에 대한 자세한 리뷰입니다.
Daniel Cremers이 [arXiv]에 게시한 ‘ViSTA-SLAM: Visual SLAM with Symmetric Two-view Association’ 논문에 대한 자세한 리뷰입니다.
Zhiheng Lyu이 [arXiv]에 게시한 ‘VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use’ 논문에 대한 자세한 리뷰입니다.
Pavlo Molchanov이 [arXiv]에 게시한 ‘Universal Deep Research: Bring Your Own Model and Strategy’ 논문에 대한 자세한 리뷰입니다.
Haoyang Zou이 [arXiv]에 게시한 ‘UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Junchi Yan이 [arXiv]에 게시한 ‘Towards More Diverse and Challenging Pre-training for Point Cloud Learning: Self-Supervised Cross Reconstruction with Decoupled Vie...
Hejia Geng이 [arXiv]에 게시한 ‘The Landscape of Agentic Reinforcement Learning for LLMs: A Survey’ 논문에 대한 자세한 리뷰입니다.
Solomon Tsai이 [arXiv]에 게시한 ‘The Gold Medals in an Empty Room: Diagnosing Metalinguistic Reasoning in LLMs with Camlang’ 논문에 대한 자세한 리뷰입니다.
Qian Liu이 [arXiv]에 게시한 ‘SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning’ 논문에 대한 자세한 리뷰입니다.
bindsch이 [arXiv]에 게시한 ‘SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction’ 논문에 대한 자세한 리뷰입니다.
Bernard Ghanem이 [arXiv]에 게시한 ‘Reasoning Vectors: Transferring Chain-of-Thought Capabilities via Task Arithmetic’ 논문에 대한 자세한 리뷰입니다.
Haicheng Wang이 [arXiv]에 게시한 ‘POINTS-Reader: Distillation-Free Adaptation of Vision-Language Models for Document Conversion’ 논문에 대한 자세한 리뷰입니다.
Zirui Wang이 [arXiv]에 게시한 ‘OpenVision 2: A Family of Generative Pretrained Visual Encoders for Multimodal Learning’ 논문에 대한 자세한 리뷰입니다.
Wangbo Gong이 [arXiv]에 게시한 ‘MobiAgent: A Systematic Framework for Customizable Mobile Agents’ 논문에 대한 자세한 리뷰입니다.
Hengjie Cao이 [arXiv]에 게시한 ‘Metis: Training Large Language Models with Advanced Low-Bit Quantization’ 논문에 대한 자세한 리뷰입니다.
Xiaofeng Yang이 [arXiv]에 게시한 ‘MedDINOv3: How to adapt vision foundation models for medical image segmentation?’ 논문에 대한 자세한 리뷰입니다.
Yan-Jie Zhou이 [arXiv]에 게시한 ‘M3Ret: Unleashing Zero-shot Multimodal Medical Image Retrieval via Self-Supervision’ 논문에 대한 자세한 리뷰입니다.
Jianwei Yang이 [arXiv]에 게시한 ‘LLaVA-Critic-R1: Your Critic Model is Secretly a Strong Policy Model’ 논문에 대한 자세한 리뷰입니다.
SXxtyz이 [arXiv]에 게시한 ‘Kwai Keye-VL 1.5 Technical Report’ 논문에 대한 자세한 리뷰입니다.
Tianlu이 [arXiv]에 게시한 ‘Jointly Reinforcing Diversity and Quality in Language Model Generations’ 논문에 대한 자세한 리뷰입니다.
Simon Jenni이 [arXiv]에 게시한 ‘Improving Large Vision and Language Models by Learning from a Panel of Peers’ 논문에 대한 자세한 리뷰입니다.
Lu Wang이 [arXiv]에 게시한 ‘Implicit Actor Critic Coupling via a Supervised Learning Framework for RLVR’ 논문에 대한 자세한 리뷰입니다.
Lingen Li이 [arXiv]에 게시한 ‘GenCompositor: Generative Video Compositing with Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.
Dongmin Park이 [arXiv]에 게시한 ‘FlashAdventure: A Benchmark for GUI Agents Solving Full Story Arcs in Diverse Adventure Games’ 논문에 대한 자세한 리뷰입니다.
Zhen Wang이 [arXiv]에 게시한 ‘FastFit: Accelerating Multi-Reference Virtual Try-On via Cacheable Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Percy Liang이 [arXiv]에 게시한 ‘Fantastic Pretraining Optimizers and Where to Find Them’ 논문에 대한 자세한 리뷰입니다.
Xuanyu Zheng이 [arXiv]에 게시한 ‘ELV-Halluc: Benchmarking Semantic Aggregation Hallucinations in Long Video Understanding’ 논문에 대한 자세한 리뷰입니다.
Amin Heyrani Nobar이 [arXiv]에 게시한 ‘Discrete Noise Inversion for Next-scale Autoregressive Text-based Image Editing’ 논문에 대한 자세한 리뷰입니다.
Kai Lu이 [arXiv]에 게시한 ‘DCPO: Dynamic Clipping Policy Optimization’ 논문에 대한 자세한 리뷰입니다.
Vito Renó이 [arXiv]에 게시한 ‘C-DiffDet+: Fusing Global Scene Context with Generative Denoising for High-Fidelity Object Detection’ 논문에 대한 자세한 리뷰입니다.
mjaggi이 [arXiv]에 게시한 ‘Benchmarking Optimizers for Large Language Model Pretraining’ 논문에 대한 자세한 리뷰입니다.
Jayok6이 [arXiv]에 게시한 ‘Baichuan-M2: Scaling Medical Capability with Large Verifier System’ 논문에 대한 자세한 리뷰입니다.
Xiaolei Huang이 [arXiv]에 게시한 ‘Attributes as Textual Genes: Leveraging LLMs as Genetic Algorithm Simulators for Conditional Synthetic Data Generation’ 논문에 대한 자...
Rahul Karthikeyan이 [arXiv]에 게시한 ‘AMBEDKAR-A Multi-level Bias Elimination through a Decoding Approach with Knowledge Augmentation for Robust Constitutional Al...
Omartificial-Intelligence-Space이 [arXiv]에 게시한 ‘UI-Level Evaluation of ALLaM 34B: Measuring an Arabic-Centric LLM via HUMAIN Chat’ 논문에 대한 자세한 리뷰입니다.
Yu Zhao이 [arXiv]에 게시한 ‘T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables’ 논문에 대한 자세한 리뷰입니다.
Yuewei Zhang이 [arXiv]에 게시한 ‘PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic Reasoning’ 논문에 대한 자세한 리뷰입니다.
Danijel Skočaj이 [arXiv]에 게시한 ‘No Label Left Behind: A Unified Surface Defect Detection Model for all Supervision Regimes’ 논문에 대한 자세한 리뷰입니다.
Jayanth Srinivasa이 [arXiv]에 게시한 ‘How Can Input Reformulation Improve Tool Usage Accuracy in a Complex Dynamic Environment? A Study on τ-bench’ 논문에 대한 자세한 리뷰입...
Songming Liu이 [arXiv]에 게시한 ‘From reactive to cognitive: brain-inspired spatial intelligence for embodied agents’ 논문에 대한 자세한 리뷰입니다.
Yufeng Zhong이 [arXiv]에 게시한 ‘UItron: Foundational GUI Agent with Advanced Perception and Planning’ 논문에 대한 자세한 리뷰입니다.
Jiyao Deng이 [arXiv]에 게시한 ‘TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training’ 논문에 대한 자세한 리뷰입니다.
Yifan Lu이 [arXiv]에 게시한 ‘Think in Games: Learning to Reason in Games via Reinforcement Learning with Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Pengcheng Chen이 [arXiv]에 게시한 ‘TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis’ 논문에 대한 자세한 리뷰입니다.
Han Hu이 [arXiv]에 게시한 ‘R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce Learning’ 논문에 대한 자세한 리뷰입니다.
Amy Pavel이 [arXiv]에 게시한 ‘Morae: Proactively Pausing UI Agents for User Choices’ 논문에 대한 자세한 리뷰입니다.
Wenjie Zhou이 [arXiv]에 게시한 ‘Mimicking the Physicist’s Eye:A VLM-centric Approach for Physics Formula Discovery’ 논문에 대한 자세한 리뷰입니다.
Tianhai Liang이 [arXiv]에 게시한 ‘HERMES: Human-to-Robot Embodied Learning from Multi-Source Motion Data for Mobile Dexterous Manipulation’ 논문에 대한 자세한 리뷰입니다.
Zhaoqing Chen이 [arXiv]에 게시한 ‘EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control’ 논문에 대한 자세한 리뷰입니다.
Han Xiao이 [arXiv]에 게시한 ‘Efficient Code Embeddings from Code Generation Models’ 논문에 대한 자세한 리뷰입니다.
Qi Jia이 [arXiv]에 게시한 ‘Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation’ 논문에 대한 자세한 리뷰입니다.
Raymond A. Yeh이 [arXiv]에 게시한 ‘CLIPSym: Delving into Symmetry Detection with CLIP’ 논문에 대한 자세한 리뷰입니다.
Jiamin Wu이 [arXiv]에 게시한 ‘A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers’ 논문에 대한 자세한 리뷰입니다.
Siwei Yang이 [arXiv]에 게시한 ‘AHELM: A Holistic Evaluation of Audio-Language Models’ 논문에 대한 자세한 리뷰입니다.
Libo Chen이 [arXiv]에 게시한 ‘A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code’ 논문에 대한 자세한 리뷰입니다.
Weijiang Xu이 [arXiv]에 게시한 ‘rStar2-Agent: Agentic Reasoning Technical Report’ 논문에 대한 자세한 리뷰입니다.
Jiahe Tian이 [arXiv]에 게시한 ‘USO: Unified Style and Subject-Driven Generation via Disentangled and Reward Learning’ 논문에 대한 자세한 리뷰입니다.
Bernard Ghanem이 [arXiv]에 게시한 ‘Turning the Spell Around: Lightweight Alignment Amplification via Rank-One Safety Injection’ 논문에 대한 자세한 리뷰입니다.
Simin Ma이 [arXiv]에 게시한 ‘TCIA: A Task-Centric Instruction Augmentation Method for Instruction Finetuning’ 논문에 대한 자세한 리뷰입니다.
Hantang Liu이 [arXiv]에 게시한 ‘ROSE: Remove Objects with Side Effects in Videos’ 논문에 대한 자세한 리뷰입니다.
Vivien Cabannes이 [arXiv]에 게시한 ‘Provable Benefits of In-Tool Learning for Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Jiazi Bu이 [arXiv]에 게시한 ‘Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Roy Ka-Wei Lee이 [arXiv]에 게시한 ‘Persuasion Dynamics in LLMs: Investigating Robustness and Adaptability in Knowledge and Safety with DuET-PD’ 논문에 대한 자세한 리뷰입니다.
Yitong Wang이 [arXiv]에 게시한 ‘OneReward: Unified Mask-Guided Image Generation via Multi-Task Human Preference Learning’ 논문에 대한 자세한 리뷰입니다.
Alex Endert이 [arXiv]에 게시한 ‘OnGoal: Tracking and Visualizing Conversational Goals in Multi-Turn Dialogue with Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Irem Demir이 [arXiv]에 게시한 ‘Multi-View 3D Point Tracking’ 논문에 대한 자세한 리뷰입니다.
Junfei Xiao이 [arXiv]에 게시한 ‘Mixture of Contexts for Long Video Generation’ 논문에 대한 자세한 리뷰입니다.
Shashank Biju이 [arXiv]에 게시한 ‘MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers’ 논문에 대한 자세한 리뷰입니다.
Xi Wang이 [arXiv]에 게시한 ‘FakeParts: a New Family of AI-Generated DeepFakes’ 논문에 대한 자세한 리뷰입니다.
Yu-Xiong Wang이 [arXiv]에 게시한 ‘Dress&Dance: Dress up and Dance as You Like It - Technical Preview’ 논문에 대한 자세한 리뷰입니다.
Ziwei Liu이 [arXiv]에 게시한 ‘Collaborative Multi-Modal Coding for High-Quality 3D Generation’ 논문에 대한 자세한 리뷰입니다.
Liqiang Nie이 [arXiv]에 게시한 ‘CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification’ 논문에 대한 자세한 리뷰입니다.
Qintong Wu이 [arXiv]에 게시한 ‘AWorld: Orchestrating the Training Recipe for Agentic AI’ 논문에 대한 자세한 리뷰입니다.
Chunlei Han이 [arXiv]에 게시한 ‘Taming the Chaos: Coordinated Autoscaling for Heterogeneous and Disaggregated LLM Inference’ 논문에 대한 자세한 리뷰입니다.
Olga Golovneva이 [arXiv]에 게시한 ‘StepWiser: Stepwise Generative Judges for Wiser Reasoning’ 논문에 대한 자세한 리뷰입니다.
Zhenwen Liang이 [arXiv]에 게시한 ‘Self-Rewarding Vision-Language Model via Reasoning Decomposition’ 논문에 대한 자세한 리뷰입니다.
Alham Fikri Aji이 [arXiv]에 게시한 ‘Predicting the Order of Upcoming Tokens Improves Language Modeling’ 논문에 대한 자세한 리뷰입니다.
An-An Liu이 [arXiv]에 게시한 ‘MotionFlux: Efficient Text-Guided Motion Generation through Rectified Flow Matching and Preference Alignment’ 논문에 대한 자세한 리뷰입니다.
Yue Yao이 [arXiv]에 게시한 ‘Mind the Third Eye! Benchmarking Privacy Awareness in MLLM-powered Smartphone Agents’ 논문에 대한 자세한 리뷰입니다.
Yan Zhou이 [arXiv]에 게시한 ‘MIDAS: Multimodal Interactive Digital-human Synthesis via Real-time Autoregressive Video Generation’ 논문에 대한 자세한 리뷰입니다.
Anton Ivaschenko이 [arXiv]에 게시한 ‘Gaze into the Heart: A Multi-View Video Dataset for rPPG and Health Biomarkers Estimation’ 논문에 대한 자세한 리뷰입니다.
Sitong Mao이 [arXiv]에 게시한 ‘Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies’ 논문에 대한 자세한 리뷰입니다.
Shilin Yan이 [arXiv]에 게시한 ‘Diffusion Language Models Know the Answer Before Decoding’ 논문에 대한 자세한 리뷰입니다.
Ion Stoica이 [arXiv]에 게시한 ‘DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis’ 논문에 대한 자세한 리뷰입니다.
Jianze Liang이 [arXiv]에 게시한 ‘CODA: Coordinating the Cerebrum and Cerebellum for a Dual-Brain Computer Use Agent with Decoupled Reinforcement Learning’ 논문에 대한 ...
Aviv Shamsian이 [arXiv]에 게시한 ‘Beyond Transcription: Mechanistic Interpretability in ASR’ 논문에 대한 자세한 리뷰입니다.
Yixiao Ge이 [arXiv]에 게시한 ‘AudioStory: Generating Long-Form Narrative Audio with Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Chaonan Ji이 [arXiv]에 게시한 ‘Wan-S2V: Audio-Driven Cinematic Video Generation’ 논문에 대한 자세한 리뷰입니다.
Rui Chen이 [arXiv]에 게시한 ‘VoxHammer: Training-Free Precise and Coherent 3D Editing in Native 3D Space’ 논문에 대한 자세한 리뷰입니다.
Yaoyao Chang이 [arXiv]에 게시한 ‘VibeVoice Technical Report’ 논문에 대한 자세한 리뷰입니다.
Jianxi Gao이 [arXiv]에 게시한 ‘Unraveling the cognitive patterns of Large Language Models through module communities’ 논문에 대한 자세한 리뷰입니다.
Ran Guo이 [arXiv]에 게시한 ‘UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning’ 논문에 대한 자세한 리뷰입니다.
Zhoufutu Wen이 [arXiv]에 게시한 ‘TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling’ 논문에 대한 ...
Zijian Wang이 [arXiv]에 게시한 ‘Training Language Model Agents to Find Vulnerabilities with CTF-Dojo’ 논문에 대한 자세한 리뷰입니다.
Jiangjie Chen이 [arXiv]에 게시한 ‘ThinkDial: An Open Recipe for Controlling Reasoning Effort in Large Language Models’ 논문에 대한 자세한 리뷰입니다.
zerojun48이 [arXiv]에 게시한 ‘Spacer: Towards Engineered Scientific Inspiration’ 논문에 대한 자세한 리뷰입니다.
Kai Jia이 [arXiv]에 게시한 ‘ReportBench: Evaluating Deep Research Agents via Academic Survey Tasks’ 논문에 대한 자세한 리뷰입니다.
Manuela Veloso이 [arXiv]에 게시한 ‘QueryBandits for Hallucination Mitigation: Exploiting Semantic Features for No-Regret Rewriting’ 논문에 대한 자세한 리뷰입니다.
Dinesh Jayaraman이 [arXiv]에 게시한 ‘Pixie: Fast and Generalizable Supervised Learning of 3D Physics from Pixels’ 논문에 대한 자세한 리뷰입니다.
Daisuke Nohara이 [arXiv]에 게시한 ‘Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks’ 논문에 대한 자세한 리뷰입니다.
Jiaqi Yang이 [arXiv]에 게시한 ‘OmniHuman-1.5: Instilling an Active Mind in Avatars via Cognitive Simulation’ 논문에 대한 자세한 리뷰입니다.
Beiqi Chen이 [arXiv]에 게시한 ‘ObjFiller-3D: Consistent Multi-view 3D Inpainting via Video Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Hung-Ting Su이 [arXiv]에 게시한 ‘MovieCORE: COgnitive REasoning in Movies’ 논문에 대한 자세한 리뷰입니다.
Xingang Pan이 [arXiv]에 게시한 ‘FastMesh:Efficient Artistic Mesh Generation via Component Decoupling’ 논문에 대한 자세한 리뷰입니다.
Arman Cohan이 [arXiv]에 게시한 ‘Demystifying Scientific Problem-Solving in LLMs by Probing Knowledge and Reasoning’ 논문에 대한 자세한 리뷰입니다.
Kun Kuang이 [arXiv]에 게시한 ‘ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation’ 논문에 대한 자세한 리뷰입니다.
Ziwei Liu이 [arXiv]에 게시한 ‘CineScale: Free Lunch in High-Resolution Cinematic Visual Generation’ 논문에 대한 자세한 리뷰입니다.
Dongchen Huang이 [arXiv]에 게시한 ‘CMPhysBench: A Benchmark for Evaluating Large Language Models in Condensed Matter Physics’ 논문에 대한 자세한 리뷰입니다.
Albert Gu이 [arXiv]에 게시한 ‘Autoregressive Universal Video Segmentation Model’ 논문에 대한 자세한 리뷰입니다.
Haoxiang Shi이 [arXiv]에 게시한 ‘Visual-CoG: Stage-Aware Reinforcement Learning with Chain of Guidance for Text-to-Image Generation’ 논문에 대한 자세한 리뷰입니다.
Wei Liu이 [arXiv]에 게시한 ‘UQ: Assessing Language Models on Unsolved Questions’ 논문에 대한 자세한 리뷰입니다.
Jiaqi Li이 [arXiv]에 게시한 ‘TaDiCodec: Text-aware Diffusion Speech Tokenizer for Speech Language Modeling’ 논문에 대한 자세한 리뷰입니다.
Xihui Liu이 [arXiv]에 게시한 ‘T2I-ReasonBench: Benchmarking Reasoning-Informed Text-to-Image Generation’ 논문에 대한 자세한 리뷰입니다.
Ersin Yumer이 [arXiv]에 게시한 ‘SpotEdit: Evaluating Visually-Guided Image Editing Methods’ 논문에 대한 자세한 리뷰입니다.
Wei Zhou이 [arXiv]에 게시한 ‘ST-Raptor: LLM-Powered Semi-Structured Table Question Answering’ 논문에 대한 자세한 리뷰입니다.
Chenyu You이 [arXiv]에 게시한 ‘PosterGen: Aesthetic-Aware Paper-to-Poster Generation via Multi-Agent LLMs’ 논문에 대한 자세한 리뷰입니다.
Golnoosh Farnadi이 [arXiv]에 게시한 ‘Neither Valid nor Reliable? Investigating the Use of LLMs as Judges’ 논문에 대한 자세한 리뷰입니다.
Yanzhe Liang이 [arXiv]에 게시한 ‘MeshSplat: Generalizable Sparse-View Surface Reconstruction via Gaussian Splatting’ 논문에 대한 자세한 리뷰입니다.
sagiebenaim이 [arXiv]에 게시한 ‘MV-RAG: Retrieval Augmented Multiview Diffusion’ 논문에 대한 자세한 리뷰입니다.
Doratossadat Dastgheib이 [arXiv]에 게시한 ‘MEENA (PersianMMMU): Multimodal-Multilingual Educational Exams for N-level Assessment’ 논문에 대한 자세한 리뷰입니다.
Radu State이 [arXiv]에 게시한 ‘Limitations of Normalization in Attention Mechanism’ 논문에 대한 자세한 리뷰입니다.
jinglinglin이 [arXiv]에 게시한 ‘InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency’ 논문에 대한 자세한 리뷰입니다.
Cristian-George Craciun이 [arXiv]에 게시한 ‘German4All - A Dataset and Model for Readability-Controlled Paraphrasing in German’ 논문에 대한 자세한 리뷰입니다.
Xin Zheng이 [arXiv]에 게시한 ‘Explain Before You Answer: A Survey on Compositional Visual Reasoning’ 논문에 대한 자세한 리뷰입니다.
Jiale Zhao이 [arXiv]에 게시한 ‘Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning’ 논문에 대한 자세한 리뷰입니다.
Daniil Orel이 [arXiv]에 게시한 ‘Beyond Memorization: Extending Reasoning Depth with Recurrence, Memory and Test-Time Compute Scaling’ 논문에 대한 자세한 리뷰입니다.
Di Yin이 [arXiv]에 게시한 ‘TPLA: Tensor Parallel Latent Attention for Efficient Disaggregated Prefill & Decode Inference’ 논문에 대한 자세한 리뷰입니다.
Jae-Pil Heo이 [arXiv]에 게시한 ‘Selective Contrastive Learning for Weakly Supervised Affordance Grounding’ 논문에 대한 자세한 리뷰입니다.
Xiao Sun이 [arXiv]에 게시한 ‘Learnable SMPLify: A Neural Solution for Optimization-Free Human Pose Inverse Kinematics’ 논문에 대한 자세한 리뷰입니다.
Liming Fang이 [arXiv]에 게시한 ‘Jailbreaking Commercial Black-Box LLMs with Explicitly Harmful Prompts’ 논문에 대한 자세한 리뷰입니다.
Diping Song이 [arXiv]에 게시한 ‘InMind: Evaluating LLMs in Capturing and Applying Individual Human Reasoning Styles’ 논문에 대한 자세한 리뷰입니다.
Pengcheng Qiu이 [arXiv]에 게시한 ‘End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning’ 논문에 대한 자세한 리뷰입니다.
Wentao Wang이 [arXiv]에 게시한 ‘EgoTwin: Dreaming Body and View in First Person’ 논문에 대한 자세한 리뷰입니다.
Roei Herzig이 [arXiv]에 게시한 ‘Do What? Teaching Vision-Language-Action Models to Reject the Impossible’ 논문에 대한 자세한 리뷰입니다.
Yonatan Belinkov이 [arXiv]에 게시한 ‘CRISP: Persistent Concept Unlearning via Sparse Autoencoders’ 논문에 대한 자세한 리뷰입니다.
Yulun Zhang이 [arXiv]에 게시한 ‘CARFT: Boosting LLM Reasoning via Contrastive Learning with Annotated Chain-of-Thought-based Reinforced Fine-Tuning’ 논문에 대한 자세한 리뷰...
Ying Nian Wu이 [arXiv]에 게시한 ‘Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR’ 논문에 대한 자세한 리뷰입니다.
Liuyi Yao이 [arXiv]에 게시한 ‘AgentScope 1.0: A Developer-Centric Framework for Building Agentic Applications’ 논문에 대한 자세한 리뷰입니다.
Yidi Du이 [arXiv]에 게시한 ‘AetherCode: Evaluating LLMs’ Ability to Win In Premier Programming Competitions’ 논문에 대한 자세한 리뷰입니다.
Heng Zhang이 [arXiv]에 게시한 ‘aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists’ 논문에 대한 자세한 리뷰입니다.
Rui Guo이 [arXiv]에 게시한 ‘When and What: Diffusion-Grounded VideoLLM with Entity Aware Segmentation for Long Video Understanding’ 논문에 대한 자세한 리뷰입니다.
Yifu Zhang이 [arXiv]에 게시한 ‘Waver: Wave Your Way to Lifelike Video Generation’ 논문에 대한 자세한 리뷰입니다.
Chuiyun Wu이 [arXiv]에 게시한 ‘Snap-Snap: Taking Two Images to Reconstruct 3D Human Gaussians in Milliseconds’ 논문에 대한 자세한 리뷰입니다.
Ya Zhang이 [arXiv]에 게시한 ‘SceneGen: Single-Image 3D Scene Generation in One Feedforward Pass’ 논문에 대한 자세한 리뷰입니다.
Haowei Liu이 [arXiv]에 게시한 ‘Mobile-Agent-v3: Foundamental Agents for GUI Automation’ 논문에 대한 자세한 리뷰입니다.
huuuyeah이 [arXiv]에 게시한 ‘LiveMCP-101: Stress Testing and Diagnosing MCP-enabled Agents on Challenging Queries’ 논문에 대한 자세한 리뷰입니다.
xuhuang87이 [arXiv]에 게시한 ‘Intern-S1: A Scientific Multimodal Foundation Model’ 논문에 대한 자세한 리뷰입니다.
Yacine Jernite이 [arXiv]에 게시한 ‘INTIMA: A Benchmark for Human-AI Companionship Behavior’ 논문에 대한 자세한 리뷰입니다.
Lifan Guo이 [arXiv]에 게시한 ‘Fin-PRM: A Domain-Specialized Process Reward Model for Financial Reasoning in Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Xia Su이 [arXiv]에 게시한 ‘Does the cafe entrance look accessible? Where is the door? Towards Geospatial AI Agents for Visual Inquiries’ 논문에 대한 자세한 리뷰입니다.
Xuewei Wang이 [arXiv]에 게시한 ‘Deep Think with Confidence’ 논문에 대한 자세한 리뷰입니다.
Siyi Li이 [arXiv]에 게시한 ‘A Survey on Large Language Model Benchmarks’ 논문에 대한 자세한 리뷰입니다.
Shunsuke Saito이 [arXiv]에 게시한 ‘ATLAS: Decoupling Skeletal and Shape Parameters for Expressive Parametric Human Modeling’ 논문에 대한 자세한 리뷰입니다.
anoperson이 [arXiv]에 게시한 ‘mSCoRe: a Multilingual and Scalable Benchmark for Skill-based Commonsense Reasoning’ 논문에 대한 자세한 리뷰입니다.
Daeyoung Kim이 [arXiv]에 게시한 ‘ViExam: Are Vision Language Models Better than Humans on Vietnamese Multimodal Exam Questions?’ 논문에 대한 자세한 리뷰입니다.
Hao Chen이 [arXiv]에 게시한 ‘Tinker: Diffusion’s Gift to 3D–Multi-View Consistent Editing From Sparse Inputs without Per-Scene Optimization’ 논문에 대한 자세한 리뷰입니다.
jiangpinliu이 [arXiv]에 게시한 ‘RynnEC: Bringing MLLMs into Embodied World’ 논문에 대한 자세한 리뷰입니다.
Shiqing Wu이 [arXiv]에 게시한 ‘Refining Contrastive Learning and Homography Relations for Multi-Modal Recommendation’ 논문에 대한 자세한 리뷰입니다.
Haobo Xu이 [arXiv]에 게시한 ‘Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs’ 논문에 대한 자세한 리뷰입니다.
Guoyin Wang이 [arXiv]에 게시한 ‘On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting’ 논문에 대한...
abercovich이 [arXiv]에 게시한 ‘NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model’ 논문에 대한 자세한 리뷰입니다.
Jiangmiao이 [arXiv]에 게시한 ‘MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds’ 논문에 대한 자세한 리뷰입니다.
Prathyusha Jwalapuram이 [arXiv]에 게시한 ‘MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers’ 논문에 대한 자세한 리뷰입니다.
Jeremiah Jiang이 [arXiv]에 게시한 ‘Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer’ 논문에 대한 자세한 리뷰입니다.
Ingrid Verbauwhede이 [arXiv]에 게시한 ‘Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell’ 논문에 대한 자세한 리뷰입니다.
tianlecai이 [arXiv]에 게시한 ‘FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction’ 논문에 대한 자세한 리뷰입니다.
Ziyan Kuang이 [arXiv]에 게시한 ‘From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models’ 논문에 대한 자세한 리뷰입니다.
zijieqiu이 [arXiv]에 게시한 ‘From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery’ 논문에 대한 자세한 리뷰입니다.
Yu Lu이 [arXiv]에 게시한 ‘DuPO: Enabling Reliable LLM Self-Verification via Dual Preference Optimization’ 논문에 대한 자세한 리뷰입니다.
Flora D. Salim이 [arXiv]에 게시한 ‘ZARA: Zero-shot Motion Time-Series Analysis via Knowledge and Retrieval Driven LLM Agents’ 논문에 대한 자세한 리뷰입니다.
Deyu Zhou이 [arXiv]에 게시한 ‘Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.
Jian Yang이 [arXiv]에 게시한 ‘TempFlow-GRPO: When Timing Matters for GRPO in Flow Models’ 논문에 대한 자세한 리뷰입니다.
Enrico Palumbo이 [arXiv]에 게시한 ‘Semantic IDs for Joint Generative Search and Recommendation’ 논문에 대한 자세한 리뷰입니다.
Susanne Schmidt이 [arXiv]에 게시한 ‘Radiance Fields in XR: A Survey on How Radiance Fields are Envisioned and Addressed for XR Research’ 논문에 대한 자세한 리뷰입니다.
Yuqing Yang이 [arXiv]에 게시한 ‘Prompt Orchestration Markup Language’ 논문에 대한 자세한 리뷰입니다.
Xiaoduan Feng이 [arXiv]에 게시한 ‘OmniTry: Virtual Try-On Anything without Masks’ 논문에 대한 자세한 리뷰입니다.
Shiyun Lang이 [arXiv]에 게시한 ‘MultiRef: Controllable Image Generation with Multiple Visual References’ 논문에 대한 자세한 리뷰입니다.
Xin Chen이 [arXiv]에 게시한 ‘Motion2Motion: Cross-topology Motion Transfer with Sparse Correspondence’ 논문에 대한 자세한 리뷰입니다.
Xinyi Wang이 [arXiv]에 게시한 ‘Mind the Generation Process: Fine-Grained Confidence Estimation During LLM Generation’ 논문에 대한 자세한 리뷰입니다.
Jonas Geiping이 [arXiv]에 게시한 ‘MedSAMix: A Training-Free Model Merging Approach for Medical Image Segmentation’ 논문에 대한 자세한 리뷰입니다.
Fernando López이 [arXiv]에 게시한 ‘MMAU-Pro: A Challenging and Comprehensive Benchmark for Holistic Evaluation of Audio General Intelligence’ 논문에 대한 자세한 리뷰입니다.
Jun Dong이 [arXiv]에 게시한 ‘MM-BrowseComp: A Comprehensive Benchmark for Multimodal Browsing Agents’ 논문에 대한 자세한 리뷰입니다.
Yen-Yu Lin이 [arXiv]에 게시한 ‘LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos’ 논문에 대한 자세한 리뷰입니다.
Abhilash Nandy이 [arXiv]에 게시한 ‘Leveraging Large Language Models for Predictive Analysis of Human Misery’ 논문에 대한 자세한 리뷰입니다.
Alice Wang이 [arXiv]에 게시한 ‘Evaluating Podcast Recommendations with Profile-Aware LLM-as-a-Judge’ 논문에 대한 자세한 리뷰입니다.
Fei Ni이 [arXiv]에 게시한 ‘Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation’ 논문에 대한 자세한 리뷰입니다.
Mounia Lalmas이 [arXiv]에 게시한 ‘Describe What You See with Multimodal Large Language Models to Enhance Video Recommendations’ 논문에 대한 자세한 리뷰입니다.
Adriano Koshiyama이 [arXiv]에 게시한 ‘CorrSteer: Steering Improves Task Performance and Safety in LLMs through Correlation-based Sparse Autoencoder Feature Select...
Xixiang Zhao이 [arXiv]에 게시한 ‘Copyright Protection for Large Language Models: A Survey of Methods, Challenges, and Trends’ 논문에 대한 자세한 리뷰입니다.
Liam-Liu이 [arXiv]에 게시한 ‘Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL’ 논문에 대한 자세한 리뷰입니다.
Alexey Skrynnik이 [arXiv]에 게시한 ‘CAMAR: Continuous Actions Multi-Agent Routing’ 논문에 대한 자세한 리뷰입니다.
Alina Landowska이 [arXiv]에 게시한 ‘Beyond Human Judgment: A Bayesian Evaluation of LLMs’ Moral Values Understanding’ 논문에 대한 자세한 리뷰입니다.
Zhuo Chen이 [arXiv]에 게시한 ‘Advances in Speech Separation: Techniques, Challenges, and Future Trends’ 논문에 대한 자세한 리뷰입니다.
Zishang Jiang이 [arXiv]에 게시한 ‘A Stitch in Time Saves Nine: Proactive Self-Refinement for Language Models’ 논문에 대한 자세한 리뷰입니다.
Elena Tutubalina이 [arXiv]에 게시한 ‘When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs’ 논문에 대한 자세한 리뷰입니다.
Jusen Du이 [arXiv]에 게시한 ‘Speed Always Wins: A Survey on Efficient Architectures for Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Meiqi Wu이 [arXiv]에 게시한 ‘S^2-Guidance: Stochastic Self Guidance for Training-Free Enhancement of Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Daniel L. K. Yamins이 [arXiv]에 게시한 ‘Representing Speech Through Autoregressive Prediction of Cochlear Tokens’ 논문에 대한 자세한 리뷰입니다.
Haokai Xu이 [arXiv]에 게시한 ‘Reinforcement Learning with Rubric Anchors’ 논문에 대한 자세한 리뷰입니다.
Minghan Qin이 [arXiv]에 게시한 ‘Precise Action-to-Video Generation Through Visual Action Prompts’ 논문에 대한 자세한 리뷰입니다.
Yang Li이 [arXiv]에 게시한 ‘Ovis2.5 Technical Report’ 논문에 대한 자세한 리뷰입니다.
Kang Liao이 [arXiv]에 게시한 ‘Next Visual Granularity Generation’ 논문에 대한 자세한 리뷰입니다.
Yifan Zhang이 [arXiv]에 게시한 ‘Matrix-Game 2.0: An Open-Source, Real-Time, and Streaming Interactive World Model’ 논문에 대한 자세한 리뷰입니다.
Zixiang Gao이 [arXiv]에 게시한 ‘Lumen: Consistent Video Relighting and Harmonious Background Replacement with Video Generative Models’ 논문에 대한 자세한 리뷰입니다.
Tyler Derr이 [arXiv]에 게시한 ‘Inverse-LLaVA: Eliminating Alignment Pre-training Through Text-to-Vision Mapping’ 논문에 대한 자세한 리뷰입니다.
Artyom Sorokin이 [arXiv]에 게시한 ‘HeroBench: A Benchmark for Long-Horizon Planning and Structured Reasoning in Virtual Worlds’ 논문에 대한 자세한 리뷰입니다.
Ruisi Wang이 [arXiv]에 게시한 ‘Has GPT-5 Achieved Spatial Intelligence? An Empirical Study’ 논문에 대한 자세한 리뷰입니다.
Evgeny Burnaev이 [arXiv]에 게시한 ‘G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration’ 논문에 대한 자세한 리뷰입니다.
Yufeng Wang이 [arXiv]에 게시한 ‘ComoRAG: A Cognitive-Inspired Memory-Organized RAG for Stateful Long Narrative Reasoning’ 논문에 대한 자세한 리뷰입니다.
Xi Yang이 [arXiv]에 게시한 ‘Beyond Solving Math Quiz: Evaluating the Ability of Large Reasoning Models to Ask for Information’ 논문에 대한 자세한 리뷰입니다.
Zeng Tao이 [arXiv]에 게시한 ‘4DNeX: Feed-Forward 4D Generative Modeling Made Easy’ 논문에 대한 자세한 리뷰입니다.
Islem Rekik이 [arXiv]에 게시한 ‘X-Node: Self-Explanation is All We Need’ 논문에 대한 자세한 리뷰입니다.
Wei Chen이 [arXiv]에 게시한 ‘Thyme: Think Beyond Images’ 논문에 대한 자세한 리뷰입니다.
Nan Cao이 [arXiv]에 게시한 ‘TexVerse: A Universe of 3D Objects with High-Resolution Textures’ 논문에 대한 자세한 리뷰입니다.
Junyong Noh이 [arXiv]에 게시한 ‘StyleMM: Stylized 3D Morphable Face Model via Text-Driven Aligned Image Translation’ 논문에 대한 자세한 리뷰입니다.
Yanxu Chen이 [arXiv]에 게시한 ‘SSRL: Self-Search Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Paolo Soda이 [arXiv]에 게시한 ‘SPARSE Data, Rich Results: Few-Shot Semi-Supervised Learning via Class-Conditioned Image Translation’ 논문에 대한 자세한 리뷰입니다.
Xianpei Han이 [arXiv]에 게시한 ‘PaperRegister: Boosting Flexible-grained Paper Search via Hierarchical Register Indexing’ 논문에 대한 자세한 리뷰입니다.
Nicolas Gonthier이 [arXiv]에 게시한 ‘MAESTRO: Masked AutoEncoders for Multimodal, Multitemporal, and Multispectral Earth Observation Data’ 논문에 대한 자세한 리뷰입니다.
Mu Xu이 [arXiv]에 게시한 ‘FantasyTalking2: Timestep-Layer Adaptive Preference Optimization for Audio-Driven Portrait Animation’ 논문에 대한 자세한 리뷰입니다.
Maxime Oquab이 [arXiv]에 게시한 ‘DINOv3’ 논문에 대한 자세한 리뷰입니다.
Michal Drozdzal이 [arXiv]에 게시한 ‘Controlling Multimodal LLMs via Reward-guided Decoding’ 논문에 대한 자세한 리뷰입니다.
Xiaowan Wang이 [arXiv]에 게시한 ‘We-Math 2.0: A Versatile MathBook System for Incentivizing Visual Mathematical Reasoning’ 논문에 대한 자세한 리뷰입니다.
Shuheng Shen이 [arXiv]에 게시한 ‘UI-Venus Technical Report: Building High-performance UI Agents with RFT’ 논문에 대한 자세한 리뷰입니다.
Xiaoyu Li이 [arXiv]에 게시한 ‘ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing’ 논문에 대한 자세한 리뷰입니다.
Honghua Chen이 [arXiv]에 게시한 ‘STream3R: Scalable Sequential 3D Reconstruction with Causal Transformer’ 논문에 대한 자세한 리뷰입니다.
Giorgos Tolias이 [arXiv]에 게시한 ‘Processing and acquisition traces in visual encoders: What does CLIP know about your camera?’ 논문에 대한 자세한 리뷰입니다.
Qinghao Ye이 [arXiv]에 게시한 ‘Pass@k Training for Adaptively Balancing Exploration and Exploitation of Large Reasoning Models’ 논문에 대한 자세한 리뷰입니다.
Rui Lu이 [arXiv]에 게시한 ‘PRELUDE: A Benchmark Designed to Require Global Comprehension and Reasoning over Long Contexts’ 논문에 대한 자세한 리뷰입니다.
Quan Sun이 [arXiv]에 게시한 ‘NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale’ 논문에 대한 자세한 리뷰입니다.
Yi Yuan이 [arXiv]에 게시한 ‘HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs’ 논문에 대한 자세한 리뷰입니다.
Ziyin Zhang이 [arXiv]에 게시한 ‘From Black Box to Transparency: Enhancing Automated Interpreting Assessment with Explainable AI in College Classrooms’ 논문에 대한 자세한 ...
Zhiqiang Shen이 [arXiv]에 게시한 ‘A Survey on Diffusion Language Models’ 논문에 대한 자세한 리뷰입니다.
Gjergji Kasneci이 [arXiv]에 게시한 ‘When Explainability Meets Privacy: An Investigation at the Intersection of Post-hoc Explainability and Differential Privacy in...
Dongdong Zhang이 [arXiv]에 게시한 ‘VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models’ 논문에 대한 자세한 리뷰입니다.
Dani Lischinski이 [arXiv]에 게시한 ‘Story2Board: A Training-Free Approach for Expressive Storyboard Generation’ 논문에 대한 자세한 리뷰입니다.
Chen Li이 [arXiv]에 게시한 ‘Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation’ 논문에 대한 자세한 리뷰입니다.
Yuan Lin이 [arXiv]에 게시한 ‘Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory’ 논문에 대한 자세한 리뷰입니다.
Zeynep Akata이 [arXiv]에 게시한 ‘Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Di Zhang이 [arXiv]에 게시한 ‘Mol-R1: Towards Explicit Long-CoT Reasoning in Molecule Discovery’ 논문에 대한 자세한 리뷰입니다.
Zhihan Zhou이 [arXiv]에 게시한 ‘MathReal: We Keep It Real! A Real Scene Benchmark for Evaluating Math Reasoning in Multimodal Large Language Models’ 논문에 대한 자세한 리뷰...
Lei Fan이 [arXiv]에 게시한 ‘Learning to Align, Aligning to Learn: A Unified Approach for Self-Optimized Alignment’ 논문에 대한 자세한 리뷰입니다.
Di Zhang이 [arXiv]에 게시한 ‘IAG: Input-aware Backdoor Attack on VLMs for Visual Grounding’ 논문에 대한 자세한 리뷰입니다.
Qingnan Fan이 [arXiv]에 게시한 ‘GSFixer: Improving 3D Gaussian Splatting with Reference-Guided Video Diffusion Priors’ 논문에 대한 자세한 리뷰입니다.
Zhenghao Hu이 [arXiv]에 게시한 ‘Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation’ 논문에 대한 자세한 리뷰입니다.
Hao Zhang이 [arXiv]에 게시한 ‘Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing’ 논문에 대한 자세한 리뷰입니다.
Guiyang Hou이 [arXiv]에 게시한 ‘Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Gjergji Kasneci이 [arXiv]에 게시한 ‘Can LLM-Generated Textual Explanations Enhance Model Classification Performance? An Empirical Study’ 논문에 대한 자세한 리뷰입니다.
Jinjie Gu이 [arXiv]에 게시한 ‘AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving’ 논문에 대한 자세한 리뷰입니다.
Yong Li이 [arXiv]에 게시한 ‘AMFT: Aligning LLM Reasoners by Meta-Learning the Optimal Imitation-Exploration Balance’ 논문에 대한 자세한 리뷰입니다.
Rachid Nedjai이 [arXiv]에 게시한 ‘WGAST: Weakly-Supervised Generative Network for Daily 10 m Land Surface Temperature Estimation via Spatio-Temporal Fusion’ 논문에 대...
Jakob Engel이 [arXiv]에 게시한 ‘VertexRegen: Mesh Generation with Continuous Level of Detail’ 논문에 대한 자세한 리뷰입니다.
Kevin Galim이 [arXiv]에 게시한 ‘UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation’ 논문에 대한 자세한 리뷰입니다.
Marzyeh Ghassemi이 [arXiv]에 게시한 ‘Train Long, Think Short: Curriculum Learning for Efficient Reasoning’ 논문에 대한 자세한 리뷰입니다.
Haoran Xu이 [arXiv]에 게시한 ‘Towards Affordance-Aware Robotic Dexterous Grasping with Human-like Priors’ 논문에 대한 자세한 리뷰입니다.
Rachel Bawden이 [arXiv]에 게시한 ‘TopXGen: Topic-Diverse Parallel Data Generation for Low-Resource Machine Translation’ 논문에 대한 자세한 리뷰입니다.
Chenchen Jing이 [arXiv]에 게시한 ‘Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models’ 논문에 대한 자세한 리뷰입니다.
Zhengxi Lu이 [arXiv]에 게시한 ‘Test-Time Reinforcement Learning for GUI Grounding via Region Consistency’ 논문에 대한 자세한 리뷰입니다.
Tianbao Xie이 [arXiv]에 게시한 ‘OpenCUA: Open Foundations for Computer-Use Agents’ 논문에 대한 자세한 리뷰입니다.
Haoyue Zhan이 [arXiv]에 게시한 ‘NVSpeech: An Integrated and Scalable Pipeline for Human-Like Speech Modeling with Paralinguistic Vocalizations’ 논문에 대한 자세한 리뷰입니다.
Yuqi Li이 [arXiv]에 게시한 ‘Matrix-3D: Omnidirectional Explorable 3D World Generation’ 논문에 대한 자세한 리뷰입니다.
Qiang Ju이 [arXiv]에 게시한 ‘HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches’ 논문에 대한 자세한 리뷰입니다.
Yang Fan이 [arXiv]에 게시한 ‘GeRe: Towards Efficient Anti-Forgetting in Continual Learning of LLM via General Samples Replay’ 논문에 대한 자세한 리뷰입니다.
Xuesong Yao이 [arXiv]에 게시한 ‘Feedback-Driven Tool-Use Improvements in Large Language Models via Automated Build Environments’ 논문에 대한 자세한 리뷰입니다.
Elizabeth Karpinski이 [arXiv]에 게시한 ‘Democratizing Diplomacy: A Harness for Evaluating Any Large Language Model on Full-Press Diplomacy’ 논문에 대한 자세한 리뷰입니다.
Lukáš Burget이 [arXiv]에 게시한 ‘DeCRED: Decoder-Centric Regularization for Encoder-Decoder Based Speech Recognition’ 논문에 대한 자세한 리뷰입니다.
Yu Qiao이 [arXiv]에 게시한 ‘Cut2Next: Generating Next Shot via In-Context Tuning’ 논문에 대한 자세한 리뷰입니다.
Fei Shen이 [arXiv]에 게시한 ‘CharacterShot: Controllable and Consistent 4D Character Animation’ 논문에 대한 자세한 리뷰입니다.
Jhon Alejandro Andrade이 [arXiv]에 게시한 ‘Bridging Theory and Practice in Quantum Game Theory: Optimized Implementation of the Battle of the Sexes with Error Mit...
Arnav Arora이 [arXiv]에 게시한 ‘BiasGym: Fantastic Biases and How to Find (and Remove) Them’ 논문에 대한 자세한 리뷰입니다.
Chuyi He이 [arXiv]에 게시한 ‘Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL’ 논문에 대한 자세한 리뷰입니다.
Tao Zhang이 [arXiv]에 게시한 ‘AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators’ 논문에 대한 자세한 리뷰입니다.
Sandeep Varma이 [arXiv]에 게시한 ‘Aryabhata: An exam-focused language model for JEE Math’ 논문에 대한 자세한 리뷰입니다.
Shuai Liu이 [arXiv]에 게시한 ‘Adversarial Video Promotion Against Text-to-Video Retrieval’ 논문에 대한 자세한 리뷰입니다.
Yan Gao이 [arXiv]에 게시한 ‘WideSearch: Benchmarking Agentic Broad Info-Seeking’ 논문에 대한 자세한 리뷰입니다.
Dasol Choi이 [arXiv]에 게시한 ‘When Good Sounds Go Adversarial: Jailbreaking Audio-Language Models with Benign Inputs’ 논문에 대한 자세한 리뷰입니다.
Tong Yu이 [arXiv]에 게시한 ‘VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding’ 논문에 대한 자세한 리뷰입니다.
Jianguo Zhang이 [arXiv]에 게시한 ‘UserBench: An Interactive Gym Environment for User-Centric Agents’ 논문에 대한 자세한 리뷰입니다.
Qiufeng Wang이 [arXiv]에 게시한 ‘Temporal Self-Rewarding Language Models: Decoupling Chosen-Rejected via Past-Future’ 논문에 대한 자세한 리뷰입니다.
Matvey Skripkin이 [arXiv]에 게시한 ‘Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences’ 논문에 대한 자세한 리뷰입니다.
Hengtao Shen이 [arXiv]에 게시한 ‘Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation’ 논문에 대한 자세한 리뷰입니다.
Qingwei Meng이 [arXiv]에 게시한 ‘Reinforcement Learning in Vision: A Survey’ 논문에 대한 자세한 리뷰입니다.
Yuchen Li이 [arXiv]에 게시한 ‘ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability’ 논문에 대한 자세한 리뷰입니다.
Jiaheng Liu이 [arXiv]에 게시한 ‘Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning’ 논문에 대한 자세한 리뷰입니다.
Hongxing Li이 [arXiv]에 게시한 ‘OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks’ 논문에 대한 자세한 리뷰입니다.
Xiaokun Feng이 [arXiv]에 게시한 ‘Omni-Effects: Unified and Spatially-Controllable Visual Effects Generation’ 논문에 대한 자세한 리뷰입니다.
Shuo Liu이 [arXiv]에 게시한 ‘MolmoAct: Action Reasoning Models that can Reason in Space’ 논문에 대한 자세한 리뷰입니다.
Jianguo Li이 [arXiv]에 게시한 ‘MoBE: Mixture-of-Basis-Experts for Compressing MoE-based LLMs’ 논문에 대한 자세한 리뷰입니다.
Baihong Yuan이 [arXiv]에 게시한 ‘Less Is More: Training-Free Sparse Attention with Global Locality for Efficient Reasoning’ 논문에 대한 자세한 리뷰입니다.
Guanting Dong이 [arXiv]에 게시한 ‘Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization’ 논문에 대한 자세한 리뷰입니다.
Tieyuan Chen이 [arXiv]에 게시한 ‘Grove MoE: Towards Efficient and Superior MoE LLMs with Adjugate Experts’ 논문에 대한 자세한 리뷰입니다.
Alexander Yavorskyi이 [arXiv]에 게시한 ‘GLiClass: Generalist Lightweight Model for Sequence Classification Tasks’ 논문에 대한 자세한 리뷰입니다.
Hongyu Liu이 [arXiv]에 게시한 ‘Follow-Your-Shape: Shape-Aware Image Editing via Trajectory-Guided Region Control’ 논문에 대한 자세한 리뷰입니다.
Reynold Cheng이 [arXiv]에 게시한 ‘Fact2Fiction: Targeted Poisoning Attack to Agentic Fact-checking System’ 논문에 대한 자세한 리뷰입니다.
Robert Kirk이 [arXiv]에 게시한 ‘Deep Ignorance: Filtering Pretraining Data Builds Tamper-Resistant Safeguards into Open-Weight LLMs’ 논문에 대한 자세한 리뷰입니다.
Zhijian Xu이 [arXiv]에 게시한 ‘Compressing Chain-of-Thought in LLMs via Step Entropy’ 논문에 대한 자세한 리뷰입니다.
Kai Zou이 [arXiv]에 게시한 ‘BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent’ 논문에 대한 자세한 리뷰입니다.
Mohit Bansal이 [arXiv]에 게시한 ‘Bifrost-1: Bridging Multimodal LLMs and Diffusion Models with Patch-level CLIP Latents’ 논문에 대한 자세한 리뷰입니다.
Xinhao Yi이 [arXiv]에 게시한 ‘A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems’ 논문에 대한 자세...
jgkwak이 [arXiv]에 게시한 ‘Voost: A Unified and Scalable Diffusion Transformer for Bidirectional Virtual Try-On and Try-Off’ 논문에 대한 자세한 리뷰입니다.
Bingqi Chen이 [arXiv]에 게시한 ‘UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding’ 논문에 대한 자세한 리뷰입니다.
Chengcheng Wan이 [arXiv]에 게시한 ‘Pruning the Unsurprising: Efficient Code Reasoning via First-Token Surprisal’ 논문에 대한 자세한 리뷰입니다.
Yi Yang이 [arXiv]에 게시한 ‘MeshLLM: Empowering Large Language Models to Progressively Understand and Generate 3D Mesh’ 논문에 대한 자세한 리뷰입니다.
Shuofei Qiao이 [arXiv]에 게시한 ‘Memp: Exploring Agent Procedural Memory’ 논문에 대한 자세한 리뷰입니다.
Guohang Yan이 [arXiv]에 게시한 ‘MELLA: Bridging Linguistic Capability and Cultural Groundedness for Low-Resource Language MLLMs’ 논문에 대한 자세한 리뷰입니다.
Shubham Tulsiani이 [arXiv]에 게시한 ‘LightSwitch: Multi-view Relighting with Material-guided Diffusion’ 논문에 대한 자세한 리뷰입니다.
Pengxiang Li이 [arXiv]에 게시한 ‘InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization’ 논문에 대한 자세한 리뷰입니다.
GLM-4. 5 Team이 [arXiv]에 게시한 ‘GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models’ 논문에 대한 자세한 리뷰입니다.
Przemysław Spurek이 [arXiv]에 게시한 ‘GENIE: Gaussian Encoding for Neural Radiance Fields Interactive Editing’ 논문에 대한 자세한 리뷰입니다.
Eleni Chatzi이 [arXiv]에 게시한 ‘Adapting Vision-Language Models Without Labels: A Comprehensive Survey’ 논문에 대한 자세한 리뷰입니다.
Ruolin Shen이 [arXiv]에 게시한 ‘Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling’ 논문에 대한 자세한 리뷰입...
Xiaobin Hu이 [arXiv]에 게시한 ‘StrandDesigner: Towards Practical Strand Generation with Sketch Guidance’ 논문에 대한 자세한 리뷰입니다.
Yifei Ji이 [arXiv]에 게시한 ‘Steering One-Step Diffusion Model with Fidelity-Rich Decoder for Fast Image Compression’ 논문에 대한 자세한 리뷰입니다.
Jian Yang이 [arXiv]에 게시한 ‘RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation’ 논문에 대한 자세한 리뷰입니다.
Xiao Yu이 [arXiv]에 게시한 ‘REINA: Regularized Entropy Information-Based Loss for Efficient Simultaneous Speech Translation’ 논문에 대한 자세한 리뷰입니다.
Zongxia Li이 [arXiv]에 게시한 ‘R-Zero: Self-Evolving Reasoning LLM from Zero Data’ 논문에 대한 자세한 리뷰입니다.
Prajit Das이 [arXiv]에 게시한 ‘PRvL: Quantifying the Capabilities and Risks of Large Language Models for PII Redaction’ 논문에 대한 자세한 리뷰입니다.
Xinyu Ye이 [arXiv]에 게시한 ‘On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification’ 논문에 대한 자세한 리뷰입니다.
Qingjuan Li이 [arXiv]에 게시한 ‘Marco-Voice Technical Report’ 논문에 대한 자세한 리뷰입니다.
Xudong Jiang이 [arXiv]에 게시한 ‘MOSEv2: A More Challenging Dataset for Video Object Segmentation in Complex Scenes’ 논문에 대한 자세한 리뷰입니다.
Zhijie Sang이 [arXiv]에 게시한 ‘InfiAlign: A Scalable and Sample-Efficient Framework for Aligning LLMs to Enhance Reasoning Capabilities’ 논문에 대한 자세한 리뷰입니다.
Chirag Shah이 [arXiv]에 게시한 ‘I Think, Therefore I Am Under-Qualified? A Benchmark for Evaluating Linguistic Shibboleth Detection in LLM Hiring Evaluations’ 논문에...
Chao Wang이 [arXiv]에 게시한 ‘I2CR: Intra- and Inter-modal Collaborative Reflections for Multimodal Entity Linking’ 논문에 대한 자세한 리뷰입니다.
Reshmi Ghosh이 [arXiv]에 게시한 ‘Hop, Skip, and Overthink: Diagnosing Why Reasoning Models Fumble during Multi-Hop Analysis’ 논문에 대한 자세한 리뷰입니다.
Zhibing Li이 [arXiv]에 게시한 ‘Hi3DEval: Advancing 3D Generation Evaluation with Hierarchical Validity’ 논문에 대한 자세한 리뷰입니다.
Shengcong Chen이 [arXiv]에 게시한 ‘Genie Envisioner: A Unified World Foundation Platform for Robotic Manipulation’ 논문에 대한 자세한 리뷰입니다.
Feng Chen이 [arXiv]에 게시한 ‘Evaluating, Synthesizing, and Enhancing for Customer Support Conversation’ 논문에 대한 자세한 리뷰입니다.
Fangzhou Yao이 [arXiv]에 게시한 ‘Don’t Overthink It: A Survey of Efficient R1-style Large Reasoning Models’ 논문에 대한 자세한 리뷰입니다.
Ziming Wang이 [arXiv]에 게시한 ‘DeepPHY: Benchmarking Agentic VLMs on Physical Reasoning’ 논문에 대한 자세한 리뷰입니다.
Taiwei Shi이 [arXiv]에 게시한 ‘CoAct-1: Computer-using Agents with Coding as Actions’ 논문에 대한 자세한 리뷰입니다.
Yuan Wu이 [arXiv]에 게시한 ‘Can Large Multimodal Models Actively Recognize Faulty Inputs? A Systematic Evaluation Framework of Their Input Scrutiny Ability’ 논문에 대...
Junjie Yang이 [arXiv]에 게시한 ‘Are We on the Right Way for Assessing Document Retrieval-Augmented Generation?’ 논문에 대한 자세한 리뷰입니다.
Huan Liu이 [arXiv]에 게시한 ‘Are Today’s LLMs Ready to Explain Well-Being Concepts?’ 논문에 대한 자세한 리뷰입니다.
Xinyu Yang이 [arXiv]에 게시한 ‘Web-CogReasoner: Towards Knowledge-Induced Cognitive Reasoning for Web Agents’ 논문에 대한 자세한 리뷰입니다.
Maksim Nekrashevich이 [arXiv]에 게시한 ‘Training Long-Context, Multi-Turn Software Engineering Agents with Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Elisabetta Rocchetti이 [arXiv]에 게시한 ‘The Cow of Rembrandt - Analyzing Artistic Prompt Interpretation in Text-to-Image Models’ 논문에 대한 자세한 리뷰입니다.
Keyang Xuan이 [arXiv]에 게시한 ‘Sotopia-RL: Reward Design for Social Intelligence’ 논문에 대한 자세한 리뷰입니다.
Ambuj Mehrish이 [arXiv]에 게시한 ‘SonicMaster: Towards Controllable All-in-One Music Restoration and Mastering’ 논문에 대한 자세한 리뷰입니다.
Hao Huang이 [arXiv]에 게시한 ‘Sel3DCraft: Interactive Visual Prompts for User-Friendly Text-to-3D Generation’ 논문에 대한 자세한 리뷰입니다.
Yunxin Liu이 [arXiv]에 게시한 ‘Sculptor: Empowering LLMs with Cognitive Agency via Active Context Management’ 논문에 대한 자세한 리뷰입니다.
Xiaoyi Dong이 [arXiv]에 게시한 ‘SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience’ 논문에 대한 자세한 리뷰입니다.
Haozhe Zhang이 [arXiv]에 게시한 ‘Reasoning Language Models for Root Cause Analysis in 5G Wireless Networks’ 논문에 대한 자세한 리뷰입니다.
Kechi Zhang이 [arXiv]에 게시한 ‘RL-PLUS: Countering Capability Boundary Collapse of LLMs in Reinforcement Learning with Hybrid-policy Optimization’ 논문에 대한 자세한 리뷰입...
Jiaying Wu이 [arXiv]에 게시한 ‘Position: The Current AI Conference Model is Unsustainable! Diagnosing the Crisis of Centralized AI Conference’ 논문에 대한 자세한 리뷰입니다.
MaziyarPanahi이 [arXiv]에 게시한 ‘OpenMed NER: Open-Source, Domain-Adapted State-of-the-Art Transformers for Biomedical NER Across 12 Public Datasets’ 논문에 대한 자세한 ...
Yadong Niu이 [arXiv]에 게시한 ‘MiDashengLM: Efficient Audio Understanding with General Audio Captions’ 논문에 대한 자세한 리뷰입니다.
Liang Xu이 [arXiv]에 게시한 ‘Light-IF: Endowing LLMs with Generalizable Reasoning via Preview and Self-Checking for Complex Instruction Following’ 논문에 대한 자세한 리뷰입니다.
Yuqing Yang이 [arXiv]에 게시한 ‘LeanK: Learnable K Cache Channel Pruning for Efficient Decoding’ 논문에 대한 자세한 리뷰입니다.
Tianpeng Lv이 [arXiv]에 게시한 ‘LaTCoder: Converting Webpage Design to Code with Layout-as-Thought’ 논문에 대한 자세한 리뷰입니다.
Zhen Tan이 [arXiv]에 게시한 ‘Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens’ 논문에 대한 자세한 리뷰입니다.
Ling-I Wu이 [arXiv]에 게시한 ‘IFDECORATOR: Wrapping Instruction Following Reinforcement Learning with Verifiable Rewards’ 논문에 대한 자세한 리뷰입니다.
Dmytro Fishman이 [arXiv]에 게시한 ‘IAUNet: Instance-Aware U-Net’ 논문에 대한 자세한 리뷰입니다.
Hongsheng Li이 [arXiv]에 게시한 ‘HPSv3: Towards Wide-Spectrum Human Preference Score’ 논문에 대한 자세한 리뷰입니다.
Feng Zhao이 [arXiv]에 게시한 ‘Gaussian Variation Field Diffusion for High-fidelity Video-to-4D Synthesis’ 논문에 대한 자세한 리뷰입니다.
Ruslan Rakhimov이 [arXiv]에 게시한 ‘Enhancing Vision-Language Model Training with Reinforcement Learning in Synthetic Worlds for Real-World Success’ 논문에 대한 자세한 리뷰...
Yue Hou이 [arXiv]에 게시한 ‘Efficient Agents: Building Effective Agents While Reducing Cost’ 논문에 대한 자세한 리뷰입니다.
Dong Chen이 [arXiv]에 게시한 ‘EVOC2RUST: A Skeleton-guided Framework for Project-Level C-to-Rust Translation’ 논문에 대한 자세한 리뷰입니다.
Chao Liang이 [arXiv]에 게시한 ‘DreamVVT: Mastering Realistic Video Virtual Try-On in the Wild via a Stage-Wise Diffusion Transformer Framework’ 논문에 대한 자세한 리뷰입니다.
Donghyeon Lee이 [arXiv]에 게시한 ‘CoTox: Chain-of-Thought-Based Molecular Toxicity Reasoning and Prediction’ 논문에 대한 자세한 리뷰입니다.
Jinbao Wang이 [arXiv]에 게시한 ‘C3D-AD: Toward Continual 3D Anomaly Detection via Kernel Attention with Learnable Advisor’ 논문에 대한 자세한 리뷰입니다.
Zilong Wang이 [arXiv]에 게시한 ‘Agent Lightning: Train ANY AI Agents with Reinforcement Learning’ 논문에 대한 자세한 리뷰입니다.
Jianke Zhu이 [arXiv]에 게시한 ‘A Coarse-to-Fine Approach to Multi-Modality 3D Occupancy Grounding’ 논문에 대한 자세한 리뷰입니다.
Yanzhen Zou이 [arXiv]에 게시한 ‘Tool-integrated Reinforcement Learning for Repo Deep Search’ 논문에 대한 자세한 리뷰입니다.
Aman Chadha이 [arXiv]에 게시한 ‘TRACEALIGN – Tracing the Drift: Attributing Alignment Failures to Training-Time Belief Sources in LLMs’ 논문에 대한 자세한 리뷰입니다.
Tianyidan Xie이 [arXiv]에 게시한 ‘Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation’ 논문에 대한 자세한 리뷰입니다.
Fan Xia이 [arXiv]에 게시한 ‘Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference’ 논문에 대한 자세한 리뷰입니다.
Mike Zheng Shou이 [arXiv]에 게시한 ‘Multi-human Interactive Talking Dataset’ 논문에 대한 자세한 리뷰입니다.
Chenyang Si이 [arXiv]에 게시한 ‘LongVie: Multimodal-Guided Controllable Ultra-Long Video Generation’ 논문에 대한 자세한 리뷰입니다.
Yaojie Lu이 [arXiv]에 게시한 ‘LiveMCPBench: Can Agents Navigate an Ocean of MCP Tools?’ 논문에 대한 자세한 리뷰입니다.
Shunyu Yao이 [arXiv]에 게시한 ‘LAMIC: Layout-Aware Multi-Image Composition via Scalability of Multimodal Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.
Jui-Hui Chung이 [arXiv]에 게시한 ‘Goedel-Prover-V2: Scaling Formal Theorem Proving with Scaffolded Data Synthesis and Self-Correction’ 논문에 대한 자세한 리뷰입니다.
Songyang Gao이 [arXiv]에 게시한 ‘CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward’ 논문에 대한 자세한 리뷰입니다.
Gunhee Kim이 [arXiv]에 게시한 ‘ChartCap: Mitigating Hallucination of Dense Chart Captioning’ 논문에 대한 자세한 리뷰입니다.
Jiwei Li이 [arXiv]에 게시한 ‘CRINN: Contrastive Reinforcement Learning for Approximate Nearest Neighbor Search’ 논문에 대한 자세한 리뷰입니다.
Aman Chadha이 [arXiv]에 게시한 ‘AlignGuard-LoRA: Alignment-Preserving Fine-Tuning via Fisher-Guided Decomposition and Riemannian-Geodesic Collision Regularization...
Bin Jia이 [arXiv]에 게시한 ‘VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo’ 논문에 대한 자세한 리뷰입니다.
Liyan Xu이 [arXiv]에 게시한 ‘SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension’ 논문에 대한 자세한 리뷰입니다.
Junkun Hong이 [arXiv]에 게시한 ‘RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems’ 논문에 대한 자세한 리뷰입니다.
Kaiyuan Gao이 [arXiv]에 게시한 ‘Qwen-Image Technical Report’ 논문에 대한 자세한 리뷰입니다.
Kaidong Yu이 [arXiv]에 게시한 ‘Personalized Safety Alignment for Text-to-Image Diffusion Models’ 논문에 대한 자세한 리뷰입니다.
Anu Vellore이 [arXiv]에 게시한 ‘Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report’ 논문에 대한 자세한 리뷰입니다.
Yang Tian이 [arXiv]에 게시한 ‘InstructVLA: Vision-Language-Action Instruction Tuning from Understanding to Manipulation’ 논문에 대한 자세한 리뷰입니다.
Jesse Roberts이 [arXiv]에 게시한 ‘Exploitation Is All You Need… for Exploration’ 논문에 대한 자세한 리뷰입니다.
Zijian Wang이 [arXiv]에 게시한 ‘Cyber-Zero: Training Cybersecurity Agents without Runtime’ 논문에 대한 자세한 리뷰입니다.
Daniel Shao이 [arXiv]에 게시한 ‘CellForge: Agentic Design of Virtual Cell Models’ 논문에 대한 자세한 리뷰입니다.
Jiaqing Liang이 [arXiv]에 게시한 ‘Beyond the Trade-off: Self-Supervised Reinforcement Learning for Reasoning Models’ Instruction Following’ 논문에 대한 자세한 리뷰입니다.
Zhiwei Zhang이 [arXiv]에 게시한 ‘AgentTTS: Large Language Model Agent for Test-time Compute-optimal Scaling Strategy in Complex Tasks’ 논문에 대한 자세한 리뷰입니다.
Zuxuan Wu이 [arXiv]에 게시한 ‘A Glimpse to Compress: Dynamic Visual Token Pruning for Large Vision-Language Models’ 논문에 대한 자세한 리뷰입니다.
Long Chen이 [arXiv]에 게시한 ‘SpA2V: Harnessing Spatial Auditory Cues for Audio-driven Spatially-aware Video Generation’ 논문에 대한 자세한 리뷰입니다.
Heng Lian이 [arXiv]에 게시한 ‘SWE-Exp: Experience-Driven Software Issue Resolution’ 논문에 대한 자세한 리뷰입니다.
Heng Lian이 [arXiv]에 게시한 ‘SWE-Debate: Competitive Multi-Agent Debate for Software Issue Resolution’ 논문에 대한 자세한 리뷰입니다.
Limin Wang이 [arXiv]에 게시한 ‘PixNerd: Pixel Neural Field Diffusion’ 논문에 대한 자세한 리뷰입니다.
Zuxuan Wu이 [arXiv]에 게시한 ‘Multimodal Referring Segmentation: A Survey’ 논문에 대한 자세한 리뷰입니다.
Chengfei Lv이 [arXiv]에 게시한 ‘Learning an Efficient Multi-Turn Dialogue Evaluator from Multiple Judges’ 논문에 대한 자세한 리뷰입니다.
Fatemeh Jamshidi이 [arXiv]에 게시한 ‘Investigating Hallucination in Conversations for Low Resource Languages’ 논문에 대한 자세한 리뷰입니다.
Jianjiang Feng이 [arXiv]에 게시한 ‘IGL-Nav: Incremental 3D Gaussian Localization for Image-goal Navigation’ 논문에 대한 자세한 리뷰입니다.
Jiaqi Wang이 [arXiv]에 게시한 ‘Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models’ 논문에 대한 자세한 리뷰입니다.
Hao Tang이 [arXiv]에 게시한 ‘3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding’ 논문에 대한 자세한 리뷰입니다.
Kaixin Wang이 [arXiv]에 게시한 ‘villa-X: Enhancing Latent Action Modeling in Vision-Language-Action Models’ 논문에 대한 자세한 리뷰입니다.
Abdelrahman Mohamed이 [arXiv]에 게시한 ‘iLRM: An Iterative Large 3D Reconstruction Model’ 논문에 대한 자세한 리뷰입니다.
Jiasheng Tang이 [arXiv]에 게시한 ‘TARS: MinMax Token-Adaptive Preference Strategy for Hallucination Reduction in MLLMs’ 논문에 대한 자세한 리뷰입니다.
Zhicheng Jiang이 [arXiv]에 게시한 ‘Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving’ 논문에 대한 자세한 리뷰입니다.
Anji Liu이 [arXiv]에 게시한 ‘Scalable Multi-Task Reinforcement Learning for Generalizable Spatial Intelligence in Visuomotor Agents’ 논문에 대한 자세한 리뷰입니다.
Jian Wu이 [arXiv]에 게시한 ‘RecGPT Technical Report’ 논문에 대한 자세한 리뷰입니다.
Kai Qiu이 [arXiv]에 게시한 ‘Phi-Ground Tech Report: Advancing Perception in GUI Grounding’ 논문에 대한 자세한 리뷰입니다.
Jack Lindsey이 [arXiv]에 게시한 ‘Persona Vectors: Monitoring and Controlling Character Traits in Language Models’ 논문에 대한 자세한 리뷰입니다.
Eric C. Larson이 [arXiv]에 게시한 ‘On the Expressiveness of Softmax Attention: A Recurrent Neural Network Perspective’ 논문에 대한 자세한 리뷰입니다.
ZeSheng Wang이 [arXiv]에 게시한 ‘NeRF Is a Valuable Assistant for 3D Gaussian Splatting’ 논문에 대한 자세한 리뷰입니다.
T. Anderson Keller이 [arXiv]에 게시한 ‘Flow Equivariant Recurrent Neural Networks’ 논문에 대한 자세한 리뷰입니다.
Abdenour Hadid이 [arXiv]에 게시한 ‘Enhanced Arabic Text Retrieval with Attentive Relevance Scoring’ 논문에 대한 자세한 리뷰입니다.
Enhong Chen이 [arXiv]에 게시한 ‘Efficient Machine Unlearning via Influence Approximation’ 논문에 대한 자세한 리뷰입니다.
Yiwen Guo이 [arXiv]에 게시한 ‘C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations’ 논문에 대한 자세한 리뷰입니다.
Abdelmalik Taleb-Ahmed이 [arXiv]에 게시한 ‘Beyond Linear Bottlenecks: Spline-Based Knowledge Distillation for Culturally Diverse Art Style Classification’ 논문에 대한 ...
Yoshitaka Ushiku이 [arXiv]에 게시한 ‘AgroBench: Vision-Language Model Benchmark in Agriculture’ 논문에 대한 자세한 리뷰입니다.