secrett2633's blog

[논문리뷰] Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents

September 12, 2025

Xintao Wang이 [arXiv]에 게시한 ‘Harnessing Uncertainty: Entropy-Modulated Policy Gradients for Long-Horizon LLM Agents’ 논문에 대한 자세한 리뷰입니다.

September 12, 2025

Kaicheng Yang이 [arXiv]에 게시한 ‘Gradient-Attention Guided Dual-Masking Synergetic Framework for Robust Text-based Person Retrieval’ 논문에 대한 자세한 리뷰입니다.

September 12, 2025

Shuai Bai이 [arXiv]에 게시한 ‘FLUX-Reason-6M & PRISM-Bench: A Million-Scale Text-to-Image Reasoning Dataset and Comprehensive Benchmark’ 논문에 대한 자세한 리뷰입니다.

September 12, 2025

Kaiqi Kou이 [arXiv]에 게시한 ‘EchoX: Towards Mitigating Acoustic-Semantic Gap via Echo Training for Speech-to-Speech LLMs’ 논문에 대한 자세한 리뷰입니다.

September 12, 2025

Hui Han이 [arXiv]에 게시한 ‘Can Understanding and Generation Truly Benefit Together – or Just Coexist?’ 논문에 대한 자세한 리뷰입니다.