secrett2633's blog

[논문리뷰] WideSearch: Benchmarking Agentic Broad Info-Seeking

August 12, 2025

Yan Gao이 [arXiv]에 게시한 ‘WideSearch: Benchmarking Agentic Broad Info-Seeking’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] When Good Sounds Go Adversarial: Jailbreaking Audio-Language Models with Benign Inputs

August 12, 2025

Dasol Choi이 [arXiv]에 게시한 ‘When Good Sounds Go Adversarial: Jailbreaking Audio-Language Models with Benign Inputs’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding

August 12, 2025

Tong Yu이 [arXiv]에 게시한 ‘VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] UserBench: An Interactive Gym Environment for User-Centric Agents

August 12, 2025

Jianguo Zhang이 [arXiv]에 게시한 ‘UserBench: An Interactive Gym Environment for User-Centric Agents’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] Temporal Self-Rewarding Language Models: Decoupling Chosen-Rejected via Past-Future

August 12, 2025

Qiufeng Wang이 [arXiv]에 게시한 ‘Temporal Self-Rewarding Language Models: Decoupling Chosen-Rejected via Past-Future’ 논문에 대한 자세한 리뷰입니다.

Recent Posts

[논문리뷰] WideSearch: Benchmarking Agentic Broad Info-Seeking

[논문리뷰] When Good Sounds Go Adversarial: Jailbreaking Audio-Language Models with Benign Inputs

[논문리뷰] VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding

[논문리뷰] UserBench: An Interactive Gym Environment for User-Centric Agents

[논문리뷰] Temporal Self-Rewarding Language Models: Decoupling Chosen-Rejected via Past-Future