secrett2633's blog

[논문리뷰] MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

September 29, 2025

SunYuefeng이 [arXiv]에 게시한 ‘MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing’ 논문에 대한 자세한 리뷰입니다.

September 29, 2025

Peter Wonka이 [arXiv]에 게시한 ‘Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation’ 논문에 대한 자세한 리뷰입니다.

September 29, 2025

Weipeng Zhong이 [arXiv]에 게시한 ‘MesaTask: Towards Task-Driven Tabletop Scene Generation via 3D Spatial Reasoning’ 논문에 대한 자세한 리뷰입니다.

September 29, 2025

이 [arXiv]에 게시한 ‘LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.

September 29, 2025

이 [arXiv]에 게시한 ‘LongLive: Real-time Interactive Long Video Generation’ 논문에 대한 자세한 리뷰입니다.