secrett2633's blog

[논문리뷰] Visual Jigsaw Post-Training Improves MLLMs

September 30, 2025

Lewei Lu이 [arXiv]에 게시한 ‘Visual Jigsaw Post-Training Improves MLLMs’ 논문에 대한 자세한 리뷰입니다.

September 30, 2025

Wei Jia이 [arXiv]에 게시한 ‘StableToken: A Noise-Robust Semantic Speech Tokenizer for Resilient SpeechLLMs’ 논문에 대한 자세한 리뷰입니다.

September 30, 2025

이 [arXiv]에 게시한 ‘SLA: Beyond Sparsity in Diffusion Transformers via Fine-Tunable Sparse-Linear Attention’ 논문에 대한 자세한 리뷰입니다.

September 30, 2025

이 [arXiv]에 게시한 ‘SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer’ 논문에 대한 자세한 리뷰입니다.

September 30, 2025

Yuran Wang이 [arXiv]에 게시한 ‘RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark’ 논문에 대한 자세한 리뷰입니다.