[논문리뷰] ViExam: Are Vision Language Models Better than Humans on Vietnamese Multimodal Exam Questions?
Daeyoung Kim이 [arXiv]에 게시한 ‘ViExam: Are Vision Language Models Better than Humans on Vietnamese Multimodal Exam Questions?’ 논문에 대한 자세한 리뷰입니다.
Daeyoung Kim이 [arXiv]에 게시한 ‘ViExam: Are Vision Language Models Better than Humans on Vietnamese Multimodal Exam Questions?’ 논문에 대한 자세한 리뷰입니다.
Hao Chen이 [arXiv]에 게시한 ‘Tinker: Diffusion’s Gift to 3D–Multi-View Consistent Editing From Sparse Inputs without Per-Scene Optimization’ 논문에 대한 자세한 리뷰입니다.
jiangpinliu이 [arXiv]에 게시한 ‘RynnEC: Bringing MLLMs into Embodied World’ 논문에 대한 자세한 리뷰입니다.
Shiqing Wu이 [arXiv]에 게시한 ‘Refining Contrastive Learning and Homography Relations for Multi-Modal Recommendation’ 논문에 대한 자세한 리뷰입니다.
Haobo Xu이 [arXiv]에 게시한 ‘Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs’ 논문에 대한 자세한 리뷰입니다.