[๋ ผ๋ฌธ๋ฆฌ๋ทฐ] Multi-human Interactive Talking Dataset
Mike Zheng Shou์ด [arXiv]์ ๊ฒ์ํ โMulti-human Interactive Talking Datasetโ ๋ ผ๋ฌธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ์ ๋๋ค.
Mike Zheng Shou์ด [arXiv]์ ๊ฒ์ํ โMulti-human Interactive Talking Datasetโ ๋ ผ๋ฌธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ์ ๋๋ค.
Chenyang Si์ด [arXiv]์ ๊ฒ์ํ โLongVie: Multimodal-Guided Controllable Ultra-Long Video Generationโ ๋ ผ๋ฌธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ์ ๋๋ค.
Yaojie Lu์ด [arXiv]์ ๊ฒ์ํ โLiveMCPBench: Can Agents Navigate an Ocean of MCP Tools?โ ๋ ผ๋ฌธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ์ ๋๋ค.
Shunyu Yao์ด [arXiv]์ ๊ฒ์ํ โLAMIC: Layout-Aware Multi-Image Composition via Scalability of Multimodal Diffusion Transformerโ ๋ ผ๋ฌธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ์ ๋๋ค.
Jui-Hui Chung์ด [arXiv]์ ๊ฒ์ํ โGoedel-Prover-V2: Scaling Formal Theorem Proving with Scaffolded Data Synthesis and Self-Correctionโ ๋ ผ๋ฌธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ์ ๋๋ค.