[논문리뷰] TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling
Juhan Nam이 [arXiv]에 게시한 ‘TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling’ 논문에 대한 자세한 리뷰입니다.
Juhan Nam이 [arXiv]에 게시한 ‘TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling’ 논문에 대한 자세한 리뷰입니다.
Shuo Wang이 [arXiv]에 게시한 ‘SurveyBench: How Well Can LLM(-Agents) Write Academic Surveys?’ 논문에 대한 자세한 리뷰입니다.
Zhonghao Zhang이 [arXiv]에 게시한 ‘SpineBench: A Clinically Salient, Level-Aware Benchmark Powered by the SpineMed-450k Corpus’ 논문에 대한 자세한 리뷰입니다.
Yapeng Tian이 [arXiv]에 게시한 ‘Self-Improvement in Multimodal Large Language Models: A Survey’ 논문에 대한 자세한 리뷰입니다.
이 [arXiv]에 게시한 ‘Scaling Policy Compliance Assessment in Language Models with Policy Reasoning Traces’ 논문에 대한 자세한 리뷰입니다.