secrett2633's blog

[논문리뷰] On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting

August 21, 2025

Guoyin Wang이 [arXiv]에 게시한 ‘On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting’ 논문에 대한...

[논문리뷰] NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model

August 21, 2025

abercovich이 [arXiv]에 게시한 ‘NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

August 21, 2025

Jiangmiao이 [arXiv]에 게시한 ‘MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

August 21, 2025

Prathyusha Jwalapuram이 [arXiv]에 게시한 ‘MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers’ 논문에 대한 자세한 리뷰입니다.

[논문리뷰] Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer

August 21, 2025

Jeremiah Jiang이 [arXiv]에 게시한 ‘Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer’ 논문에 대한 자세한 리뷰입니다.

Recent Posts

[논문리뷰] On-Policy RL Meets Off-Policy Experts: Harmonizing Supervised Fine-Tuning and Reinforcement Learning via Dynamic Weighting

[논문리뷰] NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model

[논문리뷰] MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

[논문리뷰] MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

[논문리뷰] Local Scale Equivariance with Latent Deep Equilibrium Canonicalizer