[논문리뷰] SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction

2025년 9월 3일수정: 2025년 9월 3일

링크: 논문 PDF로 바로 열기

저자: Saumya Chaturvedi, Aman Chadha, Laurent Bindschaedler

핵심 연구 목표

본 논문은 자연어 질의를 SQL 쿼리로 변환하는 Text-to-SQL (NL2SQL) 시스템의 견고성과 신뢰성을 향상시키는 것을 목표로 합니다. 특히, 기존 시스템들이 실행 기반 피드백에만 의존하여 논리적으로 부정확하지만 문법적으로 유효한 SQL 쿼리 오류를 수정하지 못하는 한계를 극복하고자 합니다. 이를 위해 다중 에이전트 프레임워크와 가이드된 오류 수정 메커니즘을 통합합니다.

핵심 방법론

SQL-of-Thought는 Schema Linking, Subproblem Identification, Chain-of-Thought (CoT) 기반의 Query Plan Generation, SQL Generation 및 Guided Correction Loop로 구성된 다중 에이전트 프레임워크입니다. 오류 수정 단계에서는 9가지 카테고리, 31가지 하위 카테고리로 분류된 **오류 분류 체계(Error Taxonomy)**를 활용하여 LLM이 실행 오류를 넘어 스키마 불일치, 조인 불일치, 집계 오용 등 논리적 오류의 근본 원인을 식별하고 수정하도록 안내합니다.

주요 결과

본 프레임워크는 Spider 벤치마크 및 그 변형에서 최첨단 실행 정확도를 달성했습니다. Spider [22]에서 91.59%, Spider-Realistic [3]에서 90.16%, Spider-SYN [4]에서 **82.01%**의 실행 정확도를 기록했습니다. 또한, 오류 수정 루프가 정확도를 8-10% 향상시키고, 쿼리 계획 생성이 최소 5%의 정확도 향상에 기여했음을 어블레이션 연구를 통해 입증했습니다.

AI 실무자를 위한 시사점

Text-to-SQL 시스템 개발 시, 단순 실행 결과를 넘어 구조화된 오류 분류 체계와 CoT 기반 교정 루프를 도입하여 시스템의 견고성과 신뢰성을 크게 높일 수 있습니다. 또한, 다중 에이전트 아키텍처와 단계별 쿼리 계획 수립이 LLM의 성능을 최적화하고 환각을 줄이는 데 효과적입니다. 추론 집약적 에이전트에는 Claude Opus 3와 같은 고성능 LLM을, 다른 에이전트에는 저비용 모델을 사용하는 하이브리드 전략을 통해 비용 효율적인 배포가 가능함을 시사합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.