[논문리뷰] ST-Raptor: LLM-Powered Semi-Structured Table Question Answering
링크: 논문 PDF로 바로 열기
저자: Zirui Tang, Boxiu Li, Guoliang Li, Boyu Niu, Wei Zhou, Xinyi Zhang, Xuanhe Zhou, Jiannan Wang, Fan Wu
핵심 연구 목표
본 논문은 금융 보고서나 의료 기록과 같이 유연하고 복잡한 레이아웃(계층적 헤더, 병합된 셀 등)을 가진 **반정형 테이블(semi-structured table)**에 대한 질의응답(QA) 문제를 해결하는 것을 목표로 합니다. 기존 NL2SQL 및 멀티모달 LLM QA 방법론이 정보 손실이나 복잡한 레이아웃 이해 부족으로 인해 정확도가 낮은 한계를 극복하고자 합니다.
핵심 방법론
ST-Raptor는 대규모 언어 모델(LLM)을 활용한 트리 기반 프레임워크를 제안합니다. 복잡한 테이블 레이아웃을 포착하는 계층적 직교 트리(HO-Tree) 구조 모델과 이를 구축하는 효과적인 알고리즘을 도입하고, LLM이 일반적인 QA 작업을 실행하도록 안내하는 기본 트리 연산 세트를 정의합니다. 사용자 질문을 하위 질문으로 분해하고, 해당 트리 연산 파이프라인을 생성하며, 정확한 실행을 위해 **연산-테이블 정렬(operation-table alignment)**을 수행합니다. 또한, 실행 단계의 정확성을 확인하는 **전방 검증(forward validation)**과 답변 신뢰도를 평가하는 **후방 검증(backward validation)**을 포함한 2단계 검증 메커니즘을 통합합니다.
주요 결과
ST-Raptor는 102개의 실제 반정형 테이블과 764개의 질문으로 구성된 SSTQA라는 새로운 데이터셋을 구축했습니다. 실험 결과, ST-Raptor는 9가지 기준선 대비 최대 20% 높은 답변 정확도를 달성했습니다. 특히, SSTQA 벤치마크에서 **72.39%**의 정확도로 두 번째로 우수한 방법론보다 10.23% 높은 성능을 보였으며, 복잡도가 높은 "hard" 케이스에서도 **58.43%**의 정확도로 뛰어난 성능을 입증했습니다.
AI 실무자를 위한 시사점
ST-Raptor는 실제 AI/ML 애플리케이션에서 흔히 접하는 복잡한 반정형 테이블 데이터 처리의 효율성과 정확성을 크게 향상시킬 수 있는 실용적인 솔루션을 제시합니다. HO-Tree를 통한 구조화된 데이터 표현과 파이프라인 기반 질의응답 방식은 LLM의 환각(hallucination)을 줄이고 추론 과정을 투명하게 만들어 신뢰도를 높입니다. 이는 금융, 의료, 전자상거래 등 다양한 분야에서 데이터 분석 및 의사결정 자동화에 기여할 수 있습니다.
⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.