IT

두나무 머신러닝팀, 국제전산언어학술대회 '콜링'서 텍스트-SQL 변환 기술 발표

선재관 기자 2025-01-23 08:25:15
세계 최고 권위 전산언어학회서 연구 성과 발표...글로벌 기술 경쟁력 입증 다중 프롬프트 기법 활용, LLM 기반 텍스트-SQL 변환 성능 향상 방안 제시
이동준 두나무 머신러닝팀장이 지난 21일(현지 시각) 아랍에미레이트(UAE) 아부다비 ADNEC에서 열린 ‘제31회 국제 전산언어 학술대회(COLING 2025)’ 메인 콘퍼런스에서 논문 발표를 하고 있다.[사진=두나무]
[이코노믹데일리] 블록체인 및 핀테크 전문기업 두나무(대표 이석우)는 세계 최고 수준의 국제전산언어학술대회인 '콜링 2025(COLING 2025)'에서 머신러닝(ML)팀의 텍스트-SQL(구조화된 질의 언어) 변환 관련 연구 논문을 발표하며 기술적 우수성을 인정받았다고 23일 밝혔다.

'콜링(COLING)'은 자연어 처리(NLP)와 전산언어학 분야에서 세계적으로 권위 있는 학회 중 하나로 제출된 전체 논문의 30% 정도만 채택될 정도로 심사 기준이 엄격하다. 구글 스칼라(Google Scholar)가 선정한 전산 언어학 분야 글로벌 상위 5대 학회에도 포함된다.

올해 콜링의 메인 콘퍼런스는 지난 1월 21일(현지 시각) 아랍에미리트(UAE) 아부다비 ADNEC(Abu Dhabi National Exhibition Centre)에서 개최됐다. 이 자리에서 이동준 두나무 머신러닝팀장은 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 직접 발표했다.

발표 논문 제목은 'MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법(원문 논문명: MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation)'이다. 해당 논문은 LLM(대규모 언어 모델) 기반의 텍스트-SQL 변환 성능을 향상시키는 혁신적인 방법을 제안했다.

기존 LLM은 질문 방식이나 문장 배치 순서 등에 따라 답변이 크게 달라지는 비일관성이라는 한계가 존재했다. 예를 들어 "A와 B는 같은 뜻인가요?"와 "B와 A는 같은 뜻인가요?"라는 질문에 서로 다른 답변을 제시할 수 있다. 두나무 머신러닝팀은 이러한 문제 해결을 위해 다중 프롬프트 기법을 도입, 여러 SQL 후보를 생성한 뒤 최적의 SQL을 선택하는 방법을 제안했다. 

이 방법은 기존 LLM의 정확도와 효율성을 동시에 향상시킬 수 있다는 연구 결과를 도출했다. 해당 모델은 지난해 1월 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하며 우수성을 입증한 바 있다.

이 팀장은 "생성형 AI와 함께 주목받는 텍스트-SQL 변환 분야에 대한 기술적 도전이 세계적으로 인정받아 기쁘다"며 "이번 연구가 AI의 실질적 활용성을 넓히는 데 기여하기를 바란다"고 소감을 밝혔다.

한편 두나무는 업비트, 증권플러스, 증권플러스 비상장을 운영하고 있다. 두나무 머신러닝팀은 주식 및 디지털 자산 시장에 활용되는 AI 모델을 연구·개발하고 있다. 지난해 11월 '콜링 2025'에서 금융 허위정보 탐지 챌린지(FMD) 1위를 차지하는 등 다방면에서 글로벌 연구 역량을 인정받고 있다.