스마트마인드, TAG 활용한 ThanoSQL 통해 LLM 한계 극복

Photo Image
ThanoSQL과 Agent, TAG 비교 예시. 사진=스마트마인드

스마트마인드는 최근 스탠포드대학교와 UC 버클리 연구진이 발표한 TAG(Table-Augmented Generation, 테이블 증강 생성) 기술을 ThanoSQL(타노시퀄)을 통해 상용화했다.

스마트마인드는 2018년부터 관련 기술을 자체 개발하기 시작해 다수의 특허를 확보해왔다. 이를 기반으로 2022년에 ThanoSQL v1.0을 런칭하고 현재 v2.0으로 상용화하여 서비스 중이다.

지난 9월 스탠포드대학교와 UC 버클리 연구진은 데이터베이스 상에서 자연어 질문에 답하기 위한 TAG에 관련한 논문을 아카이브에 게재했다. 논문에 따르면 TAG는 데이터베이스와 LLM의 추론 기능을 결합해 의미적 추론이나 데이터소스에서 직접 얻을 수 있는 것 이상의 지식을 요구하는 자연어 쿼리를 처리할 수 있는 새로운 접근 방식으로 소개한다. TAG를 활용하면 특정 쿼리에 제한되는 text-to-SQL 또는 RAG(검색증강생성)와 달리 더 넓은 범위의 쿼리를 처리할 수 있게 된다는 것이다. 즉, LLM이 가지고 있는 환각증상, 복잡한 명령이 불가능하다는 점 등의 한계점을 보완할 수 있는 획기적인 방식으로 LLM과 SQL을 결합한 TAG를 소개하고 있는 것인데, 스마트마인드는 LLM과 데이터 분석 플랫폼을 통합한 AI 플랫폼, ThanoSQL을 SaaS로 이미 상용화해 서비스하고 있다.

이 논문에 따르면 쿼리합성(사용자 질문을 실행 가능한 데이터베이스 쿼리로 변환), 쿼리실행(쿼리를 실행해 관련 데이터를 검색), 답변생성(데이터와 쿼리를 사용해 자연어 답변을 생성)하는 과정을 거쳐 “고전으로 여겨지는 최고의 수익을 올린 로맨스 영화에 대한 리뷰를 요약해줘”와 같은 단순하지만 기존의 text-to-SQL이나 LLM 기술만으로는 답변할 수 없던 질문에도 정확한 답변이 가능하다는 것이다. 즉, SQL에 LLM을 결합하면 모든 쿼리 유형에서 50% 이상의 정확도를 유지하며, 표준 기준 모델들에 비해 20%에서 65%까지 정확도가 향상된다.

스마트마인드의 ThanoSQL은 이 논문에서 언급하고 있는 TAG(LLM+SQL) 기술 뿐만 아니라 단일SQL 명령에 RAG, 외부 API, AI 등을 모두 SQL에 삽입해 보다 복잡한 명령에서도 TAG의 장점을 유지하며 올바른 답변을 제공한다.

이상수 스마트마인드 대표는 “그동안 스마트마인드가 추구해 온 방식이 이번 논문을 통해 다시 한번 입증되었다”며 “앞선 기술력을 바탕으로 관련 시장을 개척하고 선도해 나가는 기업이 되겠다”고 밝혔다.

한편, ThanoSQL은 SQL(구조화된 쿼리)에 트랜스포머 모델을 적용함으로써, 정형 데이터 뿐만 아니라 이미지, 텍스트, 영상 등 비정형 데이터까지 SQL로 처리할 수 있도록 만들고, 여기에 기업 내부망에서 동작할 수 있는 LLM을 포함한 올인원 서비스형 소프트웨어(SaaS)다.

이원지 기자 news21g@etnews.com