내년부터 자연어 검색서비스 도입으로 통계청 국가통계포털(KOSIS) 이용이 더욱 쉽고 편리해질 전망이다. “합계출산율을 1970년부터 지금까지 찾아줘” “에너지 절약형 축열식 전기난방기를 만들려고 하는데 관련 통계를 못 찾겠어”와 같은 자연어로 질문을 하면 원하는 답변을 얻을 수 있게 된다.
통계청이 내년 초거대AI 기반 대국민 챗봇 '통계비서' 서비스를 시작, 통계 활용 대중화 시대를 연다. 당장 단기모델을 출시해 '유사통계 비교' '통계해석' 등 전문적 질문에 정확한 답변을 생성한다. 중장기모델은 마이크로데이터(원자료)·내부자료까지 학습해 통계조사보고서 초안까지 작성해 줄 전망이다. 지금까지 다소 어려운 통계 용어와 분류체계 등으로 통계 이용을 꺼리게 만들었던 장벽이 획기적으로 낮아질 것이라고 통계청은 기대하고 있다.
통계청은 9월 1일 '통계의 날'을 앞두고 초거대AI 기반 챗봇 '통계비서' 단계별 추진계획과 주요 활용 시나리오를 공개했다.
'디지털플랫폼정부 구현'을 국정과제로 내건 정부가 내년도 인공지능(AI) 관련 예산을 15.8% 증액해 '초거대AI 기반 전문가 서비스'를 개발한다는 청사진을 제시했다. 통계청은 초거대AI가 국민 일상생활 편의와 산업 경쟁력을 획기적으로 혁신한다는 점에 주목하고 맞춤형 통계정보서비스를 구현한다.
통계청은 내년 단기모델로 초거대언어모델(LLM) 기반의 전문적 통계활용을 지원할 챗봇을 구축해 본격 서비스한다. 국산 LLM 파운데이션 모델을 활용, 통계활용 목적에 맞춰 이용자의 전문적 질의에 답변하도록 한다. 생성형 AI의 약점인 환각 문제를 예방하기 위해 통계청이 제시한 데이터베이스(DB) 범위를 벗어나는 답변을 생성하지 않도록 팩트체크 로직을 별도로 개발한다.
통계비서 단기모델은 통계추천 및 분석지원서비스, 통계 전문질의 답변 서비스까지 제공할 것으로 기대된다. 이용자가 사용 목적을 제시하면, 통계설명자료와 통계표 목록, 통계활용 내역 등 방대한 메타데이터를 바탕으로 가장 적합한 통계자료의 추천과 접근경로를 제공한다. 또 적합한 자료 분석 방법을 제공하고 실제 통계량을 사용한 분석결과 제시도 가능하다.
통계비서 중장기모델은 학습데이터를 원자료와 내부자료까지 확대해 더 깊이 있고 전문적인 통계서비스가 될 것으로 보인다. 그동안 전문가들이 세스(SAS)나 알(R) 등 관련 통계 전문 패키지를 이용해야 분석할 수 있었던 영역까지 일반인도 통계 분석이 가능해 진다. 뿐만 아니라 일반인들이 쉽게 이해할 수 있도록 목적과 의도에 따라 가장 적합한 시각화 방식을 찾아내서 그래프, 지도, 인포그래픽 등을 추천해준다.
통계청 관계자는 “이번 사업이 완성되면 '세종시 대평동에서 가게를 열려고 하는데 어떤 업종이 좋을까?' '새로 오픈한 헬스장을 홍보하려고 하는데 전단지는 언제, 어디서 돌리지?'와 같은 마케팅, 상권분석, 이사 등 실생활에서 늘상 맞닥뜨리는 의사결정 문제에서 데이터 기반 결론을 내릴 수 있도록 지원할 수 있게 된다”고 설명했다.
이준희 기자 jhlee@etnews.com
-
이준희 기자기사 더보기