QA AI 기업 포티투마루, 컴퓨터 언어학 학회 ACL에 논문 채택

ACL(Association for Computational Linguistics) 등재 논문 일부, HCVAE 프레임워크 예시
ACL(Association for Computational Linguistics) 등재 논문 일부, HCVAE 프레임워크 예시

포티투마루(대표 김동환)의 '다양하고 일관성 있는 문맥 기반 질의응답 생성을 위한 상호정보량 극대화 계층적 HCVAE' 논문이 컴퓨터 언어학 학회인 ACL에 채택됐다.

포티투마루는 단일 문맥에서 다양한 질문-응답을 생성하기 위한 새로운 프레임워크인 HCVAE를 제안했다. 질의-응답을 쌍으로 생성하는 최초 확률론적 생성 모델이다. 극대화된 정보를 가진 문맥으로부터 다양하고 일관된 질의-응답을 생성하고 라벨링된 데이터와 라벨링 되지 않은 데이터를 동시에 학습하는 준지도학습에 특별한 성과를 보였다.

해당 프레임워크는 이전 VAE 방식으로는 불가능했던 단일 문맥 상 다양한 잠재변수를 샘플링하여 질의-응답을 생성하고, 질문과 답변 간의 공통 정보를 극대화함으로써 답변과 맥락에 의미론적으로 관련이 있고 답변이 가능한 질문을 생성할 수 있다. 이렇게 생성된 질의-응답들은 QA(Question-Answering) 모델 성능을 향상시킬 수 있다.

인공지능 기반의 언어지능 기술을 상용화하기 위해서는 학습데이터 구축이 필수이나 현재까지는 수작업에 의존하여 시간과 비용이 많이 소요되었다. 이번 연구 결과로 학습데이터 자동 생성이 가능해 짐에 따라, 금융, 의료, 법률, 특허, 철강, 건설을 비롯하여, 교통, 물류, 제조업, 농업, 교육 등의 산업 전 분야에 걸쳐 기계독해(MRC) 기반의 질의-응답(Question-Answering) 시스템을 저비용으로 신속하게 도입이 가능하게 됐다.

김동환 포티투마루 대표는 “세계 수준 기술 리더십을 다시 한번 확인했다”며 “기계독해 외에도, 기계 번역, 음성 인식, 생성 요약 등 다양한 언어 지능 분야 학습 데이터 자동 생성에도 응용 가능할 것으로 기대된다”고 말했다.

이현수기자 hsool@etnews.com