솔트룩스(대표 이경일)가 국립국어원 '구어 자료 수집 및 원시 말뭉치 수집 사업'을 수주했다. 인공지능(AI) 산업 발전을 위해 대규모 고품질 우리말 자원 구축을 위한 사업이다.
국립국어원과 솔트룩스는 TV와 라디오 등 구어 원자료와 드라마·연극대본 등 준구어 원자료를 수집해 말뭉치를 구축하고 저작권 이용 계약까지 체결해 민간 활용 가치를 극대화한다.
솔트룩스는 2018년 자체 말뭉치 구축 전문인력으로 품질순도 99.9% 국립국어원 '국어 말뭉치 연구 및 구축 사업'을 수행했다. 이외에도 한국전자통신연구원(ETRI) '음성 DB 구축', 한국언론진흥재단 '뉴스 빅데이터 시스템 구축' 등 20년간 축적된 빅데이터 구축 경험과 4단계 품질관리 프로세스를 갖고 있다.
이경일 솔트룩스 대표는 “AI 산업과 국어·언어학계에 필요한 구어 말뭉치 구축을 위해 유용성 검증과 품질 확보라는 두 마리 토끼를 잡아야 한다”며 “자체 보유한 AI 원천 기술력과 AI 서비스 개발 경험으로 고품질 프로세스로 반드시 성공적으로 사업을 수행하겠다”고 말했다.
박종진기자 truth@etnews.com