나무기술이 인공지능(AI) 기반 청력검사 모델 개발에 나선다.
나무기술은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 '2021년도 인공지능 학습용 데이터 구축사업' 주관기관으로 선정돼 청력검사 학습데이터 세트를 구축, 난청 원인 진단 모델 개발 프로젝트를 추진한다고 밝혔다.
나무기술은 인피노브, 조인트리, 이루온아이앤에스 전남대병원, 경북대병원, 전북대병원, 충남대병원 8개사와 컨소시엄을 구축해 순음청력 검사결과 데이터 사업을 진행한다. 총 사업비는 22억5000만원 규모다.
순음청력 검사결과 데이터 사업을 통해 이미지로 저장된 순음청력, 어음청력 검사결과를 정형 데이터로 변환하고 효과적으로 라벨링하는 도구를 개발한다. 난청 원인 분류를 청력검사 결과로부터 예측하는 AI 학습 모델 개발을 개발한다.
우리나라는 인구 고령화에 따른 난청환자가 지속 증가세다. 청각장애는 지체장애에 이어 두 번째로 높은 장애 유형이다. 그동안 난청 형태·원인, 연령별로 수치화된 청각 빅데이터가 없는 게 현실이다. 대부분 병원에서 진행된 청력검사 결과는 수치화된 결과가 아닌 순음청력검사 그래프와 어음청력검사 수치가 기재된 이미지 파일로 병원마다 결과지 형태가 다르다.
이번 과제에서 구축하는 학습데이터셋 최종 결과는 모두 정형데이터로 변환된다. 학습 용이성을 위해 CSV 포맷으로 가공할 예정이다. 참여 병원이 보유한 청력검사 원시데이터와 원천데이터는 좌측과 우측을 모두 포함한 데이터를 수집한다. 라벨링 이후 좌, 우를 분리하므로 최종 데이터는 10만건 규모가 될 것으로 예상된다.
사업을 통해 구축하는 학습데이터는 청력 관련 연구의료진과 AI 기업, 보청기, 이어폰, 청력검사기기 등 청력 관련 산업계에 공유될 예정이다. 청력 관련 AI 연구 기폭제가 될 것으로 기대한다.
김경우 나무기술 상무는 “국내외를 통틀어 최대 규모 청력검사 학습데이터셋이 구축될 것으로 기대한다”면서 “개발한 정제 도구와 라벨링 도구는 AI 허브와 대한청각학회의 학술 대회 등을 통해 공개할 예정”이라고 말했다.
김지선기자 river@etnews.com
-
김지선 기자기사 더보기