인공지능(AI)은 새로운 시대 핵심 성장 동력이다. 네트워크와 휴먼-컴퓨터 인터페이스(HCI) 기술 역시 이를 뒷받침한다. 과학기술정보통신부와 정보통신기획평가원(IITP)이 중점 지원하는 정보통신기술(ICT) 연구개발(R&D) 영역이다. 올해 '2021 국가 R&D 우수성과 100선'에도 IITP 지원으로 도출된 성과 상당수가 이름을 올렸다. 이 가운데 최우수 2건을 포함한 6건을 소개한다. <편집자주>
IITP ICT R&D 성과 중 먼저 눈길을 끄는 것은 AI 분야다. 이 가운데 '혁신성장동력프로젝트(AI)' 사업 일환으로 개발된 한국전자통신연구원(ETRI)의 다중 화자간 대화 음성인식 기술은 여러명의 대화를 인식, 문서화한다. 우리말 기준 구글보다 인식 정확도가 높다. 음절인식 정확도가 평균 94.8%다.

각각 개별 마이크를 쓴다는 전제로 말하는 이를 구분하는 '화자분리 음성인식'이 가능하다. 이는 구글 수준 정확도다. 화자 발성구간 분리 정확도가 97.3%에 달했다.
'종단형(end to end)' 음성인식 기술도 특징이다. 전후처리 등 다양한 과정가 부가요소가 필요했던 기존과 달리 음성파형과 텍스트만으로 학습이 가능하고 도출 AI 모델도 강력하다.
이미 30건 가까운 기술이전을 이뤘고 27억원 이상 기술료 수익을 거뒀다. 공공과 민간부문 회의록 사업화, 음성인식 서비스에 폭넓게 쓰인다.
박전규 ETRI 책임연구원은 “음성인식은 쓰임새가 무궁무진하고 적용 분야도 넓다”며 “향후에도 활발한 영역 확대가 이뤄질 전망으로 개발 기술 활용도가 높다”고 말했다.
같은 사업, 같은 기관 '딥뷰' 기술도 우수성과에 이름을 올렸다. 사람 행동을 정밀 이해하는 시각지능 원천기술이다.

고성능 백본 네트워크 기술을 신경망에 이용, 세계 최고 수준의 영상 속 객체 고속 분할 성능을 확보했다.
또 사람 관절 정보(스켈레톤)를 기반으로 영상 속 사람의 현 상태 및 상황을 면밀하게 인식할 수 있다. 영상이 변형되거나 기울어져 있어도 인식 정확도가 높다. 연구진은 영상 속에 감지 대상이 되는 구간을 찾아내는 기술까지 구현했다. 기술력은 해당 분야 최우수 학회인 'CVPR' 등을 통해 세계적으로 인정받았다. 2018~2020년 기술이전 11건(약 5억원 수익), 사업화 17건(약 41억원) 성과도 달성했다.
배유석 ETRI 책임연구원은 “사물과 행동을 이해하는 기술을 개발해 실제 지자체와 연계해 실증을 진행 중”이라며 “공공 사회문제 해결에 기술 활용이 가능하다”고 말했다.
김영준기자 kyj85@etnews.com