[기획]AI 원팀, 기술협업 성과는

AI 원팀
AI 원팀

AI 원팀은 산업계와 학계 원활한 협업으로 인공지능(AI) 음성·사물인식, 로봇고장 진단기술 등 괄목할 만한 연구 성과를 도출했다.

KT와 김회린 한국과학기술원(KAIST) 교수 팀은 '딥러닝 음성합성(P-TTS, Personalized-Text To Speech)' 기술 개발에 협력했다.

P-TTS는 기존 대비 비용을 4분의 1 수준으로 줄이고 속도는 10배가량 향상시킨 것이 특징이다. 순서대로 음성을 만드는 방식에서 동시에 음성을 만들어내는 방식으로 구조를 변경, 획기적 속도향상이 가능했다. KT는 기술을 상용화해 AI콘택트센터(AICC), 차세대 기가지니 등에 활용할 계획이다.

KT는 장준혁 한양대 교수팀과 'E2E(End-to-End) 음성인식' 기술을 개발했다. 인식 정확도를 높이는 것은 물론이고 적은 양의 학습데이터로 도메인 확장이 가능해 활용성이 크다.

사양 증강(Spec Augmentation), 데이터 증강(Data Augmentation) 등 최신 학습기술을 적용해 기존 하이브리드 방식에 비해 단어 오류율(WER)을 7% 이상 향상시켰다. KT는 기술을 토대로 자유발화 음성인식률을 끌어올린다는 계획이다.

'무빙 픽처(Moving Picture)' 솔루션은 이미지를 영상으로 변환하는 AI 기술로, KT와 김태현 한양대 교수가 공동 연구했다. 이미지에 모션 효과를 적용해 영상으로 바꿔준다. 영상 분할, 객체 검출, 모션 추정, 초해상도 이미지 복원(인페인팅)과 같은 최신 AI 기술을 적용했다.

KT는 무빙 픽처 솔루션을 IPTV를 비롯해 포스터, 웹툰, 애니메이티드 광고 등 다양한 분야에서 활용한다는 계획이다. 무빙 픽처 솔루션에 적용된 핵심 기술은 이미 국내에서 특허 2건을 확보했으며 국제학술지 'IEEE Access' 등재를 위한 심사도 진행 중이다.

'AI 기반 로봇 고장 진단' 기술은 현대중공업그룹이 한양대 장준혁 교수와 공동으로 개발했다. AI가 산업용 로봇 고장을 진단할 수 있는 기술로, 진동 신호에 음성처리 기술과 딥러닝 기술을 적용해 핵심 구동부품인 감속기의 이상을 탐지할 수 있다. 운전 조건에 관계 없이 적용 가능하고 정상상태와 고장상태 데이터 불균형을 해결해 진단의 정확도를 높였다.

현대중공업그룹은 이 기술을 다양한 로봇 제품에 적용해 자동화 라인의 유지보수 효율을 극대화할 수 있을 것으로 기대하고 있다.

박지성기자 jisung@etnews.com