[인공지능 데이터 활용 경진대회]〈1〉인공지능 우수인재 발굴

[인공지능 데이터 활용 경진대회]〈1〉인공지능 우수인재 발굴

지난해 9월 15일 시작된 '2021 인공지능(AI) 데이터 활용 경진대회'가 12월 16일 40개팀에 대한 시상을 끝으로 막을 내렸다.

과학기술정보통신부가 주최하고 한국지능정보사회진흥원(NIA)이 주관한 AI 데이터 활용 경진대회는 지난해 6월 'AI 허브'에 개방된 191종 학습용 데이터를 활용, 우수 인재 발굴과 AI 신규 서비스 발굴을 독려하기 위해 추진됐다.

대회를 통해 한국어 음성인식 경진대회와 서비스 공모전 등 2개 분야에서 참신한 아이디어와 다양한 서비스 모델이 발굴됐다. 분야별 주요 수상팀과 아이디어를 2회에 걸쳐 소개한다.

제1 분야인 '한국어 음성·자연어 AI 경진대회(인공지능, 훈민정음에 빠져들다)'는 한국어 학습용 데이터를 활용, 모델 성능을 고도화하는 대회다. 한국어 AI 데이터 중요성과 성능을 검증하는 게 목적이다. 음성인식, 화자인식, 대화요약 영역으로 진행, 최우수상 3팀 등 총 21개팀이 수상의 영예를 안았다.

음성인식 분야(한국어 음성인식 성능평가)는 우리말을 더욱 잘 인식하고 다룰 수 있는 AI를 목표로 문자오류율(CER), 단어오류율(WER)을 평가해 순위를 결정했다.

최우수상(과기정통부 장관상)을 수상한 UST-LMK팀(과학기술연합대학교 소속)은 음성합성, 음성처리, 자연어처리를 메인으로 전공하는 3명 팀원이 음성인식 분야에서 역량 확인을 위해 경진대회에 도전했다.

UST-LMK팀 맹준규씨는 “AI 허브 데이터를 거의 대부분 사용해 거대 음성인식 데이터를 만들어 (음성인식) 오류 발생 확률을 최대한 낮췄다”고 말했다.

그는 “AI 분야에서 다량 데이터를 사용하는 것이 트렌드인데, AI 허브에서 다량의 데이터를 배포함으로써 우리팀뿐만 아니라 국내의 많은 AI 전문가가 최신 기술을 한국어 버전으로 적용해볼 수 있다는 점에서 의미가 있다”고 평가했다.

화자인식 분야 최우수상(KT융합기술원장상)은 서울대 대학원 소속 shmun팀에 돌아갔다. 모델 성능 향상에 초점을 맞춰 실제 활용 가능성 높은 모델을 제공하기 위해 노력했다는 평가다.

shmun팀 문성환씨는 “한국어는 공개된 데이터가 부족해 AI 모델개발에 어려움이 큰데 대회를 통해 다양한 한국어 데이터를 활용할 기회를 얻어 좋았다”며 “한국어 데이터 활용 경진대회가 자주 열리길 바란다”고 말했다.

대화요약 분야 우수상(NIA 원장상)을 받은 뭐라도해야지팀 박광현씨는 군인 신분으로 참여, 수상까지 하게 돼 눈길을 끌었다. 그는 전역을 앞두고 어떤 일이든 도전해보자는 생각으로 경진대회를 찾아보던 중 '훈민정음'이라는 흥미로운 주제에 이끌려 대회 참여했다. 부대 안에서는 보안 문제로 컴퓨터 활용이 불가능해 작은 휴대폰 화면을 통해 데이터를 분석하며 대회에 참여했다.

박씨는 “평소 질의응답(QA)과 언어모델에 관심이 있었는데 이번 대회를 통해 대화요약에도 관심을 가지고 배우는 기회가 됐다”며 “대규모 한국어 데이터를 기반으로 많은 사람과 AI 모델 성능을 겨룰 수 있었던 점이 흥미로웠다”고 말했다.

과학기술정보통신부와 한국지능정보사회진흥원이 2021 인공지능 데이터 활용 경진대회 시상식을 지난해 12월 16일 서울 용산에서 개최했다. 수상자들이 단체사진을 찍고 있다.
과학기술정보통신부와 한국지능정보사회진흥원이 2021 인공지능 데이터 활용 경진대회 시상식을 지난해 12월 16일 서울 용산에서 개최했다. 수상자들이 단체사진을 찍고 있다.

대화요약 분야 최우수상(네이버 대표상)은 알라꿍달라꿈팀(스캐터랩, 성균관대, 세종대)에, 음성인식 분야 우수상(NIA 원장상)은 ISDS팀(서강대)과 ASR팀(메가스터디교육)에 돌아갔다.


(제1 분야) 2021 한국어 인공지능 경진대회 결과
 

[인공지능 데이터 활용 경진대회]〈1〉인공지능 우수인재 발굴


안호천기자 hcan@etnews.com