국내 연구진이 시각 인공지능(AI) 기술 핵심 알고리즘을 일반에 공개했다. 시각지능 학습에 필요한 이미지 데이터도 함께 공개했다.
한국전자통신연구원(ETRI·원장 김명준)은 사물인식, 행동추적 등 시각 AI 구현에 필요한 백본 네트워크(VoVNet), 도심환경 사물 560종 대상 사물인식 학습데이터 20만장을 최근 공개했다고 12일 밝혔다.
백본 네트워크는 사진 속 객체 특징을 찾아내 정보를 추출·분석한다. 인공신경망으로 AI 모델을 만들어낼 수 있다. 개발자들이 쉽게 활용해 원하는 서비스나 혁신 기능을 구현하도록 돕는다.
이것은 ETRI가 이전에 공개한 편집기술과 함께 사용 가능하다. 백본 네트워크 공개에 앞서 지난 2월 사람 얼굴 사진을 편집하는 기술 'SC-FEGAN)'을 공개한 바 있다.
SC-FEGAN은 사진 속 인물이 하고 있지 않던 액세서리를 추가하거나 머리 모양, 표정까지도 바꿀 수 있다. 심지어 낙서 등으로 인해 일부가 훼손되거나 빈 공간이 생겨도 원하는 내용을 간단하게 그려 복원할 수도 있다. 얼굴 사진에 특화돼 다양한 편집이 가능한 알고리즘인 셈이다.
이 기술에는 딥러닝 기법 중 하나인 갠(GAN) 기술이 쓰였다. 인공적으로 데이터를 만들고 이를 판별하면서 진짜 같은 가짜 데이터를 만들어내는데 기술이다.
ETRI는 앞으로 시각지능 관련 핵심 기반 기술, 데이터를 지속 공개할 계획이다. 얼굴뿐만 아니라 냉장고, 가구 등 다른 객체를 쉽게 편집을 할 수 있도록 기술도 고도화할 계획이다.
박종열 ETRI 시각지능연구실장은 “국내 시각 AI 기술이 급속도로 성장하고 있지만 외국 의존도가 점차 높아지고 있어 관련 기술을 공개하게 됐다”며 “국내 산·학·연이 보다 경쟁력 있는 기술을 확보하고 생태계를 조성할 수 있도록 적극 지원할 예정”이라고 밝혔다.
대전=김영준기자 kyj85@etnews.com