폐쇄회로(CC) TV 화면에서 흐릿하게 보이는 눈과 코, 입 등을 또렷이 인식할 수 있는 인공지능(AI) 기술이 개발됐다. 범죄 해결 등 보안 분야에서 활용할 수 있다.
광주과학기술원(GIST·총장 김기선)은 이규빈 융합기술학제학부 교수팀이 어텐션 맵을 이용해 고해상도 얼굴 이미지에서 학습한 정보를 저해상도 얼굴 이미지 인식 모델에 전달해 성능을 향상시키는 방법을 개발했다고 24일 밝혔다.
어텐션 맵은 딥러닝 네트워크가 인식을 수행할 때 입력 이미지의 어떤 영역이 인식 결과에 많은 영향을 줬는지 시각화한 정보다. 활성값 0~1을 보이며 1에 가까울수록 결과에 영향을 많이 끼친다.
얼굴 인식 분야에서 딥러닝 기술은 99% 이상 정확도를 보이며 범죄 현장 등 보안 분야에서 활발히 활용되고 있다. 하지만 저화질 화면에서는 얼굴 인식 성능이 급격하게 저하돼 수사기관이나 보안업체 등이 대상자의 신원 확인에 어려움을 겪는다.
24×24픽셀 수준의 저해상도 이미지에서는 사람 얼굴의 주요 특징을 담고 있는 이목구비 영역이 아닌 피부와 같이 해상도에 영향을 적게 받는 부위에 집중해 얼굴 인식을 수행한다. 평균 112×112픽셀의 고해상도에서도 얼굴 이미지를 학습한 기존 인식 모델의 경우 정확도는 30% 수준에 그친다.
더욱이 이미지 해상도가 높더라도 멀리서 촬영하거나 다수의 사람이 한꺼번에 촬영될 경우 각각의 얼굴 정보는 적은 픽셀로 구성돼 낮은 인식 성능을 보인다. 상용화된 얼굴 인식 제품이 가까운 거리에서 한 명씩 촬영한 뒤 인식을 수행하기 때문이다.
이 교수팀은 AI 딥러닝 기술을 적용해 저화질 영상에서도 눈·코·입 등 사람 얼굴의 주요 특징을 잘 인식할 수 있는 기술 개발에 성공했다.
연구팀은 저해상도 네트워크 어텐션 맵이 고해상도 네트워크 어텐션 맵과 유사해지도록 학습하는 손실 함수를 추가해 저해상도 네트워크가 얼굴 인식에 도움이 되는 주요 영역에 초점을 맞출 수 있도록 유도했다. 얼굴 확인 및 식별 작업에 사용하는 CASIA-WebFace 데이터 셋으로 훈련해 저해상도 얼굴 이미지 인식 성능을 비교하기 위한 TinyFace 공인 벤치마크에서 평가했을 때 기존 세계 최고 수준인 45.49%보다 5% 향상된 47.91% 인식 정확도를 달성했다. 이는 지금까지 가장 높은 수준의 성능이다.
특히 얼굴 인식 외에도 저해상도 이미지에서 물체의 종류를 분류하는 과업에서도 연구팀이 제안한 방법이 높은 성능 향상을 거뒀다. 향후 다양한 컴퓨터 비전 태스크에서 적용할 수 있음을 시사했다.
이규빈 교수는 “이번 연구 성과가 응용되면 범죄 해결의 중요 단서를 제공하는 CCTV로 멀리서 촬영된 사람의 얼굴 특징을 정확하게 인식할 수 있게 됐다”면서 “연구팀이 제안한 어텐션 맵 전이 기법은 얼굴 인식 외에도 물체 영역 검출, 종류 분류 등 컴퓨터 비전의 다양한 과업에서 핵심 기술로 활용될 것으로 기대한다”고 말했다.
한편, 이번 연구는 과학기술정보통신부의 클라우드 로봇복합인공지능 핵심기술개발사업, 산업통상자원부의 에너지기술개발사업, 한국전자통신연구원 연구운영지원사업의 지원을 받아 이뤄졌다. 연구에 사용된 코드는 깃허브에서 오픈소스로 이용할 수 있다. 논문은 세계 3대 컴퓨터 비전 학회인 '유럽 컴퓨터 비전 학술대회(ECCV)'에서 최근 발표했다.
광주=김한식기자 hskim@etnews.com