
네이버는 지난해 웹검색 고도화를 위한 프로젝트 '그리핀(Griffin) 프로젝트'를 통해 수집한 다량의 웹문서 중 고품질 이미지를 네이버 이미지 검색에 반영했다고 3일 밝혔다. 이미지 데이터베이스(DB) 수량을 2배 이상 확대하고 고품질 이미지 검색 결과를 제공하는 데 주력했다.
네이버는 모바일 환경에서 검색어 형태가 길어지고 다양화되는 '롱테일(Long-Tailed) 검색어'가 이미지 검색에서도 많이 인입되는 흐름에 맞춰 양질 이미지 검색결과를 제공하기 위해 연구해왔다.
이미지 검색 고도화에는 △대규모 이미지 DB 수집 및 정제 기술 △증가한 DB 규모에 따른 대규모 이미지 데이터 처리 시스템 △이미지 품질 평가와 관련된 기계학습 시스템 등 다양한 AI 기술이 활용됐다.
이미지 품질을 평가하는 요소(피처)를 지속 개발했다. 이를 활용하기 위한 별도 '이미지 피처 저장소'를 구축했다. 고품질 이미지 DB를 2배 이상 확대했다. 딥러닝 기반으로 이용자 요구에 신속 대응한다. 수십억건 이미지에 대한 속성을 분석하기 위해 대규모 데이터 처리 시스템을 자체 개발했다. 실시간 수집된 DB는 신뢰도 높은 텍스트 자동 추출, AI 통번역 기술 기반 다국어 대응, 성인이미지 자동 분류 등 정제 기술을 거치도록 했다.
그 결과 대용량 이미지 데이터를 실시간 수집·반영하고 안정적 이미지 품질 분석이 가능해졌다. 네이버 이미지 검색에서 클릭수가 증가하는 등 이용자 만족도가 높아졌다.
김상범 네이버 웹&이미지 리더는 “이미지 검색어 형태도 갈수록 세분화, 다양화되는 만큼 다양한 주제에 대한 양질 이미지를 수집해 제공하기 위해 노력했다”며 “이미지 검색 개선에 대한 지속 연구는 네이버가 글로벌 검색엔진으로 진화하기 위한 초석”이라고 말했다.
오대석기자 ods@etnews.com