네이버 AI, 검색 넘어 일상으로

김성훈 네이버 클로바 리더
김성훈 네이버 클로바 리더

인공지능(AI)은 이제 미래 기술이 아니라 일상이다. 네이버와 라인이 제공하는 모든 서비스에 음성인식, 자연어처리(NLP), 컴퓨터비전 등 AI 기술이 녹아있다.

28일 서울 코엑스에서 열린 개발자 콘퍼런스 네이버 '데뷰'에서는 장내 모든 안내 방송이 사람이 아닌 음성합성 AI로 진행됐다. 행사장 출입관리는 안면인식 기술이 활용됐다. 방문객 얼굴이 미리 등록해둔 사진과 일치하는지 AI가 확인했다. 스마트폰이나 초대장을 일일이 확인할 필요 없이 1~2초 만에 입장할 수 있었다.

김성훈 네이버 클로바 리더는 “최근 몇 년간 인공지능 기술 발전 속도는 매일매일 놀라움의 연속이었다. 그 발전 중심에 네이버 클로바 AI가 동참하고 있다”며 “이 같은 AI는 사용자를 더 잘 이해하고, 감동을 주고, 우리를 편리하게 한다”고 강조했다.

기존 네이버 클로바 플랫폼은 이용자와 AI 간 소통 수단이 음성이었다. 육성으로 질문을 던지면 클로바가 합성된 목소리로 답변을 줬다. 네이버는 듣는 AI에서 보는 AI로 저변을 넓히고 있다. AI가 화자의 목소리와 얼굴을 동시에 인식하는 기술을 개발 중이다. 여러 인원이 동시에 회의를 진행하더라도 녹화 화면 내에서 누가 목소리 주인인지 인식한다. 비디오 정보가 더해지는 만큼 음성 인식 성능이 높아진다. 누가 어떤 발언을 했는지 AI가 인원만큼 개별 회의록을 기록하는 활용도 기대할 수 있다.

이는 비디오 콘텐츠 분석에도 적용될 수 있는 기술이다. 영상 한 편에서 어떤 가수가 어느 시점에 얼마나 많이 등장했는지, 드라마에서 배우 간 키스 장면이 언제 있었는지도 짚어낸다.

음성합성 기술은 이미 인간 목소리와 구분이 거의 불가능한 수준이다. 이제는 한 단계 더 나아가 '슬픔' '기쁨' 등 인간 감정을 목소리 톤으로 표현한다. 다음 단계는 억양을 넣은 '사투리' 표현이다. 강원도 억양이 들어간 음성합성 기술이 시연됐다. 김성훈 리더는 “내년 정도면 완벽한 사투리 억양까지 스타일 트랜스퍼(변환) 가능한 음성합성 기술을 갖게 될 것”이라고 자신했다.

네이버 서비스 출발점인 검색엔진 기술도 이제 AI를 떼어놓고 설명할 수 없다. 김광현 네이버 서치 리더는 “20년 동안 네이버가 국내 이용자에게 사랑받은 이유는 기술력 덕분”이라며 “이제는 AI시대, 텍스트를 넘어 이용자 일상 대화와 문맥을 이해해 유용한 정보를 제공한다”고 설명했다.

네이버는 올해 초 '그린닷' 서비스를 출시하면서 모바일 시대에 맞는 검색 서비스를 제공하기 시작했다. 이미지나 영상을 컴퓨터비전 기술로 분석해 정보를 제공하고, 이용자가 묻기 전에 위치 정보를 분석해 필요 예상 정보를 미리 추천해 준다.

김광현 리더는 “네이버는 20년 연구 성과를 쌓으면서 자연스럽게 알고리즘, 빅데이터, 컴퓨팅 파워 및 인프라 요소를 갖췄다. 국내 뿐 아니라 글로벌 시장에 놓고 비교해도 AI를 잘 연구할 수 있는 좋은 환경”이라며 “항상 사용자 관점에서 도움되는 정보 마련 위해 많은 노력을 기울이고 있다”고 전했다.

이형두기자 dudu@etnews.com