네이버가 숏폼 서비스 클립의 실시간 시청 이력과 거대언어모델(LLM)을 기반으로 한 기술력을 공개했다.
한상규 네이버 발견·탐색 프로덕트 부문 리더는 11일 서울 강남구 코엑스에서 열린 DAN 24에서 '클립 크리에이터와 네이버 유저를 연결하기'를 주제로 개최한 세션에서 실시간 클립 시청 이력을 기반으로 한 개인화 추천 기술을 강조했다.
한 리더는 다른 콘텐츠 포맷에 비해 빠른 속도감이 숏폼 서비스 핵심이기 때문에 뉴스, 블로그·카페 게시글 등 긴 호흡 콘텐츠를 소비하던 네이버의 기존 이용자들도 숏폼을 즐기도록 클립 특화 추천 시스템을 개발했다고 설명했다.
네이버의 클립 추천 시스템은 이용자가 유의미하게 시청하는 영상과 스킵하는 영상 확률을 모두 고려한 유저 컨텍스트 모델(User Context Model)을 기반으로 개인화 추천 모델을 구축했다. 이용자의 최근 시청 이력을 추가 반영하는 방식으로 운영된다. 네이버는 보다 정확한 추천을 위해 실시간 시청 이력을 추천 시스템에 반영하는 주기를 단축해 콘텐츠 제안 시 발생할 수 있는 지연을 없앴다. 기존에는 10개의 클립을 시청하거나 스킵해야만 다시 새로운 콘텐츠가 추천됐다면 4개의 클립에 대한 피드백만 모여도 즉시 맞춤형 콘텐츠가 추천되는 방식이다. 짧은 영상을 빠르게 소비하는 숏폼 서비스 특성 상 이용자가 관심있을 만한 콘텐츠를 정확하고 신속하게 제안하는 기술력은 네이버 클립 서비스 경쟁력으로 이어졌다.
한 리더는 클립의 강점은 네이버 생태계 속 다양한 서비스와 끈끈하게 연결되어 콘텐츠의 발견부터 실제 경험까지 완결성 있는 사용자 경험을 제공할 수 있다는 점에 있다고 강조했다. 클립은 숏폼 시청 후에도 관련 정보를 다른 경로로도 탐색을 이어간다는 숏폼 이용자만의 특성을 고려해, 클립을 통해 바로 다른 서비스로 이용할 수 있는 전환형 기능 '정보 스티커'를 적용해왔다. 정보 스티커는 네이버 플레이스나 네이버쇼핑으로 연결돼 간편한 예약과 구매를 돕고 있다. 블로그, 뉴스, 오픈톡 등 네이버 내의 콘텐츠와도 연결돼 추가 정보 검색도 끊김 없이 이용할 수 있다. 예를 들어, 맛집 리뷰를 하는 창작자가 방문한 식당 정보를 영상 내 스티커로 삽입하면, 이를 시청한 이용자가 식당의 위치, 운영시간 등을 확인하고 예약까지 할 수 있다.
네이버를 기반으로 활동하는 창작자와 사업자에게도 긍정적인 성장 기반을 마련할 수 있을 것으로 기대된다. 클립이 고객과의 새로운 접점 채널로 기능할 수 있기 때문이다. 한 예로 로컬 기반으로 지역 특산물을 스마트스토어에서 판매하며 블로그로 자세한 콘텐츠를 게시하고 있는 사업자가 있다면, 클립에서 이 스마트스토어나 블로그 링크를 연결해 극대화된 효과를 얻을 수 있다.
네이버는 기술 고도화 측면에서도 네이버 생태계 내와의 활발한 연결이 차별화 포인트가 되고 있다고 설명했다. 한 리더는 기술 세션에서 검색 이력이 이용자의 현재 관심사를 가장 직관적으로 보여주는 데이터라고 강조했다. 사용자의 검색, 소비, 구독 등 다양한 활동 이력을 잘 활용하면 클립에 익숙하지 않은 이용자에게도 개인별 맞춤 콘텐츠를 제공할 수 있다고 전했다.
네이버는 이용자가 관심을 이어가는 맥락에 적합한 콘텐츠를 풍성하게 추천하기 위해 LLM을 기반으로 개인화 콘텐츠 추천 품질을 높였다. 한 리더는 하이퍼클로바X로 사용자가 입력한 검색어들을 종합적으로 분석해 핵심 키워드를 추출하고, 이용자의 의도와 맥락에 최적화된 클립을 추천하는 것도 가능하다고 전했다.
예를 들어, '광안리 소품샵', '부산역 저녁', '흰여울마을 가는 길' 등의 키워드를 검색한 이용자에게는 '부산여행'과 관련된 클립이 제안되고, '봄브라이트', '가을뮤트' 등을 검색한 사용자에게는 '퍼스널 컬러' 관련한 클립이 추천되는 방식이다.
네이버는 이번 발표에서 시각적인 요소까지 고려해 더욱 풍성하고 다양한 클립을 추천하고, 클립에 머무르며 소비를 이어가는 중장기 소비자를 위한 고도화 계획도 발표했다. 클립 서비스 내에 머무르는 이용자들의 행동을 예측하고 시청 이력과 '좋아요/관심없음'과 같은 사용자 반응 등 이용자의 피드백을 종합적으로 고려해 추천 모델을 최적화할 수 있는 기법을 도입한다. 하이퍼클로바X 기반 이미지 처리 기술과 같이 시각 데이터까지 이해하는 대규모 언어 모델을 활용하면 '대형 카페'를 검색한 이용자에게는 넓고 개방된 공간이 중점적으로 소개되는 클립이, 밴드 이름을 검색한 이용자에게는 무대 위의 열정적인 모습이 담긴 라이브 퍼포먼스 클립이 추천되는 방식으로 업데이트할 수 있다.
네이버 관계자는 “이용자 취향을 정확하게 타겟팅해 유입율과 체류 시간을 모두 높이겠다는 것”이라면서 “네이버는 '초개인화'라는 키워드로 서비스를 강화해 클립 크리에이터와 이용자를 계속해서 연결하겠다”고 말했다.
변상근 기자 sgbyun@etnews.com