네이버, 쇼핑검색 '랭킹' 대폭 개선

네이버가 쇼핑 검색에서 랭킹(순위) 부분 검색 결과를 개선했다. 2020년 4월 인공지능(AI) 기반 L2R(Learning to Rank) 모델을 쇼핑 검색에 처음 도입한 후 지속 업그레이드하고 있다. 네이버는 검색 의도와 상품 특징을 더 잘 반영하는 '트리'(Tree) 기반 모델을 쇼핑 검색에 29일부터 적용했다고 밝혔다. 그간 평균 6개월 단위로 랭킹 검색 결과를 업그레이드해 온 네이버는 지난해 8월 이후 거의 1년여 만에 새로운 모델을 도입했다.

네이버는 지금까지 쇼핑 검색 결과 노출 순위를 결정하는 모델로 '선형 랭킹 모델'을 적용해 왔다. 기존 선형 모델은 상품 단어 간 적합도, 판매지수, 클릭 수 등 랭킹 요소 중요도를 합산하는 방식이었다. 조회 수, 리뷰 수, 상품 판매량 등 복합적으로 연관된 상품 요소의 상관관계를 정교하게 반영하지 못했다.

특정 요소의 가중치에 따라 다른 요소 점수가 매우 낮아도 검색 결과 상위에 노출될 가능성을 내재하고 있어 검색어와 적합도가 낮은 상품이 도출되거나 검색 결과에 영향을 미치려는 어뷰징에 취약할 수 있다는 단점도 있었다.

(왼쪽)개선 전에는 검색어와 관련이 낮은 상품들이 결과로 노출, (오른쪽)개선 후에는 검색어와 관련이 높은 상품 위주로 검색 결과가 개선.
(왼쪽)개선 전에는 검색어와 관련이 낮은 상품들이 결과로 노출, (오른쪽)개선 후에는 검색어와 관련이 높은 상품 위주로 검색 결과가 개선.

새롭게 적용된 '트리 모델'은 수십~수백 개 집합에 달하는 다수 트리 모델로 구성돼 있다. 검색어와 상품 랭킹 요소 값을 근거로 최적의 내부 트리 모델이 선택되고, 내부 트리 모델별로 상황에 따라 랭킹 요소 중요도를 달리해 이를 점수에 반영한다. 선형 모델 대비 다양한 랭킹 요소와 그 값의 변화를 세밀하게 반영할 수 있다. 예를 들어 특정 상품을 검색할 때 사용자 인기도와 적합도 모두 높은 상품을 상위 검색 결과로 제시할 수 있다. 역으로 검색 적합도가 떨어지는 상품은 하위 결과로 분류한다. 또 모델 구조가 세밀화됨에 따라 검색 결과 품질에 악영향을 미치는 각종 어뷰징 시도도 제한할 수 있다.

네이버 측은 “최근 기존 모델 랭킹 결과와 트리 기반 모델을 비교 테스트한 결과 단순히 클릭이나 매출이 높다고 검색어와 적합도가 떨어지는 상품이 상위에 노출되는 빈도가 크게 감소했다”면서 “보다 편리한 쇼핑 검색이 가능해질 것으로 기대된다”고 강조했다.

성현희기자 sunghh@etnews.com