네이버가 지난 7일 오후 웹호스팅 업체, 웹사이트 제작 대행사 실무진, 광고·마케팅 담당자를 대상으로 '2017 웹커넥트 데이'를 진행하고, 웹문서 검색의 연구 과정 및 향후 방향성 등에 대해 공유하는 시간을 가졌다고 8일 밝혔다.
네이버는 웹문서 검색 고도화를 위한 '그리핀 프로젝트'에 AI 기반의 기술을 접목해 웹문서의 실시간 수집, 자연어이해 기반의 스팸 탐지, 투명성을 강화한 검색 랭킹에 대한 연구를 소개했다.
문서 수집 시스템의 경우, 실시간 스트리밍 구조로 개선해 수집 로봇이 뉴스, 위키백과 등 신규 콘텐츠를 상시 분석하여 새롭게 등장하는 웹문서를 발견해 신속하게 수집할 수 있도록 했다. 또한 학술전문정보나 해외의 가치있는 사이트 및 웹문서 수집도 적극 강화했다.
네이버는 딥러닝을 적용해 문서의 노출과 클릭 패턴뿐만 아니라 문서 내용의 충실성까지 판단해 스팸을 제거하는 시스템에 대해서도 소개했다. 자연어이해 기반의 웹 스팸 추출 로직을 개발하여, AI가 자동으로 복잡하고 다양해진 스팸 문서를 학습해 제거할 수 있도록 개선했다.
수집과 스팸 탐지를 거쳐 네이버 화면에서의 노출을 결정하는 랭킹 시스템은 투명성을 강화해 여러 곳에서 인용되었고 이용자들이 꾸준히 소비하는 화제성, 작성자 및 게시물에 대한 다른 이용자들의 신뢰도 등의 가치를 더욱 반영했다.
또한 네이버는 웹사이트 운영에 도움이 될만한 실질적인 정보들을 공유하는 세션과 쉬는 시간 동안 웹사이트 운영자들이 궁금증을 해결할 수 있는 부스도 마련했다. 추첨을 통해 선정된 일부 사이트 관리자들에게는 네이버 실무진들이 1:1로 사이트 진단을 해주는 컨설팅 기회도 제공됐다.
한편, 네이버는 웹문서와 사이트 검색을 웹사이트로 통합하는 개선을 시작해 웹문서와 사이트 영역으로 나뉘어져 있던 정보들을 한데 모아 웹문서 정보를 제공할 예정이다.
Copyright ⓒ 디지틀조선일보 - 디지틀조선TV