네이버 블로그를 운영하는 사람은 한 두 번 정도는 경험했을 법한데 블로그에 올린 글이 검색에 보이지 않는 경우가 있다. 포스트 제목 전체를 복사해서 검색창에 붙여넣기 해서 찾아도 없으면 검색에 반영 되지 않은 것이다.
네이버 고객센터에 문의하면 출처 검색 기능을 이용해 찾아 보라 답변을 하는데 출처 검색은 네이버 검색 반영 결과와는 별도의 서비스로 검색에는 없어도 출처 검색에는 보인다.
이 경우 2가지를 조사해 보면 원인을 알 수 있다.
네이버 리브라(Libra) 알고리즘의 핵심이 품질 좋은 컨텐츠를 찾아 먼저 보여 주는 것인데 아직 구글 만큼 신뢰가 높지 않다. (솔직히 사람이 신고하지 않으면 해결이 안 되는 경우가 더 많은 것 같다.)
중복 문서 판독 정확도를 위해 몇 가지 테스트를 해 봤다.
즉, 네이버 블로그를 운영하는 누군가에 의해 내 글이 네이버 블로그로 옮겨 질 때 시간 영향을 받게 된다는 것을 알 수 있다. 워드프레스 글이 먼저 검색에 반영된 후 네이버 블로그로 옮겨 갈 경우에는 네이버 글은 중복에 의해 검색에 노출 되지 않는다.
그리고 또 한 가지 흥미로운 사실은 포스트 제목을 약간 수정해서 올려 보면 2개 모두 검색에 노출되는 경우를 보게 된다. 이 정도로 허술하다는 얘기. 본문은 전혀 수정하지 않았음에도 타이틀 변경만으로도 중복 문서가 뚫렸다.
Google+와 Facebook에서는 social interaction으로 평가해서 뉴스피드 최적화(NFO)를 가동한다. 예를 들어 공유, 좋아요, +1, 댓글, 친구 태그 등의 반응이 활발한 글이 좋은 글로 평가 받는 식이다.(물론 계정 운영자의 프로필에 대한 평가가 가장 높다.)
네이버 내부 블로그에 대한 평가는 비교적 쉽다. (물론 이것도 공정하지 않게 하고 있긴 하다.) 공감, 댓글, 엮인 글, 각 포스트에 대한 체류 시간, 방문자 수, content relevant, 계정 역사(이력), 프로필 종합 점수 등으로 평가하면 되지만 네이버는 지금 이런 시스템이 없는 것 같다.
문제는 외부 플랫폼을 사용하고 있는 작가에 대한 평가인데 지금까지 살펴 본 바로는 방문자 수(클릭 수) 기준으로 신뢰도를 결정하는 것 같다. 즉, 동일한 글이 발견 되었을 때 해당 게시물이 네이버 검색에 반영된 후부터 어느 문서에서 더 많은 클릭이 발생 했는가에 따라 순위를 정하는데 이렇게 하다 보니 진짜 원문이 뒤로 밀려나 버리는 문제가 있다.
위 내용은 개인적 테스트를 통한 것이기 때문에 네이버 공식화된 로직은 아니다. 네이버 검색에 대한 정확한 기준을 알려 주지 않는 이상 아무도 단정할 수는 없다. 하지만, 확실한 것 한 가지는 네이버 검색 중복문서 판독 자체에는 문제가 많다는 것이다.
이 외에도 네이버 중복문서 판독 관련해서는 다양한 경험들이 있을 것 같다. 사례를 공유하고 방법을 찾아 보는 것도 괜찮을 것 같아 아래 공개 댓글 또는 메일로 내용을 알려 주시면 감사 하겠다.
[contact-form][contact-field label=’이름 또는 필명’ type=’name’ required=’1’/][contact-field label=’중복문서 경험 사례’ type=’textarea’ required=’1’/][/contact-form]