네이버 검색의 고질적 문제 중복문서 판독

Author icon

Written by zinicap

Tag icon

Published under MEMO

Clock icon

2013년 12월 6일

Comments icon

No comments

네이버 블로그를 운영하는 사람은 한 두 번 정도는 경험했을 법한데 블로그에 올린 글이 검색에 보이지 않는 경우가 있다. 포스트 제목 전체를 복사해서 검색창에 붙여넣기 해서 찾아도 없으면 검색에 반영 되지 않은 것이다.

네이버 고객센터에 문의하면 출처 검색 기능을 이용해 찾아 보라 답변을 하는데 출처 검색은 네이버 검색 반영 결과와는 별도의 서비스로 검색에는 없어도 출처 검색에는 보인다.

이 경우 2가지를 조사해 보면 원인을 알 수 있다.

  • 네이버 검색 규정 위반으로 검색 제한 조치를 받은 경우(대부분 사람에 의한 신고로 알고 있음)
  • 당신 글을 누군가 몰래 훔쳐 가 네이버 블로그나 카페, 웹 문서에 올렸고 그 복사본이 원본으로 인식 되었을 때(이 경우에는 정말 허망하겠지만 네이버에 연락을 취해야 한다.)

네이버 리브라(Libra) 알고리즘의 핵심이 품질 좋은 컨텐츠를 찾아 먼저 보여 주는 것인데 아직 구글 만큼 신뢰가 높지 않다. (솔직히 사람이 신고하지 않으면 해결이 안 되는 경우가 더 많은 것 같다.)

중복 문서 판독 정확도를 위해 몇 가지 테스트를 해 봤다.

 

WP-->NaverNaver-->WPLibra
필자는 2개의 블로그를 운영 중이다. 하나는 네이버 블로그고 또 다른 하나는 워드프레스로 만든 반응형 웹이다. 워드프레스에서 먼저 발행한 글을 네이버 블로그로 가져 가 그대로 올리면 검색에는 네이버 블로그가 먼저 반영이 된다. 이 경우에는 네이버 블로그 글이 원문으로 인식 된다.

즉, 네이버 블로그를 운영하는 누군가에 의해 내 글이 네이버 블로그로 옮겨 질 때 시간 영향을 받게 된다는 것을 알 수 있다. 워드프레스 글이 먼저 검색에 반영된 후 네이버 블로그로 옮겨 갈 경우에는 네이버 글은 중복에 의해 검색에 노출 되지 않는다.

네이버 블로그에 글을 올리면 거의 실시간 검색에 반영되기 때문에 다른 외부 블로그로 이동 시켜도 중복 문서에 걸릴 확률이 높다. 여기서 흥미로운 사실은 네이버는 외부에서 가져 오는 글은 언제든지 환영하면서 네이버 내부 글을 다른 외부 플랫폼으로 가져 가는 것을 싫어 한다는 사실이다^^.

 

그리고 또 한 가지 흥미로운 사실은 포스트 제목을 약간 수정해서 올려 보면 2개 모두 검색에 노출되는 경우를 보게 된다. 이 정도로 허술하다는 얘기. 본문은 전혀 수정하지 않았음에도 타이틀 변경만으로도 중복 문서가 뚫렸다.

리브라의 핵심은 신뢰도가 높은 작가가 쓴 글에 대해 높은 평가를 주겠다는 것인데 그 신뢰도 측정 기준이 무엇인지 모호하다는 것이다.

 

Google+와 Facebook에서는 social interaction으로 평가해서 뉴스피드 최적화(NFO)를 가동한다. 예를 들어 공유, 좋아요, +1, 댓글, 친구 태그 등의 반응이 활발한 글이 좋은 글로 평가 받는 식이다.(물론 계정 운영자의 프로필에 대한 평가가 가장 높다.)

 

네이버 내부 블로그에 대한 평가는 비교적 쉽다. (물론 이것도 공정하지 않게 하고 있긴 하다.) 공감, 댓글, 엮인 글, 각 포스트에 대한 체류 시간, 방문자 수, content relevant, 계정 역사(이력), 프로필 종합 점수 등으로 평가하면 되지만 네이버는 지금 이런 시스템이 없는 것 같다.

 

문제는 외부 플랫폼을 사용하고 있는 작가에 대한 평가인데 지금까지 살펴 본 바로는 방문자 수(클릭 수) 기준으로 신뢰도를 결정하는 것 같다. 즉, 동일한 글이 발견 되었을 때 해당 게시물이 네이버 검색에 반영된 후부터 어느 문서에서 더 많은 클릭이 발생 했는가에 따라 순위를 정하는데 이렇게 하다 보니 진짜 원문이 뒤로 밀려나 버리는 문제가 있다. 

위 내용은 개인적 테스트를 통한 것이기 때문에 네이버 공식화된 로직은 아니다. 네이버 검색에 대한 정확한 기준을 알려 주지 않는 이상 아무도 단정할 수는 없다. 하지만, 확실한 것 한 가지는 네이버 검색 중복문서 판독 자체에는 문제가 많다는 것이다.

 

이 외에도 네이버 중복문서 판독 관련해서는 다양한 경험들이 있을 것 같다. 사례를 공유하고 방법을 찾아 보는 것도 괜찮을 것 같아 아래 공개 댓글 또는 메일로 내용을 알려 주시면 감사 하겠다.

 

[contact-form][contact-field label=’이름 또는 필명’ type=’name’ required=’1’/][contact-field label=’중복문서 경험 사례’ type=’textarea’ required=’1’/][/contact-form]

 

Dear Naver blogger
당신이 운영 중인 블로그가 네이버 블로그고 다른 사람이 쓴 글이 마음에 들어 사용하고 싶다면 해당 글에 대한 당신의 의견을 간략하게 올리고 원문으로 링크를 해 주시라. 링크를 실천하면 검색엔진에서도(특히, 구글) 당신의 블로그를 더 높게 평가를 한다. 즉, 링크 빌딩(Link building)에 참여한(된) 원 저작권자와 당신 두 사람 모두 이익을 얻게 된다. 통째로 펌을 하는 것은 도둑과 다를 바가 없다. 남의 지식을 자기 것인 마냥 사용하는 것이 결코 유쾌한 경험은 아닐 것이다.
 


About the Author

Posted by zinicap 성과를 측정하지 못하는 마케팅은 광고주의 지지를 이끌지 못합니다. 100% 내부 기술에 의한 프로그램 개발, 데이터 분석, SEO & SNS 통합마케팅, ROI 측정이 가능한 솔루션 기반의 마케팅을 합리적인 가격에 제안 합니다. 문의 : UXKOREA
Bottom border