칼럼
- 제목
-
색인생성에 관하여
내용
색인생성은, 구글에서 페이지를 가져와 색인에 추가하는 과정입니다.
구글에서 크롤링을 통해 파악한 페이지를 방문하여 각 페이지에 관한 정보를 분석하는 과정을 걸친 후
페이지의 콘텐츠, 이미지, 동영상 파일을 분석하여 어떤 페이지인지 파악합니다. 이 파악된 정보는 구글의 데이터 베이스, 구글 색인에 저장됩니다.
쉽게 말해, googlebot은 크롤링 하는 각 페이지를 처리하여 페이지의 콘텐츠를 이해합니다.
페이지가 발견되면 이 페이지가 어떠한 페이지인지 파악하고자합니다. (이과정을 색인생성이라고 함)
여기에는 텍스트 콘텐츠, 핵심콘테츠 태그 및 속성(title 태그 및 alt 속성이미지, 동영상 등)이 처리됩니다.
googlebot은 대부분 콘텐츠 유형을 처리할 수 있지만, 일부 처리가 불가능한 유형도 있습니다.
구글에서는 크롤링과 색인생성을 하는 중에 페이지가 다른 페이지의 중복되는지 또는 표준 페이지인지 판단합니다.
만약 페이지가 중복으로 간주된다면 크롤링 빈도가 훨씬 적어집니다. (유사한 페이지는 문서로 그룹화되기때문에)
구글봇으로 파악된 페이지 정보는 거대한 데이터 베이스인 '구글 색인'에 저장됩니다.
<색인 개선하기>
구글에서는 noindex 명령어가 포함된 페이지는 색인을 생성하지 않습니다.
문서의 표준 url은 구글이 가장 자주 크롤링하고 색인을 생성하는 url이고 다른 url은 중복 url이나 대체 url로 간주되며,
사용자의 요청에 의해 때때로 크롤링 되거나 게재될 수 있습니다.
웹사이트 內 페이지는 주제를 전달하는 페이지 제목을 사용하시기 바랍니다.
이미지 보다는 텍스트를 사용하여 콘텐츠를 전달하며,
동영상과 이미지에는 주석을 달아 사용해주시면 구글에서 해당 이미지를 이해하여 색인으로 생성하기 조금 더 유리합니다.
<고유하고 정확한 페이지 제목>
<title> 태그는 사용자는 물론 검색엔진에 특정 페이지의 주제가 무엇인지 알려줍니다. <title> 태그는 html 문서의 <head> 요소 內 위치해야 합니다.
또한 사이트의 페이지마다 고유한 제목을 만들어야 합니다.
** 문서 : 유사한 페이지의 모음입니다. 사이트에 중복 페이지가 있는 경우 표준 url이 있고, 대체 url 또한 있을 수 있습니다.
문서 url은 같거나 다른 조직의 것 일 수 있습니다. 구글은 모바일과 pc,
사용자의 언어, 위치 및 여러 다양한 변수에 따라 검색결과에 표시할 최선의 url을 선택합니다.
구글은 자연 크롤링 또는 사이트에서 구현한 기능을 통해 사이트에 관련한 페이지를 찾습니다.
다른 조직의 관련 페이지는 사이트에서 명시적으로 코딩한 경우에만 대체 페이지로 표시될 수 있습니다.
** url : 사이트의 특정 콘텐츠에 접속하는데 사용하는 url입니다.
** 표준 페이지(url) : 구글이 문서에서 가장 대표라고 간주하는 url입니다.
구글은 항상 이 url을 크롤링하지만 문서의 중복 url을 크롤링 할 때도 있습니다.
** 대체/중복 페이지(url) : 구글이 때때로 크롤링 할 수 있는 문서 url입니다. 구글은 사용자 및 요청에 맞는 경우 이 url을 게재하기도 합니다.
예를 들어 데스크톱(pc) 사용자를 위한 대체 url은 표준 모바일 url 대신 데스크톱 요청을 위해 게재됩니다.
URL 복사
아래의 URL을 전체 선택하여 복사하세요.
게시물수정
게시물 수정을 위해 비밀번호를 입력해주세요.
댓글삭제게시물삭제
게시물 삭제를 위해 비밀번호를 입력해주세요.