구글 검색의 정보 구성 방법
공식 구글 검색 정보 구성 방법 이 글을 참고하며 작성하였다.
구글의 크롤링
크롤링으로 정보 찾기
검색 색인은 대부분 크롤러라고 알려진 소프트웨어를 통해 만들어진다. 사람이 웹에서 정보를 탐색하는 것처럼 크롤러라는 봇이 공개적으로 접근 가능한 웹페이지를 자동으로 방문하고 공개 페이지에 있는 링크를 따라가며 이 페이지에서 저 페이지로 옮겨가며 모든 링크와 그 도큐먼트에 있는 정보, 접근 가능한 컨텐츠를 검색 색인에 저장한다.
색인 생성을 통한 정보 구성
크롤러가 웹페이지를 찾으면 구글 시스템은 브라우저처럼 페이지의 컨텐츠를 렌더링하고, 검색 색인에서 웹사이트에 대한 모든 주요 신호를 추적한다.
구글 검색 색인에는 수천억 개의 웹페이지가 있으며 그 크기가 1억 Gb를 훨씬 넘는다고 함
새로운 정보를 업데이트 하는 크롤링
웹페이지는 관리자가 정보를 업데이트하던지, 사용자가 게시글을 업데이트하던지의 식으로 어떤 방식으로든 웹과 각종 컨텐츠가 끊임없이 변화한다. 구글의 크롤링 프로세스도 이를 따라잡기위해서 쉬지 않고 작동하며 이전에 방문했던 웹사이트를 방문하며 새로운 정보를 리프레쉬한다.
구글의 검색 프로세스
구글은 위에서 언급했듯이 1억 Gb를 훨씬 넘는 크기의 데이터를 가지고 있다. 그렇다면 유저가 구글에 검색했을 때 어떤 방식으로 상위의 정보가 표시되는 것일까?
검색 알고리즘
구글의 알고리즘은 관련성과 정확성을 위해 매우 복잡한 알고리즘으로 구성되어있다. 하나의 문장을 검색해도 알고리즘은 아래의 그리고 더 한 필터를 기반으로 사용자에게 정보를 표시한다.
검색어의 단어, 페이지의 관련성 및 유용성, 출처의 전문성, 사용자의 위치 및 설정과 같은 다양한 요소와 신호를 고려합니다. 각 요소에 적용되는 가중치는 검색어의 성격에 따라 달라집니다. 예를 들어 시사 관련 검색어의 경우 사전 정의 검색어에 비해 최신 콘텐츠인지 여부가 더 중요합니다.
검색어의 의미
구글은 생각할 수 있는 거의 모든 요소와 신호를 고려하여 검색어에 대한 정보를 표시한다. 심지어 검색어의 성격에 따라 표시되는 순위가 달라진다.
예를 들어 노트북 밝기 변경 이라고 사용자가 검색했지만 블로거가 게시한 노트북 밝기 조정에 대한 컨텐츠를 표시하고, 한국어로 검색했다면 한국어 위주의 검색을, 프랑스어로 검색했다면 프랑스어 위주의 검색결과를 표시한다. 또 ‘피자’를 검색하면 배달을 제공하는 근처 가게(GPS기반)에 관한 검색 결과를 표시한다.
댓글남기기