第一步:抓取网页
谷歌拥有大量的计算机,这些计算机上有一种被人们称为“蜘蛛机器人”的软件googlebot,googlebot根据特定的算法,确定要抓取的网站、抓取频率以及从每个网站中获取的网页数量。如果要想谷歌抓取你的网站,那么你的网站必须向谷歌提交,或谷歌能通过别的网站找到你网站;
第二步:编制索引
抓取完网页以后,接着就是处理这些网页,谷歌这些网页中找到的所有字词和这些字词在每个网页上的位置,并把这些词汇编到包含大量索引的列表中。此外,谷歌还会处理关键内容标记和属性中的信息,例如 title 、 alt 属性。Googlebot 可处理许多类型的内容,但是象动态网页、图像内容、flash动画、多媒体不能处理。
第三步:提供结果
网页浏览者在输入某个词查询网页时,谷歌会搜索索引以查找匹配的网页,并返回与用户搜索最为相关的结果,也就是浏览者看到的通过排名的网页。谷歌声称这个排名结果由 200 多个因素来确定,PR就是其中之一;要让您的网站在搜索结果页中获得较好的排名,您一定要确保谷歌能够正确地抓取您的网站并将其编入索引。