第四日:google(谷歌)建站指导
作者:yafan99 日期:2008-09-28
这两天一些谷歌(google)优化的操作好像有些缓慢了点,就趁有空温习了下《google(谷歌)建站指导》。
网站管理员指南
遵循这些指南有助于 Google 查找您的网站、将其编入索引和对其进行排名。 即使您选择不采纳这些建议,我们也强烈建议您对"质量指南"多加留意,其中简要说明了一些可能造成网站从 Google 索引中彻底删除或受到其他处罚的违禁行为。 如果网站受到处罚,则可能不会再出现在 Google.cn 或任何 Google 合作伙伴网站的搜索结果中。
网站准备就绪后:
- 将其他相关网站链接到您的网站。
- 通过 http://www.google.cn/addurl.html 将其提交给 Google。
- 提交 Sitemap,作为 Google 网站管理员工具的一部分。 Google 使用您的 Sitemap 来了解您网站的结构,并提高对您网页的抓取率。
- 确保应了解您网页的所有网站都知道您的网站已处于在线状态。
- 将您的网站提交到相关的目录,例如,开放式目录管理系统和 Yahoo!,以及其他特定行业的专业网站。
- 网站应具有清晰的层次结构和文本链接。 每个网页应至少可以通过一个静态文本链接打开。
- 为用户提供网站地图,列出指向网站重要部分的链接。 如果网站地图上的链接超过 100 个左右,则您可能需要将网站地图拆分为多个网页。
- 创建实用且信息丰富的网站,并编写文字清晰且准确地表述内容的网页。
- 考虑用户会键入哪些字词来查找您的网页,并确保网站上确实包含了这些字词。
- 尽量使用文字而不是图片来显示重要的名称、内容或链接。 Google 抓取工具无法识别图片中所含的文字。
- 确保 <标题> 元素和 ALT 属性具有描述性且准确无误。
- 检查链接是否损坏,并确保 HTML 格式正确。
- 如果要使用动态网页(即网址中包含"?" 字符),请注意并非每一个搜索引擎信息采集软件都能抓取动态和静态网页。 这有助于缩短参数长度并减少参数数目。
- 将给定网页上的链接限制在合理的数量内(少于 100 个)。
技术指南
- 使用诸如 Lynx 的文本浏览器来检查您的网站,因为大多数搜索引擎信息采集软件查看您网站的方式与 Lynx 几乎一样。 如果诸如 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂功能造成您在文本浏览器中无法看到整个网站,则搜索引擎信息采集软件在抓取您的网站时可能会遇到问题。
- 允许搜索漫游器抓取您的网站,而不用会话 ID 或参数来跟踪其在网站中的路径。 这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。 如果采用这些技术,可能会导致对网站的索引编入不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。
- 确保您的网络服务器支持 If-Modified-Since HTTP 标头。 通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。 支持该功能可以节省您的带宽和开销。
- 利用网络服务器上的 robots.txt 文件。 该文件会告诉抓取工具哪些目录能够抓取,哪些不能。 确保该文件是适用于网站的最新版本,以免意外拦截 Googlebot 抓取工具。 请访问 http://www.robotstxt.org/wc/faq.html 了解如何在漫游器访问您的网站时对其进行指示。 您可以使用 Google 网站管理员工具中的 robots.txt 分析工具来测试 robots.txt 文件,以确保正确使用此文件。
- 如果贵公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎信息采集软件可以抓取您的网站。
- 使用 robots.txt 可避免抓取搜索结果网页或其他自动生成的网页,这些网页无法为来自搜索引擎的用户增加价值。
这些质量指南涵盖了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 仍可予以拒绝。 不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。 作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。
如果您认为其他网站正在滥用 Google 质量指南,请通过 https://www.google.cn/webmasters/tools/spamreport 举报该网站。 Google 希望能开发出灵活的自动解决方案来解决上述问题,从而尽量避免一一处理违禁行为。 我们收到的滥用行为报告将用于创建灵活的规则系统,以便于识别并阻止以后的滥用企图。
质量指南 - 基本原则
- 设计网页时该考虑的是用户,而不是搜索引擎。 不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种,这种做法通常称为"隐藏"。
- 请不要为了提高搜索引擎排名而弄虚作假。 一个简单的分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。 另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助? 如果不存在搜索引擎,我是否还会这样做?"
- 请不要参与旨在提高您的网站排名或 PageRank 的链接方案。 尤其要避免链接到违禁的网站或"恶邻",因为您自身的排名会受到这些链接的负面影响。
- 请不要使用未经授权的计算机程序来提交网页和检查排名等。 此类程序会消耗计算资源并违反我们的服务条款。 Google 不建议使用 WebPosition Gold™ 这类产品向 Google 发送自动查询或用程序编写的查询。
质量指南 - 具体指南
- 请避免使用隐藏文本或隐藏链接。
- 请不要使用隐藏真实内容或欺骗性的重定向手段。
- 请不要发送自动查询给 Google。
- 请不要加载使用无关关键字的网页。
- 请不要创建包含大量重复内容的多个网页、子域或域。
- 请不要制作欺诈性或安装有病毒、特洛伊木马或其他有害软件的网页。
- 请避免使用专门针对搜索引擎创建的"桥页",或使用其他如联属计划这类原创内容很少或几乎没有原创内容的"俗套方法"。
- 如果您的网站参与联属计划,请确保您的网站可为其增加价值。 提供独特且相关的内容,使用户有理由首先访问您的网站。
如果您断定您的网站不符合这些指南,可进行修改使其满足要求,然后提交网站以便重新审核。
向 Google 添加网站
纳入 Google 搜索结果是免费的,而且操作容易;您甚至不需要将网站提交给 Google。 Google 是一个完全自动化的搜索引擎,它使用称为"信息采集软件"的软件定期抓取网络并找到可添加到 Google 索引的网站。 事实上,列入搜索结果中的绝大多数网站都不是人工提交的,而是信息采集软件抓取网络时找到并自动添加的。
但是,如果您的网站提供专门的产品、内容或服务,则您可以通过在 Google 网络搜索和其他 Google 服务上分发它们以在全世界范围内传播。 有关更多信息,请访问 Google 内容中心。
要判断您的网站目前是否包含在 Google 索引中,请对您的网站网址进行"site:"搜索。 例如,搜索 [site:google.cn] 会返回以下结果:http://www.google.cn/search?hl=en&q=site%3Awww.google.cn+
虽然 Google 可抓取数十亿个网页,但遗漏少数网站也在所难免。 如果我们的信息采集软件遗漏某个网站,这通常是由于以下其中一种原因造成的:
- 网站未通过多个链接牢靠地连接到网络上的其他网站。
- 网站在 Google 完成最近一次抓取后才开始运行。
- 网站的设计让 Google 很难有效抓取其中的内容。
- 我们试图抓取网站时,该网站暂时不可用,或者我们收到了错误。 您可以使用 Google 网络管理员工具来查看当我们试图抓取您的网站时是否收到了错误。
我们的宗旨是公平准确地展示互联网内容。 为实现此目标,我们提供了有关构建便于抓取的网站的指南和提示。 虽然我们无法保证信息采集软件能找到某个特定网站,但遵循以下指南应该可以增加网站在我们的搜索结果中显示的机会。
考虑创建并提交关于您网页的详细 Sitemap。 Sitemap 是您向 Google 索引提交所有网址并获得网页在 Google 上的显示情况详细报告的一条捷径。 通过 Sitemap,我们可以随时自动获得有关您当前网页及其更新的所有信息。 请注意,提交 Sitemap 并不能保证您网站上的所有网页都会被抓取或包含在我们的搜索结果中。
上一篇
下一篇

文章来自:
Tags: