重复内容
重复内容通常是指域内或多个域之间存在的、与其他内容完全匹配或大致类似的内容。大多数情况下,重复内容本身不具有欺骗性。非恶意重复内容可能包含:
- 能够生成用于移动设备的常规和简化网页的论坛
- 通过多个不同网址显示或链接的存储项目
- 网页的可打印版本
如果您的网站包含多个具有大量重复内容的网页,您可以采用多种方法向 Google 指明您的首选网址。(这叫做”规范化”。)有关规范化的详细信息。
然而,在某些情况下,为操纵搜索引擎排名或获得更多的访问量,某些网站所有者会故意在多个域内安插重复内容。此类行为即属于欺骗性行为,这会导致非常糟糕的用户体验:用户在一组搜索结果中会看到大量相同的重复内容。
Google 会尽量使用不同的信息来编制索引以及显示网页。例如,这种过滤方法表示,如果您网站中的每篇文章都有”常规”和”可打印”两种版本,并且 robots.txt 或 noindex 元标记都未拦截任何一个版本,那么,我们会选择列出其中一种版本。如果 Google 认定显示重复内容是为了操纵我们的排名并欺骗我们的用户,尽管这种情况很少出现,我们也会在将此类网站编入索引和对其进行排名的过程中做出相应的调整。这样一来,网站的排名可能会受到影响,或者我们可能会将网站从 Google 索引中完全删除,网站删除后将不会再显示在搜索结果中。
您可采取某些措施来主动解决重复内容的问题,并确保访问者可看到您希望他们看到的内容。
- 考虑阻止将网页编入索引:您可能不希望让 Google 算法来决定文档的”最佳”版本,而是希望向我们指明您的首选版本。例如,如果您不希望我们将您网站文章的可打印版本编入索引,请禁止这些目录或在您的 robots.txt 文件中使用常规表达式。
- 使用 301 重定向:如果您已重组了您的网站结构,那么,请在您的 .htaccess 文件中使用 301 重定向(”永久重定向”)来灵活地重定向用户、Googlebot 和其他信息采集软件。(在 Apache 中,可以使用 .htaccess 文件进行此操作;在 IIS 中,可以通过管理控制台进行此操作。)
- 保持一致:尽量使您的内部链接保持一致。例如,请勿链接到 http://www.example.com/网页/、http://www.example.com/网页和 http://www.example.com/网页/索引.htm。
- 使用顶级域:为帮助我们提供最恰当的文档版本,请尽量使用顶级域来处理国家/地区特定的内容。例如,与 www.example.com/de 或 de.example.com 相比,我们更容易看出 www.example.de 中包含针对德国的内容。
- 谨慎联合供稿:如果您在其他网站上将您的内容显示为联合供稿,那么,在每次指定的搜索中,Google 会始终显示我们认为最适合用户的版本,该版本可能是您的首选版本,也可能不是。不过,这有助于确保将您的内容显示为联合供稿的每个网站都包含一个指向您原始文章的链接。您还可以要求使用您联合供稿材料的网站所有者使用 robots.txt 来拦截其网站上的版本。
- 使用网站管理员工具通知我们您希望您的网站以何种方式编入索引:您可以告知 Google 您的首选域(例如 www.example.com 或 http://example.com)。
- 最大限度地减少样板文件重复:例如,不要在每个网页的底部添加冗长的版权文字,而只添加一段简短摘要,然后链接到能够提供详细信息的网页。
- 避免发布空白内容:用户不喜欢看到”空白”的网页,因此请尽量避免使用占位符。例如,请勿发布尚无实际内容的网页。如果创建了占位符网页,请使用 robots.txt 来阻止 Google 抓取这些网页。
- 了解自己的内容管理系统:请务必熟悉内容在您网站上的显示方式。博客、论坛以及相关系统往往会以不同的格式显示相同的内容。例如,某个博客条目可能会显示在博客的主页、存档网页以及具有相同标签的其他条目的网页中。
- 最大限度地减少相似内容:如果您的多个网页内容相似,那么请考虑扩充每个网页的内容,或将这些网页合并成一个。例如,如果您的旅行网站上包含两个城市的不同网页,但两个网页中的内容相同,那么,您可以将这两个网页合并为一个网页来介绍这两个城市的相关信息,或者您也可以扩充每个网页的内容,使其包含相应城市的独特内容。
除非网站上的重复内容看上去意在欺骗用户以及操纵搜索引擎结果,否则,我们不会对含有重复内容的网站采取措施。如果您的网站存在重复内容问题,而您并未遵循上述建议,那么,我们会自行选择要在搜索结果中显示的内容版本。
但是,如果我们经过审查,发现您的网站有欺骗行为,并且我们已将您的网站从搜索结果中删除,那么请仔细检查您的网站。如果您的网站已从我们的搜索结果中删除,请参阅我们的网站管理员指南来了解详细信息。如果您已进行了更改并确信您的网站不再违反我们的指南,请提交网站以便让我们重新审核。
如果您发现其他网站抄袭(盗用和再发布)了您的内容,这未必会对您的网站在 Google 搜索结果页中的排名产生负面影响。但是,如果您发现任何出格的情况,欢迎您提交数字千年版权法案申请来声明对相关内容的所有权,并要求从 Google 索引中删除其他网站。
已更新 6/19/2009
转载:http://www.google.com/support/webmasters/bin/answer.py?answer=66359
最近评论