重复内容对SEO有何不良影响及相应的解决办法

重复内容对SEO有何不良影响及相应的解决办法

重复内容(Duplicate Content),即在同一个网站存在2个或以上内容相似或相同的页面,即会被搜索引擎判定为重复内容。

一个网站存在过多的重复内容,极大几率会被搜索引擎判断为作弊,从而影响搜索引擎索引及排名。

本文将会从重复内容的定义,对SEO的影响和如何解决重复内容问题多个方面进行说明。

什么是重复内容?

重复内容是与其他网站或同一网站的不同页面上的内容相似或完全相同的内容。网站上有大量重复内容会对Google排名产生负面影响。

换句话说:

重复内容是与出现在另一个页面上的内容逐字相同的内容。

重复内容图示

但“重复内容”也适用于与其他内容相似的内容……即使稍微重写。

类似内容图示

重复内容如何影响SEO?

一般来说,Google不希望对具有重复内容的页面进行排名。

事实上,谷歌声明

谷歌努力索引和显示具有不同信息的页面。

因此,如果您网站上的页面没有明确的信息,则可能会损害您的搜索引擎排名。

具体来说,这是具有大量重复内容的网站遇到的三个主要问题。

更少的自然流量:这很简单。Google不想对使用从Google索引中的其他页面复制的内容的页面进行排名。

(包括您自己网站上的页面)

例如,假设您的网站上有三个具有相似内容的页面。

内容相似的三个页面

Google不确定哪个页面是“原始”页面。因此,所有三个页面都将难以排名。

三个重复的页面将难以获得搜索排名

处罚(极其罕见):谷歌曾表示,重复的内容可能会导致处罚或完全取消网站索引。

严重的重复内容惩罚

然而,这非常罕见。并且仅在站点故意从其他站点抓取或复制内容的情况下才会这样做。

极其严重的内容重复惩罚

因此,如果您的网站上有大量重复页面,您可能无需担心“重复内容惩罚”。

更少的索引页面:这对于具有大量页面的网站(如电子商务网站)尤其重要。

有时谷歌不只是降低重复内容的排名。它实际上拒绝对其进行索引。

谷歌拒绝索引内容重复的页面

因此,如果您网站上的页面未编入索引,则可能是因为您的抓取预算浪费在重复内容上。

最佳实践

注意不同URL上的相同内容

这是弹出重复内容问题的最常见原因。

例如,假设您经营一个电子商务网站。

你有一个销售T恤的产品页面。

产品页面示例

如果一切设置正确,则该T恤的每种尺寸和颜色仍将位于同一URL上。

所有变体最好使用一个URL

但有时您会发现您的网站会为您产品的每个不同版本创建一个新URL……这会导致数千个重复的内容页面。

所有变体使用独立url的错误示例

另一个例子:

如果您的网站具有搜索功能,那么这些搜索结果页面也可以被编入索引。同样,这可以轻松地将1,000多个页面添加到您的网站。所有这些都包含重复的内容。

检查索引页面

查找重复内容的最简单方法之一是查看您网站中在Google中编入索引的页面数量。

您可以通过在Google中搜索site:example.com来执行此操作。

或者在Google Search Console中查看您的索引页面。

谷歌搜索控制台索引

无论哪种方式,此数字都应与您手动创建的页面数量一致。

如果这个数字是16,000或160,000,我们就会知道很多页面是自动添加的。这些页面可能包含大量重复内容。(当然,也非绝对。)

确保您的网站正确重定向

有时,您不仅拥有同一页面的多个版本……而且是同一站点的多个版本。

虽然很少见,但我在野外见过很多次。

当您的网站的“WWW”版本未重定向到“非WWW”版本时,就会出现此问题。

(或相反亦然)

如果您将站点切换到HTTPS……并且没有重定向HTTP站点,也会发生这种情况。

简而言之:您网站的所有不同版本都应该在同一个地方结束。

站点的所有版本都应该最终重定向到权威版本

使用301重定向

301重定向是解决您网站上重复内容问题的最简单方法。

(除了完全删除页面)

因此,如果您在网站上发现一堆重复的内容页面,请将它们重定向回原始页面。

使用301重定向修复重复内容问题

一旦Googlebot停下来,它就会处理重定向并仅索引原始内容。

(这可以帮助原始页面开始排名)

留意类似的内容

重复的内容不仅仅意味着从其他地方逐字复制的内容。

事实上,谷歌将重复内容定义为:

匹配内容或类似内容

因此,即使您的内容在技术上与现有内容不同,您仍然可能会遇到重复内容问题。

对于大多数网站来说,这不是问题。大多数网站有几十页。他们为每一页写独特的东西。

但在某些情况下,可能会出现“相似”的重复内容。

例如,假设您经营一个网站,教人们如何说法语。

你服务于大波士顿地区。

好吧,您可能有一个围绕关键字优化的服务页面:“波士顿学习法语”。

围绕关键词“波士顿学习法语”进行优化

还有另一个试图为“剑桥学习法语”排名的页面。

围绕关键词“剑桥学习法语”进行优化

有时内容在技术上会有所不同。例如,一页列出了波士顿位置的位置。另一页有剑桥地址。

但在大多数情况下,内容非常相似。

技术上不同的页面可能有非常相似的内容

这在技术上是重复的内容。

为您网站上的每个页面编写100%独特的内容是否很痛苦?是的。但是,如果您认真考虑对网站上的每个页面进行排名,那么这是必须的。

使用规范标签

rel=canonical标签告诉搜索引擎:

“是的,我们有一堆内容重复的页面。但是这个页面是原始的。你可以忽略其余的”。

使用规范标记区分重复页面和原始页面

谷歌表示,规范标签比阻止具有重复内容的页面更好。

canonical标签

(例如,使用robots.txt或网页HTML中的noindex标记阻止Googlebot)

因此,如果您在网站上发现一堆包含重复内容的页面,您可以:

  • 删除它们
  • 重定向它们
  • 使用规范标签

使用工具

有一些SEO工具具有旨在发现重复内容的功能。

例如,Siteliner会扫描您的网站以查找包含大量重复内容的页面。

siteliner

合并页面

就像我提到的那样,如果您有很多包含直接重复内容的页面,您可能希望将它们重定向到一个页面。

(或使用规范标签)

但是,如果您有类似内容的页面怎么办?

好吧,您可以为每一页制作独特的内容……或者将它们合并到一个巨型页面中。

例如,假设您的网站上有3篇技术上不同的博客文章……但内容几乎相同。

不同但相似的博客文章

您可以将这3篇文章组合成一篇100%独一无二的精彩博客文章。

将类似的帖子合并为唯一一篇

因为您从网站中删除了一些重复的内容,所以该页面的排名应该比其他3个页面的总和更好。

不索引WordPress标签或类别页面

如果您使用WordPress,您可能已经注意到它会自动生成标签和类别页面。

wordpress标签页

这些页面是重复内容的巨大来源。

所以它们对用户很有用,我建议在这些页面上添加“noindex”标签。这样,它们就可以在没有搜索引擎索引的情况下存在。

您还可以在WordPress中进行设置,以便根本不会生成这些页面。

学习更多

Google如何处理重复内容?:来自Google的Matt Cutts的关于Google如何查看重复内容的视频(需要梯子)。

重复内容惩罚的神话:这篇文章概述了为什么大多数人不需要担心“重复内容惩罚”。