搜索引擎如何识别重复的内容

2021-02-27 16:42:30发布

1条回答
天宇老师
1楼 · 2021-02-27 16:49:36.采纳回答

我们通过一些具体的例子便可了解谷歌如何发现网络中的重复内容。在图6-28到图6-31所举的例子中,我们做了三个假设


·假设页面含有的文本是重复的内容(不仅仅是一个摘要,还有说明)。

·重复内容的每个页面都假设在一个独立的域名下。

·接下来的步骤都是经过简化的,目的是使讲解过程简单清楚,谷歌实际运行的方式并不是这样的(但效果却是如此)。

在内容重复方面,还有许多话题是值得一提的,因为这些话题会给刚刚接触内容重复问题的网站管理者造成障碍。


重复内容的位置

如果内容全部都在我的网站中,那么它会是重复的内容吗?是的,实际上,重复的内容会出现在一个或多个网站中。


重复内容的比例

重复内容在网页中占到多大的比例才会使你面临内容重复过滤的问题?遗憾的是,搜索引擎不会透露这方面的信息,因为这会损害它们预防和处理问题的能力。


另外,每个搜索引擎对这个比例的认定都会定期发生波动,而且相似点超过一个就需要进行重复内容检测。但实际上,页面并非需要完全相同才算内容重复。


代码与文本的比率

如果我的代码非常多,而页面中独特的HTML元素却比较少,那该怎么办呢?我的页面会被谷歌看作另一个副本吗?不会的,搜索引擎并不关心你的代码,它们感兴趣的是页面的内容,只有当代码长度达到极点时,才会成为问题。


导航元素与独特内容的比率

网站中的每个页面都有一个巨大的导航栏、大量页眉和页脚条目,内容却寥寥无几,谷歌会认为这些页面是复制的吗?不会的,谷歌和Bing在评估一个页面是否是副本之前,会分析出常见的页面元素,如导航。它们非常熟悉网站的布局,并且认识到网站所有(或许多)页面中的永久性结构是非常正常的,而且,它们会将注意力放在每个页面的比较“独特的”部分,而通常会忽略掉其余的部分。但需要注意的是,这类页面极有可能会被搜索引擎看作是内容单薄的。


授权内容

如果我想避免内容重复的问题,而又想将其他网页来源中的授权内容展示给网站的访客,那么我应该怎么做呢?使用meta name="robots" content="noindex,follow",将该标签放置在页面的标题中,这样一来,搜索引擎就会知道该内容不是为它们准备的,这是一个常规的做法,因为用户仍然可以访问并链接至该页面,且页面中的链接依然是具有价值的。


另外一种做法是确保你具有内容的专属权和发表权。

TAG标签:

相关问答