易混淆词组搜索引擎是怎么处理的?

2021-02-04 22:37:31发布

1条回答
念梦 - 念梦SEO
2楼-- · 2021-02-05 22:16:46

易混淆词组、消除歧义以及差异性


与之相反,输入的词语对搜索引擎来说一直是一个巨大的挑战。其中一个巨大的挑战就是消除歧义。例如,当人们输入boxers时,人们指的是职业拳击手、狗的品种还是某种类型的内衣?另外一个例子是jaguar,曾经指代丛林猫、车、足球队、运行系统以及一种吉他。用户到底指的是什么?


搜索引擎经常会遇到这种模棱两可的情况。这里提供的两个案例本身有其固有问题,但事实上问题更大。例如,如果某个人在搜索框输入“cars”,他是想:


·想要阅读评论?

·想要去车展?

·想要买车?

·想要阅读关于车的新科技?


查询词“cars”是如此宽泛,仅仅基于查询词无法判定搜索用户的意图。搜索引擎处理这种情况的一个方法是查找此用户之前输入的搜索条目来判断他的意图。我们已在1.4.4节“自适应检索”中描述更多此方面的内容


他们使用的另外一种方法是提供不同的结果。比如说,如图2-24显示的一次通用搜索,这次是搜索“GDP”的。


这就涉及一个非常重要的排名概念。很可能图2-24中的投资百科不是自己为其相关性和驱动链接重要性得分做出了严格的分析,从而位于搜索结果第一页,实际上是对多样性的需求提高了本页面的排名。通过这种方式来改变搜索结果的概念被称为内容多样化(Query Deserves Diversity,QDD)。


一个严格的基于相关性和重要性的排名系统可能会显示一系列额外讨论GDP的政府相关页面。然而,已经显示的政府页面就能够满足大多数用户的搜索需求,但是对那些没有满足的搜索用户来说,提供同种类型的搜索页面不大可能会提高他们对搜索结果的满意度。


引入一些多样性能够使谷歌为那些寻求除政府页面之外的搜索结果的用户提供满意的答案。据谷歌测试表明,这种基于多样性的方法在其用户中引起了更高层次的满足。


例如,非多样性搜索结果的测试数据指出,搜索结果页面的点击率下降,用户进行了更多的查询修改,甚至由此而引发相关搜索次数的提高。


慎重地将多样性引入到搜索结果算法中的做法是很有道理的,并且可以加强搜索用户对以下搜索条目的满意度:


·公司名字(搜索用户可能希望获取积极的或者消极的言论、以及公司的官方域名)。

·产品搜索(一般电子商务搜索结果可能会占据搜索结果页面,但是谷歌也试图提供一些评论或者非商业的、相关的内容)。

·新闻和政事搜索(可能会莽撞地显示某个问题的“各个方面”,而不是获得很多链接的左翼或者右翼博客)。

搜索引擎也会基于搜索用户的搜索历史以及他们的搜索行为来提供个性化搜索结果。例如,如果一个用户曾经搜索过纸牌游戏,然后搜索多米诺,搜索引擎可能就会选择将多米诺骨牌的相关搜索结果放置最靠前的位置,而不是强调电力公司。


新鲜感在哪里比较重要

在大多数时间里,搜索引擎从比较陈旧的经得住时间考验的资源中获取搜索结果是有道理的。然而,有的时候搜索结果应该从较为新的资源中获取信息。


例如,当有突破性新闻时,比如一次地震,搜索引擎几秒钟后就会获得查询,第一批文章会在15分钟之内出现在网络上。


在这种情况下,就需要实时地发现信息并且对新的信息进行检索。谷歌将这种概念称之为内容新鲜度(QDF)。就纽约时报而言,内容新鲜度将若干因素考虑在内,例如:

·搜索量;

·新闻报道;

·博客报道。


内容新鲜度适用于最新的新闻报道,也适用于其他场景,例如热门的、新折扣的交易或者获取很多搜索量和媒体报道的新产品发布。有猜想说,谷歌会对具有较高页面排名的网站使用内容新鲜度原则。

相关问答