搜索引擎看不到识别什么?

2021-02-04 22:36:35发布

1条回答
念梦 - 念梦SEO
2楼-- · 2021-02-05 22:07:48

了解搜索引擎在网页上可以“看到”哪些内容


搜索引擎爬虫以及检索程序基本上都是软件程序。这些程序非常有用。它们爬取几百万亿的网页、分析所有页面的内容,然后分析各个网页之间互相链接的方式。再然后它们将其整合到一系列的数据库中,可以在用户输入搜索查询词后的几毫秒内获取高度相关的搜索答案。


这是一个了不起的成就,但是也有其局限性。软件非常机械化,并且它仅仅能理解大多数网页的某些部分。这个搜索引擎爬虫分析某个网页的源HTML格式。如果你想了解是什么样子,可以通过使用你的浏览器浏览源代码来实现。


显示的是在Chrome浏览器中如何实现,图2-15显示的是在Firefox浏览器中如何实现。一般来说,你可以在某个网页中通过右击鼠标来访问隐藏的菜单。


同样有很多浏览器开发工具(附件和扩展工具)能够帮助你在浏览器中访问源代码,用来发现网页应用以及JavaScript库。一个最为广泛使用的代码分析工具是WebDeveloper,由ChrisPederick研发,用于Chrome、Firefox以及Opera。


一旦你浏览了网页源代码,你就看到了网络服务器传送给你的浏览器相同的代码。这就是大多数搜索引擎爬虫看到的内容(搜索引起那个同样可以看到页面的HTTP头部设置,这是网络服务器传送给它的位置状态码)。在某些情况下谷歌会在页面上运行JavaScript。要了解它们的操作过程,请参照第6章的内容。在试图分析某个网页对用户可见的内容时,搜索引擎会在很大程度上忽略导航的代码以及排列代码,如图2-16所示,因为它和网页的内容没有联系。


搜索引擎爬虫对网页的HTML文本最感兴趣。图2-17显示的是Moz主页的HTML文本的案例。


仍然显示了一些HTML编码,但你可以看到“常规”文本在编码中的显示。这是爬虫要寻找的独特的内容。


此外,搜索引擎也读取一些其他的元素。其中的一个部分就是网页标题。网页标题是某个页面排名中最重要的因素之一。它是在浏览器标题栏中显示的文本(高于浏览器菜单以及地址栏)。


第一个高亮区域是<title>标签。<title>标签同样也经常用在搜索结果列表显示的标题中


除了页面标题,搜索引擎之前使用元关键词标签。这是一串你想和页面相关联的关键词。几年前,垃圾邮件制作者(那些通过违反搜索引擎规则试图控制搜索引擎结果的人)破坏了这个标签的SEO价值,因此它的价值现在可以忽略,因为搜索引擎已经不再使用它。不推荐花费时间在元关键词中,因为它缺乏搜索引擎优化价值。


第二高亮区域显示的是元关键词标签的一个案例。

同时,搜索引擎也读取元描述标签(中的HTML源第三个高亮区域)。然而,一个元描述标签并不被搜索引擎直接用在它们的排名算法里。


然而,元描述标签的作用也很关键,搜索引擎经常将它作为搜索结果的描述部分。因此一个写得很好的元描述可以很大程度地影响你的网站获得的点击量,点击量又会影响你的排名。因此,花费时间在元描述上很有价值。


对trip advisor进行的搜索,显示了元描述标签被用作搜索结果中的描述部分。


注意当用户的关键词出现在搜索结果中时一般都是用黑体显示的(有时候相近的同义词也是用黑体显示)。举个例子,,TripAdvisor在描述的开始部分用黑体显示。这被称为上下文关键词(KWIC)。


搜索引擎读取的第四个元素是图像的alt属性。alt属性本来是用来呈现给那些无法查看图片的用户的信息:


·有视觉障碍的用户无法浏览图片;

·为了快速冲浪而把图片关闭的用户。这一般是没有宽带连接用户容易出现的问题。


对有视觉障碍的用户的支持仍然是使用alt属性的一个重要原因。你可以通过访问W3C网络可达性倡议页面来获取更多信息。


搜索引擎也会读取某个图像标签()的><></></><>搜索引擎读取的另外一个元素是<>标签。从历史观点上说,搜索引擎读取>标签。这是个非常简单的><></></><><>部分是“你的浏览器不支持>标签包含“这个世界毕竟很小”。<>标签应该仅仅在><></></>

相关问答