百度搜索引擎的工作原理解析

01.16 20:46:53发布

【我的问题】

1、蜘蛛是什么?是通过什么进行抓取的呢?

2、如何让蜘蛛抓你的网站呢?

3、搜索引擎的过程?怎样获取排名的?

4、怎么查看网站的抓取记录?

5、怎么查看网站的收录量和索引量?怎么查看是否被收录呢?

6、如何查看网站那些是内容已经被抓取了、那些没有被抓取呢?

百度搜索引擎的工作原理图

【我的回答】

1、蜘蛛(spider)存在作用于在庞大的互联网中分析并抓取你的网站里面的内容。是通过可点击的链接、图片、文字、视频。

2、可分为主动和被动,one:百度搜索站长平台-链接提交-自动提交啊&手动提交通知蜘蛛。two:找一些较大的平台,进行发帖:内容加上自己的网站文章的链接(建议50多个)抓取被人的同时把自己也给抓取了。

3、通过蜘蛛在网站抓取内容进入临时的数据库中,将信息过滤掉垃圾,筛选出优质的内容收录,然后优中选优才能进入索引区参与排名。

4、可以在站长平台(zhanzhang.baidu.com)-网站日志-抓取记录。

5、site:加域名可以在里面查看收录量和索引量。可以网站复制文章的链接,在百度搜索框输入链接,如果能搜索出文章,就是被收录了。

6、网站后面加/robots.txt就可以查找到那些被抓取的、那些没能被抓取的。


总结:百度搜索引擎首先是“抓取网站页面”(抓取的都是网站的源代码)——“百度搜索引擎数据库”(进行初步筛选过滤)——“筛选优质内容”(建立索引库)——“计算排名名词”给予用户搜搜关键词展现

TAG标签:

登录 后发表评论
0条评论
还没有人评论过~