如何使用网站的子框架

2021-02-27 21:46:30发布

1条回答
天宇老师
1楼 · 2021-02-27 22:02:21.采纳回答

有时,你可能不希望搜索引擎看到网页中的某一段内容(或整个网站中的某一块内容),正如我们在本章前面部分所介绍的,你可以利用子框架巧妙地处理这一问题

这个概念非常简单:通过使用子框架,你可以将另一个网址中的内容嵌入到你所选中的页面内,然后使用robots.txt阻止搜索爬虫访问子框架,确保搜索引擎“看不到”页面中的这部分内容。网站之所以要这样做,可能有多方面的原因,包括避免内容重复的问题,缩小页面规模,或减少页面中可爬行链接的数量(控制链接权限的流动)。


将文本隐藏在图片中

正如我们之前所讨论的,大型搜索引擎依然无法完全解读图片中的文本(而且所需的处理权限是一个严重的障碍),我们通常不建议将内容隐藏在图片中,因为它不适合其他设备(尤其是移动设备),而且其他程序也无法获取(如屏幕阅读器)。

将文本隐藏在Java小应用程序中

与图片中的文本类似,Java小程序中的内容也无法被搜索引擎解析,不过,将其作为隐藏文本的工具确实有点奇怪。


强制的表单提交

搜索引擎不会为了自己能够访问搜索或提交中的信息而提交HTML格式,因此,如果你将内容放在一个强制表单提交中而未从外部导入链接,那么你的内容便不会出现在搜索引擎中(如图6-43所示)。


使用注册或密码保护

密码保护或其他的网站付费门槛能有效阻止搜索引擎访问内容,任何一种人工验证的要求也会起到这样的作用,如CAPTCHA(该对话框要求用户复制字母或数字组合才能获取内容访问的权限),大型搜索引擎不会试着去猜密码或绕开这些系统。


从搜索引擎的索引中删除网址

一个次要的、后索引的策略是通过网站验证或使用搜索引擎工具将网址从大型搜索引擎中删除。例如,谷歌允许你使用搜索控制台删除网址,Bing也允许你通过Bing网站管理者工具将网址从其索引中删除。

TAG标签:

相关问答