如何优化新闻搜索谷歌新闻网站

2021-03-04 21:59:44发布

1条回答
天宇老师
1楼 · 2021-03-04 22:47:03.采纳回答

作为一个主要的、以新闻为基础的网络内容流量驱动器,谷歌新闻应当是你新闻搜索优化清单的首选。谷歌新闻并非仅仅为出版商提供谷歌新闻网页,还为其提供可见性,因为出版商的文章也会出现在谷歌的常规搜索中。头条新闻和时事的某些查询将触发谷歌显示更新的结果。有些文章在群集中呈现,并标记为“在新闻中”,这使出版商有机会使他们最近的文章出现在结果页,或在结果页的顶部附近。


多种查询将触发“消息框”。比如灾害(海啸、地震、风暴)、攻击(校园枪击事件,恐怖分子袭击)、选举、假期、重大体育赛事(奥运会、世界杯、超级碗)等,大品牌的名字以及知名人士死亡。图10-16显示一个消息框插入SERP顶部,查询“ebola”消息。


直到最近,搜索结果中的新闻集群只包含出版商批准的文章,而出版商必须为谷歌新闻所接受。2014年10月,谷歌开始在消息框中包含其他来源,如reddit、Twitter或非常小的利基网站。


 验收标准


出版商必须满足非常严格的质量标准才能为谷歌新闻接受,必须坚决执行这些标准(包括进入和维持的标准)。在“谷歌新闻出版商帮助部分”中,谷歌概述了对新闻的详细要求。在应用之前,你应该仔细浏览这些准则。


一般要求如下:


·你的网站必须明显地包含可访问的联系信息,包括公司实际地址、电话号码和电子邮件。


·如果你的网站以常见的出版物名称命名,有可能在谷歌新闻中早已有出版商用了相同的名字,那么,你将需要用一个独特的名字提交你的网站。例如,明星论坛报将其出版名称提交为明尼阿波利斯明星论坛报。一定要省略多余的字和描述性句子。


·如果你的网站在多种语言中可用,那么你必须为每个版本提交单独的请求。


应用程序进程


一旦你确定你的网站符合所有的要求,那就将你的应用程序提交给谷歌新闻。


应全面、精确地填写应用程序。谷歌审查一个加入请求会花费几周的时间。如果申请被驳回,谷歌不会提供理由,并且在60天内你不能再次申请,因此,要确保你提交的内容尽可能准确、完整。


3 付费和订阅网站


需要注册才能查看文章或“收费”的网站,访问其文章需要订阅,这些网站在谷歌新闻中是要这样被标记的


标记为“订阅”的故事的点击量往往比免费故事的少,从而降低了该出版物的点击率。因为点击率在排名算法中是一个强烈信号,比起免费网站,在谷歌新闻中订阅网站会得到的关注度往往更少。


谷歌会给订阅网站贴上标签,作为一种替代方法,谷歌提供了一个叫做“首次点击免费”的程序。通过首次点击免费,出版商必须允许谷歌相关用户绕过付费环节。在这期间的任何额外的点击,出版商都会向用户呈现收费窗口。


首次点击免费要求来自谷歌的访客能够每天免费点击五次,不管是“硬”收费(无免费文章可读)还是“计量收费”(特定时间段内,通常为一个月,允许浏览特定的内容)。例如,《纽约时报》限制非订阅者每月只能看10篇文章。理解首次点击免费覆盖出版商计量的分配内容是很重要的。一旦用户查看了她每月可看的免费文章,她必须订阅(或注册)以查看更多的文章。然而,若此用户来自谷歌,则实行首次点击免费的站点必须仍然允许此用户免费访问第一篇文章,并且必须保证每天


5次。


谷歌新闻发布中心


当谈到内容时发现,谷歌新闻与谷歌网络搜索是不同的,前者是一个静态环境,而后者是动态的。若谷歌新闻接受一家出版商,那么爬虫程序会从一些进入数据库的网页中低于一般水平进行抓取。如果你的网站推出一个新的分页面,谷歌新闻不会在你的导航中抓取新链接来找到那个页面。你必须通知谷歌新闻出版商帮助团队,他们将手动更新系统,从而给你的爬虫程序添加新的源页。


动态的、不断增长的出版商网页会创造一个烦琐的、经常不确定的周期,在这个周期内会频繁地请求更改你的注册信息,这是一个手动的过程。谷歌不喜欢手动过程,新的谷歌新闻发布中心也是如此。这个工具,允许出版商更新部分页面及其标签,旨在使新网页的添加、移除和“贴标签”更加容易。


如何添加、编辑或删除部分URL


显示谷歌新闻中管理部分的屏幕。


如何更新源详细信息


谷歌新闻中管理源详细信息的屏幕。


技术要求


谷歌新闻有一些特殊的技术内容要求,其中许多都比网络搜索算法更特别。例如:


·构成一篇文章日期信息和作者署名的文本,应是文章标题和第一句之间唯一的文本或代码。它应该放在单独的HTML行中,在文章的标题和文章的正文文本之间。


·每篇文章的URL必须包含一个唯一的编号,该编号由至少三个数字组成;但是,若URL通过新闻网站地图提交,则此规则就无效。


·文章必须包含至少80个单词。这意味着短新闻简报或视频网页和一个简单的段落可能会被列入新闻索引中。


·一节或一篇文章的HTML源页的大小必须低于256KB。对使用无限滚动或有大量用户评论的页面来说是一个问题。


·在同一URL显示多篇文章的页面将不会包括在内。


·嵌入在JavaScript中的图片链接或链接不能被抓取。


·节和文章页必须在同一个域(或子域)来作为你的主网站(例外情况是在YouTube.com上的视频和Feedburner.com上的RSS信息接口)。


·在UTF-8编码的网站都是最优的,文章页面必须有text/html、text/plain,或者application/xhtml+xml的HTTP内容类型。


·如果你的出版物兼有新闻和其他类型的内容,比如建议专栏、指导性文章、天气预报、股票数据、分类广告或付费广告,谷歌新闻希望你阻止此内容抓取。有三种方法可以做到这一点:


—使用页面特定的元标签:


—将你的所有非新闻内容放在不同的子目录(或子域),如http://example.com/jobs或http://jobs.example.com,并阻止googlebotNews访问这些robots.txt文件中的节。


—只为你的新闻文章创建一个谷歌新闻网站地图,告知谷歌新闻你更愿意使文章从这里专门抓取。标题


标题的技术规格如下:


·标题必须包含至少10个字符,长度在2至22个字之间。


·不要链接文章标题(链接的标题在一些网站模板中是默认设置的)。


·在一个<h1>标记将文章标题打包。理想情况下,这将是该页面上唯一的<h1>标签。


·文章标题也应该在<title>标签中,放在任何附加信息之前,如出版商名称或者节。


—像这样:<title>This is the headline-Lifestyle-DailyPublisher</title><title>


—但不是像这样:<title>Daily Publisher-This is the headline</title>


—也不是像这样:<title>Lifestyle:This Is the Headline-DailyPublisher</title>


·如果<title>标签中的标题与<h1>标签中的标题截然不同,则可以防止这个故事涵盖在谷歌新闻中。


元标签


谷歌新闻关于使用元标签有一定的要求。


规范。如果你在你的网站内的多个页面上发布了同一篇文章,则使用rel="canonical"链接元素来指定用哪个URL为故事排名。


元描述。谷歌新闻并不使用元描述标签作为片段。相反,抓取程序关注文章标题附近的正文文本。


有两个元标签是特定于谷歌新闻的,并不适用于网络搜索:news_keyword和standout。


news_keyword。这个标签是唯一的页面关键词标签,是用来通过主要搜索引擎进行排名的。


news_keyword标签将被放置在页面<head>标签内。它可以用来指定与文章高度相关的关键词,但可能不会在标题或故事的第一段中。例如,一篇文章,标题为“美国与比利时打破另一个收视率最高纪录”,可以使用这样的标记:


此字段中唯一允许使用的标点符号是逗号,应该用于分隔每个关键词或短语。你最多可以为一篇特定的文章使用10个术语,所有关键词有相等的值,所以第一个关键词不会比第10个词有更强的信号。标题或第一段中包含的单词不需要在news_keywords标记中重复。


standout。当出版商发布一个新闻故事时,对谷歌新闻来说将此文章归类为原始源是很重要的,但算法一直是个挑战。2010年年底,谷歌宣布了一个叫做standout的新的元标记,出版商可以用来指定一篇特定的文章,作为一个故事的来源或一篇独有的新闻稿件。谷歌提供以下标准来确定何时使用此标记是恰当的:


·这篇文章是故事的原始来源。


·你的组织在报告或生产这篇文章上已投入大量资源。


·这篇文章值得特别关注。


·standout标签在过去的日历周内,在你文章中使用次数不超过7次。


若另一个出版商发布了一个故事,你的公司要写关于这篇故事的文章,引用这篇故事,或者从这篇故事中摘取内容,谷歌强烈建议在你的文章中使用此标签,通过在你的standout标签中援引它的URL来将那个出版商标记出来。如果你的文章利用多篇原创的或独有的新闻稿件,你可以在你的文章内使用多个standout标记引文。从其他出版商处引用standout文章不会对你每周七个自我引文的限制产生不利影响。


这篇文章发布后会无法添加standout标签。此标签被放置在页面<head>中,可以编码为元标记或链接标签:


当href URL指向本身时,谷歌将标记解释为自我引文。当href URL指向另一个出版商的页面时,该标签被认为是向外的引文。


文章到期。此标记被视为删除请求,用于指定在特定时间内,一篇文章应从谷歌索引中删除。要正确运行的话,该标签在第一次抓取时,必须包括在文章中。删除日期大约过去一天后,该网页便从搜索结果中消失。日期和时间必须按如下所示,在RFC850格式中指定:


日期。除了文章署名处的指定日期和时间外,也可以用此标签。使用W3C格式:


 谷歌新闻中的缩略图片


谷歌新闻几乎在每个群集中都包含一个缩略图,这些图片在网络搜索结果中或者在谷歌新闻首页和栏目页面显示(如图10-21所示)。把你文章中的图片用作一个群集的缩略图可以增加该文章的点击量。


图片必须在出版商的域上进行托管——不是外部域或内容传送网络(CDN)——必须使用像.jpg一样的标准文件扩展名。


使用以下准则来增加涵盖你文章图片的可能性:


·把图片放置在文章标题附近;


·将图片内联放入文章内容中;


·使用精心编写的说明文字;


·使用较大尺寸(至少60×60像素)的图片。


你可以为谷歌新闻找到额外的图片信息。10.8.7 重新抓取


谷歌新闻确实会对文章进行重新抓取,但大多数只发生在发现后的几个小时内。谷歌的系统一般能更好地检测和显示更大的更新,如标题或第一段的重大改变。如果文章在谷歌新闻中索引后被编辑,则无法保证该文章重新被抓取并更新。


 谷歌新闻网站地图


谷歌新闻使用标准的网站地图协议,但有额外的新闻特定标签,如相关关键词、文章图片、内容流派和相关股票行情收报器。即使一个标准的网站地图文件可以包含多个类型的内容,但最好还是为你的新闻内容创建一个单独的新闻网站地图。新闻网站地图允许用户更有效、更综合地发现你的内容,因为你可以将你的新闻文章输入谷歌新闻中,即使它们不是从消息数据库中的部分页链接而来的。如果你的网站包含各种新闻和非新闻内容,你可以使用网站地图来更精确地控制哪些内容被提交。新闻网站地图将接受不包含三个数字的URL,这三个数字是用于抓取时进行侦查的。


特别为以下内容推荐新闻网站地图:


·最近已添加到谷歌新闻的网站;


·经常添加部分新页面或更改现有部分URL的网站;


·为用户提供几个跟踪链接到新闻文章的网站


注意谷歌网站地图生成器,不能用于创建资讯网站地图。谷歌推荐的很多第三方工具可以帮助你生成一个谷歌新闻网站。


新闻网站地图准则


创建资讯网站地图的准则如下:


·将网站地图上载到你的根目录;


·在发布一篇新的文章之后立即更新网站地图;


·不包括超过48小时的文章;


·对于发布日期,请参阅W3C格式,使用“完成日期”格式(YYYY-MM-DD)或“完成日期加上小时、分钟和秒”格式,用时区指示符(YYYY-MM-DDThh:mm:ssTZD)格式。在你的网站使用这篇文章发表的原始日期和时间,而不是这篇文章被添加到你的网站地图的时间;


·有1000多个URL的资讯网站地图必须用网站地图索引文件,分成多个网站地图。


新闻网站地图字段


描述新闻网站地图字段的准则和要求如下。


发布名称。请确保你网站地图中的出版物名称与你向谷歌新闻提交请求时所用的名称完全匹配。如果你的出版物名称是Daily Herald,但你提交的是Gotham DailyHerald,因为谷歌新闻已经包含名为Daily Herald的出版物,故你的网站地图出版物名称必须使用Gotham Daily Herald。


访问(付费和注册)。<access>标签采用下列中的一个值。


订阅:一篇要求用户支付才能查看内容的文章。


注册:一篇要求用户注册一个免费账户才能查看内容的文章。


对于那些拥有各种免费和付费文章的出版商,唯一的方法是使用一个新闻网站地图的信息接口内的<access>标签,对这些文章进行逐条设计。


类型(内容类型)。<genres>标签的值适用于并限于以下五个选项时,就被要求使用。标签可以包含多个值,以逗号分隔。


Satire(讽刺类文章):一篇讽刺其主语以起到教化目的文章。


OpEd(专栏):一篇来自你的网站专栏部分的表达观点的文章。


Opinion(议论文):任何其他不会出现在专栏页面的表达意见的文章。


PressRelease(新闻):官方新闻稿。


Blog(博客):任何发表在博客上的文章,或以博客的形式呈现的文章。


关键词。关键词字段包含一个逗号分隔的、描述文章主题的关键词列表。关键词可以但并不限于从现有的谷歌新闻关键词列表中摘取。


图片。使你的图片被索引的最有效途径,是将它们包含在你的资讯网站地图信息接口中。


股票行情收报器。对于商业文章,你可以包含一个逗号分隔的列表,其中最多有五个公司股票行情收报器,这五个公司是文章的主题。每个收报器必须以其在证券交易所的名称作为前缀,并且必须与其在谷歌财经中的条目相匹配。


谷歌新闻网站地图验证


下面的XML模式,将可以出现在一个新闻网站地图文件中的元素和属性进行定义。新闻网站地图可以包含新闻特定元素和核心网站元素,可以从对应的网站下载。


基于这些模式,有很多工具可用来验证你的网络地图结构


若要针对一个模式验证你的新闻网站地图文件,需要在XML文件中提供额外的标头。


提交谷歌新闻网站地图


有几种给谷歌新闻提交网站地图的不同方法。


通过robots.txt。你可以将你新闻网站地图文件的位置加到robots.txt文件上。


网站地图:http://example.com/sitemap_location.xml。


此指令独立于用户代理行,因此与在你的文件中它的存放位置并无多大关系。如果你有一个网站地图索引文件,只需要包含索引文件的位置即可,而不是每个网站地图的位置。


通过谷歌搜索控制台。即使你在robots.txt文件中指定了位置,你也应该通过你的搜索控制台的账户上传网站地图。这样做,在你的网站地图包含错误时,你能够访问详细信息。


下面是在搜索控制台中提交一个网站地图的方法:


1.登录到谷歌搜索控制台,若你没有账户,则请设置账户;


4.在屏幕的右上角点击“Add/Test Sitemap”按钮;


5.在弹出的文本框中,将完整的URL路径添加到你的网站地图或网站地图索引文件中;


6.点击“Submit”按钮。


7.刷新你的浏览器,在网站地图列表中查看你的新网站地图。这里是如何测试一个网站地图的方法:


1.登录到谷歌搜索控制台,若没有账户,则请先设置账户


2.在搜索控制台主页上,点击要为其管理网站地图的站点;


4.点击列表中的一个网站地图,以打开网站地图详细信息页,然后点击右上角的“Test Sitemap”按钮。或者,如果你看不到你正在寻找的网站地图,则在主要的网站地图页面上点击“Add/Test Sitemap”按钮,进入出现对话文本框中的URL路径,点击“Te s t”按钮;


5.一旦测试完成,请点击“Open Test Results”按钮来查看看你的测试结果;


6.一旦你已纠正测试所发现的问题,你可以点击“Resubmit”按钮来提示谷歌。


最后,这是查看网站地图详细信息页面的方法:


1.登录到谷歌搜索控制台,若没有账户,则请先设置账户;2.在搜索控制台主页上,点击要为其管理网站地图的站点;


3.在左手菜单上,点击“Crawl”选项以显示扩展菜单,然后从抓取菜单列表中点击网站地图;


4.在网站地图的列表中,点击你想要检查的网站地图,以打开网站地图详细信息页面。在此页面中,你可以查看错误、索引统计信息,以及做其他更多操作。


新闻抓取错误


谷歌新闻中的出版商可以在他们的谷歌搜索控制台账户中,查看消息特定抓取错误报告:


1.从仪表板中点击抓取>抓取错误;


2.点击消息选项卡以查看你新闻内容的抓取错误;


3.抓取错误分为许多类别,如“Article extraction”或“Title error”。点击这些类别会显示一个受影响的URL列表,以及正在生成的抓取错误。


谷歌新闻中的视频


只有谷歌接受的出版社发布的视频才能包含在内。可以用YouTube播放器将视频嵌入一篇文章中,或者出版商可以创建一个YouTube频道,用谷歌新闻进行分享。若要包含在谷歌新闻中,YouTube频道和嵌入的视频必须遵守以下准则:


·视频应该是即时的,是对当前新闻事件的报道。不允许发布指导性视频、促销活动视频、电影预告片或音乐视频。


·视频应尽可能快地上载。这将使它们能够与最近的文章组合。


·首选包含一个单一的故事而不是多个段的视频。


·视频标题应该是描述性和具体的(不能是泛指的,如“惊爆新闻”)。


·视频描述字段应包含很多细节。传达出故事的人物是谁,在什么时间、地点做了什么事,原因是什么。


·视频关键词标签字段是很有帮助的。包括人、地方、企业和视频中提到的事件的名称。


·每个视频在上传时,都必须分配入一个类别中。对于一般的新闻报道,选择YouTube类别中的“新闻与政治”(即youtube_category_id 25)。


·音频必须清楚、容易理解。图片应该放在重点方位。


·所有内容必须是原创和独有的。音乐、图片和视频中的文本必须属于你的组织,或者在使用时经过法律许可。


·视频若要在谷歌新闻中展示出来,必须能够嵌入其他网站中。


·在某些地区进行地域屏蔽的视频不会出现在谷歌新闻中。


附加的YouTube频道指南如下:


·只有已经存在于谷歌新闻的出版商的YouTube频道可包含在内。


·定期更新的频道更有可能被接受。


·可以定制一个YouTube频道来反映组织的品牌推广。在频道配置文件节中,需要包含关于你组织的信息以及你的网页链接。


·如果你有多个频道,那么请清楚地标识每个类别(政治、商业、娱乐、体育等)。


YouTube频道一旦准备好,使用“添加新节”表单告知谷歌:


1.在“New section URLs”下方的字段中,添加你的YouTube频道的URL。


2.在“Category”下拉菜单中,选择列表末尾旁边的“YouTube channel”频道。


3.请确保表单的起始部分也包含你的出版物名称和URL。


编辑器推荐内容


编辑器推荐这一功能使出版商可以用其出版标志展示原始的、创新的新闻内容。编辑器推荐位于谷歌新闻主页和某些栏目页右列的侧边栏模块中。编辑器推荐可以包含谷歌新闻可能无法索引的内容,如长篇叙事文章、幻灯片、交互式图形或视频故事等。在任何特定时刻,出版商最多可提供五个链接代表该组织的最佳原创新闻工作。


出版商通过创建并提交一个自定义的RSS或Atom信息接口,可以加入编辑器推荐。最多可提交三个不同的信息接口——一个是主页,另外两个则是技术部分和业务部分。


以下是有关提交和维持这种信息接口的重要指导方针:


·仅包括新闻内容(没有订阅链接、指导性文章、股票报价、分类广告、天气预报等内容)。


·信息接口中的单个项目可以超过48小时,只要信息接口中至少有一项最近已经更新就可以。理想情况下,每天应更新一次或两次信息接口。每48小时必须至少将一个额外的项目添加到信息接口中。48小时内未进行更新的信息接口将不会显示给用户。


·只有至少包含三篇文章的信息接口才能显示出来。如果文章超过五篇,则只显示前五篇文章。


·建议每篇文章中都包含作者姓名。如果没有作者姓名,署名区将显示为“<Publisher>staff”。


·超过75个字符的标题会被截断。


一旦你的信息接口准备就绪,可以将其提交。

TAG标签:

一周热门 更多>

相关问答