开放协议概述
使用此开放协议,将会为您的网站带去更多流量!
《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及时地告知百度搜索引擎。
采用了《互联网新闻开放协议》,就相当于网站的新闻被搜索引擎订阅,通过百度——全球最大的中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到您网站的新闻,进而为您的网站带来潜在的流量。
开放协议非常简单! 您可以在我们的帮助下轻松使用。
开放协议内容
下图为遵照《互联网新闻开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的新闻的相关信息。 XML网页示例:
XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。 *<document>——标记整个XML文件内容的开始和结束。 *<webSite>——站点地址。 *<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。 *<updatePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的新闻更及时地出现在百度新闻中。 *<item>——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息,不包括新闻专题。 *<title>——新闻标题。 *<link>——新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个URL,相当于多篇新闻。 <description>——新闻内容简介。 *<text>——完整的新闻正文(仅包含正文文字,不包含HTML语言等其它字符)。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。 *<image>——新闻正文内相关图片,采用绝对地址。若该篇新闻无相关图片,可以为空;若含有多张图片,请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。 <headlineImg>——为有可能成为头条的新闻制作的头条图,采用绝对地址。 <keywords>——反映新闻主题内容的一个或多个关键词,关键词之间以空格隔开。此项仅作为参考,检索结果不完全依赖于此标签中的内容。 <category>——新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。 <author>——新闻作者,可以为机构或个人 。 <source>——新闻来源,即原创媒体或其它机构 。 *<pubDate>——新闻发布时间,与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。
推荐时间格式:年月日小时分钟秒 如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 | 2005年11月09日10时37分00秒 | Fri, 09 Nov 2005 10:37:00 GMT
|