我们一直使用 Google XML Sitemap 插件产生符合国际标准的 sitemap.xml 文件。百度对国际标准的 sitemap.xml 是否支持无法考证,不过百度自己推出了一个互联网论坛收录开放协议:
互联网论坛收录开放协议是百度网页搜索制定的论坛内容收录标准,论坛网站可将论坛内发布的帖子制作成遵循此开放协议的XML格式的网页供搜索引擎索引,将论坛发布的帖子主动、及时地告知百度搜索引擎。
百度的互联网论坛收录开放协议的页面详细介绍了生成的 XML 文件的每个标签的属性和说明,所以只要按照它每个元素的描述,就能够给自己的博客制作适合百度互联网论坛收录开放协议的 sitemap 文件。下面是这份协议的一些需要注意的地方:
- 互联网论坛收录开放协议只是对百度 spider 原有收录方式的一种协助和有益补充,而不是取代。这个和 Google 的 Sitemap.xml 文件一样,我们不能完全依赖他来做 SEO,但是可以让百度或者 Google 更好的抓取我们的站点。
- XML 文件的大小最大为10M,大于10M的文件百度spider将不能保证正确获取。
- 请将 XML 文件命名为 sitemap_baidu.xml 并上传到您网站根目录下,并保证文件所在的 URL 地址能够被百度 spider 正常访问。例如,网站为http://fairyfish.net/,则将 XML 文件上传至 http://fairyfish.net/sitemap_baidu.xml。由于百度没有 Google 一样的 WebMaster 工具,可以让你提交 sitemap 文件,所以需要把 baidu sitemap 的 URL 能够放到一个已经让百度索引的页面上,比如和我一样在这篇日志中列出百度 sitemap 的 URL。
- 另外百度spider不保证一定能收录您提交的全部内容。
其实博客和论坛在形式上是差不多的,博客更注重作者表述,论坛跟注重交流而已,
。所以我根据这份协议,在制作了百度 Sitemap 的 WordPress 插件:baidu_sitemap.zip。其中对这份协议中的做了如下的假定:
- <bbs:reply> — 百度的协议中是“帖子总的回复数,不包括主贴”,我在插件中设置为留言数。
- <bbs:hit> — 百度的协议中是“帖子总的查看次数”,我在插件设置为日志的查看次数,需要你安装 PostViews 插件,如果没有安装,则显示为 0。
- <bbs:boardid> — 百度的协议中是“帖子所在版面,提供版面的 id ”,我在插件中设置为日志的第一个分类 slug,如果有多个,也只选择第一个。
- <bbs:pick> — 百度的协议中是“是否设为精华,精华标为 1 ,非精华标为 0 ”,我在插件中设置为日志是否为置顶,如果是为 1,非为 0。
百度 Sitemap 插件使用简单,上传激活即可,没有后台选项,所以如果你想修改 sitemap 更新周期 <updatePeri> 的话你需要直接编辑 baidu_sitemap.php 文件,直接修改 $updatePeri 这个变量, 这个值的默认为为 24 小时。
这个插件在你编辑或者发布日志的时候在你博客的根目录下重新生成 sitemap_baidu.xml 文件,所以你首先需要保证你博客的根目录可写,在第一次安装插件之后,你可以通过编辑任意一篇日志的方式产生 sitemap_baidu.xml 文件。
另外如果你想用户每次留言之后,都要重新生成 sitemap_baidu.xml 文件的话,你可以把下面这行前面的注释符 // 去掉即可:
//add_action('edit_post', 'generate_baidu_sitemap', 0); // leaving a comment called edit_post

首佳软件 | 2009-10-28 18:07:55 | #
我把根目录属性改成777之后,整个博客完蛋了,500内部错误.
改回750就可以.
支持 反对
首佳软件 | 2009-10-30 11:11:28 | #
博主,有解决办法吗?
支持 反对
Denis | 2009-10-30 19:34:52 | #
那你的博客 750 也可以生成吧?
支持1 反对
第三眼 | 2009-10-30 20:54:35 | #
说起来好麻烦哦
支持 反对
华晨 | 2009-11-01 20:59:12 | #
太棒了!原来百度也有sitemap了呀!
支持 反对
kavid | 2009-11-10 10:32:55 | #
出现了以下错误:
无法显示 XML 页。
使用 XSL 样式表无法查看 XML 输入。请更正错误然后单击 刷新按钮,或以后重试。
——————————————————————————–
操作成功完成。处理资源 ‘http://www.kavid.net/sitemap_baidu.xml’ 时出错。第 263 行,位置: 17
博客写作学习——102种博客标题格式
—————-^
>
-
<DIV
支持 反对
Denis | 2009-11-10 11:03:35 | #
没有进行字符串过滤,下个版本会修正!
支持 反对
Apollools | 2009-12-09 10:59:18 | #
安装,感受一下~留链接~
支持 反对
无明 | 2009-12-31 21:34:59 | #
我也安装了~不过中文url的问题百度一直不收录我
支持 反对
Sevi | 2010-01-06 14:04:11 | #
早就有了 baidu-sitemap-generator
支持 反对
Dianso | 2010-02-02 17:12:44 | #
我博客放子目录,发现生成在子目录里了,怎么办啊?
支持 反对