国内垃圾留言横行,作为国内最大的搜索引擎百度对此负有不可推卸的责任,由于百度不支持 rel="nofollow" 属性,造成了 Spammer 恣意妄为,肆意到处留言,根据 Akismet 这个防垃圾留言插件的统计,2008 年12月一个月就收到 4000 多条垃圾留言。并且如果如果这些外链很多都是链接到垃圾站,会让导致博客在搜索引擎(主要是百度,Google nofollow 到垃圾网站也是没事的)中的降权,直接导致排名下降。
但是百度死不悔改,并无打算遵守这个事实标准,修复这个漏洞。当你看到自己博客的留言区一大堆链接是起重机,减肥这类的广告是什么样的看法,是的这些都是我们不愿意看到,我们只想拥有一个干净的博客环境,所以我开发了一个 WordPress 插件:Comments Link Redirect,勇敢对抗 Spammer 和百度,彻底解决 WordPress 中这个问题,使得 Spammer 即使成功留言了,也不会被搜索引擎索引。
Comments Link Redirect 这个插件的主要功能主要参考 Shawn 的防止SPAM的另类方法制作,这里首先感谢下 Shawn 的 idea。但是 Shawn 需要修改主题比较多的地方,还需要添加 JS 代码,比较麻烦,我修改了下做成 WordPress 插件,只需要上传激活,然后在 robots.txt 增加一行代码即可。
Comments Link Redirect 这个插件主要功能是把留言者的链接和留言中链接的 URL 转化为一个跳转链接,如:
http://fairyfish.net/?r=http://superdenis.com/
然后手工在 robots.txt 中添加一行以下代码即可:
Disallow: /?r=*
这样所有留言区的链接既不会被搜索引擎(包括百度,如果百度真如他所说它遵守 robots.txt 协议的话)索引,更不会给予权重。
PS1:第一版本,经 hamo 指出有点巨大漏洞,有修正。
PS2:忘记说了,该插件并不会减少你博客的垃圾留言,但是它能够让这些垃圾留言不能被索引,到你博客上获取权重,这样能够真正保护你的博客。


无敌了,这个思路不错
支持 反对
一开始我也想弄跳转,后来觉得跳转对搜索引擎不友好,因为页面存在 Query Strings。最近出了个针对 WordPress 的 spam 发送器,很恐怖。
支持 反对
这个 query strings 没有问题啊,因为 robots 中已经屏蔽了啊。
支持 反对
“顶楼上的”这是收到最多的人肉spam
支持 反对
顶胡戈戈!
支持 反对
顶楼上的
支持 反对
顶你们。。
支持 反对
我也顶你们
支持 反对
所谓的垃圾留言就是如此吧~~
支持 反对
支持 反对
俺一年也收不到1000条spam,先不用了……
支持 反对
fucking 百度…
支持 反对
支持 反对
矛与盾,可惜百度不遵守robots.txt
支持 反对
问题是百度似乎不遵守roots协议啊……
不过还是启用了,看看
支持 反对
百度也無敵了…什麽都亂來
支持 反对
话说像我这种没名气的小小博客,上个月也收到了 30 几个垃圾留言,囧~
先下载试用看看。
支持 反对
这样存在另外一个更严重的问题,没有对输入网址进行控制,容易被利用拿来贴危险链接。
比如在MediaWiki贴 http://fairyfish.net/?r=http://badsite.com/,可能导致 fairyfish.net被封禁,国内注册的域名还可能因为被投诉然后被停域名
支持 反对
这个问题,没有考虑到,我想想怎么处理。
支持 反对
我以前在Wiki碰到过这个问题,通过refer禁用外部来源的链接即可。
支持 反对
恩,我已经添加 refer 了。
支持 反对
Z-Blog的网址转发和这个类似,月光的地址被维基百科列入黑名单:
http://www.williamlong.info/archives/1584.html
surl.cn被HOLD停用
http://www.pkphp.com/2008/12/01/surlcn%E5%9F%9F%E5%90%8D%E8%A2%AB%E5%81%9C%E6%AD%A2/
—-
贴了两个网址,不知道会不会被当垃圾留言
支持 反对
好了,我已经解决了,我通过判断 HTTP_REFERER 不是本站就不跳转,哈哈!
谢谢你提供的 bug。
你现在看看直接吧地址复制到浏览器应该不跳转,而是直接到我首页。
支持 反对
嗯,那如果…… http://twitpic.com/1640n 会怎么样呢?
支持 反对
那是你设置你的浏览器,但所有人的浏览器并没有这样的设置。
支持 反对
国外垃圾留言也很多,甚至更多,反正我收到的spam是英文居多……
支持 反对
我这几天正为这个犯难呢,我即使加了验证码也天天收到 人工SPAM呢,我马上装了去试试
支持 反对
何不,把 disallow /?r=* 自动追加到 robots.txt 呢?
支持 反对
每天都会有那么几条,手动删除时间还是有的!百度的东西咱们不能信!
支持 反对
再怎么跳转,来spam的机器人还是会有。只是spam了没用而已。
支持 反对
不错的东东!!保护的意义更大些!!
支持 反对
百度基本不守robots.txt协议。
支持 反对
除了遵守taobao.com外~
支持 反对
我来跑题的,鱼,更新我的链接吧。www.magki.com。嘿嘿
我是 Wady
支持 反对
这个新域名什么意思啊?
支持 反对
http://fairyfish.net/2009/01/22/comments-link-redirect/#comment-38237
测试一下,好东东
支持 反对
我的一个垃圾评论都没有
支持 反对
很强大。
支持 反对
楼主好,我觉得,大家都犯了一个重要的概念性错误。
为什么会把垃圾留言和影响排名联系在一起呢??
那么如果有人,不发Spam,正常的留言,就不会影响你的排名了吗?
正常留言不等于正面影响
支持 反对
支持!
支持 反对
牛X
支持 反对
百度对robots可说是阳奉阴违呀
支持 反对