忘记robot.txt了,导致百度蜘蛛返回404代码

以前对seo并不是很在意,这次度娘连续K我两站后,我开始关注起这破玩意儿了。昨天在检查我可怜的L站的访问日志时,意外地发现其实百度蜘蛛依旧来得很勤快,但是返回代码竟然都是404!这就意味着无效页面……
仔细看了一下,发现蜘蛛爬的都是include和plugins之类的文件夹下面的文件,我记得这些个文件夹在官方自带的robot.txt里都是有屏蔽的啊,怎么会……
看来我犯了一个大错误,上谷哥临时抱佛脚,发现robot.txt只能作用于根目录,对于bbs这样的二级目录是不起作用的,所以我把bbs目录下的robot.txt移到了网站根目录下,然后对robot.txt也稍作了些修改:
[quote]User-agent: *
Disallow: /admin/
Disallow: /api/
Disallow: /attachments/
Disallow: /images/
Disallow: /install/
Disallow: /forumdata/
这个是DZ官网自带的robot.txt文件内容截取
User-agent: *
Disallow: /bbs/admin/
Disallow: /bbs/api/
Disallow: /bbs/attachments/
Disallow: /bbs/images/
Disallow: /bbs/install/
Disallow: /bbs/forumdata/
然后像这样修改一下论坛所在的路径就好了
[/quote]
另外,其实有不少人问我为什么要折腾做这么多站,我只有一句话:兴趣爱好罢了……
»版权所有:《禁爱庄园》 → 《忘记robot.txt了,导致百度蜘蛛返回404代码》;
»本文网址:http://www.loveif.com/post/259 ;
»除特别标注,本博客所有文章均为原创. 互联分享,尊重版权,转载请以链接形式标明本文地址 ;
»本文网址:http://www.loveif.com/post/259 ;
»除特别标注,本博客所有文章均为原创. 互联分享,尊重版权,转载请以链接形式标明本文地址 ;



相关日志:
拖了N久的单页站终于完成了,改变散漫的态度
哈哈,chinaz和度娘掐架了~~~速速围观(附图)
啊哦~长假这么快就结束了……
让域名转出乱收费的见鬼去吧!十天顺利转出国内域名的方法!
博客所在主机被攻击料……
在 2010-09-22 17:08 鸡冻的表示:
在 2010-09-20 16:28 鸡冻的表示:
在 2010-09-19 00:24 鸡冻的表示:
在 2010-09-18 23:00 鸡冻的表示:
在 2010-09-18 14:00 鸡冻的表示:
在 2010-09-18 13:32 鸡冻的表示:
在 2010-09-18 12:55 鸡冻的表示: