忘记robot.txt了,导致百度蜘蛛返回404代码

懒小爱  发布于2010/9/18 9:39   网站经验    标签: dz 网站 论坛 seo   
点击在新窗口中浏览此图片

  以前对seo并不是很在意,这次度娘连续K我两站后,我开始关注起这破玩意儿了。昨天在检查我可怜的L站的访问日志时,意外地发现其实百度蜘蛛依旧来得很勤快,但是返回代码竟然都是404!这就意味着无效页面……

  仔细看了一下,发现蜘蛛爬的都是include和plugins之类的文件夹下面的文件,我记得这些个文件夹在官方自带的robot.txt里都是有屏蔽的啊,怎么会……

  看来我犯了一个大错误,上谷哥临时抱佛脚,发现robot.txt只能作用于根目录,对于bbs这样的二级目录是不起作用的,所以我把bbs目录下的robot.txt移到了网站根目录下,然后对robot.txt也稍作了些修改:

[quote]User-agent: *

Disallow: /admin/
Disallow: /api/
Disallow: /attachments/
Disallow: /images/
Disallow: /install/
Disallow: /forumdata/
这个是DZ官网自带的robot.txt文件内容截取


User-agent: *

Disallow: /bbs/admin/
Disallow: /bbs/api/
Disallow: /bbs/attachments/
Disallow: /bbs/images/
Disallow: /bbs/install/
Disallow: /bbs/forumdata/
然后像这样修改一下论坛所在的路径就好了
[/quote]

  另外,其实有不少人问我为什么要折腾做这么多站,我只有一句话:兴趣爱好罢了……
本文已有评论 7 条,检测到共有 1266 人飘过...↓快速评论↓

7楼
瓶子无芯
在 2010-09-22 17:08 鸡冻的表示:
另外,其实有不少人问我为什么要折腾做这么多站,我只有一句话:兴趣爱好罢了……
6楼
louboutin shoes
在 2010-09-20 16:28 鸡冻的表示:
了解下,谢谢博主!
5楼
黄伟涛
在 2010-09-19 00:24 鸡冻的表示:
希望小爱早日找到被K的原因,东山再起。
4楼
星星之火
在 2010-09-18 23:00 鸡冻的表示:
robot.txt的技巧还是要了解下的
3楼
陈剑
在 2010-09-18 14:00 鸡冻的表示:
写个空白的上去就得了
2楼
爱情宣言博客
在 2010-09-18 13:32 鸡冻的表示:
博主很多站吗?呵呵不算多也不算少,不过和他们做群站的比起来那就小巫见大巫了~
1楼
vastar
在 2010-09-18 12:55 鸡冻的表示:
我倒是忘记写robot导致一个测试站点被收录了。。。很多时候,蜘蛛也不喜欢听robot的规则
发表回复: