全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 1856|回复: 17
打印 上一主题 下一主题

我讨厌蜘蛛 我讨厌蜘蛛侠

[复制链接]
跳转到指定楼层
1#
发表于 2013-3-4 20:31:10 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
2.jpg (129.33 KB, 下载次数: 0) 3.jpg (175.79 KB, 下载次数: 0) QQ截图20130304203727.jpg (88.74 KB, 下载次数: 0)
18#
发表于 2013-3-4 23:33:22 | 只看该作者
我大爱 蜘蛛 就怕蜘蛛不来
17#
 楼主| 发表于 2013-3-4 23:05:15 | 只看该作者
wdlth 发表于 2013-3-4 23:00
robots.txt加
Crawl-delay: 60
Visit-time: 0100-1300

霸气啊
16#
发表于 2013-3-4 23:00:26 | 只看该作者
本帖最后由 wdlth 于 2013-3-4 23:02 编辑
大胡子 发表于 2013-3-4 22:46
我好像就被这个整苦逼。。。 iptables都不能屏蔽访问 why?


robots.txt加
Crawl-delay: 60
Visit-time: 0100-1300
Request-rate: 30/1m 0100 - 0759
Request-rate: 10/1m 0800 - 1300
有点效果
15#
 楼主| 发表于 2013-3-4 22:46:40 | 只看该作者
wdlth 发表于 2013-3-4 22:42
不是一次性,是持续性。而且会自己生成关键字搜索……

我好像就被这个整苦逼。。。 iptables都不能屏蔽访问 why?
14#
发表于 2013-3-4 22:42:33 | 只看该作者
大胡子 发表于 2013-3-4 22:39
用了Sitemap之后是不是一次性爬我更新的所有内容。。。


不是一次性,是持续性。而且会自己生成关键字搜索……
13#
 楼主| 发表于 2013-3-4 22:39:29 | 只看该作者
wdlth 发表于 2013-3-4 22:30
Google的高并发蜘蛛才杯具

用了Sitemap之后是不是一次性爬我更新的所有内容。。。
12#
发表于 2013-3-4 22:38:53 | 只看该作者
很多小的伪装蜘蛛来采集
11#
发表于 2013-3-4 22:30:42 | 只看该作者
Google的高并发蜘蛛才杯具
10#
发表于 2013-3-4 22:15:43 | 只看该作者
宜搜这家 不按国际规则办事 搜狗这家也是
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-1-15 00:21 , Processed in 0.079514 second(s), 14 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表