SAE屏蔽迅雷离线服务器

昨天本博客迎来了一个访问量高峰,我不得不两度上调配额。想来可能是因为被学术状态帝转了一篇文章;也因为做了点广告;检查日志还发现了谷歌爬虫光顾的踪迹,这无疑都是令人欣喜的。亲眼看了谷歌爬虫的 User-Agent:

Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

这货刚一来,首先就请求我的 /robots.txt 。果然高风亮节。话说我还得到了谷歌爬虫的一些 IP :66.249.79.* 。用 MyIP.cn 查询得:美国 加利福尼亚州圣克拉拉县山景市谷歌公司。

顺便说一下,MyIP.cn 拥有我所见过的最 NB 没有之一的 IP 归属地数据库。拿紫荆宿舍网口的 IP 查居然可以精确到门牌号,让我十分震惊。当然上学期宿舍网口换成 DHCP 动态 IP 后就不准了,但是还是很 NB 有木有。

但是很快我就在日志中发现了不对劲的事情。有一个 URL 似乎被同一个 IP 反复请求。SAE 的日志中心还是可以,过滤了一下,发现果然不对劲。

221.204.204.140。这货非常勤劳,也非常守时嘛!从 17/Feb/2015 00:23:47 +0800 开始,像被上了发条一样,每 55 秒请求一次,永不停歇。

赶快查一下这是什么鬼东西。MyIP.cn 告诉我,这个 IP 属于“山西省太原市 迅雷离线服务器”。站长工具给出的则是“山西省太原市 迅雷网络联通节点”。

我想,很有可能是有一位可爱的读者,用迅雷下载我的了 GradeSDK.zip;也许他选择了离线下载;反正,迅雷的系统有 Bug。。。就开始无休止地向我请求这个文件。

调试好了再上线不好嘛!!迅雷你酱紫很桑我们这些小站长的心你造吗??

怎么办呢,把它屏蔽掉吧。因为这个文件被我偷懒放在代码空间里了,所以我想只能求助于 SAE 平台了。既然 “SAE 提供的是云计算服务,不同于一般的空间提供商”,那么,我想屏蔽一个 IP 的功能应该是有的吧?

找到 管理应用界面 > 安全与运维 > 应用防火墙 ,简直是救命稻草。文档里写着“应用防火墙针对访问行为提供如下三种控制机制:黑白名单机制;频率/流量限制机制;访问速度限制机制”,看起来十分强大嘛!好极了。不料,点开后就得到提示“您还未通过实名认证,无法配置应用防火墙”。而实名认证需要 3 个工作日。呜呼,3 个工作日后我的云豆要被迅雷这样消耗多少去了!

好在天无绝人之路,我又找到了 管理应用界面 > 开发与调优 > AppConfig > 基于主机的访问控制,“您可以限制或允许某个IP访问您的应用,或您应用的某个目录”,这货看起来只提供 IP 黑白名单,但是对付你个调皮的迅雷服务器是够了!果断加黑名单,

 - hostaccess: deny "221.204.204.140"

至此世界重归平静。(完)

 

Update: 加黑名单之后,该 IP 的所有请求都得到了 403 ……但是这货不懂知难而退啊……在日志中心可以看到,这货仍然锲而不舍。截止此刻仍在每 65 分钟请求一次。恩,频率倒是下降了不少。(2015-2-17 20:55:41)

I’m back!

时隔三年,重拾写博客的激情。鼓起勇气开起了独立博客。可以自定义整个站点的任何一个细节,不得不说,这种感觉真是太好了。

时隔三年,重拾写博客的激情。鼓起勇气开起了独立博客。可以自定义整个站点的任何一个细节,不得不说,这种感觉真是太好了。

200、404 都是 HTTP 状态码。博客名字 200-404,寓意为:成功地找到了未找到。创意来自 @Shirley 🙂

自豪地采用 WordPress。目前放在 SAE 上。更新 2016-9-26:已从新浪云迁出,目前用 VPS ,来自 Vultr。

欢迎大家来踩~~~~~~~

您可以在以下位置找到我以前的文章:

1. 2011年以前,百度空间。由于百度空间已彻底关闭,您可以参观我保留的备份镜像(仅文章正文)

2. 2011年到2014年,人人网(可能需要登录)

考虑过把以前别的地方写的东西都搬过来。甚至已经在用 PHP 写从百度空间到 WordPress 的搬家工具。中途放弃了,是因为麻烦,也是因为觉得以前写的东西有些确实幼稚。所以嘛,就不搬了。这个博客将是一个新的开始。

It’s a fresh start~