12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。

你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。


这问题目前从表面规则来说是无解的。 管理部门不愿意承担放开限...
翻译说明Linux内核开发人员 Moon Hee Lee 在...
我家的无线路由器,老婆买的: 音乐播放机,老婆买的: ...
代码仓库 gitee本例代码 gitee之前写的 创建项目先...
越南的春晚才有意思,是他们穿着艳丽的古装,向玉皇大帝嬉笑怒骂...
干得太漂亮了,特拉维夫的制空权都被伊朗夺取了,三分之二以上的...
这个问题的潜台词是“为什么是 go 而不是 j***a”对吧...
说一个老事吧。 苹果开源API代码里面有一段专门为微信的写注...
polars几乎全线碾压pandas,尤其是在大型数据集的情...
公共DNS算电信业务,自建且不备案就是违规经营电信业务电信业...
