12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。

你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。


补充说明一下,谷歌当年是自己停止搜索服务的。 为啥叫停止,因...
这个标准是谁认定的?目前根据各新闻门户网站, 凤凰网说是央视...
Solid 很灵活。 它没有和 Web 绑死,没有和特殊的编...
去俄罗斯旅游的时候,领队告诉我的,俄罗斯女生上下限都很高,为...
macOS漂亮是漂亮,但是并没有GNU/Linux流畅啊。 ...
Manus是否开源已经没有那么重要了。 。 。 。 。 。 ...
为啥要这样?裸睡可以理解,我也经常裸睡,但是那是保证床品干净...
Linus Torvalds,软件工程师, Linux 内核...
如果是初学者建议直接学Jetpack Compose,因为两...
太正常不过了。 。 。 。 。 记得18年的时候,驻微某软...
