12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最...
这么喜欢看露点的 那推荐一部俄罗斯的片子《契卡》 从头到尾都...
迷你主机身上主要存在一对矛盾: 它更面向电脑小白,但关注群体...
这张照片拍摄于2024年,中国女子100米栏运动员吴艳妮和夏...
8g树莓派560元不知道能干啥,玩linux太慢,玩单片机太...
在Android系统上停止携带32位和X86原生库,并且放弃...
借助 Cardify 卡片工坊 ,你可以轻松将网页 HTML...
哎呦,小老弟,你这问题问得挺有意思,正好踩在了老油条的脚趾上...
是时候祭出大杀器了: 移动用户:使用本机编辑短信“CXXZ#...
最关键是做不大。 CRT最后的绝唱出现在08年,当时一波看...