自己写的百度采集

运行图
采集结果
蓝奏云下载

1 个赞

上周找了好久都没找到,百度的规则经常变化导致工具寿命短,可以想法具备灵活变化。

还好吧 通过cookie 加 正常浏览器 UA突破的 反爬机制

?inurl:.asp?id=xxxx怎么采集到的是域名,而不是域名/.asp?id=

1 个赞

这种工具没源码,怕是钓鱼哦。

域名格式处理过

钓鱼的话管理员早就删了

百度的规则不怎么变化呀。 :rofl:
别用正则,用css表达式。很长时间都不用更新