时下,AI 爬虫把各种网站折腾得不轻,不是让其崩了就是卡了,导致运行也变得极为不稳定,哪怕更改了用于规定搜索引擎抓取工具可以访问网站上哪些网址的robots.txt 文件、屏蔽已知的爬虫标识(User-Agent)、甚至过滤可疑流量,它们还是能绕过封锁,伪造身份、用住宅 IP 代理,怎么都拦不住......
随着 AI 技术的快速迭代,不少小型开发商、开源开发者发出怒吼,他们称自己正被 AI 爬虫逼到崩溃边缘,而这究竟是怎么一回事?
个人开发者:实在没办法的话,只能关服务器了
身为技术教育者、AI 艺术家的 Xe Iaso 便是众多“受害者”之一。
今年 1 月,她公开怒斥亚马逊的 AI 爬虫,称其疯狂抓取自己的 Git 代码托管服务,导致网站频繁崩溃,几乎无法正常运行。