2022年9月 - 酷玛DS

最早的网站数据采集形式可能是离线浏览器，通常可能叫Website Ripper、Website Downloader、Website Copier或者Website Grabber，给定一个站点链接，就可以下载有链接关系的所有页面和附件，并保持原始网站的相对链接结构。

抓取一个网站的所有内容既不厚道（未经许可制作镜像站点）、不现实（大多动态内容不能下载）也不实用（下载了许多对自己没有价值的内容），于是进化成为网页采集器。网页采集器使用正则表达式制定路径和过滤规则，轻松地批量获取目标内容的文章内容，却不带任何代码和样式，有利于制作看起来是自己原创的东西。

酷玛DS