收集指定公众号的历史文章数据,一个自动化帮你搞定
接着昨天的动态,分享最近做的微信公众号文章爬虫。
通过使用这个爬虫,你可以指定一个公众号,收集其下所有历史文章的数据,包括标题、发布日期、链接。比如我昨天用一个公众号做测试,就成功爬取了历史发布的 300 多篇文章数据。
为了能持续稳定的运行,爬取的速度设得比较低,约 5 篇文章/分钟,等待期间可以去做做其他事。
虽说是爬虫,但并不需要你折腾什么代码。只要你有一个公众号账号,一台装有 Chrome 浏览器的 Windows / Mac 电脑就可以用。
获取这个自动化:https://www.automa.site/workflow/QgZAdhe3pKKpYSj09oaZR
使用步骤:
1. 给你的 Chrome 安装 Automa 插件,固定显示在插件栏,这是个用于开发和分享网页自动化的工具
2. 访问这个自动化的分享页,点击 Add to extension 获取
3. 在 Chrome 插件栏点 Automa 插件的按钮,点这个自动化的标题、打开编辑页面
4. 将【输入公众号名称】的字段,改为你要爬取的公众号名称,默认是“落日间”
5. 在网页端登录微信公众号,保留登录后的主页打开
6. 运行这个自动化,直至搜索公众号,在结果中选择你要爬取的公众号
7. 等待数据收集结束,自动下载为 CSV 文件
测试用的是落日间的公众号,印象中那边应该发过不少内容,但实际看到有 300 多篇还是很吃惊,感觉到了持续创作的力量。
评论区
共 5 条评论热门最新