当前位置: 首页 > article >正文

不用写代码,批量下载今日头条文章导出excel和pdf

前几天有人问我怎么批量抓取今日头条某个号的所有文章数据,需要文章链接,标题和时间,但是不会写代码,于是我写了个简单的教程

图片

这里以渤海小吏为例 

图片

首先用edge浏览器安装web-scraper浏览器扩展

图片

然后打开浏览器控制台,找到web-scraper, import sitemap,复制以下代码:

 

图片

点击scrape开始抓取 。

图片

导出excel效果如图,包含文章链接,文章标题,文章阅读数,文章评论数,文章发布时间,效果见网盘 https://pan.quark.cn/s/949ca3387267

图片

如果要抓取其他号的文章,修改edit metadata里的链接,你学会了吗?

图片

后续可以将所有文章下载合并成一个pdf文件,大小97MB,左侧是文章目录,点击可跳转到对应文章,效果见网盘 https://pan.quark.cn/s/949ca3387267

图片

图片

图片

当然web-scraper也支持抓取其他网站的数据,掌握点网页知识就可以。


http://www.kler.cn/a/569820.html

相关文章:

  • 傅里叶分析
  • 如何使用ArcGIS Pro制作横向图例:详细步骤与实践指南
  • 介绍如何使用生成对抗网络(GAN)和Cycle GAN设计用于水果识别的模型
  • ES 删除index 的curl
  • Vue.js 组件开发指南:实现、传值与优缺点分析
  • 性能优化——cache与cacheline
  • 如何远程访问svn中的URL
  • 数据结构(初阶)(六)----队列
  • ctfshow刷题笔记—栈溢出—pwn61~pwn64
  • C++类和对象:匿名对象及连续构造拷贝编译器的优化
  • Vscode通过Roo Cline接入Deepseek
  • 授权与认证之jwt(三)刷新令牌该如何设计
  • 计算机网络学习————(五)TCP/IP学习
  • ubuntu Linux 正确设置中文环境的方法
  • Python常见面试题的详解24
  • 实现用户特征自动识别和动态圈子创建,需构建一套完整的自动化流程
  • 本地搭建Ollama运行各种平台的大模型(deepseek),配合AnythingLLM-UI界面使用
  • 2025-02-28 学习记录--C/C++-PTA 7-34 通讯录的录入与显示
  • 基于消息事件实现结合状态机实现事件触发通用单片机逻裸机框架处理
  • 《机器学习数学基础》补充资料:线性变换和最小二乘