当前位置: 首页 > article >正文

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

之前分享过文章 2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf ,今天再整理分享下知乎知乎回答/文章/想法/专栏/视频/收藏夹下载。

苏生不惑

这个账号已经持续5年每周更新原创文章,分享些有趣实用的软件/网站和黑科技教程,来跟我一起高效地玩转互联网。

464篇原创内容

公众号

下载所有知乎回答以渤海小吏的号为例 再次破xx,苏生不惑新开发的工具 

图片

下载导出的excel包含所有知乎回答问题标题和链接。

图片

然后用脚本将excel里的回答批量下载:

图片

下载的所有回答html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf  。

图片

再将所有pdf合成一个pdf文件,效果见网盘https://pan.quark.cn/s/8522433ad346

图片

每个回答都有原知乎回答链接。

图片

顺便我还下载了渤海小吏这个公众号的所有文章,包含留言  2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数 。

图片

下载所有知乎文章以半佛仙人的号为例 :

图片

下载导出的excel数据包含知乎文章标题,链接,评论数和赞同数。

图片

然后用脚本将excel里的文章批量下载:

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf。  

图片

再将所有pdf合成一个pdf文件,效果见网盘 https://pan.quark.cn/s/8522433ad346 ,每篇文章都有原知乎文章链接 再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf   

图片

顺便我还下载了半佛仙人这个公众号的所有文章,包含留言。 2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数

图片

最近我又开发了知乎收藏夹批量下载工具,软件下载地址发布到我的知识星球 https://t.zsxq.com/qWLTU ,欢迎加入我的知识星球 加入我的知识星球 ,有问题可以加微信 sushengbuhuo 

图片

图片

打开工具输入知乎收藏夹地址https://www.zhihu.com/collection/40047806, 页数和cookie ,如何获取cookie见之前文章 总有人问我 cookie 到底是什么?

图片

默认下载500篇回答,视频,文章,如果要继续下,修改页数再次下载。

图片

下载的html文件在zhihu目录。

图片

下载的视频在video目录。

图片

下载完成后合并转换生成的pdf文件大小200MB ,因为依赖wkhtmltopdf ,需要将wkhtmltopdf.exe加入环境变量。

图片

点击左侧标题书签可以跳转到对应内容。

图片

如果转换pdf失败可以用我开发的html2pdf批量转换html为pdf。

图片

再用我开发的pdf_merge将pdf文件合并成一个文件。

图片

顺便导出收藏夹excel数据包含类型(回答,文章,视频),标题,链接,创建时间,更新时间,简介,评论数,赞同数,页数等。

图片

除了知乎收藏夹批量下载还有我开发的知乎专栏批量下载工具https://pan.quark.cn/s/a26076946612 ,输入专栏链接https://www.zhihu.com/column/c_1721130763582382082和cookie就可以下载了。

图片

下载专栏文章回答html文件:

图片

合成的pdf文件,大小10MB。

图片

图片

顺便导出专栏excel数据包含类型,标题,链接,创建时间,更新时间,简介,评论数,赞同数等。

图片

最后是之前发布的知乎问题回答下载工具 https://t.zsxq.com/e7cPX

图片

输入知乎问题id和cookie:

图片

导出的 excel数据包含回答链接,回答者主页,回答者昵称,回答内容,回答发布时间,回答更新时间等:

图片

玩转互联网达人

苏生不惑备用号,分享各种黑科技软件资源和技巧,带你玩转互联网。

19篇原创内容

公众号

最新原创文章:

加入我的知识星球

2024 更新版:苏生不惑开发过的那些原创工具和脚本

2024 公众号苏生不惑发布软件目录

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

2024 极品互联网宝藏资源库,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

2024苏生不惑精华帖合集,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,微博内容/图片/视频/评论/转发数据,导出 excel 和 pdf


http://www.kler.cn/news/308349.html

相关文章:

  • Django_Vue3_ElementUI_Release_004_使用nginx部署
  • idea插件开发的第四天-完善JSON工具
  • 算法:76.最小覆盖子串
  • 文章-深入GPU硬件架构及运行机制 学习后记
  • 撤回仓库的提交
  • 基于SpringBoot实现SpringMvc上传下载功能实现
  • uniapp 如何自定义导航栏并自适应机型
  • 【ESP32】ESP-IDF开发 | 中断矩阵+按键输入中断例程
  • 发送成绩的app或小程序推荐
  • PTrade量化服务器连接openapi的地址、key等配置涉及哪些文件?
  • 【学习笔记】SSL密码套件之哈希
  • 【目标检测】labelimg图像标注软件的使用流程
  • 清华镜像源的使用说明
  • 文心一言 VS 讯飞星火 VS chatgpt (349)-- 算法导论23.2 8题
  • AI教你学Python :详解Python元组与集合、字典基础和字符串操作(补充)
  • JavaSE:8、包装类
  • seafaring寻找漏洞
  • 算法入门-贪心1
  • 【React】MobX
  • CI/CD持续集成和持续交付(git工具、gitlab代码仓库、jenkins)
  • DL/T645-2007 通信库(C#版本)
  • 裸金属服务器怎么实现算力共享,裸金属服务器提供者怎么做,租户怎样使用,共享平台需要搭建什么
  • C++11新增特性:lambda表达式、function包装器、bind绑定
  • 在Windows系统中管理苹果磁盘实用工具-使用磁盘,读取磁盘中的文件-供大家学习研究参考
  • 深入解析代理模式:静态代理、JDK 动态代理和 CGLIB 的全方位对比!
  • 开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界(一)
  • 魔方财务安装指南
  • Qt6编译达梦8数据库驱动插件
  • 92、K8s之ingress下集
  • 遍历指定的目录a中的所有子目录及所有文件os.walk(root_dir)