2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

之前分享过文章 2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf ,今天再整理分享下知乎知乎回答/文章/想法/专栏/视频/收藏夹下载。

苏生不惑

这个账号已经持续5年每周更新原创文章,分享些有趣实用的软件/网站和黑科技教程,来跟我一起高效地玩转互联网。

464篇原创内容

公众号

下载所有知乎回答以渤海小吏的号为例 再次破xx,苏生不惑新开发的工具 

图片

下载导出的excel包含所有知乎回答问题标题和链接。

图片

然后用脚本将excel里的回答批量下载:

图片

下载的所有回答html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf  。

图片

再将所有pdf合成一个pdf文件,效果见网盘https://pan.quark.cn/s/8522433ad346

图片

每个回答都有原知乎回答链接。

图片

顺便我还下载了渤海小吏这个公众号的所有文章,包含留言  2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数 。

图片

下载所有知乎文章以半佛仙人的号为例 :

图片

下载导出的excel数据包含知乎文章标题,链接,评论数和赞同数。

图片

然后用脚本将excel里的文章批量下载:

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf。  

图片

再将所有pdf合成一个pdf文件,效果见网盘 https://pan.quark.cn/s/8522433ad346 ,每篇文章都有原知乎文章链接 再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf   

图片

顺便我还下载了半佛仙人这个公众号的所有文章,包含留言。 2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,抓取文章数据包含阅读数/点赞数/在看数/留言数

图片

最近我又开发了知乎收藏夹批量下载工具,软件下载地址发布到我的知识星球 https://t.zsxq.com/qWLTU ,欢迎加入我的知识星球 加入我的知识星球 ,有问题可以加微信 sushengbuhuo 

图片

图片

打开工具输入知乎收藏夹地址https://www.zhihu.com/collection/40047806, 页数和cookie ,如何获取cookie见之前文章 总有人问我 cookie 到底是什么?

图片

默认下载500篇回答,视频,文章,如果要继续下,修改页数再次下载。

图片

下载的html文件在zhihu目录。

图片

下载的视频在video目录。

图片

下载完成后合并转换生成的pdf文件大小200MB ,因为依赖wkhtmltopdf ,需要将wkhtmltopdf.exe加入环境变量。

图片

点击左侧标题书签可以跳转到对应内容。

图片

如果转换pdf失败可以用我开发的html2pdf批量转换html为pdf。

图片

再用我开发的pdf_merge将pdf文件合并成一个文件。

图片

顺便导出收藏夹excel数据包含类型(回答,文章,视频),标题,链接,创建时间,更新时间,简介,评论数,赞同数,页数等。

图片

除了知乎收藏夹批量下载还有我开发的知乎专栏批量下载工具https://pan.quark.cn/s/a26076946612 ,输入专栏链接https://www.zhihu.com/column/c_1721130763582382082和cookie就可以下载了。

图片

下载专栏文章回答html文件:

图片

合成的pdf文件,大小10MB。

图片

图片

顺便导出专栏excel数据包含类型,标题,链接,创建时间,更新时间,简介,评论数,赞同数等。

图片

最后是之前发布的知乎问题回答下载工具 https://t.zsxq.com/e7cPX

图片

输入知乎问题id和cookie:

图片

导出的 excel数据包含回答链接,回答者主页,回答者昵称,回答内容,回答发布时间,回答更新时间等:

图片

玩转互联网达人

苏生不惑备用号,分享各种黑科技软件资源和技巧,带你玩转互联网。

19篇原创内容

公众号

最新原创文章:

加入我的知识星球

2024 更新版:苏生不惑开发过的那些原创工具和脚本

2024 公众号苏生不惑发布软件目录

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

2024 极品互联网宝藏资源库,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出 excel 和 pdf

2024批量下载知乎回答文章想法专栏收藏夹,公众号文章内容图片封面视频音频,微博内容图片视频评论转发数据,导出excel和pdf

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

2024苏生不惑精华帖合集,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏/视频/收藏夹,微博内容/图片/视频/评论/转发数据,导出 excel 和 pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1537482.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins基于tag的构建

文章目录 Jenkins参数化构建设置设置gitlab tag在工程中维护构建的版本按指定tag的版本启动服务 Jenkins参数化构建设置 选择参数化构建: 在gradle构建之前,增加执行shell的步骤: 把新增的shell框挪到gradle构建之前, 最后保存 …

驱动器磁盘未格式化难题:深度剖析与恢复实践

驱动器磁盘未格式化的深层探索 在数据存储与管理的日常中,驱动器作为我们数字生活的基石,其稳定性直接关系到数据的安全与可用性。然而,当屏幕上赫然出现“驱动器中的磁盘未被格式化”的提示时,许多用户往往感到手足无措&#xf…

Linux 文件与目录操作命令详解

文章目录 前言创建文件1. touch2. vim 文件内容显示3. cat4. more5. less6. head7. tail 文件(目录)复制、删除和移动8. cp9. rm10. mv 压缩文件与解压缩11. gzip12. zip 和 unzip 创建目录13. mkdir 删除目录14. rmdir 改变工作目录15. cd16. pwd 显示目…

【C语言】联合体枚举的讲解

目录 ✨声明!!!: 联合体与结构体只有一个区别,那就是内存存储方式不同 💕1.联合体的声明 💕2.联合体内存的存储 💕3.联合体字节大小的计算 例题2: ✨4.枚举的声明…

全面掌握 Jest:从零开始的测试指南(下篇)

在上一篇测试指南中,我们介绍了Jest 的背景、如何初始化项目、常用的匹配器语法以及钩子函数的使用。这一篇篇将继续深入探讨 Jest 的高级特性,包括 Mock 函数、异步请求的处理、Mock 请求的模拟、类的模拟以及定时器的模拟、snapshot 的使用。通过这些技…

list从0到1的突破

目录 前言 1.list的介绍 2.list的常见接口 2.1 构造函数( (constructor)) 接口说明 2.2 list iterator 的使用 2.3 list capacity 2.4 list element access 2.5 list modifiers 3.list的迭代器失效 附整套练习源码 结束语 前言 前面我们学习…

一款源码阅读的插件

文章目录 进度汇报功能预览添加高亮标记高亮风格设置笔记颜色设置数据概览高亮数据详情 结尾 进度汇报 之前提到最近有在开发一个源码阅读的IDEA插件,第一版已经开发完上传插件市场了,等官方审批通过就可以尝鲜了。插件名称:Mark source cod…

防火墙——NAT

目录 NAT NAT分类 旧分类 新分类 NAT配置 源NAT​编辑 配置源NAT地址池​编辑 关于源NAT环路问题 环境如下​编辑 防火墙nat​编辑​编辑 路由器要配置指向11.0.0.0 网段的静态路由​编辑 测试​编辑 如果此时有外网用户直接pingNAT地址,则环路出现。​…

PAT甲级-1016 Phone Bills

题目 题目大意 顾客打长途电话计费,输出每月的账单。输入一行给出一天24小时的计费钱数,注意单位是美分,还要乘以0.01。接下来给出n条记录,每条记录都包括客户名,时间,状态。“on-line”是开始打电话的时间…

专题四_位运算( >> , << , , | , ^ )_算法详细总结

目录 位运算 常见位运算总结 1.基础位运算 2.给一个数 n ,确定它的二进制表示中的第 x 位是 0 还是 1 3.运算符的优先级 4.将一个数 n 的二进制表示的第 x 位修改成 1 5.将一个数n的二进制表示的第x位修改成0 6.位图的思想 7.提取一个数(n)二进…

如何优雅地处理返回值

我们已经知道了如何优雅的校验传入的参数了,那么后端服务器如何实现把数据返回给前端呢? 返回格式 后端返回给前端我们一般用 JSON 体方式,定义如下: {#返回状态码code:string, #返回信息描述message:string,#返回值data…

算法设计与分析(线性时间选择算法

目录 线性时间选择算法(QuickSelect)实现注意事项有可能出现的特殊情况:小结: 线性时间选择算法(QuickSelect)实现 线性时间选择算法 是快速排序算法的一个变种,用于在未完全排序的数组中找到第…

Next-ViT: 下一代视觉Transformer,用于现实工业场景中的高效部署

摘要 由于复杂的注意力机制和模型设计,大多数现有的视觉Transformer(ViTs)在实际的工业部署场景中,如TensorRT和CoreML,无法像卷积神经网络(CNNs)那样高效运行。这提出了一个明显的挑战&#x…

[Redis] Redis中的set和zset类型

🌸个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 🏵️热门专栏: 🧊 Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 🍕 Collection与…

微信,手机文件管理,通过自己软件打开——手机平板电脑编程———未来之窗行业应用跨平台架构

一、手机平板IT人员编程编辑器 专为 IT 和运维人员设计的手机和平板编程编辑器,具有便携灵活、即时响应、适应多场景、触控便捷、资源丰富、成本较低、激发创意和数据同步方便等优点。 二、手机平板现状 目前手机和平板的现状是缺乏专门针对 IT 人员的编辑工具&a…

避免服务器安装多个mysql引起冲突的安装方法

最近工作中涉及到了数据迁移的工作. 需要升级mysql版本到8.4.2为了避免升级后服务出现异常, 因此需要保留原来的mysql,所以会出现一台服务器上运行两个mysql的情况 mysql并不陌生, 但是安装不当很容易引起服务配置文件的冲突,导致服务不可用, 今天就来介绍一种可以完美避免冲突…

COMDEL电源CX2500S RF13.56MHZ RF GENERATOR手侧

COMDEL电源CX2500S RF13.56MHZ RF GENERATOR手侧

【C++ Primer Plus习题】16.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream> #include <list> using …

采用 Redis+数据库为某互联网文化公司建立网上社区平台

目录 案例 【说明】 【问题 1】(10 分) 【问题 2】(7 分) 【问题 3】(8 分) 【答案】 【问题 1】解析 【问题 3】解析 相关推荐 案例 阅读以下关于数据库缓存的叙述&#xff0c;回答问题 1 至问题 3。 【说明】 某互联网文化发展公司因业务发展&#xff0c;需要建立网…

海思Hi3559av100 sdk开发环境搭建

SDK阐释 海思官方给的sdk布局&#xff0c;如Hi3559AV100R001C02SPC031&#xff0c;其包含编译工具、硬件设计资料、软件sdk、文档等资料&#xff0c;tree布局可以构建如下形式&#xff0c;但不是必要的。 软件sdk在 01.software中&#xff0c;这个路径下才是真正的软件代码&…