青小蛙遇到一个问题,一些网页上的资料 ,需要离线保存下来备用,但各类剪藏工具又不能很完整的抓取完整网页,于是想起能不能转换为 PDF 保存。@Appinn
注意,这是青小蛙搜索了大概7~8款在线工具之后,挑选了一款各方面比较符合需求的工具,低频使用、少量。但肯定不是最好的,如果你知道更好的工具,请留言告诉我们。
至于为什么需要保存到本地阅读,其实本来是想保存到 Onenote 里的,但效果非常糟糕,几乎不可读。而保存在本地,是因为近年来太多的内容变成了 404,当初的网络收藏夹已经变成了孤岛,除了收藏夹本身可用之外,大部分的链接都死掉了,这就十分尴尬。
然而,转换为 PDF 之后,青小蛙还是将 PDF 放在了 Onenote 里,毕竟带着方便 😂
Pdfcrowd
Pdfcrowd 是一款在线的文档转换工具,支持将网页转换为 PDF 和图片,可以是 URL、HTML 文件,或者是 HTML 代码。
即开即用,使用默认配置即可,直接输入网址,点击 Convert 转换,就能直接下载或者在线阅读,非常方便。
不过转换后的 PDF 会在每一页的末尾添加一行小尾巴,对于个人是用来说无伤大雅,商业应用请谨慎。
示例
以下是使用《Zenkit To Do – 简洁的跨平台任务管理工具,一个奇妙清单的替代品》一文在 Pdfcrowd 转换为 PDF 后的效果,注意中间那个黑框是 PDF 分页,不是 bug。
有同样需求的同学可以试试看,Pdfcrowd 网站在这里:https://pdfcrowd.com/
另外,本文的重点是,你们有其他推荐的赶紧发过来。
如果量不大,偶尔需要把网页转换为PDF的话,
可以试试用chrome直接ctrl+P打印网页,目标打印机选“打印为PDF”。
可以满足大部分情况下偶尔使用的需求
尝试了下,带边栏的网页…效果很糟糕
我也是用这个方法的,所以我一般都先开 DevTools 移掉多余的节点。不过现在突然想到其实可以写油猴脚本来适配,转念又一想简悦之类的不就类似内置了各种适配……
用简悦切换到阅读模式,然后打印为pdf
恩,如果页面有跟随浮动的元素,打印效果就会比较糟糕。
Firefox 有 nuke everything,可以把所有无关的元素先去掉
chrome选中要保存的部分,打印时,选择“仅限选定内容”。
我是用adobe acrobat的chrome插件
https://www.printfriendly.com/ 这个是把网页转化成适合打印的模式,用打印模式就可以输出PDF了,这样似乎比直接输出网页架构的PDF更适合作为资料保存,供参考
这个不错哦,但原本网页的样式没有了。
是啊,这样比较适合保存文章类型的资料(像是百度百家好等等很多无用版式),如果要完整下载的话直接打印PDF就可以了~:D
这个我也在用,这个特别好,保存的效果特别满意,而且可以删除不想要的内容后保存成PDF的
这个确实好用,谢谢分享。
印象笔记的剪藏插件不香吗?
目前在用devonthink的 Capture Web Archive,可读性很好,但是只是for safari的一个服务,对于移动端的知乎等没有直接的方式。不晓得非ios系统的evernote如何?以前的wiznote可能比较完美,但目前简单试了一下,iphone上和印象笔记一样失败。
https://www.printfriendly.com/
浏览器扩展,直接打印成PDF。打印前还可以选择性删除网页中的元素,比如不想要的广告啥的。
简阅插件可以输出pdf,也可以输出到onenote
2年前我在论坛聊过web转pdf的话题。 https://meta.appinn.net/t/web-pdf-chrome/7183
哈哈哈哈
Firefox有个扩展,叫SingleFile,可以直接将一个完整的页面保存到“单个HTML 文件”中
我在用一个 chrome 的扩展叫 save page we 也是存’单个html’
WE 这个很可能意味着是来自 Firefox 的 web extension 的移植…..
但是 we 版往往是 原版的劣化版本, 没办法, 新的标准限值了很多东西嘛;
啊原来如此,了解了
现在chrome上也有singfile了 同一个插件
这个真不错,扩展按上了
既然放onenote,为什么不用剪辑插件呢~
浏览器问题,为什么不考虑下从浏览器上面解决呢?如果chrome不够满意,ff不成?
通过第三方网站打印的话,内容有可能会有不同哦~
Safari ??
印象笔记剪藏 ??
印象笔记保存选中部分从来没遇到过不能保存的页面
有没有可以搜索PDF内容的人软件,这样就可以当知识库使用了,试了很多软件,都无法搜索PDF中的中文。
FileLocator pro 可以搜中文
docfetcher可以搜索pdf,就是分词做得不是很好
win10文件管理器,右上角搜索框,自带内容文本搜索功能
你这情况为啥要转PDF?直接存HTML格式挺好啊。然后使用EVERYTHING来检索,这玩意支持文件内容检索。
否则就是放到一个EVERNOTE里面用软件内的检索(相当不推荐)。
Chrome原生工具Capture full size screenshot,或许更实用,起码不用安装别的东西。
不需要链接的话,还是截成图片更好。
简悦,不仅保存本地还保存至云端
推荐过的
以前用firefox,可以直接打印出来pdf,
一般用浏览器的SingFile扩展把整个网页或选择的部分保存成本地离线html文件(只有这一个文件,里面包含图片,格式也都能保留)
另外就是用chrome来生成PDF,也是可以保存整个网页或选择的部分,比较方便,不用安装东西。
受不了网页保存成 PDF 后连续的网页被页面分割了
我还是习惯用 SingleFileZ 把网页保存成 html,配合 uBlock Origin 临时去掉网页上其他元素(例如留言栏)
对于一些很简洁的网页,用 Web Clipper 剪成 markdown,配合 Joplin 的 Token 令牌可以直接保存到 Joplin
save page we不行吗?
点赞的那个手是谁做的?
太形象了,哈哈哈哈^_^
为什么要保存成pdf,需要在网页上做标记,使用liner插件就行了,我一直用免费版
直接用chrome保存mhtml也可以啊,有浏览器的地方就可以。
我在用一个叫 Full Page Screen Capture 的 Chrome 扩展程序,支持长截图也能导出PDF。推荐大家试一试: https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl
1、opera浏览器自带网页保存成PDF功能。
2、为知笔记抓取页面是最好的。抓取后可以作为html,也可以导出为PDF
看了上面的一些建议… 好吧,为什么不用简悦呢?
针对这个情景,使用简悦相当于包含了:uBlock(去污)+ 页面优化(阅读模式)+ 导出(各种常用的生产力工具)
基本上是 1 对 n 的产品,以及傻瓜化的一条龙式的操作。
甚至于,你可以使用离线下载导出为 HTML 再保存到网盘里面,不仅自带样式,还包含了离线图片,也方便搜索,
事后,你需要的话,再转 PDF 也来得及…
所以… 神马 PDF 方案是不是有些过时了?
现在用的都是SingleFileZ这个浏览器插件,chrome和firefox都有,可以保存整个网页,也可以保存选中的部分,保存下来的文件体积也不大。
对于现代浏览器这种做法相当的优美,但是在totalcmd里就没法快速查看了。
好久之前用过一个网页打印工具,可以在打印之前像开发者模式一样选择要打印的内容和要删掉的内容
我一直以为这是浏览器自带的功能来着,可是现在我找不到这个工具了,实在是难受
找到一个类似的扩展
https://chrome.google.com/webstore/detail/print-edit-we/olnblpmehglpcallpnbgmikjblmkopia
我觉得印象的剪藏好用,对于我来说,如果不能搜索其中内容的话,那是没多大用处。请问这样转换而来的PDF可以搜索其中的内容吗?
直接语雀 剪辑到知识库了 存本地也是麻烦
配合插件
https://chrome.google.com/webstore/detail/web-clipper/mhfbofiokmppgdliakminbgdgcmbhbac
直接图片文字一次提取到位
新版Edge可以直接保存 不需要工具
如果用one note ,为什么不直接存图片,one note还可以识别复制图片中的文本。
一直一以来是用acrobat直接打印成pdf或是创建网页pdf。
CYBORG收藏处理网页链接的生成PDF在线文档。
https://documentcyborg.com/
如果是iOS或者Mac,Safari浏览器对于能够识别并打开阅读器视图的网页文章自带分享成“阅读器视图的PDF”格式,可以仅把文章内容做成PDF导出。
为什么不直接保存网页为.mht格式呢?这种网页格式虽然是IE内核的,你可以为了你的需求用一下IE内核的浏览器就可以了,平时完全用Chrome。另外,为啥不保存网页为图片呢?这方面有很多浏览器的扩展可用,保存围图片的好处是排版和分辨率都能保证呀,你需要pdf,就把图片转成PDF即可,不过我觉得图片看着更舒服呀。
因为…没有 IE 吧
我一般是使用chrome的开发者工具,先把不必要的页面元素删掉,之后再使用ctrl-shift-c选择特定的页面结构,ctrl-shift-p,输入cpature node screenshot便可以打印该节点的内容了。
右键另存为不好吗?但也没格式
右键另存为不好吗?单页面格式 类型选—网页,单个文件 mhtm
直接浏览器打开就行了。
这个工具会让图片丢失
傲游浏览器5.3.8.2000便携版
感觉Chrome插件FireShot-capture page就挺好用的。
用 SingleFile 保存为单个 HTML 文件就挺好的,可以只保存选择的部分,不用考虑浏览器兼容性,支持文件内容文本检索
而且选项丰富,支持去掉不必要的网页框架和脚本,保留原始 URL 信息,含有图片的超大页面可以延时等待避免出错,如果硬盘够大,还可以根据域名自动保存所有浏览页面
正文和评论里提到的离线保存的都试了一遍……
如果是要保存成一页可编辑的pdf文档,本页面提到的都不行,chrome另存为pdf、简悦、printfriendly都不行,正文提到的网站会直接把一张图片分开到两页上保存。
评论里提到的两年前就有过讨论中提到的扩展PDF Mage可以保存成一页可编辑的pdf文档,但是免费版有限制。
如果不要求保存网页样式,评论提到的都可以,简悦和printfriendly也不错,但是像这篇文章,评论也很重要,就不是特别合适了。
我现在保留的方法:①选中页面内容,然后chrome另存为pdf中选中“仅限选定内容”,可以只保存选择的部分。
② SingleFile扩展,也可以选择保存选中的部分为单独的离线HTML文件。这个是单页的。
也可以试试小白工具包
percollate 没有人推荐吗?命令行工具,可以自定义模板,可以批量。直接提取内容标题,没有乱七八糟。看到好的文章,直接yy下网址,放到win+r中,一个命令保存到本地磁盘文件。强烈推荐。不过,尽管很方便,我还是很少用,因为,现在好看的文章,毕竟不多了。
浏览器不是本身就有保存为PDF的功能吗?谷歌, 火狐可能要到设置中打开选项。 EDGE 直接就可以。而且这样可以选择需要的部份来打印。 我觉得输出为PDF不是问题, 但是如何原汁原味的体现网页原样才是难点。比如PDF中还是可以显示gif的动态,网页原来链接的保持等等。。
还是浏览器直接打印为PDF保存得完整
https://pdfcrowd.com/save-as-pdf-addon/
变成这个网址了