PearOCR 是一款免费无限制的在线 OCR 工具,最大特色是使用自己的 OCR 识别引擎,全部识别过程在浏览器本地完成,不受限于需要付费的大厂 API 服务。@Appinn
来自发现频道
PearOCR 主要特色
- 自研识别引擎,不用大厂 API,全部识别过程在浏览器本地完成,没有数据上传,保护数据安全避免滥用
- 完全免费,没有次数/大小限制,不需要自行申请API,不需要登录,不需要下载
- 以原图文本位置排版,方便对照
- 支持导出为 PDF,方便归档
PearOCR 支持本地图片和剪贴板,针对隐私问题,开发者这样说:
PearOCR 所有的运算都是纯前端完成,图片和识别数据都不会经过服务器,把 OCR 做成一个网页只是为了无需下载点开即用,比如网页加载完成后断开网络一样可以正常识别,不会和服务器有数据交互。
相对的,更多使用各大厂 OCR 接口的产品,是先上传至服务器再识别的。
未来的 PearOCR 有计划添加 PWA 支持。
PearOCR 官网
- 官网:https://pearocr.com/
- 发现频道:https://meta.appinn.net/t/topic/25209/
- 原文:https://www.appinn.com/pearocr-online/
能把整个OCR过程用纯前端做出来,看得出来作者的技术功底很强,做得也十分好用
体验了下,很不错, WebAssembly本地识别,如果能增加表格等格式识别,以及复制时保留原文档排版格式就完美了
这个666,前端识别文字有点意思
大佬牛批
站长有没有啥工具可以转换/虚拟打印PDF时不分页?我发现网页、文档要转PDF时,现有的工具都会按A4等纸张类型分页,就没有不分页的选项。之前用过的工具只有fireshot这个浏览器插件可以不分页保存网页为PDF,但它是收费的,价格不便宜,免费版有很多限制。
试了一下还不错,希望作者做个纯净exe程序,没网也能识别该多好
Chrome 可以安装为应用
我手机试了一下断网也能用
记得以前有个英文的项目也是做这个,后来不知道怎么样了,名字特别奇怪难记
pdfFactory Pro等都可以,首先要设置纸张大小,不过打印出来的是图片,无法检索pdf的内容。
后来发现:
用chrome自带的“另存为PDF”,在其中把页面大小设为比原来的纸张大1号(比如,原来A4的设置为A3),然后在左侧预览区把页与页之间的边界用鼠标拖到最小,打印出来就可以。
唯一美中不足的是页和页之间有小虚线。
其实还是有缺陷,只是把页边距减小到近乎于0,但本质是还是分页的,所以有些图片、表格之类网页上是连续的,存PDF时就给断到下一页了,前页一大片空白。而且chrome自带的存PDF虽然快,但有时居然小概率出错,页面排版混乱,也是无语了,按说浏览器原生的应该最稳定才是,虽然出错概率很小但这也让它必须再有个备用工具了。
直接用截长图插件,截图,然后图片转PDF啊
那就失去PDF的意义了,PDF能检索文字,能点链接直接跳转到对应网页,这些长截图都办不到。要说长截图新版edge就自带了超强的,能整体长截图,还能拖动范围长截图,胜过一堆第三方工具,然而它不能存为PDF,截图上的文字后续不能检索跳转用。
腻害,开源么
有没有本地的音频识别工具?