PearOCR - 不使用大厂 API 的在线 OCR 文字识别工具，无限量、免费识别

PearOCR 是一款免费无限制的在线 OCR 工具，最大特色是使用自己的 OCR 识别引擎，全部识别过程在浏览器本地完成，不受限于需要付费的大厂 API 服务。@Appinn

PearOCR 主要特色

PearOCR 支持本地图片和剪贴板，针对隐私问题，开发者这样说：

PearOCR 所有的运算都是纯前端完成，图片和识别数据都不会经过服务器，把 OCR 做成一个网页只是为了无需下载点开即用，比如网页加载完成后断开网络一样可以正常识别，不会和服务器有数据交互。

相对的，更多使用各大厂 OCR 接口的产品，是先上传至服务器再识别的。

未来的 PearOCR 有计划添加 PWA 支持。

sille 2021/08/16 回复

能把整个OCR过程用纯前端做出来，看得出来作者的技术功底很强，做得也十分好用
magic 2021/08/16 回复

体验了下，很不错， WebAssembly本地识别，如果能增加表格等格式识别，以及复制时保留原文档排版格式就完美了
小K 2021/08/16 回复

这个666，前端识别文字有点意思
duzhe 2021/08/16 回复

大佬牛批
山城子 2021/08/16 回复

站长有没有啥工具可以转换/虚拟打印PDF时不分页？我发现网页、文档要转PDF时，现有的工具都会按A4等纸张类型分页，就没有不分页的选项。之前用过的工具只有fireshot这个浏览器插件可以不分页保存网页为PDF，但它是收费的，价格不便宜，免费版有很多限制。
JACKY 2021/08/16 回复

试了一下还不错，希望作者做个纯净exe程序，没网也能识别该多好

山城子 2021/08/18 回复

其实还是有缺陷，只是把页边距减小到近乎于0,但本质是还是分页的，所以有些图片、表格之类网页上是连续的，存PDF时就给断到下一页了，前页一大片空白。而且chrome自带的存PDF虽然快，但有时居然小概率出错，页面排版混乱，也是无语了，按说浏览器原生的应该最稳定才是，虽然出错概率很小但这也让它必须再有个备用工具了。

山城子 2021/08/18 回复

那就失去PDF的意义了，PDF能检索文字，能点链接直接跳转到对应网页，这些长截图都办不到。要说长截图新版edge就自带了超强的，能整体长截图，还能拖动范围长截图，胜过一堆第三方工具，然而它不能存为PDF，截图上的文字后续不能检索跳转用。