Umi-OCR 是一款适用于 Win10 x64 平台的免费、离线 OCR 文字识别工具,基于 PaddleOCR,支持批量导入、读取剪贴板,可排除图片中水印区域,提取干净的文本。@Appinn
感谢 Beta 提醒,4 天前 Umi-OCR 发布 v1.2.6,最重要的更新内容是「速度更快!准确度更高!」
Umi-OCR
这是一款简单易用的工具,普通版仅包括简体中文&英文识别库。如果需要的话,还可以下载多国语言识别扩展包,包括了繁中(新版,适合横排)、繁中(旧版,适合竖排)、日文、韩文、德文、法文识别库。
普通版 77.4MB 大小,对于一款不联网的离线 OCR 工具,相当可以了。下载后即开即用。
青小蛙测试了一张网络截图,直接拖进去:
OCR批量图片转文字识别软件,带界面,离线运行。可排除图片中水印区域的干扰,提取干净的文本。基于 PaddleOCR 。
在设置中还能忽略部分区域、批量时处理子文件夹、自动保存为文件(.txt / .md)、完成后自动关机等功能:
如果你有 OCR 需求,快去试试。
获取
原文:https://www.appinn.com/umi-ocr/
终于有离线的OCR
离线OCR很早就有,Tesseract 了解一下,基于此的软件有Capture2Text、OCRmyPDF,都是很好用的开源方案
运行的时候要解压到临时文件夹,我的电脑用不了
估计是通过命令行调用OCR解析,所以不得不先保存成临时文件
这张参考图是可以发的吗?🐶
不错,很好用;缺点就是只能依赖剪贴板读取,不能自己截图识别
Quicker 建个动作自动化操作即可
原来青小蛙还被封控着😷😷😷
离线支持中文的ocr,非常推荐这个 【https://pearocr.com/】
模型下载到浏览器上进行解析的,把网站保存下来,模型下载好,自己起个nginx就能本地搭建了。
甚至,还能用nodejs调。
感谢分享,已装配到电脑上
新版是不是不支持win7了?一直报错,老提示下api-ms-win-core-processtopology-obsolete-l1-1-0.dll丢失。1.24版能正常使用。
用了一下,效率不错,效果也很好。要是能pdf直接转就更好了。现在还是用了几百兆存临时图片。
今天识别了一本书,391页,耗时2051秒,从效率上来说,我觉得相当不不错了,识别结果也算满意。
怎么实现识别PDF的?
谢谢分享!软件在哪儿下载?
页面搜索“获取”
我一运行就报错:识别器初始化失败
%遇到了亿点小问题
×
识别器视始化失败:[OCR init fail.]
识别器路径:[PaddleOCR-json/PaddleOCR json.exe]
配置文件路径:[PaddleOCRjson_config_简体中文.txt]
启动参数:0
请检查以上配置有无问题!
确定