chineseocr_lite – 超轻量级中文 OCR,本地文字识别工具

chineseocr_lite 是一个开源项目,用来实现中文的文字识别,支持竖排文字识别、繁体识别,总模型只有 17M(很小就是了),无需联网,支持 CPU 与 GPU,但需要自己部署。@Appinn

chineseocr_lite - 超轻量级中文 OCR,本地文字识别工具 1
Photo by Annie Spratt on Unsplash

目前绝大多数图片转文字,或者说中文 OCR 系统,都使用了云服务,也就是需要联网使用,这使得服务商有着大量的数据可以进行机器学习,而 chineseocr_lite 就有点厉害了:

超轻量级中文 ocr,支持竖排文字识别, 支持 ncnn 推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅 17M

虽然说,青小蛙对上面的几个项目不是很熟(第一次见),但测试了一番,识别率还是可以的,这就行了。

chineseocr_lite - 超轻量级中文 OCR,本地文字识别工具 2
chineseocr_lite - 超轻量级中文 OCR,本地文字识别工具 3

如何安装?

chineseocr_lite 是一款需要自行编译、自行部署的开源软件(GitHub 开源),所以…有使用门槛!

必备环境:

  • Python
  • PyTorch(官网
  • VS2015(Windows 需要)

Linux 与 macOS 直接编译就好,青小蛙在想要不要搞成 Docker 方便大家用…想用的人多么?

编译也非常简单,只需要先复制源代码,然后跟着编译即可:

git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd psenet/pse
rm -rf pse.so 
make

如何运行?

pip3 install -r requirements.txt
cd chineseocr_lite ## 进入chineseocr目录
python3 app.py 8080 ## 8080端口号,可以设置任意端口

上面的安装和运行两个步骤,对于新手会有不少的坑,所以你需要善用搜索引擎…总之青小蛙觉得这是一个能挡住 90% 普通用户的项目 🙈

如何使用?

在浏览器上输入 ip:8080 就能打开页面,然后加载图片进行识别了。并且还有 火车票身份证 两个单独识别选项。

38 条留言

  1. ray 2020/03/22 回复
    • TONY哥 2020/04/11 回复
  2. Dyxang 2020/03/22 回复
  3. Dyxang 2020/03/22 回复
  4. 季风哥 2020/03/22 回复
  5. 海天 2020/03/23 回复
    • skystar 2020/03/23 回复
  6. 154798760 2020/03/23 回复
  7. 你好 2020/03/23 回复
    • 青小蛙 2020/03/23 回复
  8. 喵星人 2020/03/23 回复
  9. 大叔 2020/03/23 回复
    • 青小蛙 2020/03/23 回复
    • notdiebird 2020/04/30 回复
  10. jyc860923 2020/03/23 回复
  11. randomcic 2020/03/23 回复
  12. Kio 2020/03/23 回复
  13. ddv 2020/03/23 回复
  14. CRK 2020/03/23 回复
  15. yangweijie 2020/03/24 回复
  16. butter 2020/03/24 回复
  17. 坎杜拉 2020/03/24 回复
  18. rodger 2020/03/25 回复
  19. 老黑先生 2020/03/25 回复
  20. Tony 2020/03/25 回复
    • 青小蛙 2020/03/26 回复
  21. Tony 2020/03/26 回复
  22. 土豆 2020/03/26 回复
  23. 无风清响 2020/03/28 回复
  24. 一缕阳光 2020/04/09 回复
  25. donggua 2020/04/13 回复
  26. devil 2020/04/22 回复
  27. frankienul 2020/06/30 回复

写留言