字符识别之PaddleOcr介绍、安装与应用
itomcoil 2025-08-01 17:47 2 浏览
- paddleocr介绍
paddleocr是一款轻量型字符识别工具库,支持多语言识别,支持pip安装与自定义训练。详细信息如下表所示。
名称 | 许可证 | 当前版本 | 下载地址(github地址) | 支持语言 | 运行方式pip安装 |
PaddleOCR | Apache 2.0 license | PaddleOCR v2.3 | https://gitee.com/paddlepaddle/PaddleOCR?utm_source=alading&utm_campaign=repo | python等 | 安装相应的pip即可,或者下载github源码 |
2. paddleocr安装
在python环境中,运行pip命令:
pip install "paddleocr>=2.0.1"
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
在执行安装命令之前需要配置完成一些必要的库,参考requments.txt安装如下的包:
shapely、scikit-image==0.17.2、imgaug==0.4.0、pyclipper、lmdb
tqdm、numpy、visualdl、python-Levenshtein、opencv-contrib-python==4.4.0.46
lxml、premailer、openpyxl
此外还需要安装paddlepaddle以及必须的模型等。模型下载地址:
模型信息:
下载:!wget
https://paddleocr.bj.bcebos.com/inference.tar 并且需要将模型放在固定位置
模型信息:https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/models_list.md
官方文档:
https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.0/doc/doc_ch
https://www.bookstack.cn/read/PaddleOCR/quickstart.md
3. 测试
提供两种测试方式,一种是pip方式,一种以命令行的源码启动。以下图为例进行测试。
对代码方式运行结果如下:
左右两边分别对应原图标识和结果。对命令行启动步骤如下(以需要下载模型为例)
- 在github或其他相关网页上找到需要下载的模型,一般会有两个模型,分别是检测模型和识别模型。下载完成后在源码路径下新建inference文件夹,然后将模型解压放在该文件夹下。
- 使用命令
>python tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_PP-OCRv2_det_slim_quant_infer/" --rec_model_dir="./inference/ch_PP-OCRv2_rec_slim_quant_infer/" --use_gpu=False
* use_gpu=False表示不使用GPU。
完成后结果保存在源码路径下的inference_results文件夹下。可以看出更换模型后效果较默认模型要好。
这里使用官方图像进行测试的结果。
4. paddleocr训练
paddleocr提供完全的训练方式,具体方式可参考官方文档进行处理。官方提供了标注工具,界面启动和截图如下。在PaddleOcr源码下PPOCRLabel文件夹下执行命令(需要先安装pyqt):
python PPOCRLabel.py --lang ch
执行后界面如下:
- 上一篇:40行代码实现人脸识别
- 下一篇:一个识别率较高的OCR识别库
相关推荐
- C|经典实例理解算法之顺推、逆推、迭代、递归思想
-
递推算法可以不断利用已有的信息推导(迭代)出新的信息,在日常应用中有如下两种递推算法。①顺推法:从已知条件出发,逐步推算出要解决问题的方法。例如斐波那契数列就可以通过顺推法不断递推算出新的数据。②...
- [西门子PLC] 博途编程之递归算法
-
首先跟大伙讲一讲哈,递归算法瞅着是挺优雅挺不错的,可实际上没啥大用,在真正的项目里能不用就别用递归,为啥呢?因为用了递归可能会惹出大麻烦,后面会给大伙举例讲讲原因。那啥叫递归呢?从名字上就能看出来,就...
- SQL 也能递归?一文搞懂 Recursive CTE的魔力
-
很多人以为递归(Recursive)只属于编程语言,和SQL没什么关系。但其实SQL中也能实现递归操作,特别是在处理树结构、路径查找时,WITHRECURSIVE展现出强大威力。本文将带你...
- 10张动图学会python循环与递归
-
一图胜千言! 循环难学?十张动图GIFS有助于认识循环、递归、二分检索等概念的具体运行情况。 本文代码实例以Python语言编写。 一、循环 GIF1:最简单的while循环 GIF...
- C语言学习之-----(十三) 函数递归
-
(十三)函数递归一、栈在说函数递归的时候,顺便说一下栈的概念。栈是一个后进先出的压入(push)和弹出(pop)式数据结构。在程序运行时,系统每次向栈中压入一个对象,然后栈指针向下移动一个位置。当系...
- Python自动化办公应用学习笔记19—— 循环控制:break 和 continue
-
在Python的循环结构中,break和continue是两个特殊的保留字,主要用于改变循环的执行流程。1.定义与核心作用break:立即终止当前循环,跳出整个循环体(仅限最内层循环)conti...
-
- 循环与递归的那些事
-
大家好,我是贠学文,点击右上方“关注”,每天为您分享java程序员需要掌握的知识点干货。在任何的编程语言中,循环和递归永远都是一个避不开的话题,因为在某些特定的场景下,用递归确实要比循环简单得多,比如说遍历文件夹目录等等,但是,递归也有下面...
-
2025-08-02 18:49 itomcoil
- 漫谈递归、迭代、循环——人理解迭代,神理解递归
-
后续计划好几天没有更新了,没有偷懒。随着源码的阅读,学习到了字典和集合的底层实现。字典这种数据结构的搜索效率很高,底层结构采用了效率优于红黑树的哈希表。红黑树是一种平衡二叉树,C++中的map和lin...
- Excel递归与循环——货物分箱问题
-
递归指通过函数自身调用实现复杂计算,在Excel中多通过支持递归的函数(如LAMBDA)实现。第一,简化复杂逻辑表达:对于有明确递推关系的问题,递归能将多层嵌套的逻辑转化为简洁的自我调用形式,比手...
- MongoDB入门之索引
-
索引就像书的目录,如果查找某内容在没有目录的帮助下,只能全篇查找翻阅,这导致效率非常的低下;如果在借助目录情况下,就能很快的定位具体内容所在区域,效率会直线提高。索引简介首先打开命令行,输入mongo...
- MongoDB之集合管理一
-
最近的几篇博客都是关于MongoDB的,虽然个人感觉也没多少知识点,但没想到竟然有转载我的博客的,不管有经过我同意还是没经过我同意,说明写的应该还是有价值的,这也是我写博客的一个动力之一吧。上一博客学...
- SpringBoot集成扩展-访问NoSQL数据库之Redis和MongoDB!
-
与关系型数据库一样,SpringBoot也提供了对NoSQL数据库的集成扩展,如对Redis和MongoDB等数据库的操作。通过默认配置即可使用RedisTemplate和MongoTemplate...
- 揭秘你不会画“信息结构图”的本质
-
编辑导语:产品信息结构图有助于清晰地展示产品信息,一定程度上可以为后台上传数据提供依据,但不少人可能觉得产品信息结构图很难,这可能是对数据库表结构不理解等因素导致的。本篇文章里,作者就产品信息结构图的...
- MongoDB导入导出备份数据
-
要提前安装mongodb-database-tools参考:centos离线安装mongodb-database-tools导出数据常用的导出有两种:mongodump和mongoexport,两种方...
- mongodb导入导出及备份
-
-------------------MongoDB数据导入与导出-------------------1、导出工具:mongoexport1、概念:mongoDB中的mongoexport...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)