百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python光学字符识别工具-EasyOCR安装与使用(Win10)

itomcoil 2025-02-06 15:17 24 浏览

EasyOCR是Python实现的一个光学字符识别(OCR)工具。

安装pytorch

PyTorch is an optimized tensor library for deep learning using GPUs and CPUs.( https://pytorch.org/docs/stable/index.html

PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。(
https://baike.baidu.com/item/PyTorch/24269838?fr=aladdin
)。

PyTorch官网: https://pytorch.org/

网页(
https://pytorch.org/get-started/locally/#windows-python
)详细介绍了PyTorch安装的前提条件、方法及相关的注意事项,截图如下:


比较有趣、有用且强大的功能是上图中的表,根据不同的选择可以生成相应的安装命令。我选的是Windows、Pip、Python、CPU(不适用CUDA),得到对应的安装命令是: pip3 install torch torchvision torchaudio

在Win10命令行窗口,执行上述命令(前提是已安装了Python及pip)。结果如下图所示:


顺便使用命令“ python.exe -m pip install --upgrade pip ”更新了pip。


使用网页(
https://pytorch.org/get-started/locally/#windows-python
)的“VERIFICATION”部分介绍的代码,进行安装正确性检验。

python

import torch

x = torch.rand(5, 3)

print(x)

执行结果如下图所示:


应该是安装成功了。

安装EasyOCR

网页
https://www.jaided.ai/easyocr/install/


介绍了EasyOCR的安装方法(该网页的Pre-install部分的第一句话的意思是“对于Windows,你可能需要手动安装pytorch”,是不是Python 3.10.4会自动下载安装,回头有时间可以试一下),使用pip安装的命令是: pip install easyocr

在win10命令行窗口执行上述命令的结果如下图所示(需要时间较长;若长时间无反应,可敲击回车键试试是否已完成安装):


由于内容较多,将其文字部分附在最后。

安装完成后,在目录“D:\Programs\Python\Python310\Scripts”中会增加若干exe文件。


使用EasyOCR识别图片中的文字

jaided网站上的例子

将网页“
https://www.jaided.ai/easyocr/tutorial/
”中的图片


下载保存为文件“d:\temp\chinese_tra.jpg”,在python中依次执行下列命令(代码):

import easyocr

reader = easyocr.Reader(['ch_tra', 'en'])

result = reader.readtext(r'd:\temp\chinese_tra.jpg')


当执行代码“reader = easyocr.Reader(['ch_tra', 'en'])”时,程序自动通过互联网下载了检测模型和识别模型。提示信息及翻译如下:

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.

(没有CUDA-缺省使用CPU。注意:这个模块在GPU上运行效率更高)

Downloading detection model, please wait. This may take several minutes depending upon your network connection.

(正在下载检测模型,请等待。花费时间取决于您的网络)

Downloading recognition model, please wait. This may take several minutes depending upon your network connection.

(正在下载识别模型,请等待。花费时间取决于您的网络)

没有找到CUDA是因为我在安装Pytorch时没有选择安装CUDA。

EasyOCR使用检测模型匹配图片中的文字,也就是找到图片中的文字;找到之后使用识别模型进行文字识别。

其中的'ch_tra'和'en'是语言标识,'ch_tra'表示古汉语,'en'表示英语。EasyOCR支持的语言在网页“
https://www.jaided.ai/easyocr/
”中列出。


下载的模型文件保存在“C:\Users\zhang\.EasyOCR\model”(其中zhang是用户名,随计算机用户的不同而不同)目录中,如下图所示:



代码“result = reader.readtext(r'd:\temp\chinese_tra.jpg')”的结果显示信息过于详细,可以使用“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0)”或“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0, paragraph=True)”代替,执行结果如下图所示:


执行结果与网页“
https://www.jaided.ai/easyocr/tutorial/
”中的一致。

车牌的识别(有识别错误)

文件名“D:\temp\chepai.png”,图片内容如下:


因为车牌中有简体中文、英文和数字,所以使用下列命令:

reader = easyocr.Reader(['ch_sim', 'en'])

result = reader.readtext(r'd:\temp\chepai.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


在执行代码“reader = easyocr.Reader(['ch_sim', 'en'])”时,下载了识别模型文件“zh_sim_g2.pth”保存在目录“C:\Users\zhang\.EasyOCR\model”中。

识别结果为“京0T4209”,而实际是“京Q TA209”。把Q错误地识别为0,把A错误地识别为4。也就是说,存在识别错误。而且,没有识别出路面上的汉字

这里测试了一下,好像EasyOCR不能处理文件名(路径)中的中文

公益广告牌中文字识别(有识别错误)

文件名“D:\temp\pingdeng.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\pingdeng.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:公益广告 平等 众尘乎等 月尊月强

真实文字为:公益广告 平等 众生平

把“生平”误认作“尘乎”,“自”误认作“月”。也是存在一定的识别错误

扫描电子书图片中的文字识别(正确率较高)

文件名“D:\temp\shu.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\shu.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:排除型字符组是表示所有未列出字符的字符组的简便方

真实文字为:排除型字符组是表示所有未列出字符的字符组的简便方法

识别25个字,有一个错误。


小结

介绍了EasyOCR的安装,并用其识别了一些图片中的文字。结果显示,EasyOCR具备从图片中检测并识别文字的功能,但存在一定的识别错误率。

相关参考网页

http://www.360doc.com/content/22/0125/16/64728681_1014850914.shtml


https://gitee.com/mirrors/EasyOCR/
( Gitee 极速下载 / EasyOCR)

https://baijiahao.baidu.com/s?id=1729428712024244812&wfr=spider&for=pc


https://blog.csdn.net/family5love/article/details/89362943
(pip3的用法)

https://www.jaided.ai/easyocr/


https://www.jaided.ai/easyocr/install/
介绍如何安装EasyOCR的网页


pip install easyocr 命令执行的结果

Downloading easyocr-1.4.2-py3-none-any.whl (70.8 MB)

---------------------------------------- 70.8/70.8 MB 3.2 MB/s eta 0:00:00

Requirement already satisfied: torchvision>=0.5 in d:\programs\python\python310\lib\site-packages (from easyocr) (0.12.0)

Requirement already satisfied: numpy in d:\programs\python\python310\lib\site-packages (from easyocr) (1.22.4)

Collecting scipy

Downloading scipy-1.8.1-cp310-cp310-win_amd64.whl (36.9 MB)

---------------------------------------- 36.9/36.9 MB 3.7 MB/s eta 0:00:00

Collecting opencv-python-headless<=4.5.4.60

Downloading opencv_python_headless-4.5.4.60-cp310-cp310-win_amd64.whl (35.0 MB)

---------------------------------------- 35.0/35.0 MB 3.3 MB/s eta 0:00:00

Requirement already satisfied: torch in d:\programs\python\python310\lib\site-packages (from easyocr) (1.11.0)

Collecting PyYAML

Downloading PyYAML-6.0-cp310-cp310-win_amd64.whl (151 kB)

---------------------------------------- 151.7/151.7 kB 2.2 MB/s eta 0:00:00

Collecting python-bidi

Downloading python_bidi-0.4.2-py2.py3-none-any.whl (30 kB)

Requirement already satisfied: Pillow in d:\programs\python\python310\lib\site-packages (from easyocr) (9.1.1)

Collecting scikit-image

Downloading scikit_image-0.19.2-cp310-cp310-win_amd64.whl (12.6 MB)

---------------------------------------- 12.6/12.6 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: typing-extensions in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (4.2.0)

Requirement already satisfied: requests in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (2.27.1)

Collecting six

Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)

Collecting imageio>=2.4.1

Downloading imageio-2.19.2-py3-none-any.whl (3.4 MB)

---------------------------------------- 3.4/3.4 MB 4.4 MB/s eta 0:00:00

Collecting PyWavelets>=1.1.1

Downloading PyWavelets-1.3.0-cp310-cp310-win_amd64.whl (4.2 MB)

---------------------------------------- 4.2/4.2 MB 4.0 MB/s eta 0:00:00

Collecting tifffile>=2019.7.26

Downloading tifffile-2022.5.4-py3-none-any.whl (195 kB)

---------------------------------------- 195.6/195.6 kB 3.9 MB/s eta 0:00:00

Requirement already satisfied: packaging>=20.0 in d:\programs\python\python310\lib\site-packages (from scikit-image->easyocr) (21.3)

Collecting networkx>=2.2

Downloading networkx-2.8.2-py3-none-any.whl (2.0 MB)

---------------------------------------- 2.0/2.0 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in d:\programs\python\python310\lib\site-packages (from packaging>=20.0->scikit-image->easyocr) (3.0.9)

Requirement already satisfied: certifi>=2017.4.17 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2022.5.18.1)

Requirement already satisfied: urllib3<1.27,>=1.21.1 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (1.26.9)

Requirement already satisfied: charset-normalizer~=2.0.0 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2.0.12)

Requirement already satisfied: idna<4,>=2.5 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (3.3)

Installing collected packages: tifffile, six, scipy, PyYAML, PyWavelets, opencv-python-headless, networkx, imageio, scikit-image, python-bidi, easyocr

Successfully installed PyWavelets-1.3.0 PyYAML-6.0 easyocr-1.4.2 imageio-2.19.2 networkx-2.8.2 opencv-python-headless-4.5.4.60 python-bidi-0.4.2 scikit-image-0.19.2 scipy-1.8.1 six-1.16.0 tifffile-2022.5.4


PyWavelets:是Python的小波分析库(小波变换)。

相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...