百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python光学字符识别工具-EasyOCR安装与使用(Win10)

itomcoil 2025-02-06 15:17 8 浏览

EasyOCR是Python实现的一个光学字符识别(OCR)工具。

安装pytorch

PyTorch is an optimized tensor library for deep learning using GPUs and CPUs.( https://pytorch.org/docs/stable/index.html

PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。(
https://baike.baidu.com/item/PyTorch/24269838?fr=aladdin
)。

PyTorch官网: https://pytorch.org/

网页(
https://pytorch.org/get-started/locally/#windows-python
)详细介绍了PyTorch安装的前提条件、方法及相关的注意事项,截图如下:


比较有趣、有用且强大的功能是上图中的表,根据不同的选择可以生成相应的安装命令。我选的是Windows、Pip、Python、CPU(不适用CUDA),得到对应的安装命令是: pip3 install torch torchvision torchaudio

在Win10命令行窗口,执行上述命令(前提是已安装了Python及pip)。结果如下图所示:


顺便使用命令“ python.exe -m pip install --upgrade pip ”更新了pip。


使用网页(
https://pytorch.org/get-started/locally/#windows-python
)的“VERIFICATION”部分介绍的代码,进行安装正确性检验。

python

import torch

x = torch.rand(5, 3)

print(x)

执行结果如下图所示:


应该是安装成功了。

安装EasyOCR

网页
https://www.jaided.ai/easyocr/install/


介绍了EasyOCR的安装方法(该网页的Pre-install部分的第一句话的意思是“对于Windows,你可能需要手动安装pytorch”,是不是Python 3.10.4会自动下载安装,回头有时间可以试一下),使用pip安装的命令是: pip install easyocr

在win10命令行窗口执行上述命令的结果如下图所示(需要时间较长;若长时间无反应,可敲击回车键试试是否已完成安装):


由于内容较多,将其文字部分附在最后。

安装完成后,在目录“D:\Programs\Python\Python310\Scripts”中会增加若干exe文件。


使用EasyOCR识别图片中的文字

jaided网站上的例子

将网页“
https://www.jaided.ai/easyocr/tutorial/
”中的图片


下载保存为文件“d:\temp\chinese_tra.jpg”,在python中依次执行下列命令(代码):

import easyocr

reader = easyocr.Reader(['ch_tra', 'en'])

result = reader.readtext(r'd:\temp\chinese_tra.jpg')


当执行代码“reader = easyocr.Reader(['ch_tra', 'en'])”时,程序自动通过互联网下载了检测模型和识别模型。提示信息及翻译如下:

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.

(没有CUDA-缺省使用CPU。注意:这个模块在GPU上运行效率更高)

Downloading detection model, please wait. This may take several minutes depending upon your network connection.

(正在下载检测模型,请等待。花费时间取决于您的网络)

Downloading recognition model, please wait. This may take several minutes depending upon your network connection.

(正在下载识别模型,请等待。花费时间取决于您的网络)

没有找到CUDA是因为我在安装Pytorch时没有选择安装CUDA。

EasyOCR使用检测模型匹配图片中的文字,也就是找到图片中的文字;找到之后使用识别模型进行文字识别。

其中的'ch_tra'和'en'是语言标识,'ch_tra'表示古汉语,'en'表示英语。EasyOCR支持的语言在网页“
https://www.jaided.ai/easyocr/
”中列出。


下载的模型文件保存在“C:\Users\zhang\.EasyOCR\model”(其中zhang是用户名,随计算机用户的不同而不同)目录中,如下图所示:



代码“result = reader.readtext(r'd:\temp\chinese_tra.jpg')”的结果显示信息过于详细,可以使用“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0)”或“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0, paragraph=True)”代替,执行结果如下图所示:


执行结果与网页“
https://www.jaided.ai/easyocr/tutorial/
”中的一致。

车牌的识别(有识别错误)

文件名“D:\temp\chepai.png”,图片内容如下:


因为车牌中有简体中文、英文和数字,所以使用下列命令:

reader = easyocr.Reader(['ch_sim', 'en'])

result = reader.readtext(r'd:\temp\chepai.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


在执行代码“reader = easyocr.Reader(['ch_sim', 'en'])”时,下载了识别模型文件“zh_sim_g2.pth”保存在目录“C:\Users\zhang\.EasyOCR\model”中。

识别结果为“京0T4209”,而实际是“京Q TA209”。把Q错误地识别为0,把A错误地识别为4。也就是说,存在识别错误。而且,没有识别出路面上的汉字

这里测试了一下,好像EasyOCR不能处理文件名(路径)中的中文

公益广告牌中文字识别(有识别错误)

文件名“D:\temp\pingdeng.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\pingdeng.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:公益广告 平等 众尘乎等 月尊月强

真实文字为:公益广告 平等 众生平

把“生平”误认作“尘乎”,“自”误认作“月”。也是存在一定的识别错误

扫描电子书图片中的文字识别(正确率较高)

文件名“D:\temp\shu.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\shu.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:排除型字符组是表示所有未列出字符的字符组的简便方

真实文字为:排除型字符组是表示所有未列出字符的字符组的简便方法

识别25个字,有一个错误。


小结

介绍了EasyOCR的安装,并用其识别了一些图片中的文字。结果显示,EasyOCR具备从图片中检测并识别文字的功能,但存在一定的识别错误率。

相关参考网页

http://www.360doc.com/content/22/0125/16/64728681_1014850914.shtml


https://gitee.com/mirrors/EasyOCR/
( Gitee 极速下载 / EasyOCR)

https://baijiahao.baidu.com/s?id=1729428712024244812&wfr=spider&for=pc


https://blog.csdn.net/family5love/article/details/89362943
(pip3的用法)

https://www.jaided.ai/easyocr/


https://www.jaided.ai/easyocr/install/
介绍如何安装EasyOCR的网页


pip install easyocr 命令执行的结果

Downloading easyocr-1.4.2-py3-none-any.whl (70.8 MB)

---------------------------------------- 70.8/70.8 MB 3.2 MB/s eta 0:00:00

Requirement already satisfied: torchvision>=0.5 in d:\programs\python\python310\lib\site-packages (from easyocr) (0.12.0)

Requirement already satisfied: numpy in d:\programs\python\python310\lib\site-packages (from easyocr) (1.22.4)

Collecting scipy

Downloading scipy-1.8.1-cp310-cp310-win_amd64.whl (36.9 MB)

---------------------------------------- 36.9/36.9 MB 3.7 MB/s eta 0:00:00

Collecting opencv-python-headless<=4.5.4.60

Downloading opencv_python_headless-4.5.4.60-cp310-cp310-win_amd64.whl (35.0 MB)

---------------------------------------- 35.0/35.0 MB 3.3 MB/s eta 0:00:00

Requirement already satisfied: torch in d:\programs\python\python310\lib\site-packages (from easyocr) (1.11.0)

Collecting PyYAML

Downloading PyYAML-6.0-cp310-cp310-win_amd64.whl (151 kB)

---------------------------------------- 151.7/151.7 kB 2.2 MB/s eta 0:00:00

Collecting python-bidi

Downloading python_bidi-0.4.2-py2.py3-none-any.whl (30 kB)

Requirement already satisfied: Pillow in d:\programs\python\python310\lib\site-packages (from easyocr) (9.1.1)

Collecting scikit-image

Downloading scikit_image-0.19.2-cp310-cp310-win_amd64.whl (12.6 MB)

---------------------------------------- 12.6/12.6 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: typing-extensions in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (4.2.0)

Requirement already satisfied: requests in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (2.27.1)

Collecting six

Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)

Collecting imageio>=2.4.1

Downloading imageio-2.19.2-py3-none-any.whl (3.4 MB)

---------------------------------------- 3.4/3.4 MB 4.4 MB/s eta 0:00:00

Collecting PyWavelets>=1.1.1

Downloading PyWavelets-1.3.0-cp310-cp310-win_amd64.whl (4.2 MB)

---------------------------------------- 4.2/4.2 MB 4.0 MB/s eta 0:00:00

Collecting tifffile>=2019.7.26

Downloading tifffile-2022.5.4-py3-none-any.whl (195 kB)

---------------------------------------- 195.6/195.6 kB 3.9 MB/s eta 0:00:00

Requirement already satisfied: packaging>=20.0 in d:\programs\python\python310\lib\site-packages (from scikit-image->easyocr) (21.3)

Collecting networkx>=2.2

Downloading networkx-2.8.2-py3-none-any.whl (2.0 MB)

---------------------------------------- 2.0/2.0 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in d:\programs\python\python310\lib\site-packages (from packaging>=20.0->scikit-image->easyocr) (3.0.9)

Requirement already satisfied: certifi>=2017.4.17 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2022.5.18.1)

Requirement already satisfied: urllib3<1.27,>=1.21.1 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (1.26.9)

Requirement already satisfied: charset-normalizer~=2.0.0 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2.0.12)

Requirement already satisfied: idna<4,>=2.5 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (3.3)

Installing collected packages: tifffile, six, scipy, PyYAML, PyWavelets, opencv-python-headless, networkx, imageio, scikit-image, python-bidi, easyocr

Successfully installed PyWavelets-1.3.0 PyYAML-6.0 easyocr-1.4.2 imageio-2.19.2 networkx-2.8.2 opencv-python-headless-4.5.4.60 python-bidi-0.4.2 scikit-image-0.19.2 scipy-1.8.1 six-1.16.0 tifffile-2022.5.4


PyWavelets:是Python的小波分析库(小波变换)。

相关推荐

Excel新函数TEXTSPLIT太强大了,轻松搞定数据拆分!

我是【桃大喵学习记】,欢迎大家关注哟~,每天为你分享职场办公软件使用技巧干货!最近我把WPS软件升级到了版本号:12.1.0.15990的最新版本,最版本已经支持文本拆分函数TEXTSPLIT了,并...

Excel超强数据拆分函数TEXTSPLIT,从入门到精通!

我是【桃大喵学习记】,欢迎大家关注哟~,每天为你分享职场办公软件使用技巧干货!今天跟大家分享的是Excel超强数据拆分函数TEXTSPLIT,带你从入门到精通!TEXTSPLIT函数真是太强大了,轻松...

看完就会用的C++17特性总结(c++11常用新特性)

作者:taoklin,腾讯WXG后台开发一、简单特性1.namespace嵌套C++17使我们可以更加简洁使用命名空间:2.std::variant升级版的C语言Union在C++17之前,通...

plsql字符串分割浅谈(plsql字符集设置)

工作之中遇到的小问题,在此抛出问题,并给出解决方法。一方面是为了给自己留下深刻印象,另一方面给遇到相似问题的同学一个解决思路。如若其中有写的不好或者不对的地方也请不加不吝赐教,集思广益,共同进步。遇到...

javascript如何分割字符串(javascript切割字符串)

javascript如何分割字符串在JavaScript中,您可以使用字符串的`split()`方法来将一个字符串分割成一个数组。`split()`方法接收一个参数,这个参数指定了分割字符串的方式。如...

TextSplit函数的使用方法(入门+进阶+高级共八种用法10个公式)

在Excel和WPS新增的几十个函数中,如果按实用性+功能性排名,textsplit排第二,无函数敢排第一。因为它不仅使用简单,而且解决了以前用超复杂公式才能搞定的难题。今天小编用10个公式,让你彻底...

Python字符串split()方法使用技巧

在Python中,字符串操作可谓是基础且关键的技能,而今天咱们要重点攻克的“堡垒”——split()方法,它能将看似浑然一体的字符串,按照我们的需求进行拆分,极大地便利了数据处理与文本解析工作。基本语...

go语言中字符串常用的系统函数(golang 字符串)

最近由于工作比较忙,视频有段时间没有更新了,在这里跟大家说声抱歉了,我尽快抽些时间整理下视频今天就发一篇关于go语言的基础知识吧!我这我工作中用到的一些常用函数,汇总出来分享给大家,希望对...

无规律文本拆分,这些函数你得会(没有分隔符没规律数据拆分)

今天文章来源于表格学员训练营群内答疑,混合文本拆分。其实拆分不难,只要规则明确就好办。就怕规则不清晰,或者规则太多。那真是,Oh,mygod.如上图所示进行拆分,文字表达实在是有点难,所以小熊变身灵...

Python之文本解析:字符串格式化的逆操作?

引言前面的文章中,提到了关于Python中字符串中的相关操作,更多地涉及到了字符串的格式化,有些地方也称为字符串插值操作,本质上,就是把多个字符串拼接在一起,以固定的格式呈现。关于字符串的操作,其实还...

忘记【分列】吧,TEXTSPLIT拆分文本好用100倍

函数TEXTSPLIT的作用是:按分隔符将字符串拆分为行或列。仅ExcelM365版本可用。基本应用将A2单元格内容按逗号拆分。=TEXTSPLIT(A2,",")第二参数设置为逗号...

Excel365版本新函数TEXTSPLIT,专攻文本拆分

Excel中字符串的处理,拆分和合并是比较常见的需求。合并,当前最好用的函数非TEXTJOIN不可。拆分,Office365于2022年3月更新了一个专业函数:TEXTSPLIT语法参数:【...

站长在线Python精讲使用正则表达式的split()方法分割字符串详解

欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是《在Python中使用正则表达式的split()方法分割字符串详解》。使用正则表达式分割字符串在Python中使用正则表达式的split(...

Java中字符串分割的方法(java字符串切割方法)

技术背景在Java编程中,经常需要对字符串进行分割操作,例如将一个包含多个信息的字符串按照特定的分隔符拆分成多个子字符串。常见的应用场景包括解析CSV文件、处理网络请求参数等。实现步骤1.使用Str...

因为一个函数strtok踩坑,我被老工程师无情嘲笑了

在用C/C++实现字符串切割中,strtok函数经常用到,其主要作用是按照给定的字符集分隔字符串,并返回各子字符串。但是实际上,可不止有strtok(),还有strtok、strtok_s、strto...