百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python光学字符识别工具-EasyOCR安装与使用(Win10)

itomcoil 2025-02-06 15:17 32 浏览

EasyOCR是Python实现的一个光学字符识别(OCR)工具。

安装pytorch

PyTorch is an optimized tensor library for deep learning using GPUs and CPUs.( https://pytorch.org/docs/stable/index.html

PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。(
https://baike.baidu.com/item/PyTorch/24269838?fr=aladdin
)。

PyTorch官网: https://pytorch.org/

网页(
https://pytorch.org/get-started/locally/#windows-python
)详细介绍了PyTorch安装的前提条件、方法及相关的注意事项,截图如下:


比较有趣、有用且强大的功能是上图中的表,根据不同的选择可以生成相应的安装命令。我选的是Windows、Pip、Python、CPU(不适用CUDA),得到对应的安装命令是: pip3 install torch torchvision torchaudio

在Win10命令行窗口,执行上述命令(前提是已安装了Python及pip)。结果如下图所示:


顺便使用命令“ python.exe -m pip install --upgrade pip ”更新了pip。


使用网页(
https://pytorch.org/get-started/locally/#windows-python
)的“VERIFICATION”部分介绍的代码,进行安装正确性检验。

python

import torch

x = torch.rand(5, 3)

print(x)

执行结果如下图所示:


应该是安装成功了。

安装EasyOCR

网页
https://www.jaided.ai/easyocr/install/


介绍了EasyOCR的安装方法(该网页的Pre-install部分的第一句话的意思是“对于Windows,你可能需要手动安装pytorch”,是不是Python 3.10.4会自动下载安装,回头有时间可以试一下),使用pip安装的命令是: pip install easyocr

在win10命令行窗口执行上述命令的结果如下图所示(需要时间较长;若长时间无反应,可敲击回车键试试是否已完成安装):


由于内容较多,将其文字部分附在最后。

安装完成后,在目录“D:\Programs\Python\Python310\Scripts”中会增加若干exe文件。


使用EasyOCR识别图片中的文字

jaided网站上的例子

将网页“
https://www.jaided.ai/easyocr/tutorial/
”中的图片


下载保存为文件“d:\temp\chinese_tra.jpg”,在python中依次执行下列命令(代码):

import easyocr

reader = easyocr.Reader(['ch_tra', 'en'])

result = reader.readtext(r'd:\temp\chinese_tra.jpg')


当执行代码“reader = easyocr.Reader(['ch_tra', 'en'])”时,程序自动通过互联网下载了检测模型和识别模型。提示信息及翻译如下:

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.

(没有CUDA-缺省使用CPU。注意:这个模块在GPU上运行效率更高)

Downloading detection model, please wait. This may take several minutes depending upon your network connection.

(正在下载检测模型,请等待。花费时间取决于您的网络)

Downloading recognition model, please wait. This may take several minutes depending upon your network connection.

(正在下载识别模型,请等待。花费时间取决于您的网络)

没有找到CUDA是因为我在安装Pytorch时没有选择安装CUDA。

EasyOCR使用检测模型匹配图片中的文字,也就是找到图片中的文字;找到之后使用识别模型进行文字识别。

其中的'ch_tra'和'en'是语言标识,'ch_tra'表示古汉语,'en'表示英语。EasyOCR支持的语言在网页“
https://www.jaided.ai/easyocr/
”中列出。


下载的模型文件保存在“C:\Users\zhang\.EasyOCR\model”(其中zhang是用户名,随计算机用户的不同而不同)目录中,如下图所示:



代码“result = reader.readtext(r'd:\temp\chinese_tra.jpg')”的结果显示信息过于详细,可以使用“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0)”或“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0, paragraph=True)”代替,执行结果如下图所示:


执行结果与网页“
https://www.jaided.ai/easyocr/tutorial/
”中的一致。

车牌的识别(有识别错误)

文件名“D:\temp\chepai.png”,图片内容如下:


因为车牌中有简体中文、英文和数字,所以使用下列命令:

reader = easyocr.Reader(['ch_sim', 'en'])

result = reader.readtext(r'd:\temp\chepai.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


在执行代码“reader = easyocr.Reader(['ch_sim', 'en'])”时,下载了识别模型文件“zh_sim_g2.pth”保存在目录“C:\Users\zhang\.EasyOCR\model”中。

识别结果为“京0T4209”,而实际是“京Q TA209”。把Q错误地识别为0,把A错误地识别为4。也就是说,存在识别错误。而且,没有识别出路面上的汉字

这里测试了一下,好像EasyOCR不能处理文件名(路径)中的中文

公益广告牌中文字识别(有识别错误)

文件名“D:\temp\pingdeng.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\pingdeng.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:公益广告 平等 众尘乎等 月尊月强

真实文字为:公益广告 平等 众生平

把“生平”误认作“尘乎”,“自”误认作“月”。也是存在一定的识别错误

扫描电子书图片中的文字识别(正确率较高)

文件名“D:\temp\shu.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\shu.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:排除型字符组是表示所有未列出字符的字符组的简便方

真实文字为:排除型字符组是表示所有未列出字符的字符组的简便方法

识别25个字,有一个错误。


小结

介绍了EasyOCR的安装,并用其识别了一些图片中的文字。结果显示,EasyOCR具备从图片中检测并识别文字的功能,但存在一定的识别错误率。

相关参考网页

http://www.360doc.com/content/22/0125/16/64728681_1014850914.shtml


https://gitee.com/mirrors/EasyOCR/
( Gitee 极速下载 / EasyOCR)

https://baijiahao.baidu.com/s?id=1729428712024244812&wfr=spider&for=pc


https://blog.csdn.net/family5love/article/details/89362943
(pip3的用法)

https://www.jaided.ai/easyocr/


https://www.jaided.ai/easyocr/install/
介绍如何安装EasyOCR的网页


pip install easyocr 命令执行的结果

Downloading easyocr-1.4.2-py3-none-any.whl (70.8 MB)

---------------------------------------- 70.8/70.8 MB 3.2 MB/s eta 0:00:00

Requirement already satisfied: torchvision>=0.5 in d:\programs\python\python310\lib\site-packages (from easyocr) (0.12.0)

Requirement already satisfied: numpy in d:\programs\python\python310\lib\site-packages (from easyocr) (1.22.4)

Collecting scipy

Downloading scipy-1.8.1-cp310-cp310-win_amd64.whl (36.9 MB)

---------------------------------------- 36.9/36.9 MB 3.7 MB/s eta 0:00:00

Collecting opencv-python-headless<=4.5.4.60

Downloading opencv_python_headless-4.5.4.60-cp310-cp310-win_amd64.whl (35.0 MB)

---------------------------------------- 35.0/35.0 MB 3.3 MB/s eta 0:00:00

Requirement already satisfied: torch in d:\programs\python\python310\lib\site-packages (from easyocr) (1.11.0)

Collecting PyYAML

Downloading PyYAML-6.0-cp310-cp310-win_amd64.whl (151 kB)

---------------------------------------- 151.7/151.7 kB 2.2 MB/s eta 0:00:00

Collecting python-bidi

Downloading python_bidi-0.4.2-py2.py3-none-any.whl (30 kB)

Requirement already satisfied: Pillow in d:\programs\python\python310\lib\site-packages (from easyocr) (9.1.1)

Collecting scikit-image

Downloading scikit_image-0.19.2-cp310-cp310-win_amd64.whl (12.6 MB)

---------------------------------------- 12.6/12.6 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: typing-extensions in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (4.2.0)

Requirement already satisfied: requests in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (2.27.1)

Collecting six

Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)

Collecting imageio>=2.4.1

Downloading imageio-2.19.2-py3-none-any.whl (3.4 MB)

---------------------------------------- 3.4/3.4 MB 4.4 MB/s eta 0:00:00

Collecting PyWavelets>=1.1.1

Downloading PyWavelets-1.3.0-cp310-cp310-win_amd64.whl (4.2 MB)

---------------------------------------- 4.2/4.2 MB 4.0 MB/s eta 0:00:00

Collecting tifffile>=2019.7.26

Downloading tifffile-2022.5.4-py3-none-any.whl (195 kB)

---------------------------------------- 195.6/195.6 kB 3.9 MB/s eta 0:00:00

Requirement already satisfied: packaging>=20.0 in d:\programs\python\python310\lib\site-packages (from scikit-image->easyocr) (21.3)

Collecting networkx>=2.2

Downloading networkx-2.8.2-py3-none-any.whl (2.0 MB)

---------------------------------------- 2.0/2.0 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in d:\programs\python\python310\lib\site-packages (from packaging>=20.0->scikit-image->easyocr) (3.0.9)

Requirement already satisfied: certifi>=2017.4.17 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2022.5.18.1)

Requirement already satisfied: urllib3<1.27,>=1.21.1 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (1.26.9)

Requirement already satisfied: charset-normalizer~=2.0.0 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2.0.12)

Requirement already satisfied: idna<4,>=2.5 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (3.3)

Installing collected packages: tifffile, six, scipy, PyYAML, PyWavelets, opencv-python-headless, networkx, imageio, scikit-image, python-bidi, easyocr

Successfully installed PyWavelets-1.3.0 PyYAML-6.0 easyocr-1.4.2 imageio-2.19.2 networkx-2.8.2 opencv-python-headless-4.5.4.60 python-bidi-0.4.2 scikit-image-0.19.2 scipy-1.8.1 six-1.16.0 tifffile-2022.5.4


PyWavelets:是Python的小波分析库(小波变换)。

相关推荐

MySQL修改密码_mysql怎么改密码忘了怎么办

拥有原来的用户名账户的密码mysqladmin-uroot-ppassword"test123"Enterpassword:【输入原来的密码】忘记原来root密码第一...

数据库密码配置项都不加密?心也太大了吧!

先看一份典型的配置文件...省略...##配置MySQL数据库连接spring.datasource.driver-class-name=com.mysql.jdbc.Driverspr...

Linux基础知识_linux基础入门知识

系统目录结构/bin:命令和应用程序。/boot:这里存放的是启动Linux时使用的一些核心文件,包括一些连接文件以及镜像文件。/dev:dev是Device(设备)的缩写,该目录...

MySQL密码重置_mysql密码重置教程

之前由于修改MySQL加密模式为mysql_native_password时操作失误,导致无法登陆MySQL数据库,后来摸索了一下,对MySQL数据库密码进行重置后顺利解决,步骤如下:1.先停止MyS...

Mysql8忘记密码/重置密码_mysql密码忘了怎么办?

Mysql8忘记密码/重置密码UBUNTU下Mysql8忘记密码/重置密码步骤如下:先说下大概步骤:修改配置文件,使得用空密码可以进入mysql。然后置当前root用户为空密码。再次修改配置文件,不能...

MySQL忘记密码怎么办?Windows环境下MySQL密码重置图文教程

有不少小白在使用Windows进行搭建主机的时候,安装了一些环境后,其中有MySQL设置后,然后不少马大哈忘记了MySQL的密码,导致在一些程序安装及配置的时候无法进行。这个时候怎么办呢?重置密码呗?...

10种常见的MySQL错误,你可中招?_mysql常见错误提示及解决方法

【51CTO.com快译】如果未能对MySQL8进行恰当的配置,您非但可能遇到无法顺利访问、或调用MySQL的窘境,而且还可能给真实的应用生产环境带来巨大的影响。本文列举了十种MySQL...

Mysql解压版安装过程_mysql解压版安装步骤

Mysql是目前软件开发中使用最多的关系型数据库,具体安装步骤如下:第一步:Mysql官网下载最新版(mysql解压版(mysql-5.7.17-winx64)),Mysql官方下载地址为:https...

MySQL Root密码重置指南:Windows新手友好教程

如果你忘记了MySQLroot密码,请按照以下简单步骤进行重置。你需要准备的工具:已安装的MySQL以管理员身份访问命令提示符一点复制粘贴的能力分步操作指南1.创建密码重置文件以管理员...

安卓手机基于python3搜索引擎_python调用安卓so库

环境:安卓手机手机品牌:vivox9s4G运行内存手机软件:utermux环境安装:1.java环境的安装2.redis环境的安装aptinstallredis3.elasticsearch环...

Python 包管理 3 - poetry_python community包

Poetry是一款现代化的Python依赖管理和打包工具。它通过一个pyproject.toml文件来统一管理你的项目依赖、配置和元数据,并用一个poetry.lock文件来锁定所有依赖的精...

Python web在线服务生产环境真实部署方案,可直接用

各位志同道合的朋友大家好,我是一个一直在一线互联网踩坑十余年的编码爱好者,现在将我们的各种经验以及架构实战分享出来,如果大家喜欢,就关注我,一起将技术学深学透,我会每一篇分享结束都会预告下一专题最近经...

官方玩梗:Python 3.14(πthon)稳定版发布,正式支持自由线程

IT之家10月7日消息,当地时间10月7日,Python软件基金会宣布Python3.14.0正式发布,也就是用户期待已久的圆周率(约3.14)版本,再加上谐音梗可戏称为π...

第一篇:如何使用 uv 创建 Python 虚拟环境

想象一下,你有一个使用Python3.10的后端应用程序,系统全局安装了a2.1、b2.2和c2.3这些包。一切运行正常,直到你开始一个新项目,它也使用Python3.10,但需要...

我用 Python 写了个自动整理下载目录的工具

经常用电脑的一定会遇到这种情况:每天我们都在从浏览器、微信、钉钉里下各种文件,什么截图、合同、安装包、临时文档,全都堆在下载文件夹里。起初还想着“过两天再整理”,结果一放就是好几年。结果某天想找一个发...