百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python光学字符识别工具-EasyOCR安装与使用(Win10)

itomcoil 2025-02-06 15:17 16 浏览

EasyOCR是Python实现的一个光学字符识别(OCR)工具。

安装pytorch

PyTorch is an optimized tensor library for deep learning using GPUs and CPUs.( https://pytorch.org/docs/stable/index.html

PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。(
https://baike.baidu.com/item/PyTorch/24269838?fr=aladdin
)。

PyTorch官网: https://pytorch.org/

网页(
https://pytorch.org/get-started/locally/#windows-python
)详细介绍了PyTorch安装的前提条件、方法及相关的注意事项,截图如下:


比较有趣、有用且强大的功能是上图中的表,根据不同的选择可以生成相应的安装命令。我选的是Windows、Pip、Python、CPU(不适用CUDA),得到对应的安装命令是: pip3 install torch torchvision torchaudio

在Win10命令行窗口,执行上述命令(前提是已安装了Python及pip)。结果如下图所示:


顺便使用命令“ python.exe -m pip install --upgrade pip ”更新了pip。


使用网页(
https://pytorch.org/get-started/locally/#windows-python
)的“VERIFICATION”部分介绍的代码,进行安装正确性检验。

python

import torch

x = torch.rand(5, 3)

print(x)

执行结果如下图所示:


应该是安装成功了。

安装EasyOCR

网页
https://www.jaided.ai/easyocr/install/


介绍了EasyOCR的安装方法(该网页的Pre-install部分的第一句话的意思是“对于Windows,你可能需要手动安装pytorch”,是不是Python 3.10.4会自动下载安装,回头有时间可以试一下),使用pip安装的命令是: pip install easyocr

在win10命令行窗口执行上述命令的结果如下图所示(需要时间较长;若长时间无反应,可敲击回车键试试是否已完成安装):


由于内容较多,将其文字部分附在最后。

安装完成后,在目录“D:\Programs\Python\Python310\Scripts”中会增加若干exe文件。


使用EasyOCR识别图片中的文字

jaided网站上的例子

将网页“
https://www.jaided.ai/easyocr/tutorial/
”中的图片


下载保存为文件“d:\temp\chinese_tra.jpg”,在python中依次执行下列命令(代码):

import easyocr

reader = easyocr.Reader(['ch_tra', 'en'])

result = reader.readtext(r'd:\temp\chinese_tra.jpg')


当执行代码“reader = easyocr.Reader(['ch_tra', 'en'])”时,程序自动通过互联网下载了检测模型和识别模型。提示信息及翻译如下:

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.

(没有CUDA-缺省使用CPU。注意:这个模块在GPU上运行效率更高)

Downloading detection model, please wait. This may take several minutes depending upon your network connection.

(正在下载检测模型,请等待。花费时间取决于您的网络)

Downloading recognition model, please wait. This may take several minutes depending upon your network connection.

(正在下载识别模型,请等待。花费时间取决于您的网络)

没有找到CUDA是因为我在安装Pytorch时没有选择安装CUDA。

EasyOCR使用检测模型匹配图片中的文字,也就是找到图片中的文字;找到之后使用识别模型进行文字识别。

其中的'ch_tra'和'en'是语言标识,'ch_tra'表示古汉语,'en'表示英语。EasyOCR支持的语言在网页“
https://www.jaided.ai/easyocr/
”中列出。


下载的模型文件保存在“C:\Users\zhang\.EasyOCR\model”(其中zhang是用户名,随计算机用户的不同而不同)目录中,如下图所示:



代码“result = reader.readtext(r'd:\temp\chinese_tra.jpg')”的结果显示信息过于详细,可以使用“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0)”或“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0, paragraph=True)”代替,执行结果如下图所示:


执行结果与网页“
https://www.jaided.ai/easyocr/tutorial/
”中的一致。

车牌的识别(有识别错误)

文件名“D:\temp\chepai.png”,图片内容如下:


因为车牌中有简体中文、英文和数字,所以使用下列命令:

reader = easyocr.Reader(['ch_sim', 'en'])

result = reader.readtext(r'd:\temp\chepai.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


在执行代码“reader = easyocr.Reader(['ch_sim', 'en'])”时,下载了识别模型文件“zh_sim_g2.pth”保存在目录“C:\Users\zhang\.EasyOCR\model”中。

识别结果为“京0T4209”,而实际是“京Q TA209”。把Q错误地识别为0,把A错误地识别为4。也就是说,存在识别错误。而且,没有识别出路面上的汉字

这里测试了一下,好像EasyOCR不能处理文件名(路径)中的中文

公益广告牌中文字识别(有识别错误)

文件名“D:\temp\pingdeng.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\pingdeng.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:公益广告 平等 众尘乎等 月尊月强

真实文字为:公益广告 平等 众生平

把“生平”误认作“尘乎”,“自”误认作“月”。也是存在一定的识别错误

扫描电子书图片中的文字识别(正确率较高)

文件名“D:\temp\shu.png”,图片内容如下:


只有汉字,使用如下命令:

reader = easyocr.Reader(['ch_sim'])

result = reader.readtext(r'd:\temp\shu.png', detail = 0, paragraph=True)

result

执行结果如下图所示:


识别结果为:排除型字符组是表示所有未列出字符的字符组的简便方

真实文字为:排除型字符组是表示所有未列出字符的字符组的简便方法

识别25个字,有一个错误。


小结

介绍了EasyOCR的安装,并用其识别了一些图片中的文字。结果显示,EasyOCR具备从图片中检测并识别文字的功能,但存在一定的识别错误率。

相关参考网页

http://www.360doc.com/content/22/0125/16/64728681_1014850914.shtml


https://gitee.com/mirrors/EasyOCR/
( Gitee 极速下载 / EasyOCR)

https://baijiahao.baidu.com/s?id=1729428712024244812&wfr=spider&for=pc


https://blog.csdn.net/family5love/article/details/89362943
(pip3的用法)

https://www.jaided.ai/easyocr/


https://www.jaided.ai/easyocr/install/
介绍如何安装EasyOCR的网页


pip install easyocr 命令执行的结果

Downloading easyocr-1.4.2-py3-none-any.whl (70.8 MB)

---------------------------------------- 70.8/70.8 MB 3.2 MB/s eta 0:00:00

Requirement already satisfied: torchvision>=0.5 in d:\programs\python\python310\lib\site-packages (from easyocr) (0.12.0)

Requirement already satisfied: numpy in d:\programs\python\python310\lib\site-packages (from easyocr) (1.22.4)

Collecting scipy

Downloading scipy-1.8.1-cp310-cp310-win_amd64.whl (36.9 MB)

---------------------------------------- 36.9/36.9 MB 3.7 MB/s eta 0:00:00

Collecting opencv-python-headless<=4.5.4.60

Downloading opencv_python_headless-4.5.4.60-cp310-cp310-win_amd64.whl (35.0 MB)

---------------------------------------- 35.0/35.0 MB 3.3 MB/s eta 0:00:00

Requirement already satisfied: torch in d:\programs\python\python310\lib\site-packages (from easyocr) (1.11.0)

Collecting PyYAML

Downloading PyYAML-6.0-cp310-cp310-win_amd64.whl (151 kB)

---------------------------------------- 151.7/151.7 kB 2.2 MB/s eta 0:00:00

Collecting python-bidi

Downloading python_bidi-0.4.2-py2.py3-none-any.whl (30 kB)

Requirement already satisfied: Pillow in d:\programs\python\python310\lib\site-packages (from easyocr) (9.1.1)

Collecting scikit-image

Downloading scikit_image-0.19.2-cp310-cp310-win_amd64.whl (12.6 MB)

---------------------------------------- 12.6/12.6 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: typing-extensions in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (4.2.0)

Requirement already satisfied: requests in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (2.27.1)

Collecting six

Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)

Collecting imageio>=2.4.1

Downloading imageio-2.19.2-py3-none-any.whl (3.4 MB)

---------------------------------------- 3.4/3.4 MB 4.4 MB/s eta 0:00:00

Collecting PyWavelets>=1.1.1

Downloading PyWavelets-1.3.0-cp310-cp310-win_amd64.whl (4.2 MB)

---------------------------------------- 4.2/4.2 MB 4.0 MB/s eta 0:00:00

Collecting tifffile>=2019.7.26

Downloading tifffile-2022.5.4-py3-none-any.whl (195 kB)

---------------------------------------- 195.6/195.6 kB 3.9 MB/s eta 0:00:00

Requirement already satisfied: packaging>=20.0 in d:\programs\python\python310\lib\site-packages (from scikit-image->easyocr) (21.3)

Collecting networkx>=2.2

Downloading networkx-2.8.2-py3-none-any.whl (2.0 MB)

---------------------------------------- 2.0/2.0 MB 3.9 MB/s eta 0:00:00

Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in d:\programs\python\python310\lib\site-packages (from packaging>=20.0->scikit-image->easyocr) (3.0.9)

Requirement already satisfied: certifi>=2017.4.17 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2022.5.18.1)

Requirement already satisfied: urllib3<1.27,>=1.21.1 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (1.26.9)

Requirement already satisfied: charset-normalizer~=2.0.0 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2.0.12)

Requirement already satisfied: idna<4,>=2.5 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (3.3)

Installing collected packages: tifffile, six, scipy, PyYAML, PyWavelets, opencv-python-headless, networkx, imageio, scikit-image, python-bidi, easyocr

Successfully installed PyWavelets-1.3.0 PyYAML-6.0 easyocr-1.4.2 imageio-2.19.2 networkx-2.8.2 opencv-python-headless-4.5.4.60 python-bidi-0.4.2 scikit-image-0.19.2 scipy-1.8.1 six-1.16.0 tifffile-2022.5.4


PyWavelets:是Python的小波分析库(小波变换)。

相关推荐

Python Qt GUI设计:将UI文件转换Python文件三种妙招(基础篇—2)

在开始本文之前提醒各位朋友,Python记得安装PyQt5库文件,Python语言功能很强,但是Python自带的GUI开发库Tkinter功能很弱,难以开发出专业的GUI。好在Python语言的开放...

Connect 2.0来了,还有Nuke和Maya新集成

ftrackConnect2.0现在可以下载了--重新设计的桌面应用程序,使用户能够将ftrackStudio与创意应用程序集成,发布资产等。这个新版本的发布中还有两个Nuke和Maya新集成,...

Magicgui:不会GUI编程也能轻松构建Python GUI应用

什么是MagicguiMagicgui是一个Python库,它允许开发者仅凭简单的类型注解就能快速构建图形用户界面(GUI)应用程序。这个库基于Napari项目,利用了Python的强大类型系统,使得...

Python入坑系列:桌面GUI开发之Pyside6

阅读本章之后,你可以掌握这些内容:Pyside6的SignalsandSlots、Envents的作用,如何使用?PySide6的Window、DialogsandAlerts、Widgets...

Python入坑系列-一起认识Pyside6 designer可拖拽桌面GUI

通过本文章,你可以了解一下内容:如何安装和使用Pyside6designerdesigner有哪些的特性通过designer如何转成python代码以前以为Pyside6designer需要在下载...

pyside2的基础界面(pyside2显示图片)

今天我们来学习pyside2的基础界面没有安装过pyside2的小伙伴可以看主页代码效果...

Python GUI开发:打包PySide2应用(python 打包pyc)

之前的文章我们介绍了怎么使用PySide2来开发一个简单PythonGUI应用。这次我们来将上次完成的代码打包。我们使用pyinstaller。注意,pyinstaller默认会将所有安装的pack...

使用PySide2做窗体,到底是怎么个事?看这个能不能搞懂

PySide2是Qt框架的Python绑定,允许你使用Python创建功能强大的跨平台GUI应用程序。PySide2的基本使用方法:安装PySide2pipinstallPy...

pycharm中conda解释器无法配置(pycharm安装的解释器不能用)

之前用的好好的pycharm正常配置解释器突然不能用了?可以显示有这个环境然后确认后可以conda正在配置解释器,但是进度条结束后还是不成功!!试过了pycharm重启,pycharm重装,anaco...

Conda使用指南:从基础操作到Llama-Factory大模型微调环境搭建

Conda虚拟环境在Linux下的全面使用指南:从基础操作到Llama-Factory大模型微调环境搭建在当今的AI开发与数据分析领域,conda虚拟环境已成为Linux系统下管理项目依赖的标配工具。...

Python操作系统资源管理与监控(python调用资源管理器)

在现代计算环境中,对操作系统资源的有效管理和监控是确保应用程序性能和系统稳定性的关键。Python凭借其丰富的标准库和第三方扩展,提供了强大的工具来实现这一目标。本文将探讨Python在操作系统资源管...

本地部署开源版Manus+DeepSeek创建自己的AI智能体

1、下载安装Anaconda,设置conda环境变量,并使用conda创建python3.12虚拟环境。2、从OpenManus仓库下载代码,并安装需要的依赖。3、使用Ollama加载本地DeepSe...

一文教会你,搭建AI模型训练与微调环境,包学会的!

一、硬件要求显卡配置:需要Nvidia显卡,至少配备8G显存,且专用显存与共享显存之和需大于20G。二、环境搭建步骤1.设置文件存储路径非系统盘存储:建议将非安装版的环境文件均存放在非系统盘(如E盘...

使用scikit-learn为PyTorch 模型进行超参数网格搜索

scikit-learn是Python中最好的机器学习库,而PyTorch又为我们构建模型提供了方便的操作,能否将它们的优点整合起来呢?在本文中,我们将介绍如何使用scikit-learn中的网格搜...

如何Keras自动编码器给极端罕见事件分类

全文共7940字,预计学习时长30分钟或更长本文将以一家造纸厂的生产为例,介绍如何使用自动编码器构建罕见事件分类器。现实生活中罕见事件的数据集:背景1.什么是极端罕见事件?在罕见事件问题中,数据集是...