百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python影像识别预处理技术详解

itomcoil 2025-04-27 14:17 5 浏览

在Python中进行影像识别预处理时,通常需要以下关键步骤和技巧,以下是一个结构化的解决方案:


一、基础预处理步骤

1. 图像读取与格式转换

python

import cv2

from PIL import Image


# OpenCV读取 (BGR格式)

img_cv = cv2.imread("image.jpg")


# PIL读取 (RGB格式)

img_pil = Image.open("image.jpg")

2. 尺寸标准化

python

# 使用OpenCV调整

resized_cv = cv2.resize(img_cv, (224, 224))


# 使用PIL调整

resized_pil = img_pil.resize((224, 224))

3. 颜色空间转换

python

# BGR转RGB (OpenCV特有)

rgb_img = cv2.cvtColor(img_cv, cv2.COLOR_BGR2RGB)


# 转灰度图

gray_img = cv2.cvtColor(img_cv, cv2.COLOR_BGR2GRAY)


二、高级预处理技术

1. 数据归一化

python

# 归一化到 [0,1]

normalized = img_cv.astype('float32') / 255.0


# 标准化到均值为0 (适用于预训练模型)

mean = [0.485, 0.456, 0.406]

std = [0.229, 0.224, 0.225]

normalized = (img_cv/255 - mean) / std

2. 数据增强

使用albumentations库实现实时增强:

python

import albumentations as A


transform = A.Compose([

A.HorizontalFlip(p=0.5),

A.RandomBrightnessContrast(p=0.2),

A.Rotate(limit=30),

A.GaussianBlur(),

])

augmented = transform(image=img)["image"]

3. 降噪处理

python

# 中值滤波

denoised = cv2.medianBlur(img_cv, 5)


# 高斯滤波

blurred = cv2.GaussianBlur(img_cv, (5,5), 0)


三、深度学习专用处理

1. 张量转换

python

import torch

from torchvision import transforms


transform = transforms.Compose([

transforms.Resize(256),

transforms.CenterCrop(224),

transforms.ToTensor(),

transforms.Normalize(mean=[0.485, 0.456, 0.406],

std=[0.229, 0.224, 0.225])

])


tensor_img = transform(img_pil)

2. 批处理生成器

python

from tensorflow.keras.preprocessing.image import ImageDataGenerator


datagen = ImageDataGenerator(

rotation_range=20,

width_shift_range=0.2,

horizontal_flip=True)


generator = datagen.flow_from_directory(

'data/',

target_size=(224, 224),

batch_size=32)


四、特殊场景处理

1. 背景去除

python

# 使用rembg库

from rembg import remove

output = remove(img_pil)

2. 边缘检测

python

复制

edges = cv2.Canny(gray_img, 100, 200)

3. 直方图均衡化

python

# CLAHE对比度受限自适应直方图均衡

clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8))

enhanced = clahe.apply(gray_img)


五、最佳实践建议

  1. 通道顺序一致性:注意OpenCV(BGR)与PIL/TensorFlow(RGB)的差异
  2. 内存优化:使用生成器处理大尺寸数据集
  3. 处理流水线:建立可复用的预处理管道
  4. 可视化验证:在每个处理阶段后抽样检查结果

python

import matplotlib.pyplot as plt

plt.imshow(augmented)

plt.show()


六、完整预处理示例

python

def preprocess_image(file_path):

# 读取图像

img = cv2.imread(file_path)


# 格式转换

img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 降噪处理

img = cv2.fastNlMeansDenoisingColored(img, None, 10, 10, 7, 21)


# 尺寸调整

img = cv2.resize(img, (224, 224))


# 数据增强

transform = A.RandomRotate90(p=0.5)

img = transform(image=img)["image"]


# 归一化

img = img.astype('float32') / 255.0


# 转换为张量

return torch.from_numpy(img).permute(2, 0, 1)


通过以上步骤的组合,可以构建适应不同任务的影像预处理流程。具体参数需要根据实际数据集特点和模型需求进行调整,建议始终保留原始数据备份以便进行不同预处理方案的对比实验。

相关推荐

Excel新函数TEXTSPLIT太强大了,轻松搞定数据拆分!

我是【桃大喵学习记】,欢迎大家关注哟~,每天为你分享职场办公软件使用技巧干货!最近我把WPS软件升级到了版本号:12.1.0.15990的最新版本,最版本已经支持文本拆分函数TEXTSPLIT了,并...

Excel超强数据拆分函数TEXTSPLIT,从入门到精通!

我是【桃大喵学习记】,欢迎大家关注哟~,每天为你分享职场办公软件使用技巧干货!今天跟大家分享的是Excel超强数据拆分函数TEXTSPLIT,带你从入门到精通!TEXTSPLIT函数真是太强大了,轻松...

看完就会用的C++17特性总结(c++11常用新特性)

作者:taoklin,腾讯WXG后台开发一、简单特性1.namespace嵌套C++17使我们可以更加简洁使用命名空间:2.std::variant升级版的C语言Union在C++17之前,通...

plsql字符串分割浅谈(plsql字符集设置)

工作之中遇到的小问题,在此抛出问题,并给出解决方法。一方面是为了给自己留下深刻印象,另一方面给遇到相似问题的同学一个解决思路。如若其中有写的不好或者不对的地方也请不加不吝赐教,集思广益,共同进步。遇到...

javascript如何分割字符串(javascript切割字符串)

javascript如何分割字符串在JavaScript中,您可以使用字符串的`split()`方法来将一个字符串分割成一个数组。`split()`方法接收一个参数,这个参数指定了分割字符串的方式。如...

TextSplit函数的使用方法(入门+进阶+高级共八种用法10个公式)

在Excel和WPS新增的几十个函数中,如果按实用性+功能性排名,textsplit排第二,无函数敢排第一。因为它不仅使用简单,而且解决了以前用超复杂公式才能搞定的难题。今天小编用10个公式,让你彻底...

Python字符串split()方法使用技巧

在Python中,字符串操作可谓是基础且关键的技能,而今天咱们要重点攻克的“堡垒”——split()方法,它能将看似浑然一体的字符串,按照我们的需求进行拆分,极大地便利了数据处理与文本解析工作。基本语...

go语言中字符串常用的系统函数(golang 字符串)

最近由于工作比较忙,视频有段时间没有更新了,在这里跟大家说声抱歉了,我尽快抽些时间整理下视频今天就发一篇关于go语言的基础知识吧!我这我工作中用到的一些常用函数,汇总出来分享给大家,希望对...

无规律文本拆分,这些函数你得会(没有分隔符没规律数据拆分)

今天文章来源于表格学员训练营群内答疑,混合文本拆分。其实拆分不难,只要规则明确就好办。就怕规则不清晰,或者规则太多。那真是,Oh,mygod.如上图所示进行拆分,文字表达实在是有点难,所以小熊变身灵...

Python之文本解析:字符串格式化的逆操作?

引言前面的文章中,提到了关于Python中字符串中的相关操作,更多地涉及到了字符串的格式化,有些地方也称为字符串插值操作,本质上,就是把多个字符串拼接在一起,以固定的格式呈现。关于字符串的操作,其实还...

忘记【分列】吧,TEXTSPLIT拆分文本好用100倍

函数TEXTSPLIT的作用是:按分隔符将字符串拆分为行或列。仅ExcelM365版本可用。基本应用将A2单元格内容按逗号拆分。=TEXTSPLIT(A2,",")第二参数设置为逗号...

Excel365版本新函数TEXTSPLIT,专攻文本拆分

Excel中字符串的处理,拆分和合并是比较常见的需求。合并,当前最好用的函数非TEXTJOIN不可。拆分,Office365于2022年3月更新了一个专业函数:TEXTSPLIT语法参数:【...

站长在线Python精讲使用正则表达式的split()方法分割字符串详解

欢迎你来到站长在线的站长学堂学习Python知识,本文学习的是《在Python中使用正则表达式的split()方法分割字符串详解》。使用正则表达式分割字符串在Python中使用正则表达式的split(...

Java中字符串分割的方法(java字符串切割方法)

技术背景在Java编程中,经常需要对字符串进行分割操作,例如将一个包含多个信息的字符串按照特定的分隔符拆分成多个子字符串。常见的应用场景包括解析CSV文件、处理网络请求参数等。实现步骤1.使用Str...

因为一个函数strtok踩坑,我被老工程师无情嘲笑了

在用C/C++实现字符串切割中,strtok函数经常用到,其主要作用是按照给定的字符集分隔字符串,并返回各子字符串。但是实际上,可不止有strtok(),还有strtok、strtok_s、strto...