百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Python影像识别预处理技术详解

itomcoil 2025-04-27 14:17 11 浏览

在Python中进行影像识别预处理时,通常需要以下关键步骤和技巧,以下是一个结构化的解决方案:


一、基础预处理步骤

1. 图像读取与格式转换

python

import cv2

from PIL import Image


# OpenCV读取 (BGR格式)

img_cv = cv2.imread("image.jpg")


# PIL读取 (RGB格式)

img_pil = Image.open("image.jpg")

2. 尺寸标准化

python

# 使用OpenCV调整

resized_cv = cv2.resize(img_cv, (224, 224))


# 使用PIL调整

resized_pil = img_pil.resize((224, 224))

3. 颜色空间转换

python

# BGR转RGB (OpenCV特有)

rgb_img = cv2.cvtColor(img_cv, cv2.COLOR_BGR2RGB)


# 转灰度图

gray_img = cv2.cvtColor(img_cv, cv2.COLOR_BGR2GRAY)


二、高级预处理技术

1. 数据归一化

python

# 归一化到 [0,1]

normalized = img_cv.astype('float32') / 255.0


# 标准化到均值为0 (适用于预训练模型)

mean = [0.485, 0.456, 0.406]

std = [0.229, 0.224, 0.225]

normalized = (img_cv/255 - mean) / std

2. 数据增强

使用albumentations库实现实时增强:

python

import albumentations as A


transform = A.Compose([

A.HorizontalFlip(p=0.5),

A.RandomBrightnessContrast(p=0.2),

A.Rotate(limit=30),

A.GaussianBlur(),

])

augmented = transform(image=img)["image"]

3. 降噪处理

python

# 中值滤波

denoised = cv2.medianBlur(img_cv, 5)


# 高斯滤波

blurred = cv2.GaussianBlur(img_cv, (5,5), 0)


三、深度学习专用处理

1. 张量转换

python

import torch

from torchvision import transforms


transform = transforms.Compose([

transforms.Resize(256),

transforms.CenterCrop(224),

transforms.ToTensor(),

transforms.Normalize(mean=[0.485, 0.456, 0.406],

std=[0.229, 0.224, 0.225])

])


tensor_img = transform(img_pil)

2. 批处理生成器

python

from tensorflow.keras.preprocessing.image import ImageDataGenerator


datagen = ImageDataGenerator(

rotation_range=20,

width_shift_range=0.2,

horizontal_flip=True)


generator = datagen.flow_from_directory(

'data/',

target_size=(224, 224),

batch_size=32)


四、特殊场景处理

1. 背景去除

python

# 使用rembg库

from rembg import remove

output = remove(img_pil)

2. 边缘检测

python

复制

edges = cv2.Canny(gray_img, 100, 200)

3. 直方图均衡化

python

# CLAHE对比度受限自适应直方图均衡

clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8))

enhanced = clahe.apply(gray_img)


五、最佳实践建议

  1. 通道顺序一致性:注意OpenCV(BGR)与PIL/TensorFlow(RGB)的差异
  2. 内存优化:使用生成器处理大尺寸数据集
  3. 处理流水线:建立可复用的预处理管道
  4. 可视化验证:在每个处理阶段后抽样检查结果

python

import matplotlib.pyplot as plt

plt.imshow(augmented)

plt.show()


六、完整预处理示例

python

def preprocess_image(file_path):

# 读取图像

img = cv2.imread(file_path)


# 格式转换

img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 降噪处理

img = cv2.fastNlMeansDenoisingColored(img, None, 10, 10, 7, 21)


# 尺寸调整

img = cv2.resize(img, (224, 224))


# 数据增强

transform = A.RandomRotate90(p=0.5)

img = transform(image=img)["image"]


# 归一化

img = img.astype('float32') / 255.0


# 转换为张量

return torch.from_numpy(img).permute(2, 0, 1)


通过以上步骤的组合,可以构建适应不同任务的影像预处理流程。具体参数需要根据实际数据集特点和模型需求进行调整,建议始终保留原始数据备份以便进行不同预处理方案的对比实验。

相关推荐

Python 类型注解的进阶应用:从静态检查到元编程

阅读文章前辛苦您点下“关注”,方便讨论和分享,为了回馈您的支持,我将每日更新优质内容。如需转载请附上本文源链接!近年来,Python类型注解(TypeHinting)逐渐从一个可选的功能演变为大型...

高阶Python|返回类型提示技巧 (1)

引言Python提供了一种可选的特性——类型提示,它有助于提高代码的可读性、可推理性和可调试性。通过类型提示,开发者能够清楚地了解变量、函数参数和返回值应具备的数据类型。在开发那些需要高度灵活性的应用...

跟我一起学Python-函数的定义(基础)

一.函数的定义和调用1.语法:def函数名():函数封装的代码函数最好能够表达函数内部封装的代码功能,方便后续的调用,函数命名需要遵循规则字母、数字、下划线、不能以数字开头,不能使用系统关键字。&#...

Python函数参数和返回值类型:让你的代码更清晰、更健壮

在Python开发中,你是否遇到过这些抓狂时刻?同事写的函数参数类型全靠猜调试两小时发现传了字符串给数值计算函数重构代码时不知道函数返回的是列表还是字典今天教你两招,彻底解决类型混乱问题!让你的...

python入门到脱坑 函数—参数(python 参数处理)

本文包括必须参数,关键参数,默认参数以及可变参数Python函数参数详解一、位置参数(必需参数)位置参数是函数调用时必须提供的参数,且顺序必须与定义时一致。基本用法defgreet(name,me...

python入门到脱坑经典案例—求两个数的和

下面为大家讲解如何求两个数之和——这是编程中最基础但最重要的算术运算之一。我们会从最简单的情况逐步深入,并穿插相关编程概念。1.最基础版本#定义两个变量num1=5num2=3#...

新手必看!30 个 Python 核心函数详解,手把手教你玩转编程

Python中30个核心函数及其含义、代码示例、注释和应用场景:print():用于输出文本或变量的值到控制台。message="Hello,World!"#定义一个...

Python快速入门教程1:基本语法、数据类型、运算符、数字字符串

Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、运算符、数字和字符串等内容,并附有使用实例场景。Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、...

编程小白学做题:Python 的经典编程题及详解,附代码和注释(八)

适合Python3+的6道编程练习题(附详解)1找出字典中值最小的键题目描述:找出字典中值最小的键(如{"a":5,"b":2,"c...

新手学Python避坑,学习效率狂飙! 二十一、print()函数

感谢大家对《新手学Python避坑,学习效率狂飙!》系列的点赞、关注和收藏,今天这编是这个系列的第二十一个分享,前面还有二十个,大家可以关注下之前发布的文章。下面是我们今天第三个的分享:在Pytho...

编程小白学做题:Python 的经典编程题及详解,附代码和注释(六)

适合Python3+的6道编程练习题(附详解)1、打印杨辉三角的前n行题目描述:给定正整数n,打印杨辉三角的前n行(每个数等于它上方两数之和,每行首尾为1)。编写思路:杨辉三角的第i...

让你的Python代码更易读:7个提升函数可读性的实用技巧

如果你正在阅读这篇文章,很可能你已经用Python编程有一段时间了。今天,让我们聊聊可以提升你编程水平的一件事:编写易读的函数。请想一想:我们花在阅读代码上的时间大约是写代码的10倍。所以,每当你创建...

python入门到脱坑 函数—return语句

Python函数中的return语句详解一、return语句基础1.1基本功能return语句用于从函数中返回一个值,并立即结束函数的执行。defadd(a,b):returna+...

编程小白学做题:Python 的经典编程题及详解,附代码和注释(七)

适合Python3+的6道编程练习题(附详解)1.检查字符串是否以指定子串开头题目描述:判断字符串是否以给定子串开头(如"helloworld"以"hello&...

python的注释符是什么(python的合法注释符号是什么)

python的注释符是什么?python的注释符包括单行注释符和多行注释符。一、python单行注释符号(#)井号(#)常被用作单行注释符号,在代码中使用#时,它右边的任何数据都会被忽略,当做是注释。...