百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

OpenCV-Python速查表:从导入图像到人脸检测

itomcoil 2025-02-06 15:17 24 浏览

——本文对图像裁剪、调整大小、旋转、阈值、模糊、在图像上绘图和书写、人脸检测和使用轮廓图像检测对象都进行了解释。

什么是OpenCV-Python?

OpenCV是一个开源的计算机视觉(computer vision)和机器学习库。它拥有超过2500个优化算法,包括经典和最先进的计算机视觉和机器学习算法。它有很多语言接口,包括Python、Java、c++和Matlab。

这里,我们将处理Python接口。

安装

  • 在Windows上, 请在这里查看指南。地址:https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_setup/py_setup_in_windows/py_setup_in_windows.html
  • 在 Linux上, 请在这里查看指南。地址:https://docs.opencv.org/trunk/d7/d9f/tutorial_linux_install.html

图像导入&显示

警告1: 通过openCV读取图像时,它不是以RGB 颜色空间来读取,而是以BGR 颜色空间。有时候这对你来说不是问题,只有当你想在图片中添加一些颜色时,你才会遇到问题。

有两种解决方案:

  1. 将R?—?第一个颜色值(红色)和B —?第三个颜色值(蓝色) 交换, 这样红色就是 (0,0,255) 而不是(255,0,0)。
  2. 将颜色空间变成RGB:

使用rgb_image代替image继续处理代码。

警告2: 要关闭显示图像的窗口,请按任意按钮。如果你使用关闭按钮,它可能会导致窗口冻结(我在Jupyter笔记本上运行代码时发生了这种情况)。

为了简单起见,在整个教程中,我将使用这种方法来查看图像:

来源:Pixabay

裁剪

来源:Pixabay

裁剪后的狗狗

其中: image[10:500,500:200] 是 image[y:y+h,x:x+w]。

调整大小

来源:Pexels

调整大小到20%后

这个调整大小函数会保持原始图像的尺寸比例。

更多图像缩放函数,请查看这里。(

https://www.tutorialkart.com/opencv/python/opencv-python-resize-image/ )

旋转

左图: 图片来自Pexels的Jonathan Meyer。右图: 进行180度旋转之后的狗狗。

image.shape输出高度、宽度和通道。M是旋转矩阵——它将图像围绕其中心旋转180度。

-ve表示顺时针旋转图像的角度 & +ve逆表示逆时针旋转图像的角度。

灰度和阈值(黑白效果)

来源:Pexels

gray_image 是灰度图像的单通道版本。

这个threshold函数将把所有比127深(小)的像素点阴影值设定为0,所有比127亮(大)的像素点阴影值设定为255。

另一个例子:

这将把所有阴影值小于150的像素点设定为10和所有大于150的像素点设定为200。

更多有关thresholding函数的内容,请查看这里。(

https://docs.opencv.org/3.4/d7/d4d/tutorial_py_thresholding.html )

左图:灰阶狗狗。右图:黑白狗狗。

模糊/平滑

左图:图像来自Pixabay。右图:模糊后的狗狗。

高斯模糊函数接受3个参数:

  1. 第一个参数是要模糊的图像。
  2. 第二个参数必须是一个由两个正奇数组成的元组。当它们增加,模糊效果也会增加。
  3. 第三个参数是sigmaX和sigmaY。当左边位于0时,它们会自动从内部大小计算出来。

更多关于模糊函数的内容,请查看这里。(

https://docs.opencv.org/3.1.0/d4/d13/tutorial_py_filtering.html )

在图像上绘制矩形框或边框

左图:图像来自Pixabay。右图:脸上有一个矩形框的狗狗。

rectangle函数接受5个参数:

  1. 第一个参数是图像。
  2. 第二个参数是x1, y1 -左上角坐标。
  3. 第三个参数是x2, y2 -右下角坐标。
  4. 第四个参数是矩形颜色(GBR/RGB,取决于你如何导入图像)。
  5. 第五个参数是矩形线宽。

绘制一条线

左图:图像来自Pixabay。右图:两只狗狗用一条线分开。

line函数接受5个参数:

  • 第一个参数是要画的线所在的图像。
  • 第二个参数是x1, y1。
  • 第三个参数是x2, y2。
  • 第四个参数是线条颜色(GBR/RGB,取决于你如何导入图像)。
  • 第五个参数是线宽。

在图片上写入文字

左图:图像来自Pixabay。右图:两只狗狗用一条线分开。

putText函数接受 七个参数:

  • 第一个参数是要写入文本的图像。
  • 第二个参数是待写入文本。
  • 第三个参数是x, y——文本开始的左下角坐标。
  • 第四个参数是字体类型。
  • 第五个参数是字体大小。
  • 第六个参数是颜色(GBR/RGB,取决于你如何导入图像)。
  • 第七个参数是文本线条的粗细。

人脸检测

这里没有找到狗狗照片,很遗憾:(

图片来自Pixabay,作者:Free-Photos。

detectMultiScale函数是一种检测对象的通用函数。因为我们调用的是人脸级联,所以它会检测到人脸。

detectMultiScale函数接受4个参数:

  • 第一个参数是灰阶图像。
  • 第二个参数是scaleFactor。因为有些人脸可能离镜头更近,所以看起来会比后台的人脸更大。比例系数弥补了这一点。
  • 检测算法使用一个移动窗口来检测对象。minNeighbors定义在当前对象附近检测到多少对象,然后再声明检测到人脸。
  • 与此同时,minsize给出了每个窗口的大小。

检测到两张人脸。

轮廓——一种对象检测方法

使用基于颜色的图像分割,你可以来检测对象。

cv2.findContours & cv2.drawContours 这两个函数可以帮助你做到这一点。

最近,我写了一篇非常详细的文章,叫做《使用Python通过基于颜色的图像分割来进行对象检测》。你需要知道的关于轮廓的一切都在那里。(

https://towardsdatascience.com/object-detection-via-color-based-image-segmentation-using-python-e9b7c72f0e11 )

最终,保存图片

总结

OpenCV是一个非常容易使用的算法库,可以用于3D建模、高级图像和视频编辑、跟踪视频中的标识对象、对视频中正在做某个动作的人进行分类、从图像数据集中找到相似的图像,等等。

最重要的是,学习OpenCV对于那些想要参与与图像相关的机器学习项目的人来说是至关重要的。

英文原文:
https://qiniumedia.freelycode.com/vcdn/1/%E4%BC%98%E8%B4%A8%E6%96%87%E7%AB%A0%E9%95%BF%E5%9B%BE3/opencv-python-cheetsheet.pdf 译者:好酒不上头

相关推荐

selenium(WEB自动化工具)

定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

开发利器丨如何使用ELK设计微服务中的日志收集方案?

【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

高并发系统设计:应对每秒数万QPS的架构策略

当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

2025 年每个 JavaScript 开发者都应该了解的功能

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

JavaScript Array 对象

Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

动力节点最新JavaScript教程(高级篇),深入学习JavaScript

JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

「晚安·好梦」努力只能及格,拼命才能优秀

欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

JavaScript 中 some 与 every 方法的区别是什么?

大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

10个高效的Python爬虫框架,你用过几个?

小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

12个高效的Python爬虫框架,你用过几个?

实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

pip3 install pyspider报错问题解决

运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

PySpider框架的使用

PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

「机器学习」神经网络的激活函数、并通过python实现激活函数

神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...