OpenCV实现手势音量控制(opencv按钮)
itomcoil 2025-07-14 17:30 2 浏览
前言: Hello大家好,我是Dream。 今天来学习一下如何使用OpenCV实现手势音量控制,欢迎大家一起前来探讨学习~
一、需要的库及功能介绍
本次实验需要使用OpenCV和mediapipe库进行手势识别,并利用手势距离控制电脑音量。
导入库:
cv2:OpenCV库,用于读取摄像头视频流和图像处理。
mediapipe:mediapipe库,用于手部关键点检测和手势识别。
ctypes和comtypes:用于与操作系统的音频接口进行交互。
pycaw:pycaw库,用于控制电脑音量。
功能:
初始化mediapipe和音量控制模块,获取音量范围。
打开摄像头,读取视频流。
对每一帧图像进行处理:
转换图像为RGB格式。
使用mediapipe检测手部关键点。
如果检测到手部关键点:
在图像中标注手指关键点和手势连线。
解析手指关键点坐标。
根据拇指和食指指尖的坐标,计算手势距离。
将手势距离转换为音量大小,并控制电脑音量。
显示处理后的图像。
循环执行前述步骤,直到手动停止程序或关闭摄像头。
注意事项:
在运行代码之前,需要安装相关库(opencv、mediapipe、pycaw)。
需要连接音频设备并使其可访问。
检测到多个手部时,只处理第一个检测到的手部。
检测到手指关键点时,将索引指为0的关键点作为拇指的指尖,索引指为1的关键点作为食指的指尖。
cv2.VideoCapture()函数参数问题
这并没有错。但在树莓派上调用时需要更改参数,改为:
cap = cv2.VideoCapture(1)
调用电脑摄像头时:
电脑在用cv2.VideoCapture(0)时,程序结束后会有报错:
[WARN:0]SourceReaderCB::~SourceReaderCB terminating async callback
需要改为:
cv2.VideoCapture(0,cv2.CAP_DSHOW)
二、导入所需要的模块
1 # 导入OpenCV
2 import cv2
3 # 导入mediapipe
4 import mediapipe as mp
5 # 导入电脑音量控制模块
6 from ctypes import cast, POINTER
7 from comtypes import CLSCTX_ALL
8 from pycaw.pycaw import AudioUtilities, 9 IAudioEndpointVolume
10 # 导入其他依赖包
11 import time
12 import math
13 import numpy as np
三、初始化 HandControlVolume 类
class HandControlVolume:
def __init__(self):
"""
初始化 HandControlVolume 类的实 例
初始化 mediapipe 对象,用于手部 关键点检测和手势识别。
获取电脑音量接口,并获取音量范 围。
"""
# 初始化 medialpipe
self.mp_drawing=mp.solutions.drawing_utils
self.mp_drawing_styles=mp.solutions.drawing_styles
self.mp_hands = mp.solutions.hands
# 获取电脑音量范围
devices = AudioUtilities.GetSpeakers()
interface = devices.Activate(
IAudioEndpointVolume._iid_, CLSCTX_ALL, None)
self.volume=cast(interface, POINTER(IAudioEndpointVolume))
self.volume.SetMute(0, None)
self.volume_range=self.volume.GetVolumeRange()
- 初始化 mediapipe 对象,用于手部关键点检测和手势识别。
- 获取电脑音量接口,并获取音量范围。
四、主函数
1.计算刷新率
初始化刷新率的计算,记录当前时间作为初始时间。
使用OpenCV打开视频流,此处读取摄像头设备,默认使用设备ID为0。
设置视频流的分辨率为指定的resize_w和resize_h大小,并将图像resize为该尺寸。
在使用hands对象之前,使用with语句创建一个上下文环境,设置手部检测和追踪的相关参数,包括最小检测置信度、最小追踪置信度和最大手的数量。
进入循环,判断视频流是否打开。使用cap.read()函数从视频流中读取一帧图像,返回的success表示是否读取成功,image则是读取到的图像。
对读取到的图像进行resize,将其调整为指定的大小。如果读取失败,则打印提示信息并继续下一次循环。
文章很长
………点赞关注哦………
持续更新中………
相关推荐
- 基于Python开发的家居用品外贸网站(B2B企业官网)
-
作为一名程序员,平时除了本职工作,我也会利用业余时间做一些兼职和副业,大部分的私活都是从某鱼和CSDN接的,有些是别人介绍的。最近刚好接到了一个外贸企业网站的开发需求,客户是一家位于深圳的家居用品公司...
- 摄像头视频流处理方法总结,如何掌握视频流处理技巧?
-
摄像头视频流处理是指其技术本质、关键处理流程和核心目标。1.视频流的定义视频流(VideoStream)是摄像头连续采集图像帧(frame),并以压缩编码格式(如H.264/H.265)传输或存储...
- 大学生机器人开发辅导|代码、机构到控制全链路进阶
-
想做机器人项目,却苦于不会硬件、算法和代码?SRTP、大创、全国竞赛动手项目无从下手?Arduino、STM32、RaspberryPi模块让你头大?想在毕业设计、创新实践、社团活动做出有亮点的机器...
- OpenCV实现手势音量控制(opencv按钮)
-
前言:Hello大家好,我是Dream。今天来学习一下如何使用OpenCV实现手势音量控制,欢迎大家一起前来探讨学习~一、需要的库及功能介绍本次实验需要使用OpenCV和mediapipe库进行手...
- DIY激光枪薄纱蟑螂!AI杀蚊子博士新作,项目已开源
-
萧箫发自凹非寺量子位|公众号QbitAI几个世纪来,人类都处在被蟑螂支配的恐惧中。但比蟑螂更恐怖的,是打不死还消失了的蟑螂……现在,一位博士搞出了一套自动识别并薄(爆)纱(杀)蟑螂的激光“炮...
- 为了杀蚊子,这位博士用树莓派DIY了一把激光枪
-
金磊发自凹非寺量子位报道|公众号QbitAI世人苦蚊子久矣。尤其在夏夜,耳边嗡嗡作响,甚至还得与其“挑灯夜战”个三百回合。为此,一个国外博士便DIY了一种高端的杀蚊方式:计算机视觉精准定...
- 草根PLC革命:低价魔改开源方案对决高价LabVIEW工业视觉系统!
-
魔改方案:三菱FX5U+树莓派魔改架构硬件清单创新设计:双核协同架构:PLC负责实时控制+树莓派运行AI算法EtherCAT菊花链:省交换机成本,布线效率提升70%五大开源工具:CODESYSR...
- 机器人开发进阶:看懂这五个项目中的软硬件哲学
-
DIY机器人项目正逐渐成为技术爱好者和创客们的热门选择。无论是用于教育、娱乐还是实际应用,机器人技术都展现了其强大的潜力。本文将介绍五个EEWorld上备受工程师关注的五个DIY项目,通过本文,您将深...
- 树莓派到底是什么?能干什么?有必要买吗?
-
很多人疑惑,树莓派到底是什么?能干什么?有必要买吗?今天我带着这三个疑惑给大家解答;一、树莓派到底是什么?树莓派通俗的理解就是一台便携式小型电脑,起码最新的树莓派4当一台电脑是可以的;往深了说,他可以...
- 用腾讯优图AI视觉模组做一个驾驶疲劳监测仪
-
道路千万条,安全第一条,相信每个人都是牢记于心的,“喝酒不开车,开车不喝酒”其实不难,难的是防范始料未及的事件,疲倦就是众多始料未及事件中,杀伤力稳居前排的,前一秒心里还在想坚持坚持,下一秒可能就失去...
- Z410升级树莓派4B机型终于和大家见面了
-
*Z410-4B入门二次开发平台*经过近1年的反复测试,Z410升级树莓派4B的机型终于和大家见面了!Z410机型设计的初衷,就是想为大家提供一款基础的、开源的、高性价比、可扩展、可进行二次开发的无人...
- 有保险柜怕不安全,用树莓派制作一款只有刷脸才能开的保险柜吧
-
眨眨眼睛就能保住身家,好过记住密码或拿着钥匙,你的脸就是保险柜的钥匙!这个作品将展示给大家如何用树莓派和摄像头制作一个人脸识别的保险柜,当然,如果不慎毁容或整容,不好意思。。。直接拿锤子砸了吧软件部分...
- 项目分享|仅需1板卡+1摄像头,3步完成人脸喜怒哀乐识别
-
使用OpenCV、TensorFlow和Keras,基于RaspberryPi进行情绪识别,你的心情一览无余。面部表情识别系统可用于多种应用,可以用来研究或分析人的情绪。许多公司正在植入...
- 价值8美元的OpenAsk收费问题回答:孩子小学五年级如何入门编程?
-
从今天起,给大家持续更新OpenAsk上的一些收费问题的回答系列,内容信不信由你,但是如果您仔细看了分析后会说,真香。#少儿编程是智商税吗#“更多内容欢迎关注-司马南柯一梦”(欢迎随意转发)下面是一位...
- 再见 Pycharm,这款开箱即用的轻量级神器你值得拥有
-
作者:豆豆来源:Python技术如果你问我最好用的IDE是什么,那我肯定会毫不犹豫的告诉你Pycharm。毕竟jetbrains出品必属精品。但对于很多初学者来讲,Pycharm显得略笨...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)