基于 RealSense D435i相机实现手部姿态检测

基于 RealSense D435i相机进行手部姿态检测,其中采用 Mediapipe 进行手部检测,以下是详细步骤:

Mediapipe 是一个由 Google开发的开源框架,专门用于构建多媒体处理管道,特别是计算机视觉和机器学习任务。它提供了一系列预训练的模型和工具,可以用于实时处理图像和视频流。
主要功能:

  1. 手部检测:可以检测并跟踪手部的位置和姿态。
  2. 面部检测:识别面部特征点,用于表情识别和面部跟踪。
  3. 姿态估计:检测人体的关键点,用于运动分析和健身应用。
  4. 物体检测:实现物体检测和识别,适用于各种场景。
  5. 语音识别:支持音频处理和语音识别功能。

主要特点:

  • 高效性:能够在移动设备和边缘设备上运行,具备良好的性能。
  • 跨平台:支持多种操作系统和设备,包括 Android、iOS 和桌面环境。
  • 易于使用:提供简单的 API,方便开发者快速集成和使用。

使用场景:

Mediapipe 被广泛应用于增强现实、游戏开发、健康监测、安防监控等领域。
可以访问 Mediapipe的官方文档了解详细内容和使用示例。

一、手部姿态检测

步骤 1: 安装所需库

首先,请确保您已经安装了 Python 和 pip。然后,通过以下命令安装所需库:

pip install pyrealsense2 opencv-python mediapipe numpy

步骤 2: 设置 RealSense D435i

确保您的 RealSense D435 相机已正确连接,并安装了 RealSense SDK。
可以从 Intel 的 RealSense SDK 页面获取更多信息。

步骤 3: 演示代码

以下是一个整合了 RealSense D435i 和 Mediapipe 手部检测的 Python 脚本示例。具体的实现细节可能需要根据需求进行调整。

import cv2
import numpy as np
import pyrealsense2 as rs
import mediapipe as mp# 初始化 Mediapipe 手部模块
mp_hands = mp.solutions.hands
hands = mp_hands.Hands(static_image_mode=False, max_num_hands=2, min_detection_confidence=0.7)
mp_drawing = mp.solutions.drawing_utils# 配置 RealSense 流
pipeline = rs.pipeline()
config = rs.config()
config.enable_stream(rs.stream.depth, 640, 480, rs.format.z16, 30)
config.enable_stream(rs.stream.color, 640, 480, rs.format.bgr8, 30)# 启动流
pipeline.start(config)try:while True:# 等待获取新的帧frames = pipeline.wait_for_frames()color_frame = frames.get_color_frame()if not color_frame:continue# 将图像转换为 NumPy 数组image = np.asanyarray(color_frame.get_data())# 转换颜色空间image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)image_rgb.flags.writeable = False# 使用 Mediapipe 检测手部results = hands.process(image_rgb)# 绘制手部标记image_rgb.flags.writeable = Trueif results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:mp_drawing.draw_landmarks(image_rgb, hand_landmarks, mp_hands.HAND_CONNECTIONS)# 在这里可以调用 Dex-Retargeting 算法,处理 hand_landmarks# dex_retargeting_function(hand_landmarks)# 显示结果cv2.imshow('Hand Tracking', image_rgb)if cv2.waitKey(1) & 0xFF == ord('q'):breakfinally:# 停止流pipeline.stop()cv2.destroyAllWindows()

步骤 4: 运行代码

将上述代码保存为 hand_tracking.py,然后在终端中运行:

python hand_tracking.py

在这里插入图片描述

二、记录/打印手指关节姿态

1、修改上述步骤 3的演示代码

# 定义手指的关键点索引范围
finger_indices = {"thumb": range(0, 5),"index": range(5, 9),"middle": range(9, 13),"ring": range(13, 17),"pinky": range(17, 21)
}try:while True:# 等待新帧frames = pipeline.wait_for_frames()color_frame = frames.get_color_frame()depth_frame = frames.get_depth_frame()if not color_frame or not depth_frame:continue# 转换为 numpy 数组img = cv2.cvtColor(np.asanyarray(color_frame.get_data()), cv2.COLOR_RGB2BGR)# 处理手部检测results = hands.process(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))if results.multi_hand_landmarks:for hand_landmarks in results.multi_hand_landmarks:# 绘制手部关键点mp_drawing.draw_landmarks(img, hand_landmarks, mp_hands.HAND_CONNECTIONS)# 提取并打印每个手指的关键点空间姿态for finger, indices in finger_indices.items():keypoints = [(hand_landmarks.landmark[i].x, hand_landmarks.landmark[i].y, hand_landmarks.landmark[i].z) for i in indices]print(f"{finger} keypoints: {keypoints}")# 将手指关节姿态信息写入文件with open('hand_landmarks.txt', 'a') as f:f.write(f"{finger}: {keypoints}\n")

2、结果显示和分析

thumb: [(0.9687821865081787, 0.6210590600967407, 3.910763268777373e-07), (0.9071911573410034, 0.6109362840652466, -0.03194861114025116), (0.8624528646469116, 0.554160475730896, -0.04743020609021187), (0.8405251502990723, 0.49807286262512207, -0.06013686582446098), (0.8232850432395935, 0.4591226577758789, -0.0727970078587532)]
index: [(0.9149847626686096, 0.4301099479198456, -0.02639639377593994), (0.9145824909210205, 0.3440428376197815, -0.04998774453997612), (0.9162378907203674, 0.2871255874633789, -0.07186762243509293), (0.9200422763824463, 0.23657603561878204, -0.08782264590263367)]
middle: [(0.9503715634346008, 0.4127236604690552, -0.02441730722784996), (0.9643440246582031, 0.31598132848739624, -0.042417172342538834), (0.9733370542526245, 0.2534366846084595, -0.05844615772366524), (0.9829654097557068, 0.19702278077602386, -0.07070045918226242)]
ring: [(0.9794745445251465, 0.41305306553840637, -0.026965150609612465), (0.9923086762428284, 0.3207796812057495, -0.04289492592215538), (1.0009437799453735, 0.2619915306568146, -0.05437065660953522), (1.0100406408309937, 0.21127769351005554, -0.06270640343427658)]
pinky: [(1.0050956010818481, 0.42907220125198364, -0.033185433596372604), (1.018389105796814, 0.3570478856563568, -0.046027250587940216), (1.024712324142456, 0.31118300557136536, -0.0520443469285965), (1.030387043952942, 0.2696005702018738, -0.05643028765916824)]

上述代码打印的信息表示了拇指各个关节在三维空间中的位置坐标。具体来说,每个元组代表一个关节的 (x)、(y) 和 (z)坐标,解释如下:

  1. 拇指的关节列表

    • thumb:表示这是拇指的关键点信息。
    • 里面的每个元组均表示拇指某个关节的空间坐标。
  2. 坐标含义

    • 每个元组包含三个值:
      • (x): 表示该关节在图像宽度方向上的相对位置,值范围为 0 到 1。
      • (y): 表示该关节在图像高度方向上的相对位置,值范围为 0 到 1。
      • (z): 表示关节相对于手掌的深度值(通常是负值表示离相机更远,正值则表示更近)。

对于拇指的五个关节,上述打印的坐标信息分别是:

  1. 第一个关节(根部): ((0.9688, 0.6211, 0))
  2. 第二个关节: ((0.9072, 0.6109, -0.0319))
  3. 第三个关节: ((0.8625, 0.5542, -0.0474))
  4. 第四个关节: ((0.8405, 0.4981, -0.0601))
  5. 第五个关节(指尖): ((0.8233, 0.4591, -0.0728))
    这些数据可以用于分析拇指的姿态和运动,帮助实现手势识别或其他与手部交互相关的应用。

三、注意事项

  1. 确保 RealSense D435i 相机已连接并正常工作。
  2. 若有其他依赖项或运行环境问题,请根据错误提示进行调试。
  3. 调整 min_detection_confidence 和 min_tracking_confidence 以提高检测效果。

通过这些步骤,可以实现手部姿态检测,并将每个手指的关节空间姿态信息保存到文件中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/150170.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

身为程序员,转行请慎重:考虑以下几点再决定是否转向大模型领域

在决定从程序员转型到大模型领域之前,有几个关键点需要认真考虑。这些因素将帮助你更全面地评估这一转变是否适合你的职业规划和个人情况。 个人兴趣与激情 自我反思:你对人工智能、深度学习和自然语言处理等领域是否有浓厚的兴趣?兴趣是最好…

35岁程序员转行大模型岗位:详细学习路线,从零基础到精通2024最新

随着人工智能(AI)和深度学习技术的飞速发展,越来越多的技术人才开始考虑转向这一前沿领域。对于已经拥有丰富编程经验但希望转型到大模型开发领域的35岁程序员来说,虽然面临一定的挑战,但也具备了坚实的基础。本文将提…

C++(学习)2024.9.24

目录 容器 1.标准模板库STL 2.概念 3.顺序容器 (1)array数组 (2)vector向量 (3)list列表 (4)deque 队列 4.关联容器 5.迭代器 面向对象核心 继承 概念 构造函数 1.派生…

HTML段落,换行,水平线标签与其属性

段落标签 段落标签是通过<p> </p>来定义的。 </head> <body><p>这是一个段落</p> </body> </html> 换行标签 换行标签通过<br>来定义&#xff0c;换行标签可以在不产生新的段落的情况下进行换行操作。 </head> …

更新C语言题目

1.以下程序输出结果是() int main() {int a 1, b 2, c 2, t;while (a < b < c) {t a;a b;b t;c--;}printf("%d %d %d", a, b, c); } 解析:a1 b2 c2 a<b 成立 ,等于一个真值1 1<2 执行循环体 t被赋值为1 a被赋值2 b赋值1 c-- c变成1 a<b 不成立…

RTE大会报名丨 重塑语音交互:音频技术和 Voice AI,RTE2024 技术专场第一弹!

Voice AI 实现 human-like 的最后一步是什么&#xff1f; AI 视频爆炸增长&#xff0c;新一代编解码技术将面临何种挑战&#xff1f; 当大模型进化到实时多模态&#xff0c;又将诞生什么样的新场景和玩法&#xff1f; 所有 AI Infra 都在探寻规格和性能的最佳平衡&#xff0…

Java—反射机制详解

介绍反射 反射的基本概念 反射&#xff08;Reflection&#xff09;是Java语言中的一种机制&#xff0c;它允许程序在运行时检查和操作类、接口、字段和方法等类的内部结构。通过反射&#xff0c;你可以在运行时获取类的信息&#xff0c;包括类的构造器、字段、方法等&#xf…

服务器安装pytorch_geometric torch_scatter踩坑记录

conda create -n pyg python3.8.12 pip install torch1.13.0安装的版本如下 pip install torch-scatter pip install torch-sparse pip install torch-cluster pip install torch-spline-conv pip install torch-geometric2.2.0 pip install ipykernel python -m ipykernel i…

Java—注解机制详解

概念 注解是类的组成部分&#xff0c;可以为类携带额外的信息&#xff0c;提供一种安全的注释标记机制&#xff0c;用于将任何信息或元数据与程序元素&#xff08;如类、方法、成员变量等&#xff09;关联。 注解是供编译器或JVM使用的&#xff0c;编译器或JVM可以根据注解执…

云岚到家 第一天实战总结

为什么使用post发送请求&#xff0c;参数依旧会被拼接带url上呢&#xff1f;这应该就是param 与data传参的区别。即param传参数参数会被拼接到url后&#xff0c;data会以请求体传递 不一定post发送请求&#xff0c;数据一定在请求体中&#xff0c;主要是看数据的格式。 后端c…

c++924

2 #include <iostream> #include <cstring>using namespace std;class MyString { private:char *str; // 记录C风格的字符串int size; // 记录字符串的实际长度public:// 定义无参构造MyString() : size(0) {str new char[1];str[0] \0;cou…

《深度学习》—— 神经网络中的数据增强

文章目录 一、为什么要进行数据增强&#xff1f;二、常见的数据增强方法1. 几何变换2. 颜色变换3. 尺寸变换4. 填充5. 噪声添加6. 组合变换 三、代码实现四、注意事项五、总结 一、为什么要进行数据增强&#xff1f; 神经网络中的数据增强是一种通过增加训练数据的多样性和数量…

Python接口自动化测试输出日志到控制台和文件

一、日志的作用 一般程序日志出自下面几个方面的需求&#xff1a; 1. 记录用户操作的审计日志&#xff0c;甚至有的时候就是监管部门的要求。 2. 快速定位问题的根源 3. 追踪程序执行的过程。 4. 追踪数据的变化 5. 数据统计和性能分析 6. 采集运行环境数据 一般在程序上线之后…

2024 年 8 月公链行业研报:Layer 1、比特币 Layer 2 和以太坊 Layer 2 趋势分析

作者&#xff1a;Stella L (stellafootprint.network) 数据来源&#xff1a;Footprint Analytics 公链研究页面 8 月&#xff0c;加密货币市场波动剧烈&#xff0c;比特币和以太坊均遭遇了明显下跌。Layer 1 区块链普遍遭受市场颓势&#xff0c;然而&#xff0c;Tron 却逆势…

考研数据结构——C语言实现插入排序

插入排序是一种简单直观的比较排序算法&#xff0c;它的工作原理是通过构建有序序列&#xff0c;对于未排序数据&#xff0c;在已排序序列中从后向前扫描&#xff0c;找到相应位置并插入。插入排序在实现上&#xff0c;通常采用in-place&#xff08;原地排序&#xff09;&#…

【python篇】python pickle模块一篇就能明白,快速理解

持久性就是指保持对象&#xff0c;甚至在多次执行同一程序之间也保持对象。通过本文&#xff0c;您会对 Python对象的各种持久性机制&#xff08;从关系数据库到 Python 的 pickle以及其它机制&#xff09;有一个总体认识。另外&#xff0c;还会让您更深一步地了解Python 的对象…

【深度】边缘计算神器之数据网关

分布式计算、云边协同、互联互通是边缘计算设备的三项重要特征。 边缘计算设备通过分布式计算模式&#xff0c;将数据处理和分析任务从中心化的云平台下放到设备网关&#xff0c;即更接近数据源的地方&#xff0c;从而显著降低了数据传输的延迟&#xff0c;提高了响应速度和处…

算法4-----综合训练(3)

一&#xff1a;优美的排列 题目&#xff1a; 有1~n的n个整数&#xff0c;用这些数构造一个数组perm&#xff0c;只要构造的数组满足以下两个条件&#xff1a; &#xff08;1&#xff09;i可以被perm[i]整除 &#xff08;2&#xff09;perm[i]可以被i整除 返回其能构造出的…

影刀RPA应用迁移应用复制完整步骤-本地工具

影刀应用迁移工具本地版 不需要输入影刀的用户名和密码就能实现应用的迁移 依赖本地电脑中登录的账号 使用方法 打开软件需要激活,请联系: 左侧选择一个账号选择需要迁移的应用选择目标账号选择要替换的应用 需要用目标账号创建一个空应用,然后在这一步选择点击替换 Q&A…

3. 轴指令(omron 机器自动化控制器)——>MC_MoveRelative

机器自动化控制器——第三章 轴指令 5 MC_MoveRelative变量▶输入变量▶输出变量▶输入输出变量 功能说明▶指令详情▶时序图▶重启运动指令▶多重启动运动指令▶异常 MC_MoveRelative 指定自指令当前位置起的移动距离&#xff0c;进行定位。 指令名称FB/FUN图形表现ST表现MC…