王东
Published on 2025-02-28 / 9 Visits

【AI100问(112)】深度学习如何识别人体姿态?

人体姿态识别通过提取人体姿态骨架来估计图片或视频中人的动作,在现实生活中有广泛应用。如识别异常动作,判断是否有人摔倒;识别肢体语言,实现手语翻译;进行步态分析,用于评估运动员的运动状况或识别人的身份。

姿态识别的关键在于提取出一组人体关键点坐标,从而得到姿态骨架。国际主流人体姿态骨架图中定义了18个关键点, 分别对应着人体主要的关节和部位。

深度神经网络是当前姿态识别的主流模型,通过引入人体骨架结构化信息,这一模型可以得到合理的骨架结构。

卡内基梅隆大学的OpenPose是著名的2D人体姿态估计工具包,基于深度学习可以实现姿态的实时估计。OpenPose 网络首先通过卷积层从图像中提取抽象特征,然后将这些特征输入到两个并行网络分支中, 第一个分支预测人体关键点位置, 第二个分支预测关键点之间的关联程度。基于这些信息,我们就可以估计出人的姿态骨架图,从而理解人的动作。

目前,姿态识别已经可以达到非常高的精度。除了前面提到了一些应用, 还可以用作动作捕捉的手段,在三维特效电影制作方面大显身手;或者作为人机交互的方式,通过手势控制家电设备;还可以用于虚拟现实和增强现实,进行3D试衣、跳舞游戏等。

参考文献:

[1]https://github.com/CMU-Perceptual-Computing-Lab/openpose

By重庆科技学院  利节