当前位置：文档之家› 一份深度学习“人体姿势估计”全指南,从DeepNet到HRNet

一份深度学习“人体姿势估计”全指南,从DeepNet到HRNet

一份深度学习“人体姿势估计”全指南，从DeepNet到HRNet 从DeepNet到HRNet，这有一份深度学习“人体姿势估计”全指南
几十年来，人体姿态估计（Human Pose estimation）在计算机视觉界备受关注。

它是理解图像和视频中人物行为的关键一步。

在近年深度学习兴起后，人体姿态估计领域也发生了翻天覆地的变化。

今天，文摘菌就从深度学习+二维人体姿态估计的开山之作DeepPose开始讲起，为大家盘点近几年这一领域的最重要的论文。

什么是人体姿势估计？
人体姿态估计（Human Pose Estimation，以下简称为HPE）被定义为图像或视频中，人体关节（也被称为关键点-肘部、手腕等）的定位问题。

它也被定义为，在所有关节姿势组成的空间中搜索特定姿势。

二维姿态估计-运用二维坐标（x,y）来估计RGB图像中的每个关节的二维姿态。

三维姿态估计-运用三维坐标（x,y,z）来估计RGB图像中的三维姿态。

HPE有一些非常酷的应用，在动作识别（action recognition）、动画（animation）、游戏（gaming）等领域都有着广泛的应用。

例如，一个非常火的深度学习APP ——HomeCourt，可以使用姿态估计（Pose Estimation）来分析篮球运动员的动作。

为什么人体姿势估计这么难？
灵活、小而几乎看不见的关节、遮挡、衣服和光线变化都为人体姿态估计增加了难度。

二维人体姿态估计的不同方法
传统方法
关节姿态估计的传统方法是使用图形结构框架。

这里的基本思想是，将目标对象表示成一堆“部件（parts）”的集合，而部件的组合方式是可以发生形变的（非死板的）。

e商务文档