当前位置:文档之家› 一份深度学习“人体姿势估计”全指南,从DeepNet到HRNet

一份深度学习“人体姿势估计”全指南,从DeepNet到HRNet

一份深度学习“人体姿势估计”全指南,从DeepNet到HRNet 从DeepNet到HRNet,这有一份深度学习“人体姿势估计”全指南
几十年来,人体姿态估计(Human Pose estimation)在计算机视觉界备受关注。

它是理解图像和视频中人物行为的关键一步。

在近年深度学习兴起后,人体姿态估计领域也发生了翻天覆地的变化。

今天,文摘菌就从深度学习+二维人体姿态估计的开山之作DeepPose开始讲起,为大家盘点近几年这一领域的最重要的论文。

什么是人体姿势估计?
人体姿态估计(Human Pose Estimation,以下简称为HPE)被定义为图像或视频中,人体关节(也被称为关键点-肘部、手腕等)的定位问题。

它也被定义为,在所有关节姿势组成的空间中搜索特定姿势。

二维姿态估计-运用二维坐标(x,y)来估计RGB图像中的每个关节的二维姿态。

三维姿态估计-运用三维坐标(x,y,z)来估计RGB图像中的三维姿态。

HPE有一些非常酷的应用,在动作识别(action recognition)、动画(animation)、游戏(gaming)等领域都有着广泛的应用。

例如,一个非常火的深度学习APP ——HomeCourt,可以使用姿态估计(Pose Estimation)来分析篮球运动员的动作。

为什么人体姿势估计这么难?
灵活、小而几乎看不见的关节、遮挡、衣服和光线变化都为人体姿态估计增加了难度。

二维人体姿态估计的不同方法
传统方法
关节姿态估计的传统方法是使用图形结构框架。

这里的基本思想是,将目标对象表示成一堆“部件(parts)”的集合,而部件的组合方式是可以发生形变的(非死板的)。

相关主题