当前位置:文档之家› 人体动作识别中的深度学习模型选择_谭火媛

人体动作识别中的深度学习模型选择_谭火媛


些数据集使用递归神经网络识别效果会和卷积神经网络相差无几,
参数配置的可能性有多大?在参数探索的过程中报告的与其他模型比
甚至是优于卷积神经网络,但是研究者可以通过平均识别效果选择
较的识别效果有多大的代表性?哪一个参数对识别效果的影响最大? 这些问题对于研究者是非常重要的,但是目前在相关研究中很少有提
适合的结构模型。(4)在开始优化网络结构之前,建议先探索学 习速率,因为学习到的参数对于模型的识别效果有很大的影响。
上的适用性,可以为对深度学习感兴趣的研究人员提供一定的参考。
作[3],这一应用很显然优于之前领先的识别方法。
2.2 递归神经网络在人体动作识别中的应用
1 深度学习在人体动作识别中的研究现状
在普适计算中,帧与帧之间通常被看作是统计独立的,因此生
在过去十年中,深度学习已成为机器学习领域最热门的研究方
成模型的应用也是非常成功的,例如隐马尔科夫模型(HMM)。那 些能够利用时序数据的时间相关性的方法,自然也就成为构建人体运
5 结束语
本文在分析模拟与数字信号正交调制原理的基础上,提出的基 于AD9364的通用正交调制平台,可实现实现70 MHz至6.0 GHz频率 输出,且该平台采用FPGA控制,可以灵活地实现多模式调制,从 而满足大多数软件无线电平台的应用需求。
参考文献 [1]彭龙,田书林,刘科.基于DDS的数字调制[J].电子测试,2012(1):19-22. [2]Ulrich L. Rohde(美)著,刘光祜等译.无线应用射频微波电路设 计[M]. 北京:电子工业出版社,2004:23-50. [3]周炯磐,杨鸿文.通信原理[M].北京:北京邮电大学出版社,2005: 208-250. [4]杨小牛,楼才义,徐建良.软件无线电原理与应用[M].电子工业 出版社,2001. [5]AD9364 DataSheet.Analog Devices Inc,2014.
其主要特征包括:1)集成12位DAC和ADC的RF 1×1收发器;2)频 段:70MHz至6.0GHz ;3)可调谐通道带宽:<200kHz至56MHz;4)双 通道接收器:6路差分或12路单端输入;5)出色的接收器灵敏度,噪声 系数小于2.5dB;6)可编程速率的内插滤波器。
图2 基于AD9364硬件平台架构 从图2可以看到,模拟信号经过模数转换后送至FPGA,而数字 信号直接送至FPGA,FPGA根据设定的调制类型,对数据进行编 码、映射等处理,形成数字基带信号,然后将数字基带信号送至正 交调制器AD9364,AD9364根据需要对I、Q两路基带信号进行数字 滤波及插值处理,以匹配数字载波数率。插值后,两路数字基带信 号经过数模转换、模拟基带滤波器,与正交的两路载波信号相乘后 求和,产生已调射频信号,完成信号的正交调制。 根据AD9364器件资料,AD9364内部集成VCO,可实现70MHz至 6.0GHz频率输出,涵盖大部分特许执照和免执照频段,且器件外围电 路简单,编程应用丰富。可见,采用FPGA+AD9364的架构,可以容 易实现满足模拟与数字信号正交调制需求的通用正交调制平台。
4.2 基于AD9364的硬件平台设计 基于上述通用方案构想,考虑到调制器小型化、可编程、外围
电路简单的发展趋势,硬件平台核心电路采用FPGA+AD9364的架 构。架构原理框图如图2所示。
AD9364是一款高性能、高集成度RF捷变收发器。该器件的可 编程性和宽带能力使其成为多种收发器应用的理想选择。该器件集 RF前端与灵活的混合信号基带部分为一体,集成频率合成器,为 处理器提供可配置数字接口,从而简化设计导入。
普适计算中的人体动作识别是受益于深度学习的领域之一。人 体动作识别中相关的研究方法包括:对穿戴设备时序数据的滑动窗
Ordonez和 Roggen等在OpportunityDataset和SkodaDataset两个动作识别 数据集上将递归神经网络与卷积神经网络联合使用 [5]。实验表明,在
口分段、手动特征提取过程以及一系列的(有监督)分类方法。很 多情况下,这些相对简单的方法已经能够获得较高的识别准确度。 然而,一些更复杂的行为动作对这些需要手动设计的方法提出了一
使用可穿戴传感器收集的人体运动数据是多变量时间序列数
果较差,但是研究人员也不应该丢弃该模型。更加复杂的方法例如
据,在普适计算中分析这些数据通常是使用基于管道(pipelinebased)的方法。首先是将这些时间序列数据分割成连续的段或者
卷积神经网络或者递归神经网络的识别率差异较小,这样就更有可 (下转第49页)
理解每种模型的本质并知道它们在不同动作识别任务中的适用性。
尽管已经有一些关于深度模型在动作识别的各种应用场景中的 探索,但是缺乏一个系统的关于深度模型适用性的分析。各种论文的
通过探讨大量最新的论文,本文得出[6]:(1)对于那些持续时 间短但是有序的动作,递归神经网络的识别效果明显优于卷积神经
作者报告他们在初步实验中探索参数空间,但是通常忽略细节。实验
1.2 深度学习在人体动作识别中的应用障碍
没有用于拟合更低层面的用传感器采集到的相互独立动作数据。
深度学习将对普适计算中的人体动作识别带来巨大影响,它将
取代缺乏鲁棒性且需要手动设置的特征提取过程。然而,对于研究 者而言,为他们的具体应用场景选择合适的深度学习模型是一件比
3 结论
较困难的事情。很多促进深度学习发展的研究几乎都只是呈现了系
向,并且在学术研究和商业用途的驱动下,出现越来越多的变体。
动模型的选择。深度递归神经网络,尤其是那些依靠长期短期记忆单
通过 Torch7[1]等机器学习框架,深度学习能被大众所使用,并且在 很多应用领域中发挥重要作用。 1.1 人体动作识别的研究现状
元(LSTMs)的递归神经网络,最近在各种应用场景中已经取得了 令人印象深刻的识别效果。 首先,Neverova等利用记录在人们手机 上的运动数据研究了各种递归方法在人体识别中的识别效果[4]。接着
ELECTRONICS WORLDɾ探索与观察
人体动作识别中的深度学习模型选择
广州中医药大学医学信息工程学院 谭火媛 罗晓牧
【摘要】目前深度学习已成为机器学习领域最热门的研究方向,在众多应用领域取得良好的效果,这使得不少深度学习爱好者跃跃欲试。然 而,虽然关于深度学习的研究论文日益增多,但是仍然缺乏如何针对不同的应用场景选择合适的深度学习模型的指导。本文探讨了根据可穿 戴式传感器在人体动作识别中的信号特点,为如何根据不同的动作识别任务选择合适的深度学习模型提供参考。 【关键词】 深度学习;动作识别;卷积神经网络(CNN);递归神经网络(RNN)
网络。因为递归方法在一段长时间序列内可以联系上下文,结合上
的整个过程不但不清晰,而且难以复制。一些论文中展现单个实例, 例如卷积神经网络在某一特定场景获得较好的识别效果,然而单单报 告峰值性能数据并不能反映一种方法在普适计算中的所有识别任务具 有适用性,因为还需要花费多少精力去优化提出的方法以及调试与之
在M进制移相键控(MPSK)调制中,在M进制符号间隔内,
已调信号的载波相位是M个可能的离散相位之一,其中每个载波相
位对应于K个二进制符号

4 基于AD9364的正交调制硬件平台设计 4.1 正交调制器原理方案
基于上述正交调制模型的分析,设计通用正交调制方案,其原 理框图如图1所示。
图1 正交调制器原理框图 从图1可以看到,基带信号经串并变换或映射处理转换成I、Q 两路送入正交调制器,正交调制器通过成形滤波、数模转换、模拟 基带滤波等,将两路信号转换成模拟信号,并与LO输出的正交载 波相乘后相加,生成已调射频信号。通过控制LO频率,便可得到 不同频率的调制信号。
OpportunityDataset这个数据集中,递归神经网络与卷积神经网络联合 使用的识别效果优于其他方法;在SkodaDataset数据集中,使用递归 神经网络优于不使用递归方法的模型。应用递归神经网络仅仅是为了
定的挑战,例如在医疗应用中的动作识别等[2]。
在更抽象的层面上更有效地拟合时间相关性。目前,递归神经网络还
本文探讨了目前最常用的深度学习方法应用于基于可穿戴式传
统的最优效果,而很少介绍这些看起来最优的参数是如何确定的。
感器人体动作识别的识别效果。从研究者的角度来看,他们感兴趣
在参数探索过程中,对于最佳效果是如何与一般情况下的效果比
的并不是每种模型的最好识别效果是多少,而是探索参数的过程和
较,也没有做出很好的解释。
及,这很大程度上限制了深度学习在人体动作识别中的应用和推广。
通过对论文的探讨发现,对于不同模型的不同参数设置,最终
的识别效果会有很大的区别。普通的深度神经网络对于研究人员来
2 常用的深度学习方法在人体动作识别中的应用
说也许是最容易应用到不同的数据集中的模型,但它需要投入大量
的精力来调试参数。所以,尽管在初始的模型探索中模型的识别效
经网络 (Convolutional networks, CNN)和递归神经网络(Convolutional Neural Network, RNN)在人体动作识别中的应用。通过大量随机采样 模型配置的动作识别实验,比较不同模型在人体动作识别的不同任务
许多研究人员都在探索它们在不同动作识别任务中的识别效果。卷 积神经网络因其可以采用原始信号直接作为网络输入而避免了复杂 的特征提取过程,已经应用在特定领域,例如检测自闭症的典型动
基金项目:国家自然科学基金(No.61301294)、2016年广东省大学生创新训练计划项目(No. 201610572084)。
• 47 •
ELECTRONICS WORLDɾ探索与观察
MFSK信号表示式如式(3-13)所示。 展开得:
Hale Waihona Puke 结合式(3-14),可得MFSK信号正交调制表达式:
3.6 M进制移相键控信号的正交调制
相关主题