第45卷第$期V o l.45 N o.3计算机工程C o m p u te r E n g in e e rin g2019年3月M a rc h2019•开发研究与工程应用•文章编号:1000#428(2019)0$-0$00-09文献标志码:A中图分类号:TP183基于深度卷积神经网络模型的文本情感分类周锦峰,叶施仁,王晖(常州大学信息科学与工程学院,江苏常州213164)摘要:为高效提取不同卷积层窗口的文本局部语义特征,提出一种深度卷积神经网络(C N N)模型。
通过堆叠多个卷积层,提取不同窗口的局部语义特征。
基于全局最大池化层构建分类模块,对每个窗口的局部语义特征计算情感类别得分,综合类别得分完成情感分类标注。
实验结果表明,与现有C N N模型相比,该模型具有较快的文本情感分类速度。
关键词:情感分析;情感分类标注;深度学习;卷积神经网络;词向量中文引用格式:周锦峰,叶施仁,王晖.基于深度卷积神经网络模型的文本情感分类[J].计算机工程,2019,45(3):300-308.英文引用格式:Z H O U J in fe n g,Y E S h ire n,W A N G H u i. T ext sentim ent classification based on deep con volution al neuralnetw ork m o d e l*J].Com puter E n g in e e rin g,2019,45 (3) :300-308.Text Sentiment Classification Based on Deep Convolutional Neural Network ModelZ H O U J in fe n g,Y E S h ire n,W A N G H u i(School of Inform ation Science and E ngineering,Changzhou Universit;^,C hangzhou,Jiangsu 213164,C hina)[A b s tr a c t]This paper proposes a d e e p C o nvo lutio na l N eural N e tw ork(C N N)m odel to e ffic ie n tly extract semantic features o f d iffe re n t con volution al layer w indow s fo r te x t.The m odel avoids m anually specifying m u ltip lew indo w sizes and retains local semantic features o f diffe re n t w indow s by stacking a n u m b e r o f con volution al l C lassification m odules are b u ilt based on t he G lobal M a x P ooling(G M P)layer to calculate the category score f local semantic features o f each w in d o w.The m odel synthesizes these category scores to com plete the sentiment classification annotation.E xperim ental results show that the m odel has faster text sentim ent classificat o f other C N N m odels.[K e y w o r d s]sentim ent analysis;sentim ent classification a n n o ta tion;deep le a rn in g;C o nvo lutio na l N eural N e tw ork(C N N) ;w ord vectorD O I:10.19678/j.issn.1000-3428.0050043〇概述情感分析主要通过人类书写的文本分析和研究 人的意见、情感、评价、态度和情绪,是自然语言处理 (N a tu ra l La ng ua ge P ro c e ss in g,N L P)中最热门的研究 领域之一,并在数据挖掘、W e b挖掘和文本挖掘等应 用范畴得到广泛研究[16]。
例如,分析电商平台上对 已购商品的点评,群众对政府新颁布的政策法规的 讨论以及消费者对新产品或服务的反馈等。
每天数 以亿计的用户文本信息包含了丰富的用户观点和情 感极性,从中可以挖掘和分析出大量的知识和模式。
深度学习为经典数据挖掘任务提供了新的手 段。
卷积神经网络(C o n v o lu tio n a l N e u ra l N e tw o rk,C N N)是一种用于处理具有网状拓扑结构数据的深度神经网络(D eep N e u ra l N e tw o r k,D N N)。
C N N 通过卷积操作,组合低层特征形成更加抽象的高层特 征,使模型能够针对目标问题,自动学习特征。
在文 本情感分类应用中,C N N能够有效避免传统机器学 习方法所面临的样本特征表达稀疏、计算复杂等问题[4]。
目前,以C N N为基础的文本情感分类方法多数 是通过学习文本的一种窗口或多种窗口局部语义信 息,然后提取文本最大语义特征进行情感划分。
此 类方法在文本情感分类标注领域已取得较好的效 果。
但是目前在文本情感分类标注领域[56],甚至在 N L P的其他分类问题中[860],使用的C N N模型多数 采用一个或多个卷积层并行的结构。
C N N模型解 决情感分类标注问题时,为了充分捕捉语义的距离基金项目:国家自然科学基金(61272367);江苏省科技厅项目(BY2015027-12)。
作者简介:周锦峰(1978—),男,硕士,主研方向为机器学习、自然语言处理;叶施仁,副教授、博士;王晖(通信作者),讲师、博士。
收稿日期:2018-01-10修回日期:2018-02-27E-m a i l:zhouzhou9076@ 第45卷第3期周锦峰,叶施仁,王晖:基于深度卷积神经网络模型的文本情感分类301依赖[11],需要提取不同上下文窗口的局部语义信息,增强情感分类能力。
但是,卷积层并行的C N N 模型使用超参数设定有限种窗口大小,而且随着窗 口增加,模型计算量会大幅增加,训练效率和预测速 度也随之降低。
为提高模型计算效率,本文提出一种应用于全 局最大池化(G lo b a l M a x P o o lin g,G M P)层的深度卷 积神经网络(G M P-C N N)模型,进行文本情感分类标 注。
堆叠的卷积层能够逐层深入地提取窗口更大、抽象度更高的局部语义特征。
由特殊的卷积层和 G M P层构成的分类模块为不同窗口的局部语义特 征计算情感类别得分,得到文本情感分类标注,并采 用斯坦福情感树库(S tan fo rd S en tim en t T re e b a n k,S S T b)数据集以验证G M P-C N N模型情感分类标注 的有效性。
1相关工作文献[3]采用朴素贝叶斯模型、最大熵模型和支 持向量机模型对文本进行情感分类。
此后,以传统 机器学习为核心的情感分析模型层出不穷。
为提高 分类正确率,传统机器学习方法使用大量文本特征。
随着特征变多,训练样本在每个特征上的描述会变 得稀疏,机器学习的计算复杂性成倍增加。
由于文 本特征需要人工构造,因此特征越多,人工成本越大。
文献[12]提出分布式表示词向量的概念,从大 量未标注的语料库中无监督地学习词向量,通过向 量空间上的相似度表示文本语义上的相似度。
由词 向量序列构成文本的原始表示形式将文本内容的处 理简化为?维向量空间中的向量运算。
分布式表示 词向量的出现有效解决了 P N N输入部分对人工的 依赖,并推动P N N发展出新模型用于文本情感分类。
文献[13 ]将C N N应用在文本分类任务,并通过 实验证明基于C N N的文本分类模型能够获得比传 统机器学习模型更高的正确率。
文本情感分类标注 任务也属于文本分类任务,因此,作者使用C N N模 型完成情感分类标注任务。
文献[5]基于单词的构 造(以构成单词的字母为单位),提出C h a rS C N N模 型。
以C N N为基础的C h a rS C N N模型,采用2个并 行的卷积层分别学习单词的构造特征和句子的局部 语义特征,充分体现C N N对文本局部特征的抽象和 提取能力。
该模型在短文本情感分类时展示了较好 效果,有效论证C N N模型在进行句子情感分类标注 时的可行性。
文献[6]在C h a rS C N N模型基础上,并 行多个卷积层,学习多种窗口的文本局部特征。
对 于中文语料,该模型有效地完成情感二分类标注任务。
文献[7]使用 W o rd2V e c、G lo V e 和F astT e xt 多种词向量形成C N N模型的多通道输入,同时使用a v g池化方法代替m a x池化方法,对于英文和韩文影评语料,均取得较好的标注正确率。
目前,多数用于情感分类标注任务的C N N模型,在基础结构上类似于文献[13 ]提出的C N N模型,具有以下特点:1) 与计算机视觉领域应用的深度C N N不同,一 般使用多种卷积层的并行结构,或者只有一个卷积层。
2) C N N卷积核的大小需要与词向量维度匹配,这使得卷积核至少在一个维度上比较大。
3) 通常使用全连接层作为分类器,将卷积层学 习到的语义特征表示映射到样本标记空间。
尽管上述C N N模型在处理情感分类标注时,特别是情感二分类标注任务,应用效果良好,但是此类模型存在2个问题:1)受并行结构的限制,多提取一种窗口类型的局部语义特征需要增加一种并行的卷积层,模型在训练和预测过程中的计算量会大幅增加;2)作为分类器的全连接层参数量过大,特别是以多种窗口的局部语义特征向量作为输入的全连接层,使模型的训练和预测计算量增大,降低了模型速度,还会造成过拟合。
针对以上问题,本文提出G M P-C N N模型对文本进行情感分类标注。
2 G M P-C N N 模型如图1所示,经典的C N N模型解决情感分类标注问题时,通常采用多个池化层并行的结构。