文本情感分析及其应用研究
随着互联网的快速发展,互联网已经成为当今信息传播的主要渠道,人们在知乎、微博、今日头条等留下了大量的有感情色彩和情感倾向性的评论信息,如果能从这些评论数据中提取出对应的情感信息和情感倾向性,将会推动用户决策、舆情监控和信息预测等领域的发展,在科学研究以及实际应用中具有很大的价值。
传统的用于解决文本情感分析的方法有基于语料库的方法、基于图模型的方法和基于机器学习的方法,这些方法都依赖于人工构造特征。
但随着数据量的急速增长和表达方式的丰富,基于人工特征的模型已经难于满足新的场景,亟待提出新的方法。
深度学习在模型设计、训练算法和计算性能等方面都提出了较大的改进,使得深度学习在图像识别和文本分类等领域取得较大的突破。
为此,本文基于深度学习方法研究文本情感分析具体研究工作及贡献包括:1.分析了基于BI-LSTM-CRF模型的情感词提取方法,提出了针对BI-LSTM-CRF模型的改进方法,通过输入序列和激活函数的优化,提高了模型的表示能力和泛化能力;2.分析了集成学习方法,设计了基于Stacking方法的集成学习框架,有效避免了大规模构建人工特征的问题,同时提升了模型的效率;3.以舆情趋势预测问题为背景,设计并实现了舆情趋势预测系统。