当前位置:文档之家› 金融预料的情感分析ppt

金融预料的情感分析ppt


8019句
实验二----多实体
多实体实验
85.00% 84.00% 83.00% 82.00% 81.00% 80.00% 79.00% 78.00% word-lstm word-ian word-ataelstm word-atlstm word-ram 80.61% 81.06% 81.64% 81.84% 83.43%
84.61%
word-cnn
3736句
实验三----单、多实体混合
总体实验
82.00% 81.50% 81.00% 80.50% 80.00% 79.50% 79.00% 78.50% 78.00% 79.06% 79.16% 79.86% 80.23% 81.64%
77.50%
IAN AT-LSTM ATAE-LSTM acc RAM CNN
• 根据数据集的不同,对当前已有的深度学习模型进行三种实验,并选择最优的几种模型结果作为展示。
实验一----单实体
单实体实验
81.00% 80.00% 79.00% 78.00% 77.00% 76.00% 75.00% 8019句 76.89% 80.09% 78.26% 78.47% 78.72% 79.01%
提升模型效果的调研
1.调研模型融合的各个方法
o 对结果的处理
• 投票法 • 平均法
o 对数据集的处理
• Bagging • Boosting
• Stacking
2.一篇半监督学习论文
对模型结果的融合
o 对结果的处理
• 投票法:多个模型投票制,投票多者为最终分类结果
加权投票:投票环节,性能优异的模型赋予更多的票数 • 平均法:对多个模型结果去平均,作为最终结果
,2,0.35000098 ,3,0.35000111)(0,1)均匀分布后(0.33 ,0.0 ,0.66 ,1.0)
对模型数据集的处理 o 对数据集的处理
• Bagging:将数据集重采样分成若干份训练若干个分类器后,组合成一个强分类器
• Boosting :通过迭代的方式,每一次给错误样本增加权重,生成若干个分
iii
项目
文本情感分析
总述
1.深度学习模型实验
• • • 单实体金融新闻语料实验 多实体金融新闻语料实验 单、多实体混合金融新闻语料实验
2.提高深度学习模合
半监督学习的方法
深度学习模型实验
• 当前数据集共有8019句单实体,3736句多实体,共有CNN、RAM、IAN、ATAE-LSTM、AT-LSTM、LSTM等模型。
深度学习模型实验小结
• 深度学习模型在处理单实体金融新闻语料中,各模型准确率分布在76.89%-80.09%之间,其中RAM模 型的准确率最高,为80.09%。 • 深度学习模型在处理多实体金融新闻语料中,各模型准确率分布在80.61%-84.61%之间,其中CNN模 型的准确率最高,为84.61%。 • 深度学习模型在处理单实体、多实体混合的金融新闻语料中,各模型的准确率分布在79.06%-81.64% 之间,其中CNN模型的准确率最高,为81.64%。 • 以上结果都是用词向量表征文本数据,因字向量的方法准确率较低(低于词向量3%左右)。 • 对各模型进行优化尝试,同时对模型进行数据分析,模型结果的简单融合,但都无法取得指标的提 高。
• 排名平均(Rank averaging):先对结果进行排序,之后将结果以排
名 均 匀 分 布 至 ( 0 , 1 ) 之 间 。 例 如 ( 0.35000056 ,0.35000002 ,0.35000098 ,0.35000111 ) 排 名 后 为 ( 1,0.35000056 ,0,0.35000002
类器后组合在一起。
• AdaBoost
• Stacking : 数 据 集 k 次 折 叠 [ 将 原 训 练 集 分 成 新 训 练 集 (k-1/k) 和 测 试 集
(1/k)]训练模型,若干个模型预测的结果作为第二层的特征,用来训练输
出最终结果。
半监督学习论文
利用少量标注数据+大量带噪音数据,获取更好的模型训练结果
相关主题