当前位置：文档之家› 金融预料的情感分析ppt

金融预料的情感分析ppt

8019句
实验二----多实体
多实体实验
85.00% 84.00% 83.00% 82.00% 81.00% 80.00% 79.00% 78.00% word-lstm word-ian word-ataelstm word-atlstm word-ram 80.61% 81.06% 81.64% 81.84% 83.43%
84.61%
word-cnn
3736句
实验三----单、多实体混合
总体实验
82.00% 81.50% 81.00% 80.50% 80.00% 79.50% 79.00% 78.50% 78.00% 79.06% 79.16% 79.86% 80.23% 81.64%
77.50%
IAN AT-LSTM ATAE-LSTM acc RAM CNN
• 根据数据集的不同，对当前已有的深度学习模型进行三种实验，并选择最优的几种模型结果作为展示。
实验一----单实体
单实体实验
81.00% 80.00% 79.00% 78.00% 77.00% 76.00% 75.00% 8019句 76.89% 80.09% 78.26% 78.47% 78.72% 79.01%
提升模型效果的调研
1.调研模型融合的各个方法
o 对结果的处理
• 投票法 • 平均法
o 对数据集的处理
• Bagging • Boosting
• Stacking
2.一篇半监督学习论文
对模型结果的融合
o 对结果的处理
• 投票法：多个模型投票制，投票多者为最终分类结果
加权投票：投票环节，性能优异的模型赋予更多的票数 • 平均法：对多个模型结果去平均，作为最终结果
,2,0.35000098 ,3,0.35000111）（0，1）均匀分布后（0.33 ,0.0 ,0.66 ,1.0）
对模型数据集的处理 o 对数据集的处理
• Bagging：将数据集重采样分成若干份训练若干个分类器后，组合成一个强分类器
• Boosting ：通过迭代的方式，每一次给错误样本增加权重，生成若干个分
iii
项目
文本情感分析
总述
1.深度学习模型实验
• • • 单实体金融新闻语料实验多实体金融新闻语料实验单、多实体混合金融新闻语料实验
2.提高深度学习模合
半监督学习的方法
深度学习模型实验
• 当前数据集共有8019句单实体，3736句多实体，共有CNN、RAM、IAN、ATAE-LSTM、AT-LSTM、LSTM等模型。
深度学习模型实验小结
• 深度学习模型在处理单实体金融新闻语料中，各模型准确率分布在76.89%-80.09%之间，其中RAM模型的准确率最高，为80.09%。 • 深度学习模型在处理多实体金融新闻语料中，各模型准确率分布在80.61%-84.61%之间，其中CNN模型的准确率最高，为84.61%。 • 深度学习模型在处理单实体、多实体混合的金融新闻语料中，各模型的准确率分布在79.06%-81.64% 之间，其中CNN模型的准确率最高，为81.64%。 • 以上结果都是用词向量表征文本数据，因字向量的方法准确率较低（低于词向量3%左右）。 • 对各模型进行优化尝试，同时对模型进行数据分析，模型结果的简单融合，但都无法取得指标的提高。
• 排名平均（Rank averaging）：先对结果进行排序，之后将结果以排
名均匀分布至（ 0 ， 1 ）之间。例如（ 0.35000056 ,0.35000002 ,0.35000098 ,0.35000111 ）排名后为（ 1,0.35000056 ,0,0.35000002
类器后组合在一起。
• AdaBoost
• Stacking ：数据集 k 次折叠 [ 将原训练集分成新训练集 (k-1/k) 和测试集
（1/k）]训练模型，若干个模型预测的结果作为第二层的特征，用来训练输
出最终结果。
半监督学习论文
利用少量标注数据+大量带噪音数据，获取更好的模型训练结果

e商务文档

金融预料的情感分析ppt

相关文档推荐：