当前位置:文档之家› 不错的中文情感计算资源

不错的中文情感计算资源

不错的中文情感计算资源
情感计算是现在的研究热点,它的主要目标是使计算机能识别人类的情感,也就是需要建立完善的情感识别模型,但需要有大规模的情感语料支撑。

现在英文的情感数据有不少,但中文的不多,能免费下载的更不多。

笔者收集了一些不错的用于中文情感计算的免费资源,并给出下载的地址。

情感词典
1.知网的情感词典- /html/c_bulletin_2007.htm
由知网发布的词典,包括中文情感词典和英文情感词典
2.台湾大学的情感极性词典- /data/11837
包括2810个正极性词语和8276个负极性词语。

准确度很高
情感分析语料
3.酒店评论语料- /data/11936
谭松波整理的一个较大规模的酒店评论语料。

语料规模为10000篇。

语料从携程网上自动采集,并经过整理而成。

4.豆瓣网影评情感测试语料- /data/13539
来自豆瓣网对电影《ICE AGE3》的评论,评分标准均按照5 stars评分在网页中有标注。

语料至527页。

每页20条短评。

共计11323条评论
5.酒店、电脑与书籍的评论语料- /data/11937
数据量不太大,也有一些重复的数据
6.评论网页数据集- /data/12044
数据量不小,包括的电影和评论都不少。

相关主题