当前位置:文档之家› 简述向量空间模型的优缺点

简述向量空间模型的优缺点

简述向量空间模型的优缺点:
优点在于:
(1)该模型的权重计算方法能够提高系统的检索性能;
(2)模型中使用的部分匹配方法能检索出与用户的查询输入条件“近似”的文档;
(3)在模型中可以根据检索出的结果与查询条件的相关程度对结果进行排序。

另外,向量空间模型计算简单,检索速度快。

缺点在于:
维度独立性:向量空间模型假设词与词是相互独立的,但实际应用中,很多词汇语义上都是相互关联的(所以事实上这也就是无法解决一词多义、同义词的问题)。

内容层次浅:向量空间模型不考虑词的顺序,这种方法也叫词袋法,就是把所有词一股脑都放在一个袋子里,但事实上不考虑词的顺序,词汇集合能够提供有价值的信息非常有限。

向量维度高:向量空间模型中,维度和我们所建立的词表的规模一致。

也就是说,有多少个词,就有多少个维度。

现实应用中,通常词表的规模非常大,所以模型的维度非常高,但有些词的价值根本不大,这就浪费了巨大的计算空间和时间。

相关主题