当前位置:文档之家› 信息检索与搜索引擎

信息检索与搜索引擎

•关键问题
–相关性:一个查询结果是否包含所要查询内容•主题相关:文本和查询是否有话题内容相关,即,主题相关
•用户相关:查询结果与用户相关
•检索模型:是对查询与文档匹配过程的形式化表示,是排序
算法的基础
–评价问题:比较相关性、比较排序算法
•准确率:检索结果中相关文档比例
•召回率:全部相关文档中被检索出来的比例
•其他方法:如,日志数据、点击流数据(利用用户反馈)–注重用户的信息需求,为其提供更优质的服务•查询建议、查询扩展、相关反馈、知识图谱
•搜索引擎:信息检索技术在大规模文本集合上的实际应用
–搜索引擎被设计成各种不同的结构,
•网络搜索引擎,如google、yahoo!、百度、搜狗
•企业搜索引擎,如Autonomy
•桌面搜索引擎,如微软的Vista TM
–搜索引擎的关键问题
•有效的排序算法、评价及用户交互
•大规模数据的运行环境
•搜索引擎性能:响应时间、查询吞吐量、索引速度、增量更
新、覆盖率、时新性、可扩充性、可定制性
–搜索引擎的其他应用
•垃圾信息过滤、主题信息搜索,……。

相关主题