当前位置：文档之家› 【最新】推荐系统PPT模板完整版 (获奖作品) 图文

【最新】推荐系统PPT模板完整版 (获奖作品) 图文

计算读者相异性（续）
• 1.初次到来读者，采集读者信息后采用闵可夫斯基距离算法计算相异性，从而简单归结到
某一类型读者群中
• 2.对于经常借阅读者，由于采集数据较多，可以通过余弦相似性算法计算读者之间的距离
达到精确计算
• 3.对数据库中已有的读者信息，采用聚类模型把读者数据库中的读者划分为多个簇，即相
拓端咨询
基于频繁模式的推荐算法
• 完成对借阅室的借书历史纪录的整理和数据分析： • 采用A PRIORI算法建立了频繁模式
（发现哪些书籍经常被同时借出）
• 建立了强关联规则
（计算借了A书籍的同学可能同是借B数据的概率）
基于协同过滤推荐算法
• 完成了对读者的兴趣爱好、读书习惯的统计调
查
• 完成了统计读者对书籍的阅读体验、书籍评价、
分类等调查统计和分析
• 开发了基于协同过滤算法推荐算法，用作弱推
荐（准确度一般，时间短）（即具有相同（相似）兴趣爱好的读者可能对相同题材（类别）感兴趣）
基于主因子分析筛选变量
• 计算发现读者感兴趣的内容涉及变量实在太多，冒然分析会出现过拟合问题，即系统越学
对书籍内容进行分析
• 对于没有电子档的书籍，基本属性进行聚类分析，采用以点带面的推荐模型
（某计算出某本书籍为推荐书籍时，同一簇书籍也可以作为候选推荐书）
பைடு நூலகம்
• 鼓励读者为书籍添加标签，评分，评价，读后感，积累数据后可再次对书籍进行分析
系统后续改进（项目目标之外）
• 正在建立神经网络模型基于读者和书籍内容的学习
越傻，推荐结果出错
（如读者性别、年龄、专业、兴趣、平常读书习惯、
书籍题材、作者等等）
• 采用主因子分析方法，计算每个变量对推荐准确度的贡献率，采用最有价值的变量
（累计贡献率达80%的前6个变量）
计算读者之间的相异性
• 读者的属性是多元的、非对称的 • 采用多种模型计算读者之间的相异性 • 构造读者-属性、对象-对象结构的数据矩阵
学习读者与感兴趣书籍之间的关系，但是需要大量的读者和其喜欢的书籍信息来不断训练和测试，现在还需累积信息
• 尝试建立自然语言分析模型
此项基于贝叶斯概率模型和马尔可夫链的统计方法研究，过于困难，正在尝试
项目后续改进（续）
由于前期精力有限，目前项目完成了所有统计调查、数据整理分析、模型构建、算法实现，但只能在主机上分别运行多个程序进行分析预计4月底能够上线WEB版，将整合目前所有推荐算法，届时读者可以在校园网自由使用
似的读者划到一个圈子中，便于批量推荐新书到特定读者群
对书籍内容进行分析
• 对已有点子档的书籍进行基于内容的分析（以提高推荐准确度）
基于文字内容的分析，建立文字向量，采用余弦相似性算法，计算书籍的相似性，用作强推荐（准确度高，但耗时也多）
• 对没有电子档的书籍
1.OCR光学识别软件扫描成电子的，人工校正 2.爬虫程序从豆瓣读书，亚马逊爬起书籍的基本信息

e商务文档

【最新】推荐系统PPT模板完整版 (获奖作品) 图文

相关文档推荐：