当前位置:文档之家› 【最新】推荐系统PPT模板完整版 (获奖作品) 图文

【最新】推荐系统PPT模板完整版 (获奖作品) 图文


计算读者相异性(续)
• 1.初次到来读者,采集读者信息后采用闵可夫斯基距离算法计算相异性,从而简单归结到
某一类型读者群中
• 2.对于经常借阅读者,由于采集数据较多,可以通过余弦相似性算法计算读者之间的距离
达到精确计算
• 3.对数据库中已有的读者信息,采用聚类模型把读者数据库中的读者划分为多个簇,即相
拓端咨询
基于频繁模式的推荐算法
• 完成对借阅室的借书历史纪录的整理和数据分析: • 采用A PRIORI算法建立了频繁模式
(发现哪些书籍经常被同时借出)
• 建立了强关联规则
(计算借了A书籍的同学可能同是借B数据的概率)
基于协同过滤推荐算法
• 完成了对读者的兴趣爱好、读书习惯的统计调

• 完成了统计读者对书籍的阅读体验、书籍评价、
分类等调查统计和分析
• 开发了基于协同过滤算法推荐算法,用作弱推
荐(准确度一般,时间短) (即具有相同(相似)兴趣爱好的读者可能对 相同题材(类别)感兴趣)
基于主因子分析筛选变量
• 计算发现读者感兴趣的内容涉及变量实在太多,冒然分析会出现过拟合问题,即系统越学
对书籍内容进行分析
• 对于没有电子档的书籍,基本属性进行聚类分析,采用以点带面的推荐模型
(某计算出某本书籍为推荐书籍时,同一簇书籍也可以作为候选推荐书)
பைடு நூலகம்
• 鼓励读者为书籍添加标签,评分,评价,读后感,积累数据后可再次对书籍进行分析
系统后续改进(项目目标之外)
• 正在建立神经网络模型基于读者和书籍内容的学习
越傻,推荐结果出错
(如读者性别、年龄、专业、兴趣、平常读书习惯、
书籍题材、作者等等)
• 采用主因子分析方法,计算每个变量对推荐准确度的贡献率,采用最有价值的变量
(累计贡献率达80%的前6个变量)
计算读者之间的相异性
• 读者的属性是多元的、非对称的 • 采用多种模型计算读者之间的相异性 • 构造读者-属性、对象-对象结构的数据矩阵
学习读者与感兴趣书籍之间的关系,但是需要大量 的读者和其喜欢的书籍信息来不断训练和测试,现在还 需累积信息
• 尝试建立自然语言分析模型
此项基于贝叶斯概率模型和马尔可夫链的统计方法研 究,过于困难,正在尝试
项目后续改进(续)
由于前期精力有限,目前项目完成了所有统计调查、数据整理分析、模型构建、算法实现, 但只能在主机上分别运行多个程序进行分析 预计4月底能够上线WEB版,将整合目前所有推荐算法,届时读者可以在校园网自由使用
似的读者划到一个圈子中,便于批量推荐新书到特定读者群
对书籍内容进行分析
• 对已有点子档的书籍进行基于内容的分析(以提高推荐准确度)
基于文字内容的分析,建立文字向量,采用余弦相似性算法,计算书籍的相似性,用作 强推荐(准确度高,但耗时也多)
• 对没有电子档的书籍
1.OCR光学识别软件扫描成电子的,人工校正 2.爬虫程序从豆瓣读书,亚马逊爬起书籍的基本信息
相关主题