Mahout技术预研报告版本:V1.0修订记录目录1简介................................................................................................................. 错误!未定义书签。
1.1编写目的....................................................................................... 错误!未定义书签。
1.2背景............................................................................................... 错误!未定义书签。
1.2.1任务的提出..................................................................... 错误!未定义书签。
1.2.2使用者............................................................................. 错误!未定义书签。
1.3参考资料....................................................................................... 错误!未定义书签。
2协同过滤机制分析 ......................................................................................... 错误!未定义书签。
2.1基于协同过滤的推荐机制基本原理 ........................................... 错误!未定义书签。
2.2基于用户的协同过滤推荐 ........................................................... 错误!未定义书签。
2.3基于项目的协同过滤推荐 ........................................................... 错误!未定义书签。
2.4S LOPE O NE协同过滤推荐 ............................................................... 错误!未定义书签。
2.5协同过滤各种算法比较 ............................................................... 错误!未定义书签。
3相似度的计算................................................................................................. 错误!未定义书签。
3.1皮尔逊相关系数(P EARSON C ORRELATION C OEFFICIENT)................. 错误!未定义书签。
3.2欧几里德距离(E UCLIDEAN D ISTANCE).......................................... 错误!未定义书签。
3.3C OSINE 相似度(C OSINE S IMILARITY)............................................ 错误!未定义书签。
3.4修正的余弦相似性 ....................................................................... 错误!未定义书签。
3.5S PEARMAN秩相关系数--S PEARMAN C ORRELATION................................. 错误!未定义书签。
3.6T ANIMOTO 系数(T ANIMOTO C OEFFICIENT)........................................ 错误!未定义书签。
3.7对数似然相似度 ........................................................................... 错误!未定义书签。
3.8曼哈顿距离................................................................................... 错误!未定义书签。
4降维算法分析................................................................................................. 错误!未定义书签。
4.1主成分分析................................................................................... 错误!未定义书签。
4.2奇异值分解................................................................................... 错误!未定义书签。
5关联规则挖掘算法分析 ................................................................................. 错误!未定义书签。
5.1概要............................................................................................... 错误!未定义书签。
5.2并行FP G ROWTH算法(P ARALLEL FP G ROWTH A LGORITHM) ............... 错误!未定义书签。
6聚类算法分析................................................................................................. 错误!未定义书签。
6.1概要............................................................................................... 错误!未定义书签。
6.2各种聚类算法 ............................................................................... 错误!未定义书签。
6.2.1K均值(K-means)...................................................... 错误!未定义书签。
6.2.2模糊K均值(Fuzzy K-means)................................... 错误!未定义书签。
6.2.3Canopy聚类(Canopy Clustering).......................... 错误!未定义书签。
6.2.4均值漂移聚类(Mean Shift Clustering) ................... 错误!未定义书签。
6.2.5EM聚类(Expectation Maximization)........................ 错误!未定义书签。
6.2.6狄利克雷聚类算法......................................................... 错误!未定义书签。
7分类算法分析................................................................................................. 错误!未定义书签。
7.1概要............................................................................................... 错误!未定义书签。
7.2各种分类算法 ............................................................................... 错误!未定义书签。
7.2.1逻辑回归算法................................................................. 错误!未定义书签。
7.2.2贝叶斯算法..................................................................... 错误!未定义书签。
7.2.3SVM(支持向量机)....................................................... 错误!未定义书签。
7.2.4神经网络......................................................................... 错误!未定义书签。
7.2.5HMM (隐马尔科夫模型)................................................. 错误!未定义书签。
7.2.6决策树............................................................................. 错误!未定义书签。
1简介1.1编写目的通过对Apache Mahout开源框架和推荐系统相关技术的学习,归纳出推荐系统领域目前的主要相关算法以及这些算法的应用场景及优缺点,为后续“金融产品推荐”产品提供理论支持和技术储备。
1.2背景1.2.1任务的提出。
1.2.2使用者金融产品推荐项目组开发者。
1.3参考资料参考资料主要来源于互联网和相关算法的论文。
2协同过滤机制分析2.1基于协同过滤的推荐机制基本原理协同过滤是利用集体智慧的一个典型方法。