当前位置:文档之家› 基于标签匹配的协同过滤推荐算法研究

基于标签匹配的协同过滤推荐算法研究

Ab s t r a c t : W i t h t h e is r i n g o f mi c r o —b l o g g i n g u s e r s , mi c r o b l o g i n f o r ma t i o n c a p a c i t y h a s g r o wn r a pi dl y . F a s t r e c o mme n d a i t o n o f i n t e r e s t e d
f r i e n d s f o r mi c r o - b l o g g i n g u s e r s b a s e d o n t h e j u mb l e d mi c r o b l o g i n f o r ma t i o n b e c o me s i n e v i t a b l e p r o b l e m. T h e r e f o r e f a c e d w i t h ma s s i v e
第2 7卷 第 7期 2 0 1 7年 Байду номын сангаас月
计 算 机 技 术 与 发 展
COMP UTE R I ECHN0L 0GY AND DE VEL OP MENT
Vo 1 . 2 7 No . 7
J u l y 2 01 7
基 于标 签 匹配 的协 同过 滤 推 荐 算 法 研 究

b a s e d c o l l a b o r a t i v e il f t e in r g r e c o mme n d a i t o n lg a o r i t h m ha s b e e n p r o p o s e d nd a a r co e mme n d e d f r i e n d s s y s t e m h a s b e e n e s t a b l i s h e d, i n
马婉 贞, 钱 育 蓉
( 新疆大学 软件 学院, 新疆 乌鲁木齐 8 3 0 0 0 0 )
摘 要: 随着 微 博用户 数 量的上 升 , 微博 信息量 成倍 增长 , 基 于冗杂 的微 博信 息 向微 博用 户快 速 推荐 感 兴趣 的 好友 是不 容
回避 的技术 问题 。针 对这 一 问题 , 基 于微博 大数 据 , 以H a d o o p为平 台 , H B a s e 为基 础 , M a p R e d u c e 为 编程 框 架 , 提 出 了基 于
d a t a o f mi c r o b l o g. wi t h Ha d o o p a s p l a fo t m r a n d Ma pRe d u c e a s p r o g r a m f r m e a nd a b a s e d o n HBa s e. a h y b id r a l g o i r t h m o f Ap r i o i& I r t e m
A p i f o i算法 与 I r t e m — b a s e d 协 同过 滤算法 的组 合算 法 , 并构建 了推 荐好 友 系统 。该 系 统通 过 A p i r o i算 法对 冗杂 的微 博 内容 f 记 录进 行频 繁项 集 的计算 , 得 出能表 达用 户喜好 的标 签 , 以提 升系 统 的时间性 能 ; 通过 I t e m— b a s e d 算 法对 标 签 进行 匹配 推 荐, 以缩 短 系统 的推 荐时 间以及 资源 占用 率 。为 了验 证所 构建 系统 的有 效性 和可 靠 性 , 分 别 进行 了两组 对 比实 验 , 第一 组
关键 词 : 协 同过滤算 法 ; 标签 计算 ; H a d o o p ; Ma p R e d u c e ; 标签 匹配
中图分 类号 : T P 3 0 1 . 6 文献标 识码 : A 文章 编号 : 1 6 7 3 — 6 2 9 X ( 2 0 1 7 ) 0 7 — 0 0 2 5 — 0 4 d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 3 — 6 2 9 X. 2 0 1 7 . 0 7 . 0 0 6
I nv e s t i g a t i o n o n Co l l a b o r a t i v e Fi l t e r i ng Re c o m me nd a t i o n Al g o r i t h m wi t h
Ta g Ma t c h i ng
算法 相 比 , 所 提 出算法 的运 行时 间缩 短了 2 4 %一 4 4 %; 与混 合 K— m e a n s 聚类算 法相 比 , 所 提 出算 法 在算法 运行 时间 和 C P U
占用 率 均有 1 . 2—1 . 5倍 的提升 。可 见 , 提 出 的算法 可显著 缩短 推荐 时 间 , 减少 资源 消耗 率 , 提 高推 荐效 率 。
实验 为添加 了 A p i f o i算 法 的协 同过滤 算法 与传 统协 同过 滤算 法在 时间性 能方 面 的对 比测 试 , f 第二组 实验 则 为 A p i f o i算法 r
混合 I t e m — b a s e d 协 同过 滤算法 与混 合 K— m e a n s 算 法 的对 比测试 。实验 结果 表 明 , 在庞 大 的微 博 容量 下 , 与传 统 协 同过 滤
MA Wa n - z h e n , Q I A N Y u - r o n g
( S c h o o l o f S o f t wa r e , X i n j i a n g U n i v e r s i t y , Ur u mq i 8 3 0 0 0 0, C h i n a )
相关主题