当前位置:
文档之家› 基于社会化标注的博客标签推荐方法
基于社会化标注的博客标签推荐方法
:T , A b s t r a c t o i m r o v e t h e o f r e c o mm e n d e d t a s i n t h e b o l o s h e r e t h e a l o r i t h m s o f t a r e c o mm e n d a t i o n a n d r e l a t e d u a l i t p g g p g g q y , w o r k a r e s t u d i e d a n d a t a r e c o mm e n d a t i o n m e t h o d f o r b l o s b a s e d o n s o c i a l t a i n i s h a s t w o a d v a n t a e s . F i r s t r o o s e d . I t g g g g g g p p , t o e n s u r e t h e c o m r e h e n s i v e n e s s a n d u s a b i l i t o f t h e r e c o mm e n d e d t a s c a n d i d a t e t a s e t a r e s e l e c t e d f r o m t h e t a s o f s i m i l a r p y g g g , o s t s . S e c o n d o t b l o s b a s e d o n t h e r e l a t i o n s h i b e t w e e n s o c i a l t a s a n d b l o r e d u n d a n t t a s a n d u n f a m i l i a r t a s a r e r i d o f f r o m p g g p g g g g , t h e c a n d i d a t e t a s e t b a s e d o n T F I D F s i m i l a r i t t o i m r o v e t h e a c c u r a c a n d h i h e f f i c i e n c o f t h e r e c o mm e n d e d t a s . F i n a l l - g y p y g y g y t h e e x e r i m e n t s d e m o n s t r a t e t h e e f f e c t i v e n e s s o f t h e m e t h o d . p
T a r e c o mm e n d a t i o n f o r b l o s b a s e d o n s o c i a l t a i n g g g g g
1 1 2 , Z HAO Y a n a n D ONG J i n D ONG J i a l i a n - - g, g
( , ; 1.N o r t h C h i n a I n s t i t u t e o f C o m u t i n T e c h n o l o B e i i n 1 0 0 0 8 3, C h i n a p g g y j g , ) 2. I n s t i t u t e o f S o f t w a r e C h i n e s e A c a d e m o f S c i e n c e B e i i n 1 0 0 1 9 0, C h i n a y j g
2 0 1 2年1 2月 第3 3卷 第1 2期
计算机工程与设计
C OMP UT E R E NG I N E E R I NG AN D D E S I GN
D e c . 2 0 1 2 V o l . 3 3 N o . 1 2
:s ; t a i n t a r e c o mm e n d a t i o n c a n o n i c a l c o r r e l a t i o n a n a l s i s t e r m f r e u e n c i n v e r s e d o c u m e n t f r e u e n c - g g g g y q y q y y ; t a r e d u n d a n c m e t h o d g y
基于社会化标注的博客标签推荐方法
赵亚楠1 , 董 晶1 , 董佳梁2
( ) 1.华北计算技术研究所 , 北京 1 0 0 0 8 3; 2.中国科学院软件所 , 北京 1 0 0 1 9 0
摘 要 : 为了提高博客系统推荐标签的质量 , 分析了现有的标签推荐算法 及 相 关 技 术 , 提 出 了 一 种 基 于 社 会 化 标 注 的 博 客 标签推荐方法 。 该方法的优势在于 : 利用相似博客的社会化标签作为 候 选 标 签 集 , 确 保 了 推 荐 标 签 的 全 面 性 和 可 用 性 ; 基 于T F I D F 相似度方法定义筛选步骤去除候选标签集中冗余 和 冷 僻 的 标 签 , 提 高 了 推 荐 标 签 的 准 确 性 和 高 效 性 。 实 验 结 果 - 表明了该方法的有效性 。 关键词 : 社会化标注 ; 标签推荐算法 ; 典型相关分析 ; 文本特征加权方法 ; 标签冗余 )1 中图法分类号 : T P 3 9 1 文献标识号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 2 2 4 6 0 9 0 5 - - -