基于用户标签的推荐系统研究
\
\
研 究 与 开发
(收 集 用 户 信 息 )
J r
建 立用 户一 标签 模 型
上
计算 用户 相 似度
J ,
返回 推 荐结 果
1 推 荐 系统 模 型 框 罔
以 川 户为 基 石 } { : 的 协 同过 滤 的 f 1 _ j 发 点 是 与 用 户 兴 趣 爱好相州的另一组用 户. 就 是计 算 两 个 用 户 的 相 似 度 通 过 遍 历一 个用 户 的 关 注 和 粉 丝 .获 得 他 们 的所 有 标
签 、对大多数用户而 言 。 微博 的功能主要是获取信 息 .
而且是获取』 j j 户感 兴 趣 的 信 息 . 此 利 用 用 户 的关 注
冈 2 标签获取算法流程 图
②计算相似度 。相似度计算算法可 以用于计算用
户或项 目相 似度 以用户相似度计算 为例 .通过在用
户一 标 签 矩 阵 中 计 算 两 个 用 户相 似 标 签 的 个 数 . 可 以返
择的群组阅读 。 随着发展 . 这些 讯息可以被很 多方式 传 送, 包括 短信 、 即时讯息软件 、 电子邮件或 网页 。 为了提
供 给 用 户 更 好 的服 务 与 体 验 .微 博 系 统使 用 了一 套 用
签的推荐系统模型及 算法 。 并将其实现在微博系统上。
2 推 荐 系统 构 建
好、 个性 特长等 特征通过用户标签来体现 。 博 文标 签系
统 是 给 发 布 的微 博 内容 添加 标 签 , 用 来表示微博类 型。 标 签 系 统 是 将 具 有 相 同特 征 的 用 户 聚 类 在 一 起 .然 后 根 据 用 户 的 标 签 推 荐 具 有 相 同 圈 子 相 同标 签 的用 户 给
2 . 2 标 签 获 取 算 法
标签获取算法 主要是收集使用用户 的数 据 .如用 户 的基本信息 . 用户的登录地址 . 用户 的关注 好友和粉
丝好友 . 用 户 为 自己打 的标 签 等 数 据嘲 。
准确地搜索到他们需要的信 息
现 代 计 算 机 2 0 1 7 . 0 3 上 0
研 究s 开 发
文章 编 号 : 1 0 0 7 — 1 4 2 3 ( 2 0 1 7 ) 0 7 — 0 0 0 7 — 0 4
D OI : 1 0 . 3 9 6 9 6 . i s s n . 1 0 0 7 — 1 4 2 3 . 2 0 1 7 . 0 7 . 0 0 2
基 于用户标签 的推荐 系统研究
关键词 :
微博 : 协同过滤 : 用 户 标 签
基 金项 目 :
广 东省 本科 高 校 教 学 质 量 与 教 学 改 革 工 程 项 目( 粤 教 高 函[ 2 0 1 5 1 1 3 3 号)
1 微 博 与标 签 系统 概 述
微博客 ( M i c m b l o g g i n g或 M i c r o b l o g ) 是 一 种 允 许 用 户及时更新剪短文本 ( 通常少 于 1 4 0字 ) 并 可 以公 开 发 布 的博 客形 式 『 l 1 它 允许 任何 人 阅读 或 者 只能 由用 户 选
本 文 研 究 的 目标 是 如 何 通 过 T h i n k P HP搭 建 起 微
博 平 台 .并 且 利 用 新 浪 微 博 上 的 真 实 用 户 数 据 模 拟 原
始生态坏境 . 通过对三维 的系统进行降维 。 重点研 究 了
用 户一 用户关系 、 标签一 标签关系 , 提 出 了相 关 的 基 于 标
一
次 注册 时 由于 现 实世 界 的朋 友 并 没有 使用 本 系统 . 可
以利用用户浏览本 网站时搜 集到 的信息尝试 向其 推荐
些 明 星用 户 、 相 同地 区 的 用 户 . 当用 户 填 写 了 标 签 等
资料以后 . 可 以使用标签推荐系统 向其推荐具 有相 同标
签 及相 同圈 子 的用 户[ 5 1 推 荐 系统 模 型如 图 l 所 示
朱子江 . 刘寿 强
( 广 东 外 语 外 贸 大 学 南 国商 学 院 , 广州 5 1 0 5 4 5 )
摘要 :
在标 签 系统 中用 户 可 以随 意 上 传 资 源 , 并 且 允 许 使 用 任 意 的 称 为 标 签 的 文 字 对 资 源 进 行 标 注 。结 合 协 同过 滤 推 荐 技 术 开发 微 博 系 统 , 通过获取新浪微博真实用户数据进行实验分析 , 验证 所 提 出 的模 型 及 相关 算 法 的 有 效 性 , 并 根 据 实 验 提 出 面 向用 户 的推 荐 策 略
络系统最重要 的模块 .用户 使用微博系统就 是为 了与
其他用户进行信息交流 . 以 及 日常 的 联 系 等 。 作 为 一 个 以用 户 为 中心 的 系统 . 用 户 是 网站 最 宝 贵 的信 息 . 应 该 为 用 户 提 供更 好 的 服 务 和体 验 。 对于一个用户来说 , 第
2 . 1 推荐 系统模 型
推荐 系统 是 S N S ( S o c i a l N e t w o r k S e r v i c e s ) 社交 网
Hale Waihona Puke 户标签系统 . 更 容易将各种信息分类 标签系统又可细
分 为 用 户 标 签 系 统 和 博 文 标 签 系 统 .用 户 个 人 兴 趣 爱
一
其关注翻 。因为微博是一个信 息传递类 的社交 系统 , 用
户 与 用 户 的 关 系 是 可 以 根据 社 会 学 研 究 的 .而 标 签 系 统 则 可 以很 好 地 计 算 用 户 的好 友 圈 子 和 交 友 方 向 一 方面 . 通 过 收 集 博 文 的标 签 . 更 能 准 确 地 算 出用 户 平 时 的一些行为 , 分 析 出用 户 的 固 有 特 性 。另 一 方 面 . 越 来 越 多 的用 户 希 望 系统 向 他 们 推 荐 能 反 映 个 人 爱 好 和 意 愿 的具 有 个 性 化 特 征 的 标 签 .以 便 在 日后 能 更 迅 速 更