当前位置:文档之家› 第13章 家用电器用户行为分析及事件识别(1)

第13章 家用电器用户行为分析及事件识别(1)


智能家居是利用先进的技术,融合个性需求,将与家居生
活有关的各个子系统有机地结合在一起,通过网络化综合
智能控制和管理,实现“以人为本”的全新生活体验。 企业若能深入了解其产品在不同用户群的使用习惯,开发 新功能,就能开拓新市场,实现产品的智能化。根据家居 的智能化,分析客户行为,识别不同客户群的特征、加深
名称 状态记录 i 时间间隔阈值 符号
R i i {1, 2...n}
T
Ri 1 与 R i 之间的时间间隔
内部资料 泰迪科技()
gapi i {1, 2...理
2. 数据变换
b) 用水事件阈值寻优:根据水流量和停顿时间间隔的阈值划分一次完整 的用水事件。
《MATLAB数据分析与挖掘实战》配套PPT
更多下载: /ts/578.jhtml
家用电器用户行为分析及事件 识别
2016/11/8
目录
1 2 3 4
背景与挖掘目标 分析方法与过程 上机实验 拓展思考
内部资料 泰迪科技()
2
案例背景
保温时长A
加热时长A
保温时长B
加热时长B
用水时长A
停顿时长A
用水时长B
20:01:20 20:03:30 水温=49℃ 水温=46℃ 水流=70 水流=78 保温中 加热中 内部资料 泰迪科技() 用水开始时间 20:00:11
停顿开始时间 20:03:51
20:07:20 水温=50℃ 水流=0 保温中
6
分析方法与过程 初步分析:
热水器在状态发生改变或者有水流状态时,每2秒会采集一条流水数据 。因为用户行为不仅仅只有洗浴还存在其他的用水事件:比如洗手、洗 菜等,所以热水器采集的数据来自各种不同的用水事件。 基于热水器采集的数据,根据水流量和停顿时间间隔划分为不同大小的 时间区间,每个区间是一个可理解的一次完整用水事件,并以热水器一 次完整用水事件作为一个基本事件。 从独立的用水事件中识别出其中属于洗浴的事件。
18
当前设 置温度 50° C 50° C 50° C 50° C 50° C 50° C 50° C






内部资料 泰迪科技()
分析方法与过程 第4步:构建专家样本
热 水 事 件 1 2 3 4 5 6 7 8 起始 数据 编号 218 569 1077 1973 2320 2438 2693 2835 终止 数据 编号 344 965 1128 2236 2435 2606 2810 3033 开始时间 是否为洗浴 (1 表示是, 1 表示否) -1 1 -1 1 1 1 1 -1 总用水时 长 592 1008 468 661 550 649 298 624 总停顿 时长 304 46 269 23 165 201 8 5 平均停 顿时长 51 46 54 23 33 201 2 5 停顿 次数 6 1 5 1 5 1 4 1 用水时长 用水/ 总时长 0.5 1.0 0.4 1.0 0.7 0.7 1.0 1.0 总用 水量 13.0 50.6 7.1 32.2 13.5 22.6 15.1 41.0
内部资料 泰迪科技()
属性说明 热水器出厂编号 记录热水器处于某状态的时刻 热水器是否开机 即时加热 热水器处于对水进行加热的状态 热水器处于对水进行保温的状态 热水水流量大于等于10L/min为有水,否则为无 热水器中热水的实际温度 热水器热水的含量 热水器热水的水流速度 单位:L/min 热水器的一种节能工作模式 预约一个时间使用热水 不预约直接使用热水器 加热到设定温度还需多长时间 热水器加热时热水能够到达的最大温度
内部资料 泰迪科技()
7
分析方法与过程 总体流程:
业务系统 数据抽取
训 练 样 本 集 实 时 识 别 样 本 数 据
数据探索与预处理
建 模 样 本 数 据 预 处 理 后 的 数 据
建模& 应用
结果& 反馈
选择性抽取
数据集成
数 据 探 索 分 析
模型训练 模型评价 模 型 优 化
序 号 1 2 3 4 5 6 7 发生时间 20141019094636 20141019094638 20141019094640 20141019094658 20141019094715 20141019094717 20141019111443 开关机 状态 关 关 关 关 关 加热 中 关 关 关 关 关 保温 中 关 关 关 关 关 实际 温度 29° C 29° C 29° C 29° C 29° C 29° C 29° C 热水 量 0% 0% 0% 0% 0% 0% 0% 水流 量 0 16 13 0 20 0 0 加热剩 余时间 0 分钟 0 分钟 0 分钟 0 分钟 0 分钟 0 分钟 0 分钟
内部资料 泰迪科技()
挖掘目标 1. 根据热水器采集到的数据,划分一次完整用水事件;
2. 在划分好的一次完整用水事件中,识别出洗浴事件。
内部资料 泰迪科技()
5
目录
1 2 3 4
背景与挖掘目标 分析方法与过程 上机实验 拓展思考
内部资料 泰迪科技()
编程练习
内部资料 泰迪科技()
14
分析方法与过程 第3步:数据预处理
2. 数据变换
c) 属性构造:根据用水行为,需构造四类指标:时长指标、频率指标、 用水的量化指标以及用水的波动指标。
总用水时长
20:00:10 水温=50℃ 水流=0 保温中 20:00:12 水温=50℃ 水流=80 保温中 20:03:50 水温=46℃ 水流=70 加热中 20:03:52 水温=46℃ 水流=0 加热中 20:08:20 水温=50℃ 水流=0 保温中 20:08:22 水温=50℃ 水流=70 保温中 20:11:16 水温=46℃ 水流=80 加热中 20:11:18 水温=46℃ 水流=0 保温中
提示:经过实验分析,热水器设定温度为50摄氏度时,一次普通的洗浴时长为15分钟,总用水时长10分钟左 右,热水的使用量为10~15升。
内部资料 泰迪科技()
17
分析方法与过程 第3步:数据预处理
3. 缺失值处理:因存在网络故障等原因,导致用水数据状态记录缺失的情 况,需要对缺失的数据状态记录进行添加。其添加方法:用水状态记录 缺失的情况下,填充一条状态记录使水流量为0,发生时间加2秒,其余 属性状态不变。
10
分析方法与过程 第3步:数据预处理
1. 数据规约
a) 属性规约:因“热水器编号”、“即热”、“即时洗” 、“有无水流” 、 “预约洗”、 “节能模式”对建模无作用,可以去除。 b) 数值规约:当热水器“开关机状态”为“关”且水流量为0时,说明热水器 不处于工作状态,数据记录可以规约掉。
内部资料 泰迪科技()

停顿时间间隔为0~0.3分钟的频率很高,根据日常用水经验可以判 断其为一次用水时间中的停顿;停顿时间间隔为6~13分钟的频率 较低,分析其为两次用水事件之间的停顿间隔。两次用水事件的停 顿时间间隔分布在3~7分钟与现场实验统计用水停顿的时间间隔近 似。
内部资料 泰迪科技()
11
分析方法与过程 第3步:数据预处理
2. 数据变换:
a) b) c) d) 一次完整用水事件的划分 用水事件阈值寻优 属性构造 候选洗浴事件
属性构造 划分用水事件阈值寻优 一次完整用水事件划分
筛选“候选洗浴事件”
得到建模数据样本集
内部资料 泰迪科技()
12
分析方法与过程 第3步:数据预处理
对客户的理解等。(以热水器为例,分析客户行为)
针对不同的客户群提供个性化产品、改进新产品的智能化
的研发和制定相应的营销策略。
内部资料 泰迪科技()
3
原始数据情况
用户用水数据表:包括了洗浴、洗手、洗脸、洗菜、做饭等用水行为
热水器编 号 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 A1000001 发生时间 开关机 状态 开 开 开 开 开 开 开 开 关 关 关 关 即 热 开 开 开 开 开 开 开 开 开 开 开 开 加热 保温 中 中 开 开 开 开 开 开 关 关 关 关 关 关 关 关 关 关 关 关 开 开 关 关 关 关 有无 水流 无 无 无 无 无 无 无 无 有 有 有 有 实际 温度 47°C 47°C 48°C 48°C 49°C 49°C 50°C 50°C 50°C 50°C 50°C 50°C 热水 量 25% 25% 25% 25% 25% 25% 100% 50% 50% 50% 50% 50% 水 流 量 0 0 0 0 0 0 0 0 62 63 61 62 节能 模式 关 关 关 关 关 关 关 关 关 关 关 关 预约 即时 洗 洗 关 关 关 关 关 关 关 关 关 关 关 关 开 开 开 开 开 开 开 开 开 开 开 开 加热剩余 时间 4分钟 2分钟 2分钟 1分钟 1分钟 0分钟 0分钟 0分钟 0分钟 0分钟 0分钟 0分钟
4
当前设置 温度 50°C 50°C 50°C 50°C 50°C 50°C 50°C 50°C 50°C 50°C 50°C 50°C
20141019160 855 20141019160 954 20141019161 040 20141019161 042 20141019161 106 20141019161 147 20141019161 149 20141019172 319 20141019172 321 20141019172 323 20141019172 325 20141019172 331
9
相关主题