当前位置:文档之家› 工业感知大数据获取与计算

工业感知大数据获取与计算


工业大数据的泛在性
电梯安全
汽车生产
飞机引擎监测
纺织
造纸
化工
制药
家具
工业大数据特点
1. 行业相关性
感知数据具有很强的行业相关性,从 而具有不同的潜在逡辑机理关系。
2. 流程关联性
产品各个阶段产生的感知数据之间相 亏关联、相亏影响。
工业大数据特点
3. 价值时效性
当前时刻产生的数据如果不迅速转变 为可以支持决策的信息,其价值就会 随时间流逝而迅速减退。
智能设备 智能制造 智能产品
为企业和用户创造最大价值
智能服务
工业大数据
• 是在工业领域信息化相关应用中所产生的 海量数据
• 产品数据、环境数据、使用数据 • 工业大数据来源亍产品全生命周期的各个环节: • 需求、设计、原料、制造、仓储、物流、销售、
消费等各个环节
企业 产业链 外部数据
产品 生命期
再利用
报告内容
一、工业大数据与其应用 二、工业感知大数据挑战 三、一些探索及部分结果
部分研究结果(一)
感知数据的高质量获取
部分研究结果(一)
• 感知大数据例1
• 现代化工业制造生产线安装有数以千计的小型传
感器
• 探测温度、压力、热能、振动和噪声 • 每隔几秒就收集一次数据 • 利用这些数据可以实现:
4. 模态多样性
x1
y11 y12
y1n
x
x2
Y
y
21
y22
y2n
感知数据的类型越来越丰富,既包含
xn
ym1 ym2
ymn
温度、湿度、光强等结构化数据,也
包括图像、音视频等非结构化数据
工业大数据特点
22.3 ℃
5.质量低劣性
23 ℃
不精确
NULL 失效
23 ℃
22.5 ℃ 24.5 ℃ 23 ℃ 不一致
工业感知大数据获取与计算
技术创新,变革未来
报告内容
一、工业大数据的泛在性 二、工业大数据关键问题 三、一些探索及部分结果
正在来临第四次工业革命
第四次工业革命与大数据
数据
工业互联网(以数据为中心)
执行
获取 互联网、物联网、无线网、电信网、传感网
控制
工业
分析
大数据
挖掘
信息
决策
知识
制定
控制 决策
智能设计
• 在马航MH370失联客机搜寻过程中,波音公司获 取的发动机运转数据对亍确定飞机的失联路径起到 了关键作用。
• 智能感知是工业智能系统的基础。
• 高质量数据采集是后续分析挖掘的保障
• 一个设备的全生命期信息
• 设备运行的状态信息
• 设备运行的工况信息
感知数据
• 设备使用中的环境信息
• 维护保养信息
不 完低整精度传感器及环境干扰造 不一成采致样感频知率数、据感不精知确节。点失效、数
不 及据证感因得据数当时数据丢知采时集据不在失集,成数中一仸等、环来据含致意传因境自。有。时输素、亍过刻、影用不时获更响途同数得新等数,据全等因据无。延部素源法迟实的造保使时数成
工业大数据的关键技术问题
问题1:工业大数据的获取、传输与融合? 问题2:低质量工业大数据管理与计算? 问题3:工业大数据的自然规律? 问题4:工业大数据的计算、分析与挖掘? 问题5:工业大数据的计算平台?
加大等频数据采集的频 率可行吗?
加大采集频率意味着: 1. 产生更加庞大的感知
数据 2. 加重数据存储与传输
的负担
变频数据采集是否可行?
部分研究结果(一)
基于Hermit插值的变频数据采集算法
将时间轴分成若干时间区间
采样频S率am调ple节Se过nse于d V频alu繁es 、in [数tc-1据,tc]采集次数较 多 曲线光滑度不高、二阶间断点多
基于三次样条插值的变频数据采集算法
思想:一段时间调整一次数据采集频率 若干时间区间构成一个时间窗口 一个时间窗口内进行等频采样,不同窗口间调整采样频率
主要步骤
在[Tk,Tk+1]内采集数据点 计算[Tk,Tk+1]内的近似物理过程(感知)曲线
k<=m
预测下一个时间窗口[Tk+1,Tk+2]的数据采集周期
• ……
部分研究结果(一)
• Why?
人类通过感知数据获得信息:两个阶段
都可能产生 质量问题!
现有计算方法: 1. 仅感考知虑数如据何解决第二阶段的问题 2. 均以计等算频数据采集为前提
连续过程 离散化
部分研究结果(一) • 问题?
等频数据采集可行吗?
曲线失真,关键数据特征或变化要素丢失!
部分研究结果(一) • 问题?
• 设备诊断、用电量分析、能耗分析、质量事故分析(包括违反 生产规定、零部件故障)等。辅助生产工艺的改进
部分研究结果(一)
• 感知大数据例2
• 在波音的飞机上,发动机、燃油系统、液压和
电力系统等数以百计的变量组成了在航状态, 这些数据不到几微秒就被测量和发送一次。
• 波音737发动机在飞行中每30分钟就能产生10TB 数据。
Sampling based Algorithms
只能支持特定的简单计算(e.gaggregation .etc) 无法恢复原始数据信息
Compression Algorithms
大多数分布式压缩方法仅考虑如何减少数据收集过 程中的代价
需要解压才能进行计算 增加额外开销
Temporal and Spatial-Correlation based Algorithms Data Reduction Algorithms
tc<=tf
DeteCrmoimneputhteeSneenxstesdamCuplrivneg timine [tct+c-11,,ttcc]= tc+1
tc is current sampling time tc-1 is the last sampling time beforetc
部分研究结果(一)
ε-Dominant Dataset 获取与计算
部分研究结果(二)
Why?
尽管工业大数据的规模极其庞大,然而
很多数据之间存在着极强的时空相关性 冗余信息量大 一个小数据子集即可保证携带整个数据集的
主要信息
D o More
with Less !
Hale Waihona Puke 部分研究结果(二)现有的Do More with Less方法
部分研究结果(一)
理论分析结果
输出曲线的光滑度 一阶导数误差
H-Based算法
S-Based 算法
一阶光滑、二阶间断点多 一阶光滑、二阶间断点少
二阶导数误差
数据采集次数
计算复杂度
实验结果
精确度 通信传输
计算量小
计算量大
H-based算法 较高 较大
S-Based算法 较低 较小
部分研究结果(二)
相关主题