5.4计算模型预测法
P 11 0.7, P 12 0.2, P 13 0.1
原有疑似矽肺者一般不可能恢复为健康者,仍保持原状者为80%,有20% 被正式定为矽肺,即:
P21 0, P22 0.8, P23 0.2
5.4.2马尔可夫链预测法
4.马尔可夫链预测法实例(P168) 矽肺患者一般不可能恢复为健康或返回疑似矽肺,即
y
0
x
0
x
y a bx
y y
0
x
x
y a bx
2、一元非线性回归法 【例5-5】某企业某年每个月的工伤人数的统计数据见表5-7,用指数函数y=aekx进行 回归分析(保留三位有效数字)(课本P167)。
2、一元非线性回归法【例5-5】
2、一元非线性回归法【例5-5】
事故预测回归曲线 r=-0. 87,说明用指数曲线进行分析,在一定程度上反映了该矿工伤人数的趋势。
2 2 2
• 回归直线的方程为: y 24.3 1.77 x • 在坐标中画出回归线,如图3-3所示。
Ex1线性回归预测法:顶板事故死亡统计(3/4)
40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 x
y
y=24.3-1.77x
图 3-4 一元回归直线图
该分析计算还缺少什么?
a
2 x xy x y
( x ) 2 n x 2
55 657 385 146 24.3 2 55 10 385
x y n xy 55 146 10 657 b 1.77 ( x ) n x 55 10 385
第(n-2)次结果等,而与更早的结果无关。
一般的设随机过程ξ(t),如果在已知时间t系统处于状态x的条件下,在时刻T(T>t)系
统所处状态和时刻t以前所处的状态无关,则称ξ(t)为马尔可夫过程。 从定义可知马尔可夫过程只与t时刻有关,与t时刻以前无关。或者说过程“将来”
的情况与“过去”的情况是无关的.
j 1 n
满足这两个性质的行向量称为概率向量。 状态转移概率矩阵的所有行向量都是概率向量;反之所有行向量都是概率向量组成
的矩阵,即为概率矩阵。
5.4.2马尔可夫链预测法
4.马尔可夫链预测法实例(P168)
某单位对1250名接触矽尘人员进行健康检查时,发现职工的健康状况分布见表5-8。
根据统计资料,前年到去年各种健康人员的变化情况如下(即转移概率值): 健康人员继续保持健康者有70%,有20%变为疑似矽肺,10%的人被定为 矽肺,即:
r 0.8 时,认为两个变量有很强的线性相关性。
Ex1线性回归预测法:顶板事故死亡统计(1/4)
表3-1
时间顺序x 1 2
某矿务局近10年来顶板事故死亡人数统计
死亡人数y 30 24 x2 1 4 xy 30 48 y2 900 567
3 4
5
18 4
12
9 16
25
57 16
60
324 16
还应求出相关系数r。其计算公式如下:
相关系数r=1时,说明回归直线与实际数据的变化趋势完全相符;r=0时,说明x
与y之间完全没有线性关系。
在大部分情况下,0 r 1。这时,就需要判别变量x与y之间有无密切的线性相 关关系。一般来说,r越接近1,说明x与y之间存在着的线性关系越强,用线性回归 方程来描述这两者的关系就越合适,利用回归方程求得的预测值就越可靠。通常
P 11 P 21 P31
P 12 P22 P32
P 13 P23 P33
0.7 0.2 0.1 1000 200 50 0 0 . 8 0 . 2 0 1 0
一年后健康者人数 s1 为:
(0) (0) s1(1) s1( 0) , s2 , s3
P31 0, P32 0, P33 1
状态转移概率矩阵为:
0.7 0.2 0.1 P 0 0 . 8 0 . 2 0 1 0
试预测来年接尘人员的健康状况。 解:一次转移向量:
( 0) (0) ( 0) s (1) s ( 0 ) P s1 , s2 , s3
故回归直线的方程为: 在坐标系中画出回归直线
Ex2线性回归预测法:企业伤亡事故预测
解:将表中相关数据代入可得:
5. 4计算模型预测法 5.4.1回归分析法
2.一元非线性回归法 在回归分析法中,除了一元线性回归法外,还有一元非线性回归分析法,多元 线性回归分析法、多元非线性回归分析法等。
非线性回归的回归曲线有多种,选用哪一种曲线作为回归曲线,则要看实际数据
张三在第(n+1)年 处于健康的概率
这样一个状态随着时间的进展随机变化的链式过程
张三在第(n+1)年 处于疾病的概率
就是马尔科夫链。
5.4.2马尔可夫链预测法
3.马尔可夫链预测法 若事物未来的发展及演变仅受当时状况的影响,即具有马尔可夫性质,且一种状 态转变为另一种状态的规律又是可知的情况下,就可以利用马尔可夫链的概念进行计 算和分析,预测未来特定时刻的状态。 马尔可夫链是表征一个系统在变化过程中的特性状态,可用一组随时间进程而变化 的变量来描述。 如果系统在任何时刻上的状态是随机性的,则变化过程是一个随机过程,当时刻t 变到t+1,状态变量从某个取值变到另一个取值,系统就实现了状态转移。而系统从某
在坐标系中的变化分布形状,也可根据专业知识确定分析曲线。非线性回归的分析方 法是通过一定的变换,将非线性问题转化为线性问题,然后利用线性回归的方法进行
回归分析。
根据专业知识和使用的观点,这里仅列举一种非线性回归曲线—指数函数。
5. 4计算模型预测法 5.4.1回归分析法
2.一元非线性回归法
y a a
(1)
P 0.7 11 P 1000 200 50 0 21 P31 0
1000 0.7 200 0 50 0 700 (1) 一年后疑似矽肺人数s2 为:
(1) ( 0) (0) s2 s1( 0) , s2 , s3
P 12 P 1000 22 P32
0.2 200 50 0 . 8 0
1000 0.2 200 0.8 50 0 360
一年后矽肺患者人数
(1) 为: s3
(1) (0) (0) s3 s1( 0) , s2 , s3
5. 4计算模型预测法
计算模型是由描述预测对象与其主要影响因素有关的一个方程式或方程组构成。 计算模型预测法就是利用这一系列方程式的计算,根据主要影响因素的变化趋势,对 预测对象的未来状况进行推测。其中有回归分析法(包括线性回归分析法和非线性回归 法)、马尔可夫链预测法、灰色预测法等。 5.4.1回归分析法 要准确地预测,就必须研究事物的因果关系。回归分析法就是一种从事物变化的 因素关系出发的预测方法。它利用数理统计原理,在大量统计数据的基础上,通过寻 求数据变化规律来推测、判断和描述事物未来的发展趋势。 事物变化的因果关系可用一组变量来描述,即自变量与因变量之间的关系,一般 可以分为两大类: 一类是确定关系,它的特点是,自变量为已知时就可以准确地求出因变量,变量 之间的关系可用函数关系确切地表示出来; 另一类是相关关系,或称为非确定关系,它的特点是虽然自变量与因变量之间存 在密切的关系,却不能由一个或几个自变量的数值准确地求出因变量,在变量之间往 往没有准确的数学表达式,但可以通过观察,应用统计方法,大致地或平均地说明自 变量与因变量之间的统计关系。 所谓回归预测,是指在相关分析的基础上,把变量之间的具体变动关系模型化,求 出关系方程式,找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推 算。通过回归预测,可以将相关变量之间不确定、不枧则的数量关系一般化、规范化, 从而可以根据自变量的某一个给定值推断出因变量的可能值(或估计值)。
5.4.1回归分析法
1.一元线性回归法 回归系数a、b是根据统计的事ห้องสมุดไป่ตู้数据,通过以下方程组来决定的。
式中:y—因变量,为事故数据; x—自变量,为时间序号; n—事故数据总数。
a和b确定之后就可以在坐标系中画出回归直线。
5.4.1回归分析法
1.一元线性回归法
在回归分析中,为了了解回归直线对实际数据变化趋势的符合程度的大小,
种状态转移到各种状态的可能性大小,可用转移概率来描述。
马尔可夫链计算所使用的基本公式如下: 设初始状态向量为:
状态转移概率矩阵为:
5.4.2马尔可夫链预测法
3.马尔可夫链预测法 状态转移概率矩阵是一个n阶方阵,它满足概率矩阵的一般性质,即有
(1)0 P ij 1
( 2) P ij 1
Ex1线性回归预测法:顶板事故死亡统计(4/4)
将表 3—1中的有关数据代入,即
Ex2线性回归预测法:企业伤亡事故预测
表6. 2是某企业1998-2005工伤事故死亡人数的统计数据,试用一元线性回归方 法建立起预测方程。
Ex2线性回归预测法:企业伤亡事故预测
解:将表中数据代人可求出回归a和b的值,即:
这种性质称为:无后效性
5.4.2马尔可夫链预测法
2.马尔可夫链 用随机变量Xn表示第n年张三的健康状况,那么张三每年的健康状况有两种情况: Xn=1 健康 n=0、1、2、......为年份
Xn=2 疾病
用ai(n)表示第n年处于状态i的概率(i=1或者2,即健康或者疾病),即ai(n)=P(Xn=i). 用Pij表示今年处于状态i,明年处于状态j的概率(i,j=1或者2,即健康或者疾病) 即Pij=P(Xn+1=j|Xn=i)。 ai(n)称为状态概率,Pij称为状态转移概率(转移概率实际上是一种条件概率)。 那么第n+1年的状态Xn+1只取决于第n年的状态Xn和转移概率Pij,而与以前的状态 Xn-1,Xn-2,…无关。第n+1年的状态概率可以由全概率公式给出: