当前位置：文档之家› MATLAB 统计工具箱

MATLAB 统计工具箱

中学: 中学:x3=1, x4=0; x1~资历(年) 资历( 资历 x2 = 1~ 管理, 大学:x3=0, x4=1; 管理, 大学: x2 = 0~ 非管理更高:x3=0, x4=0. 更高:
结果分析
残差 e = y y
残差分析方法
y = a0 + a1 x1 + a 2 x 2 + a3 x3 + a 4 x 4
问题分析
随机性优化模型
存在一个合适的购进量
购进太多→卖不完退回→赔钱购进太多→卖不完退回→ 购进太少→不够销售→ 购进太少→不够销售→赚钱少应根据需求确定购进量每天需求量是随机的
每天收入是随机的
目标函数应是长期的日平均利润 = 每天收入的期望值需求量的随机规律由162天报纸需求量的调查得到天报纸需求量的调查得到需求量的随机规律由每天需求量为 r 的概率 f(r), r=0,1,2…
年龄 39 47 45 … 56 体重指数 24.2 31.1 22.6 … 19.3 吸烟习惯 0 1 0 … 0 序号 21 22 23 … 30 血压 136 142 120 … 175 年龄 36 50 39 … 69 体重指数 25.0 26.2 23.5 … 27.4 吸烟习惯 0 1 0 … 1
MATLAB 统计工具箱在数学建模中的应用
确定性模型和随机性模型
随机因素可以忽略随机因素影响可以简单地以平均值的作用出现随机因素影响必须考虑概率模型回归模型确定性模型
随机性模型马氏链模型
概率模型
零售价a 零售价 (=1元) 元
例: 报童的利润
购进价b 购进价 (=0.8元) 元
报童早上购进报纸零售,晚上将未卖掉的报纸退回. 报童早上购进报纸零售,晚上将未卖掉的报纸退回. 退回价c 退回价 (=0.75元) 元
参数参数估计值置信区间 a0 11032 [ 10258 11807 ] a1 546 [ 484 608 ] a2 6883 [ 6248 7517 ] a3 -2994 [ -3826 -2162 ] a4 148 [ -636 931 ] R2=0.957 F=226 p=0.000 R2,F, p→ 模型整体上可用 →
管理与教育的组合组合 1 2 3 4 5 6 管理 0 1 0 1 0 1 教育 1 1 2 2 3 3
e 与资历 1的关系与资历x
2000 1000
e与管理教育组合的关系与管理—教育组合的关系与管理
2000 1000 0 -1000 -2000
0
-1000
-2000 0 5 10 15 20
y=normpdf(1.5,1,2)
正态分布x=1.5的概率密度 (=1, σ=2)
y=fcdf(1,10, 50) F分布x= 1的分布函数 (自由度n1=10, n2=50) y =tinv(0.9,10) 概率α=0.9的逆t分布 (α分位数, 自由度n=10)
用MATLAB 统计工具箱求解报童模型
0 ∞ n
n
模型建立
∫ ∫
n
0 ∞
p ( r ) dr
n
ab = bc p ( r ) dr
n
(1)
a b ∫∞ p( x)dx = a c
n
( 2)
∫
0
p ( x ) dx ≈
∫
n
∞
p ( x ) dx
∫
∞
n
p( x)dx = 1 ∫ p( x)dx
∞
n
d 2G <0 2 dn
由(1)或(2)得到的是每天 ) )得到的n是每天平均利润最大的最佳购进量. 平均利润最大的最佳购进量.
p
P1 0
P2 n r
MATLAB 统计工具箱常用命令(一) 统计工具箱常用命令(
命令名称输入输出 [n,y]=hist(x,k) 频数表 x: 原始数据行向 n: 频数行向量量 y: 区间中点行向 k:等分区间数量同上直方图
hist(x,k) m=mean(x) s=std(x)
直方图均值标准差
1
2
3
4
5
6
残差大概分成3个水平, 残差大概分成个水平, 个水平 6种管理教育组合混在种管理—教育组合混在种管理一起, 一起,未正确反映
售出一份赚 a-b
退回一份赔 b-c
162天报纸需求量的调查天报纸需求量的调查
199 136 214 195 219 224 197 213 187 187 … … … 230 172 227 157 114 156
为了获得最大的利润,报童每天应购进多少份报纸? 为了获得最大的利润,报童每天应购进多少份报纸?
y与x1的散点图与线性回归模型
y与x2的散点图与
y = β 0 + β1 x1 + β 2 x2 + β 3 x3 + ε
由数据估计, 回归系数β0, β1, β2, β3 由数据估计 ε是随机误差
MATLAB 统计工具箱常用命令(二) 统计工具箱常用命令(
b=regress(y,X) [b,bint,r,rint,s]=regress(y,X,alpha) 输入: 因变量列向量), 因变量(列向量与自变量组成的矩阵, 输入 y~因变量列向量 X~1与自变量组成的矩阵, 与自变量组成的矩阵 Alpha~显著性水平α(缺省时设定为缺省时设定为0.05) 显著性水平 ) 输出:b=( β 0 , β1 , ( ), ),bint: b的置信区间, 输出的置信区间, r:残差列向量 ,rint: r的置信区间残差(列向量残差列向量), 的 s: 3个统计量:决定系数 2,F值, F(1,n-2)分布大于个统计量: 个统计量决定系数R 值 F值的概率 ,p<α时回归模型有效值的概率p, 回归模型有效值的概率 rcoplot(r,rint) 残差及其置信区间作图残差及其置信区间作图及其
dG ( a b ) np ( n ) n (b c ) p ( r ) dr = ∫0 dn ∞ (a b)np(n) + ∫ (a b) p(r )dr
n
= (b c) ∫ p(r )dr + (a b) ∫ p(r )dr
0 n
n
∞
dG =0 dn
∫ p ( r ) dr = a b b c ∫ p ( r ) dr
1, 大学 x4 = 0, 其它
资历每加一年薪金的增长是常数; 资历每加一年薪金的增长是常数; 管理,教育, 管理,教育,资历之间无交互作用线性回归模型
y = a0 + a1 x1 + a 2 x2 + a3 x3 + a 4 x4 + ε
a0, a1, …, a4是待估计的回归系数,ε是随机误差是待估计的回归系数,
模型求解
xueya01.m
回归系数
0.3604 [-0.0758 0.7965 ] 3.0906 [1.0530 5.1281] 11.8246 [-0.1482 23.7973] R2= 0.6855 F= 18.8906 p<0.0001 s2 =169.7917 回归系数
β0 β1 β2 β3
y = 58.5101 + 0.4303x1 + 2.3449 x 2 + 10.3065 x3
回归模型
例2 软件开发人员的薪金
建立模型研究薪金与资历,管理责任, 建立模型研究薪金与资历,管理责任,教育程度的关系分析人事策略的合理性, 分析人事策略的合理性,作为新聘用人员薪金的参考 46名软件开发人员的档案资料名软件开发人员的档案资料
资历~ 从事专业工作的年数;管理~ =管理人员, = 资历从事专业工作的年数;管理 1=管理人员,0= 非管理人员;教育~ =中学, =大学, = 非管理人员;教育 1=中学,2=大学,3=更高程度
分析与假设
y~ 薪金,x1 ~资历(年) 薪金, 资历( 资历
1, 中学 x3 = 0, 其它
x2 = 1~ 管理人员,x2 = 0~ 非管理人员管理人员, 教育 1=中学 = 2=大学 = 3=更高 = 中学: 中学:x3=1, x4=0 ; 大学: 大学:x3=0, x4=1; ; 更高: 更高:x3=0, x4=0
回归系数估计值回归系数置信区间回归系数估计值回归系数置信区间 45.3636 [3.5537 87.1736]
剔除异常点 (第2点和第第点和第 10点)后点后
β0 β1 β2 β3
R2= 0.8462
回归系数估计值回归系数置信区间回归系数估计值回归系数置信区间 58.5101 [29.9064 87.1138] 0.4303 [0.1273 0.7332] 2.3449 [0.8509 3.8389] 10.3065 [3.3878 17.2253] F= 44.0087 p<0.0001 s2 =53.6604
x: 原始数据行向均值m 量同上标准差s
1 n m = ∑ xi n i =1
1 n s =[ ( xi m) 2 ]1/ 2 ∑ n 1 i =1
MATLAB 统计工具箱常用命令(一) 统计工具箱常用命令(
χ2 分布均匀指布分布分布分布 t f bino poiss 字符 unif exp norm chi2 功能字符概率密度 pdf 分布函数 cdf 逆概率分布 inv 均值与方差 stat 随机数生成 rnd
模型建立
已知售出一份赚 a-b;退回一份赔 b-c ; 设每天购进 n 份,日平均收入为 G(n)
若需求量 r ≤ n → 售出 r → 赚 ( a b ) r ; → 退回 n r → 赔 (b c )( n r )

e商务文档

MATLAB 统计工具箱

相关文档推荐：