统计12-1 李本恩一、 课题名称:牙膏销售量的影响因素 二、 课题条件参考文献::《MATLAB 从入门到精通》 三、 设计任务本文从收集有关牙膏的销售量开始,从牙膏销售量和价格、广告投入之间的关系出发,分别通过对这三个方面的深入研究从而制定出各自的最佳方案,最后再综合这 三个主要因素,进一步深入并细化,从而求得最优解。
四、论文内容摘要内容 :本文从收集有关牙膏的销售量开始,从牙膏销售量和价格、广告投入之间的关系出发,分别通过对这三个方面的深入研究从而制定出各自的最佳方案, 最后再综合这三个主要因素,进一步深入并细化,从而求得最优解。
模块Ⅰ中,我们假设在x 1和x 2对y 的影响独立 ,从而得到了方程εββββ++++=22322110x x x y模块Ⅱ中,我们假设x 1和x 2对y 的影响有交互作用,进一步得到新的方程20112232412y x x x x x βββββε=+++++关键词:线性回归模型 相关系数问题重述:某大型牙膏制造企业为了更好的拓展产品市场,有效地管理 库存,公司董事会要求销售部门根据市场调查,找出公司生产 的牙膏销售量价格,广告投入等之间的关系,从而预测出在不 同价格和广告费用下的销售量。
为此,销售部的研究人员收集 了过去30个销售周期(每个销售周期为4周)公司生产的牙 膏销量,销售价格,投入的广告费用,以及同期其他厂家生产 的同类牙膏的平均销售价格,见表1。
试根据这些数据建立一 个数学模型,分析牙膏销售量与其他因素的关系,为制定价格 策略和广告投入策略提供数据依据。
销售 周期 公司销售价格(元) 其他厂家平均价格(元) 广告费用(百万元) 价格差 (元) 销售量 (百万支) 13.853.805.50-0.057.38(其中价格差指其他厂家平均价格与公司销售价格之差)1.实验设计方案 1) 前期分析:由于牙膏是生活必需品,对大多数顾客来说,在购买同类产品的牙膏时更多的会在意不同品牌之间的价格差异,而不是它们的价格本身。
因此,在研究各个因素对销售量的影响时,用价格差代替公司销售价格和其他厂家平均价格更为合适。
记牙膏销售量为y ,其他厂家平均价格与公司销售价格之差(价格差)为x 1公司投入的广告费用为x 2 ,其他厂家平均价格与公司销售价格分别为x 3和x 4 ,x 1=x 3-x 4。
基于上面的分析,我们尽利用x 1和x 2来建立y 的预测模型。
2) 模型假设:1 在一定时期内假设市场总需求量没有太大的变化。
2 同类产品在一定时期内价格无明显变化。
3 通过调节本公司的价格调整都能够达到理想的价格差 3) 建立模型:εββββ++++=22322110x x x y4) 编写程序:[b,bint,r,rint,stats]=regress(y,x,alpha)5) 对结果进行分析,讨论诸如:结果的合理性、正确性,算法的收敛性,模型的适用性和通用性,算法效率与误差等。
2.基本模型为了大致分析y 与1x 和2x 的关系,首先利用散点图观察销售量y 与价格差1x 及y 与广告投入量2x 之间的关系。
y 与1x 的关系: y 与2x 的关系:图1 y 对1x 散点图(1) 图2 y 对2x 的散点图从图(1)发现,随着1x 增加,y 的值有明显的线性增加趋势,图中直线用线性模型011y x ββε=++ (1)拟合的(其中ε是随机误差)在图2 中,当2x 增大时,y 有向上弯曲增加的趋势,图中的曲线用二次函数模型:εβββ+++=223220x x y (2) 拟合。
综上分析,结合模型(1)和(2)建立如下回归模型20112232y x x x ββββε=++++ (3) 其中,y 是建立的模型,我们用=∧y 22322110x x x ββββ+++对y 进行估计,其中3210,,,ββββ是我们待估计的参数。
3.模型求解利用MATLAB 统计工具箱中的命令regress 求解,使用格式为: [b,bint,r,rint,stats]=regress(y,x,alpha)得到模型(3)的回归系数的估计值及其置信区间(置信水平05.0=α)、检验统计量P F R ,,2,S 2的结果见下表2表 2 4.结果分析由表中的数据显示,2R =0.9054指因变量的y 的90.54%可由模型确定,F值远远超过F 检验的临界值,p 远远小于α,因而模型(3)可用。
表2的回归系数给出了模型(3)中0β,1β,2β,3β的估计值0β∧=17.3244,1β∧=1.3070,2β∧=-3.6956,3β∧=0.3486。
检查它们的置信区间发现,只有2β的置信区间包含零点(但区间右端点距零点很近),表明回归变量2x (对因变量y 的影响)不是太显著的,但由于22x 是显著的,我们仍将变量2x 保留在模型中。
5.销售量预测经回归系数的估计值代入模型(3),即可预测公司未来某个销售周期牙膏的销售量y ,将预测值记为y ∧,得到模型(3)的预测方程:y ∧=20123122x x x ββββ∧∧∧∧+++ (4) 只需知道该销售周期的价格差1x 和投入的广告费用2x ,就可以计算预测值y ∧。
公司无法直接确定价格差1x ,只能制定公司的牙膏销售价格4x ,但是其它厂家的平均价格一般可以通过根据市场情况及原材料的价格变化等估计。
模型中用价格差做为回归变量的好处在于公司可以更灵活地来预测产品的销售量或市场需求量,因为其它厂家的平均价格不是公司所能控制的。
预测时只要调整公司的牙膏销售价格达到设定的回归变量价格差1x 的值。
回归模型的一个重要应用是,对于给定的回归变量的取值,可以以一定的置信度预测因变量的取值范围,即预测区间。
6.模型改进模型(3)中回归变量1x ,2x 对因变量y 的影响是相互独立的,即牙膏销售量y 的均值和广告费用2x 的二次关系由回归系数2β,3β确定,而不依赖与价格差1x ,同样,y 的均值与1x 的线性关系由回归系数1β确定,不依赖于2x 。
根据经验可参想,1x 和2x 之间的交互作用会对y 有影响,简单的用1x ,2x 的乘积代表他们的交互作用,将模型(3)增加一项,得到:20112232412y x x x x x βββββε=+++++ (5)在这个模型中,y 的均值与2x 的二次关系为22232412x x x x βββ++,由系数2β,3β,4β确定,并依赖与价格差1x 。
下面让我们用表1的数据估计模型(5)的系数。
利用MATLAB 的统计工具箱得到的结果见表3.验统计量P F R ,,2,S 2的结果见下表1表 3表3与表2的结果相比,R 2有所提高,说明模型(5)比模型(3)有所改进,相信模型(5)更符合实际。
用模型(5)对公司的牙膏销售量做预测,仍设在某个销售周期中,维持产品的价格差X1=0.2元,并投入X2=6.5百万元的广告费用,则该周期牙膏销售量y 的估计值为=∧y ∧β0 + ∧β1x 1 +∧β2x 2+∧β3x 22+∧β4x 1x 2 =29.1133 + 11.134 ×0.2– 7.608×6.5 + 0.6712 ×6.52 -1.4777 ×0.2 ×6.5 =8.3253百万支,置信度为95%的预测空间为[7.8953,8.7592],与模型(3)的结果相比,∧y 略有增加,而预测区间长度短些。
在保持广告费用x 2=6.5百万元不变的条件下,分别对模型(3)和(5)中牙膏销售量的均值∧y 与价格差x 1的关系作图,见图3和图4图3 模型(3)∧y 与x 1 的关系 图4 模型(5)∧y 与x 1 的关系 在保持价格差x 1=0.2元不变的条件下,分别对模型(3)和(5)中牙膏销售量的均值∧y 与广告费用x 2的关系作图,见图5和图6图5 模型(3)∧y 与2x 的关系 图6 模型(5)∧y 与2x 的关系 可以看出,交互作用项1x 2x 加入模型,对∧y 与1x 的关系稍有影响,而∧y 与2x 的关系有较大变化,当2x < 6时∧y 出现下降,2x > 6以后∧y 上升则快得多。
进一步讨论: 为了解1x 和2x 之间的相互作用,考察模型(5)的预测方程 ∧y =29.1133+11.13421x -7.60802x +0.67122x 2 -1.47771x 2x (6)如果取价格差1x =0.1元,代入(6)可得∧y1x =0.1 =30.2267 -7.75582x +0.67122x 2 (7)再取1x =0.3元,代入(6)可得∧y1x =0.3 =32.4536 -8.05132x +0.67122x 2 (8)它们均为2x 的二次函数,其图形见图7,且∧y1x =0.3 -∧y1x =0.1 = 2.2269-0.29552x (9)由(9)式可得,当 2x < 7.5360时,总有∧y1x =0.3 >∧y1x =0.1,即若广告费用不超过大约7.5百万元,价格差定在0.3元时的销售量,比价格差定在0.1元的大 ,也就是说,这时的价格优势会使销售量增加。
图7 y与x的关系((7)与(8)的图形)2附录:源程序x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0 .30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55];y=[7.38;8.51;9.52;7.50;9.33;8.28;8.75;7.87;7.10;8.00;7.89;8.15;9.10;8.86;8.90;8.87;9.26;9.00;8.75;7.95;7.65;7.27;8.00;8.50;8.75;9.21;8.27;7.67;7.93;9.26]; aa=polyfit(x1,y,1);y1=polyval(aa,x1);plot(x1,y1,x1,y,'ro')%图1:Y对X1的散点图x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0 .30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55];x2=[5.50;6.75;7.25;5.50;7.00;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80 ;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80]; y=[7.38;8.51;9.52;7.50;9.33;8.28;8.75;7.87;7.10;8.00;7.89;8.15;9.10;8.86;8.90;8.87;9.26;9.00;8.75;7.95;7.65;7.27;8.00;8.50;8.75;9.21;8.27;7.67;7.93;9.26]; aa=polyfit(x2,y,2);x3=5.25:0.05:7.25;y2=polyval(aa,x3);plot(x2,y,'ro',x3,y2)%图2:Y对X2的散点图dx4=[ones(30,1),x1,x2,x2.^2]; [b,bint,r,rint,stats]=regress(y,x4) %表2x5=[ones(30,1),x1,x2,x2.^2,x1.*x2]; [b,bint,r,rint,stats]=regress(y,x5) %表3x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0 .30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55]; ytu3=17.3244+1.307*x1+(-3.6956)*6.5+0.3486*6.5*6.5;plot(x1,ytu3)grid on %图3x1=[-0.05;0.25;0.60;0;0.25;0.20;0.15;0.05;-0.15;0.15;0.20;0.10;0.40;0.45;0.35;0 .30;0.50;0.50;0.40;-0.05;-0.05;-0.10;0.20;0.10;0.50;0.60;-0.05;0;0.05;0.55]; ytu4=29.1133+11.1342*x1+(-7.608*6.5)+0.6712*6.5*6.5+(-1.4777)*6.5*x1;plot(x1,ytu4)grid on %图4x2=[5.50;6.75;7.25;5.50;7.00;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80 ;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80]; ytu5=17.3244+1.307*0.2+(-3.6956)*x2+0.3486*x2.*x2;bb=polyfit(x2,ytu5,2);xtu5=5.25:0.05:7.25;ytu51=polyval(bb,xtu5);plot(xtu5,ytu51)grid on %图5x2=[5.50;6.75;7.25;5.50;7.00;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80 ;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.50;5.75;5.80;6.80]; ytu6=29.1133+11.1342*0.2+(-7.608*x2)+0.6712*x2.*x2+(-1.4777)*x2*0.2;bb=polyfit(x2,ytu6,2);xtu6=5.25:0.05:7.25;ytu61=polyval(bb,xtu6);plot(xtu6,ytu61)grid on %图6x2=[5.50;6.75;7.25;5.50;7.65;6.50;6.75;5.25;5.25;6.00;6.50;6.25;7.00;6.90;6.80;6.80;7.10;7.00;6.80;6.50;6.25;6.00;6.50;7.00;6.80;6.80;6.5 0;5.75;5.80;6.80];xtu7=sort(x2);ytu7=30.2267-7.7558*xtu7+0.6712*xtu7.^2;plot(xtu7,ytu7)grid onhold onytu8=32.4536-8.0513*xtu7+0.6712*xtu7.^2;plot(xtu7,ytu8)hold off%图7经过讨论和模型的改进,可以预测出在不同价格和广告费用下的牙膏销售量。