当前位置:文档之家› 计量经济学英文版附录B 翻译

计量经济学英文版附录B 翻译

附录B复习概率相关概念:学习目标:基于这个附录的材料,你应该能够:1、解释一个随机变量和它的值之间的不同,并给出一个例子。

2、解释离散型随机变量与连续型随机变量之间的不同,并分别给出一个例子。

3、描述离散型随机变量的概率密度函数的特征,并给出一个例子。

4、在给定的离散型概率函数中计算事件的概率。

5、解释下面语句的涵义:在离散型随机变量中取值2时所对应的概率为0.3。

6、解释连续型随机变量的概率密度函数与离散型随机变量的密度函数之间的不同。

7、怎样用代数的方法计算给定的连续型随机变量的概率。

8、直观的解释一个随机变量的均值或者期望值的概念9、结合离散型随机变量的期望值概念,在B.9给定的概率密度函数f(x)和函数g(x)来计算期望。

10、理解离散随机变量的方差的定义,并解释当方差值越大时随机变量取值更分散的意义。

11、运用一个联合概率密度函数(表格)表示两个离散型随机变量并且计算联合事件的概率,并且找到每个单独随机变量的边缘概率密度函数。

12、在给定另外一个离散型随机变量取值和他们的联合密度函数的情况下会找出一个离散型随机变量的条件概率密度函数。

13、给出一个关于两个随机变量相互独立的直观的解释,并且给出两个随机变量独立的条件。

举出两个随机变量相互独立和不独立的实例。

14、定义两个随机变量的协方差和相关性,并且在给定两个离散型随机变量的联合概率函数的情况下计算协方差和相关性。

15、找出随机变量和的均值和方差。

16、结合表1和电脑软件计算正态分布的概率。

关键词:二进制变量自由度众数二进制随机变量离散型随机变量正态分布连续型概分布试验概率条件概率密度函数 F分率分布函数期望值概率密度函数2布概率密度函数条件概率联合概率密度随机变量连续随机变量函数标准差相关性边缘分布标准正态分布协方差均值独立累积分布中数方差我们假定你已经学过一些基本概率统计的课程,在这章附录中我们将复习一些关于概率统计的基本概念,B.1部分我们回顾离散和连续型随机变量;在B.2部分复习概率分布;B.3部分介绍联合概率分布、定义了条件概率和独立的概念;在B.4部分我们将复习概率分布的一些特性,重点复习期望和方差;在B.5部分总结一些重我们常用的概率分布的重要特征:正态分布、t分布、F分布。

B.1 随机变量俗话说世界上只有死亡和纳税是确定的。

虽然不是这句话的本意,但这个观点还是指出我们在生活中遇到的大部分事情是不确定的。

我们不知道我们球队在下一个赛季会赢多少场,你肯定不知道在第一次考试中会得多少分,我们不知道明天的股指是多少。

这些事情或是结果都是不确定的或者说是随机的。

概率给了我们一个讨论可能性结果的方法。

一个随机变量是在观察前取值未知的量,换句话说就是它是不能准确预测的变化量。

每一个随机变量都有一组可能取的值。

如果用W 代表我们球队下赛季赢球的场数,如果最多只有13场比赛的话,那么W 可以取0、1、2、……13。

这是个离散型随机变量,因为它只可取有些可数的实数值。

另外关于离散型随机变量的实例有随机挑选的家庭中拥有电脑的数量以及下一年你看医生的次数。

如果一个试验只有两个结果发生,比如,在电话问卷中,别人问你你是否有大学学历,你的回答只能“是”或者“不是”这样的事件我就说它符合二项分布。

用“1”代表“是”用“0”代表“不是”。

二项分布是离散型的,用来代替性别(男或女)、种族(白人,非白人)等性质、特征。

美国的GNP是另一例随机变量,因为它的数值在观察到之前是不确定的。

在2007年的第二季度,它的值是$138394亿 美元(季度调整的年增长率)。

诚然,GNP是用美元来衡量的,并且可以整美元来计算,但是这个值太过巨大以至于计算个人的美元收入变得毫无意义。

从实际角度看,GNP可以取从零至无限间的任意值,它是一个连续性随机变量。

其他一般的宏观经济随机变量如利率、投资、消费,也看被认作连续性随机变量。

在经济学中,股市指数,像道—琼斯指数一样,也认为是连续的。

使这些变量得以连续的关键特性是它们可以取区间内的任意值。

B.2 概率分布概率通常用试验来定义。

转骰子是一个试验,我们可以得到六种结果。

如果骰子是均匀的,那么每种可能将以1/6的概率出现,假设试验进行无数次的话。

1/6这个概率的得出是因为有六种等可能性的结果。

然而,如果骰子不是均匀的。

设X是当掷骰子时出现的值,那么说X=1的概率就是当大量掷骰子时“一”出现的次数占总数的比重。

总之,一个事件的概率就是“限制性的相对频率”,或说在长期中它发生的比重。

在收集调查数据时,人员的学历常常是感兴趣的项目。

令X=1表示随机被调查者有大学或更高层次学历;令X=0表示相反情况。

在2002年,美国25岁及以上人口中,有27%至少有大学的学历。

因而,在总人口中,X=1的概率为0.27, 写作P(X=1)=0.27。

概率一定是正的并且总和是1,所以P(X=0)=1—P(X=1)=0.73。

在这个例子中随机变量是离散的,因此谈论取某个具体值的概率是有意义的。

我们可以用概率密度函数(pdf )来总和所有概率结果。

离散型随机变量的概率密度函数是指每个可能结果的概率值。

对离散型随机变量X,概率密度f(x)是随机变量X取值x 的概率,f(x)=P(X=x )。

因为f(x)是概率,因此一定有0≤f(x)≤1, 如果X可以取n 个值1x ....,n x ,那它们的总和一定是1。

f(X1)+f(X2)+ +f(Xn)=1.对于离散性随机变量,pdf 可能以表格、公式、或者图表的形式表现,以指明一个人是否拥有大学学历的二项分布,我们可以用像表B.1中的列表来表示。

概率同样可以等式的形式来表示,如:f(x)=x x -1)73.0()27.0( 这样得出f(1)=111)73.0()27.0-(-1 = 0.27, f(0)=010)73.0()27.0-( = 0.73Table B.1 Probabilities of a College DegreeCollege x f(x) DegreeNo 0 0.73Yes 1 0.27如另一个例子,令X表示一年中大学生找到工作的那个季度。

X五个取值的概率是X=0,1,2,3,4, f(x)=0.05, 0.50, 0.10, 0.10, 0.25. 我们可以用柱状图来表示这个离散型随机变量的pdf, 这样我们可以直观地看到各种可能的结果,如表B.1概率分布函数(cdf )是另一种表示概率的方法。

随机变量X的cdf,用F(x)表示,表示X小于或者等于某个特定的值x 。

即:F(x) = P(X ≤x)X的值,pdf, cdf, 如表B.2利用pdf 我们可以计算一个学生工作超过两个季度的概率,P(X>2)=1-P(X≤2)=1- F(2)=1-0.65=0.35对于标准概率分布,统计学软件已经整合cdf 函数,这样计算概率时较为省力。

例如,二项随机变量X是n 次独立试验中成功概率为p 的成功次数。

给定总事件次数n 与成功概率p 的数值,二项分布概率就可以表示如下x n x p p x n x x X P --⎪⎪⎭⎫ ⎝⎛===)1()(f )( 表B-2 概率分布函数和累积分布函数⎪⎪⎭⎫ ⎝⎛x n =)!!(!x -n x n 上式的意思是“n 个联合的数字一次取x 个”,n !读作n 的阶乘,用公式表示即n !=n (n-1)…(2)(1)。

假设有13场比赛,LSU 老虎队比赛相互独立而且每场比赛他们获胜的概率p=0.7。

那么他们一个赛季至少赢8场的概率是多少?答案是P (X ≥8)=∑=138x x f )(=1-p (X ≤7)=1-F (7) 我们可以用表B1强力估计这个概率,但是这太单调。

用Eviews 命令@cbinom 求二项随机分布的累积分布函数,将会非常容易。

1-@cbinom (7,13,0.7)=0.8346别的一些软件也有相似的强有力的功能。

连续随机分布可以取任意一个值,并且可以取无数的数值。

结果任何一个特定值的概率都是0.对于连续随机变量,我们讨论一个某一特定区间的结果。

图B.2描述了连续随机分布X 的概率分布函数f (x )从0取到无穷大。

曲线下边的区域达标X 落在一个区间时的概率。

对于这个分布,P (X ≤20)=0.294以及P (X ≤40)=0.649.然后我们可以估算p (20≤X ≤40)=0.355这些区域是如何获得的?积分给出了曲线下面的区域的表示方法,因此P (20≤X ≤40)=dx x f 4020⎰)(=0.355分布函数是P (X ≤x )=dt t f x -)(⎰∞=F (x )图B.2 一个连续型随机变量的概率密度函数F(x)是X 的累积分布函数。

概率计算结果是P (20≤X ≤40)= F(40)-F(20) = 0.649-0.294=0.355我们不再这本书中计算积分。

我们将用电脑和简单的软件命令来计算累积分布函数值。

B.3 联合,边缘和条件概率分布处理超过一个随机变量需要一个联合概率密度函数。

一个联合概率密度函数描述了变量取值的组合的概率值。

在2002年的美国,有185183000人至少25岁。

假定我们对从这些人中随机选择上过四年大学和在2002年已经有收入的人的概率有兴趣。

定义两个随机变量:X,描述一个人的所获学历,和Y,他们在2002年是否有收入。

1 高中文凭或更低X = 2 一些专科学校3 大学学位4 更高的学位表 B.3 联合概率函数 f (x,y )0 如果在2002年没有收入Y =1 如果在2002年有正向的收入随机选择有这些特征的某人的概率已经由X 和Y 的联合概率密度函数给出了,记作f(x,y),它们由表B.3给出。

随机选择的某个人,他有4年大学学历和在2002年有收入的概率是0.14,即P(X =3,Y =1)=f (3,1)=0.14 和一元随机变量的概率密度函数一样,联合概率的总和是1. ∑∑x y f (x,y )=1.B.3.1 边际分布给定一个联合概率密度函数,我们可以获得各个随机变量的概率分布,也被称为边际分布。

如果X 和Y 是两个离散随机变量,∑=yX y x f x ),()(f对任意的X (B.2) ∑=x),()(f y x f y Y 对任意的Y注意到在(B.2)的和不含另一个随机变量—我们从联合概率密度函数里消除的那个。

这种运算有时叫做在联合概率表里加除不需要的变量。

例如,运用表B.3,(y)f Y =∑=41),(x y x f y =0,1(0)f Y =0.19+0.06+0.04+0.02=0.31联合和边际分布被记述就像在表B.4.如果随机变量是连续的,(B.2)的概念也生效,但是积分号代替了求和符号。

B.3.2 条件概率表 B.4 X 和Y 的边缘分布随机选择一个人,考虑到他有一个四年的本科学历,他有收入的概率是多少呢?这个问题就是求已知X=3时,Y=1的条件概率是多少。

相关主题