应用统计学期末复习第一章总论1.统计学是一门关于客观现象数据的搜集、整理、归纳、分析的方法论学科,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
2.统计的研究对象是具有某种相同属性的群体现象,并探索群体现象数量表现的内在规律性。
3.特点:总体性、数量性、规律性。
4.分类:按统计方法的构成分为描述统计学和推断统计学,按统计方法研究和应用的侧重分为理论统计学和应用统计学。
5.统计总体是指根据一定的目的要求所确定的研究事物的全体。
总体单位是构成统计总体的个别事物。
6.统计标志:总体各单位所具有的属性或特征。
标志表现:总体单位各标志的具体体现。
标志的分类:按性质分为品质标志和数量标志,按变异情况分为不变标志和可变标志。
7.变量:可变的数量标志。
变量值:变量的具体表现。
分类:按变量值是否具有连续性分为连续变量和离散变量,按性质分为确定性变量和随机变量。
8.统计指标:反映统计总体数量特征的概念和数值。
统计指标六要素:指标名称、计量单位、计量方法、时间状态、空间范围、指标具体壹数值。
统计指标特征:数量性、综合性、具体性。
9.统计指标与标志的区别:统计指标说明的是总体数量特征,而标志是说明总体单位特征的名称;指标都可用数值表示,而标志有不能用数值表示的品质标志和能用数值表示的数量标志。
10.统计指标分类(第21页):按反映总体的内容分为数量指标和质量指标,按作用分为总量指标、相对指标和平均指标。
11.总量指标分类:按反映的内容分为总体单位总量和总体标志总量,按反映的时间状况分为时期指标和时点指标,按指标数值采用的计量单位分为实物指标、价值指标和劳动量指标。
12.相对指标(相对数)的表现形式分为无名数(系数、倍数、百分数)和复名数(人口密度)。
13.相对指标的种类:(第23页)计划完成程度指标(%)=已完成数×100%全期计划数结构相对指标(%)=总体部分数值×100%总体全部数值比例相对指标=甲地区(单位或企业)某类指标数值乙地区(单位或企业)同类指标数量比例相对指标=总体中某一部分数值总体中另一部分数值动态相对指标动态相对数(%)=报告期水平×100%基期水平强度相对指标=某一总量指标另一有联系而性质不同的总量指标贰第二章统计数据的搜集1.数据的计量方法:定类尺度、定序尺度、定距尺度、定比尺度。
2.数据的分类:按计量层次分为名义级数据、顺序级数据和刻度级数据;按收集方法分为观测数据和实验数据;按时间状况分为截面数据和时序数据。
3.统计数据的来源:直接来源(原始数据)、间接来源(二手数据)。
4.统计调查是根据统计研究预定的目的、要求和任务,运用科学的调查方法,有组织、有计划地向客观实际搜集资料的过程。
5.统计调查方案应包括:确定调查目的、确定调查对象和调查单位。
调查对象是指调查研究总体或调查范围。
调查单位是构成调查对象的每一个具体单位。
报告单位(填报单位)指负责回答或提交调查资料的单位。
6.统计调查方式统计报表普查:一次性或周期性、需要规定统一的标准调查时间、数据比较准确、适用范围较窄。
重点调查:在调查对象的全部单位中,只选择少数重点单位进行非全面调查。
典型调查:初步分析全部研究对象,选择一个或几个具有代表性的单位进行详细深入的调查。
抽样调查特点:客观性、经济性、时效性、适用性、准确性。
7.抽样调查组织形式:叁简单随机抽样类型随机抽样(分层抽样)机械随机抽样(等距抽样、系统抽样):它是将总体单位按某一标志排队,计算出抽样间隔,并在第一个抽样间隔内随机确定一个抽样起点,再按固定的顺序和间隔来抽取样本单位。
整群随机抽样:它是先将总体中各个个体, 按照某一标志分为若干群,然后以群为单位,按随机原则从中抽取一部分群体,抽中群体的所有个体构成样本。
阶段随机抽样(分级抽样):如两阶段抽样是先将总体划分为R组,从R组中随机抽取r组,再从r组中分别随机抽取mi(i=1,2,⋯,r)个个体,构成样本。
8.统计误差:调查性误差有技术性误差、登记性误差、责任性误差;代表性误差是指抽样调查而言,因抽样方式不当或存在随机性误差。
肆第三章统计数据的整理1.统计数据整理的程序:审核和订正原始资料;分组和汇总;编制各种统计图表;积累和保管统计数据。
2.统计分组的种类:按分组标志的多少分为简单分组和复合分组;按分组标志的性质不同分为品质分组和数量分组;按分组的作用和任务不同分为类型分组、结构分组和分析分组。
3.单项式变量数列:每个组只有一个变量值的变量数列;组距式变量数列:将变量的取值范围划分为若干个区间,以一个变动区间为一个组的变量数列。
4.数据分组步骤:排序,求全距(极差=最大值-最小值)确定变量的数据形式确定组数(四舍五入)确定各组组距根据分组整理成频数分布表5.累计频数(频率)分布图分为向上累计和向下累计。
6.统计表的结构:从表的形式上看有总标题、横行标题、纵栏标题和指标数值;从表的内容上看有主词栏和宾词栏。
7.注意:分组时一般为左闭右开。
伍第四章统计数据特征的描述1.平均指标:计算均值包括算术平均数、调和平均数、几何平均数;位置均值包括中位数(Me)、众数(Mo)。
2.分位数是指按顺序排列的一组数据被划分为若干相等的部分的分割点的数值。
3.离中趋势的描述:极差(R),方差(σ2),标准差(σ)。
4.是非标志在总体标志间以是非两种形式出现,非此即彼。
总体中具有某种属性的单位数占全部单位数的比率称为成数(p)。
p+q=1 5.相对离中趋势:相对变异指标包括极差系数和标准差系数。
极差系数:V R=Rx̅×100%;标准差系数:Vσ=σx̅×100%。
6.偏态系数SK=3(算术平均数−中位数)标准差=3(x̅−Me)σ或SK=算术平均数−众数标准差=x̅−Moσ偏斜的方向:当x̅>Me时,偏态系数为正值,是一种右偏的分布;当x̅<Me时,偏态系数为负值,是一种左偏的分布。
7.峰度系数(K)用来度量次数分布曲线的扁平程度。
K=m4σ4(m4、σ4),m4表示变量X的四阶中心矩。
(第95页)陆第五章参数估计1.全及总体:根据一定的研究目的和要求所确定的研究对象的全体,简称总体,总体所包含的单位数称为总体容量,用N表示。
抽样总体:从全及总体中按随机原则抽取一部分单位所构成的集合体称为抽样总体,简称子样或样本,抽样总体所包含的单位数称为样本容量,用n表示。
一般情况下,当n≫30时,称为大样本;当n<30时,称为小样本;n/N称为抽样比例。
2.总体指标(全及指标):根据总体计算的综合指标。
总体指标:总体均值X̅、总体成数、总体方差σ2和总体标准差σ。
样本指标(抽样指标):根据抽样总体计算的综合指标。
样本指标:样本均值X̅、样本成数、样本方差S2和样本标准差s。
3.重复抽样每次抽取时总体单位数相同,不重复抽样每次抽取时总体单位数不相同。
4.设X1,X2,⋯,X n是总体X的样本,g(X1,X2,⋯,X n)是一个连续函数,若此函数中不含任何未知参数,则称函数g(X1,X2,⋯,X n)为一个统计量。
样本均值、样本方差和样本成数是最为常用的几个统计量。
统计量的概率分布称为抽样分布。
5.大数定律(第107页),中心极限定理(第108页)。
6.参数估计的方法:点估计、区间估计。
7.根据样本X1,X2,⋯,X n构造一个统计量Τ(X1,X2,⋯,X n)作为参数θ的估计,Τ称为θ的估计量。
8.评级估计量的标准:无偏性即点估计量的抽样分布的期望值等于柒总体参数;有效性即一个无偏估计量与任意一个无偏估计量相比,其方差最小;一致性即估计量与总体参数的绝对离差小于某一任意小的正数ε的极限概率等于1。
9.区间估计用两个估计量构成区间去估计总体参数。
设X1,X2,⋯,X n是来自总体X的一个简单随机样本,θ是总体参数,由样本确定的估计量为Τ1=Τ1(X1,X2,⋯,X n)和Τ2=Τ2(X1,X2,⋯,X n),对于给定的α(0<α<1),如果有P(Τ1≤θ≤Τ2)=1-a,则称(Τ1、Τ2)为θ的置信区间。
其中,Τ1称为置信区间的下限值,Τ2称为置信区间的上限值,1-α称为置信度或置信水平。
10.设X~N(μ,σ2),当σ已知时,求μ的置信区间。
一般地,若给定α(0<α<1),μ的置信区间为:P{X̅-Zα/2√n ≤μ≤X̅+Zα/2√n}=1-α11.设X~N(μ,σ2),当σ2未知时,求μ的置信区间。
P{X̅-tα/2(n-1)√n ≤μ≤tα/2(n-1)√n}=1-a12.非正态总体或总体分布未知时,求μ的置信区间。
根据中心极限定理,当n充分大时(一般认为n大于或等于30),若给定α(0<α<1),μ的置信区间同第十条。
总体方差未知,只要样本容量n≥30,可以用样本方差代替统计量Z中总体方差,这时μ的置信区间为:P{X̅-Zα/2√n ≤μ≤X̅+Zα/2√n}=1-α13.样本中某种特征的单位数占样本全部单位数的比例称为样本成数,记为p。
根据中心极限定理,在大样本条件下,样本成数的抽样分捌玖布可用正态分布来近似表示,通常用样本成数p 来代替置信上下限中的总体成数P ,这时总体成数P 的置信区间为:P{p-Z α/2√p(1−p)n ≤P ≤p +Zα/2√p(1−p)n }=1-α14. 总体方差的区间估计:给定α(0<α<1),总体方差σ2的100(1-α)%的置信区间为 P{(n−1)S 2χα22(n−1)≤σ2≤(n−1)S 2χ1−α22(n−1)}=1-α15. 测定平均数的样本单位数目:当X~N(μ,σ2),σ2已知时,或非正态总体、总体分布未知时的大样本情形,n=Z α/22σ2∆x ̅2壹拾 第六章 参数假设检验1. 原假设是要进行检验的假设,又称“零假设”;备择假设是与原假设对立的假设,也称“替换假设”。
关于一个总体参数μ的假设检验有三种基本形式:双侧检验: H 0:μ=μ0 H 1:μ≠μ0左侧检验: H 0:μ≥μ0 H 1:μ<μ0右侧检验: H 0:μ≤μ0 H 1:μ>μ02. 假设检验的基本思想是基于小概率原理,即小概率事件在一次试验或观察中不会发生。
3. 单个总体均值的假设检验设总体X~N(μ,σ2),σ2已知,μ的假设检验:双侧检验建立假设:H 0:μ=μ0 H 1:μ≠μ0;计算检验统计量的数值:Z=̅0σ√n⁄;给定显著性水平α,查正态分布表,确定临界值Z α2⁄,从而确定拒绝域为(-∞,−Z α2⁄)和[Z α2⁄,+∞),接受域为(-Z α2⁄,+Z α2⁄);统计决策:若|Z |≥Z α2⁄,拒绝H 0,否则接受H 0。