当前位置：文档之家› 统计学基本概念

统计学基本概念

日志吕品吕品的日志当前日志返回日志首页»较新一篇/ 较旧一篇分享1. 统计学：收集处理分析解释数据并从数据中得出结论的科学。

2. 描述统计：研究数据收集处理汇总图表描述概括与分析等统计方法。

3. 推断统计：研究如何利用样本数据来推断总体特征的统计方法。

4. 分类数据：只能归于某一类别的非数字型数据。

5. 顺序数...如果你也考统计学~~~~~网上搜索到的统计学基本概念~~~~~ 2011-05-28 12:06 | (分类:默认分类)1. 统计学：收集处理分析解释数据并从数据中得出结论的科学。

2. 描述统计：研究数据收集处理汇总图表描述概括与分析等统计方法。

3. 推断统计：研究如何利用样本数据来推断总体特征的统计方法。

4. 分类数据：只能归于某一类别的非数字型数据。

5. 顺序数据：只能归于某一有序类别的非数字型数据。

6. 数值型数据：按数字尺度测量的观察值。

7. 观测数据：通过调查或观测而收集到的数据。

8. 实验数据：在实验中控制实验对象而收集到的数据。

9. 截面数据：在相同或近似相同的时间点上收集的数据。

10. 时间序列数据：在不同时间上收集到的数据，这类数据按时间顺序收集到的。

11. 抽样调查：从总体中随机抽取一部分单位作为样本进行调查，根据样本调查结果来推断总体特征的数据收集方法。

12. 普查：为特定目的而专门组织的全面调查。

13. 总体：包含所研究的全部个体（数据）的集合。

14. 样本：从总体中抽取的一部分元素的集合。

15. 样本容量：也称样本量，是构成样本的元素数目。

16. 参数：用来描述总体特征的概括性数字度量。

17. 统计量：用来描述样本特征的概括性数字度量。

18. 变量：说明现象某种特征的概念。

19. 分类变量：说明事物类别的一个名称。

20. 顺序变量：说明事物有序类别的一个名称。

21. 数值型变量：说明事物数字特征的一个名称。

22. 离散型变量：只能取可数值的变量。

23. 连续型变量：可以在一个或多个区间中取任何值的变量。

24. 调查数据：通过调查方法获得的数据25. 实验数据：通过实验方法获得的数据26. 概率抽样：随机抽样，遵循随机原则进行的抽样，总体中每个单位都有一定的机会被选入样本。

27. 非概率抽样：不随机，根据研究目的对数据的要求，采用某种方式从总体中抽出部分单位对其实施调查。

28. 简单随机抽样：从包括总体的N个单位的抽样框中随机，一个个抽取n个单位作为样本，每单位等概论。

29. 抽样框：用于抽选样本的总体单位信息，是概率抽样中所不可缺30. 分层抽样：将抽样单位按某种特征或某种规则划分为不同的层，然后从不同层中独立、随机地抽取样本。

31. 整群抽样：总体中若干单位合并为组，群，抽样时直接抽取群，然后对中选群中的所有单位全部实施调查。

32. 系统抽样：总体中所有单位按顺序排列，在规定范围内随机抽取一单位作为初始单位，然后按事先规则确定其它样本单位。

33. 多阶段抽样：首先抽取群，再进一步抽样，从选中的群中抽取出若干个单位进行计查，二阶段抽样。

34. 方便抽样：依据方便原则，自行确定入抽样本的单位。

35. 判段抽样：研究人员根据经验，判断研究对象的了解，有目的选择一些单位作为样本。

36. 自愿样本：被调查者自愿参加，成为样本中一分子，向调查人员提供有关信息37. 滚雪球抽样：对稀少群体调查中，首选选择一组调查单位，调查后，请他们提供另外属于研究总体的调查对象，调查人员根据所提供的线索，进行此后调查。

38. 配额抽样：将总体中所有单位按一定的标志分若干类，然后每类采用方便抽样或判断抽样的方案选取样本单位。

39. 自填式：没有调查员协助，被调查者自已填写，完成调查问卷。

40. 面访式：面对面，调查员提问，被调查者回答。

41. 电话式：打电话方式调查。

42. 抽样误差：由于抽样的随机性引起的样本结果与总体真值之的误差。

43. 非抽样误差：相对抽样误差而言，除抽样误差之外的，由于其它原因引起的样本观察结果与总体真值之间的差异。

44. 抽样框误差：统计推论的错误是由于抽样框不完善造成的45. 频数：落在某一特定类别或组中的数据个数。

46. 频数分布：各个类别及其相应的频数形成的分布。

47. 比例：一个样本（或总体）中各个部分的数据占全部数据比值。

48. 比率：一个样本（或总体）中各不同类别数据之间的比值。

49. 累积频数：将各有序类别或组的频数逐级累加起来得到的频数。

50. 累积频率或累积百分比：将有序类别或组百分比逐级累加起来。

51. 数据分组：根据统计研究需要，将原始数据按某种标准化分成不同的组别，。

52. 组距是一个组的上限与下限的差53. 组距分组是将全部变量依次划分为若干个区间，将这一区间的变量值作为一组。

54. 等距分组，在组距分组时，如果各组的组距相等。

55. 组中值＝下限值+上限值/2 上下限的中间值56. 直方图：用矩形的宽度和高度（即面积）来表示频数分布的图形。

57. 茎叶图：由茎和叶两部分组成的、反应原始数据分布的图形。

58. 箱线图：由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布图形。

59. 集中趋势：指一组数据向某一中心值靠拢的程度，反映一组数据中心点的位置所在。

60. 众数：一组数据中出现频数最多的数值61. 中位数：一组数据排序后处于中间位置上的数值。

62. 四分位数：一组数据排序后处在25%和75%位置上的数值。

63. 平均数：又称均值，是全部数据的算术平均值64. 简单平均数：未经分组数据计算的平均数称为简单平均数。

根据分组。

加权平均数。

65. 几何平均数：是n个变量值乘积的n次方根。

常用于比例数据的平均。

66. 异众比率：指非众数组的频数占总频数的比例.67. 四分位差：75%位置上的四分位数与25%位置上的四分位数之差。

顺序数据。

68. 极差：也称全距，一组数据的最大值与最小值之差。

69. 平均差：也称平均绝对离差，它是各变量值与其平均数离差的绝对值的平均数。

70. 方差：各数据与其平均数离差平方的平均数。

71. 标准差：方差的平方根。

72. 标准分数：也称标准化值或z 分数，某个数据与其平均数的离差除以标准差后的值。

73. 离散系数：一组数据的标准差与其相应的平均数之比。

74. 偏态：对数据分布对称性的测度。

测度偏态的统计量偏态系数。

75. 偏态系数：对数据分布不对称性的度量值。

76. 峰态：对数据分布平峰或尖峰程度的测度，测度峰态的统计量则是峰态系数。

77. 峰态系数：对数据分布峰态的度量值。

78. 随机事件：在同一组条件下，每次试验可能出现也可能不出现的事件，也叫偶然事件79. 必然事件：在同一组条件下，每次试验一定出现的事件。

80. 不可能事件：在同一组条件下，每次试验一定不出现的事件。

81. 基本事件：如果一个事件不能分解成两个或更多个事件，则这个事件称为基本事件。

82. 概率：对事件发生的可能性大小的度量值。

83. 主观概率：对一些无法重复的试验，确定其结果的概率只能根据经验，人为确定这个事件的概率。

84. 条件概率：当某事件B已发生，求事件A 发生的概率，称为事件B发生条件下事件A发生的条件概率。

85. 独立事件：两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率。

86. 随机变量：事先不能确定其取值的变量。

87. 离散型随机变量：只能取有限个值的随机变量。

88. 连续型随机变量：可以取一个或多个区间中任何值的随机变量。

89. 期望值、数学期望：随机变量的平均取值，各可能值与对应概率乘积之和。

90. 方差：随机变量的每一取值与期望值的离差平方的期望值。

91. 泊松分布：用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的个数的分布。

92. 概率密度函数：对连续型随机变量用函数f(x)来表示。

大于等于0，全积分为193. 统计量：对样本特征的某个概括性度量，是样本的函数。

94. 充分统计量：统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。

95. 抽样分布：样本统计量的概率分布，是由样本统计量的所有可能取值形成相对频数分布。

96. 渐近分布：当n比较大时，用极限分布作为抽样分布的一种近似，这种极限分布常称为97. 自由度：独立变量的个数。

98. 估计量：用来估计总体参数的统计量的名称99. 估计值：估计总体参数时计算出来的估计量的具体数值100. 点估计：用样本估计量的取值直接作为总体参数θ的估计值101. 区间估计：在点估计的基础上，给出总体参数估计的一个估计区间，该区间通常由样本统计量加减估计误差组成102. 置信区间：由样本统计量构造出的总体参数在一定置信水平下的估计区间。

103. 置信水平：也称为置信度或置信系数，在重复构造的总体参数的多个置信区间中包含总体参数真值的次数所占的比例。

104. 无偏性：估计量抽样分布的期望值等于被估计的总体参数105. 有效性：对同一总体参数的两个无偏估计量，有更小标准差的估计量更有效。

106. 一致性：随着样本量的增大，估计量的值越来越接近总体参数。

107. 独立样本：一个样本中的元素与另一个样本中的元素相互独立。

108. 匹配样本：又称配对数据，一个样本中的数据与另一个样本中的数据相对应。

109. 假设检验：先对总体参数提出某种假设，然后利用样本信息判断假设是否成立的过程。

110. 原假设：也称零假设，是研究者想收集证据予以反对的假设，用表示。

111. 备择假设：也称研究假设，是研究者想收集证据予以支持的假设，用或表示。

112. 第Ⅰ类错误：原假设正确时拒绝原假设，犯第Ⅰ类错误概率记。

113. 第Ⅱ类错误：当原假设为错误时没有拒绝原假设，犯第Ⅱ类错误的概率通常记为。

114. 显著性水平：假设检验中发生第Ⅰ类错误的概率，记为。

115. 小概率原理：进行假设检验利用，指发生概率很小的随机事件在一次试验中是几乎不可能发生的。

116. 检验统计量：根据样本观测结果计算得到的，并据以对原假设和备择假设做出决策的某个样本统计量117. 拒绝域：能够拒绝原假设的检验统计量的所有可能取值的集合。

118. 临界值：根据给定的显著性水平确定的拒绝域的边界值。

119. 值：也称观察到的显著性水平，如果原假设是正确的，那么所得的样本结果出现实际观测结果或更极端结果出现的概率。

P值很小说明发生概率很小，拒绝原假设，P越小，拒绝原假设的理由就越充分。

双侧P<0.025 单侧p<0.05 拒绝原假设。

120. 单侧检验：也称单尾检验，是指备择假设具有特定的方向性，并含有符号“>”或“<”的假设检验。

121. 双侧检验：也称双尾检验，是指备择假设没有特定的方向性，并含有符号“1”的假设检验。

e商务文档

统计学基本概念

相关文档推荐：