. .. 2014—2015学年第一学期《定性数据》期末论文题目不同年级与性别对奖助学金渴望度定性数据分析姓名常XX学号***********学院数学与统计学院专业统计专业2014年 12月 18 日不同年级与性别对奖助学金渴望度定性数据分析摘要:定性数据分析是数据分析的一个重要内容,它在实践中有着广泛的应用,如问卷调查、产品检验、医学统计等领域中经常用到列联表的定性数据分析来。
列联表的定性数据分析不χ检验、似然比检验、相合性的度仅可以分析分类特征之间的相互依赖关系,还可以进行2χ检量和检验、计算相关系数作相关分析也可以进行一致性与读了性的检验。
本文主要采用2验、似然比检验、相合性的度量和检验来对不同年级、不同性别的大学生对奖助学金渴望度的独立性、相合性检验,最终得到对奖助学金的渴望度与性别无关、与年级有关。
χ检验似然比检验相合性度量关键词列联表2一、问题简述为了解高某校不同年级不同性别的大学生对奖助学的渴望程度,对某校大一年级、大二年级共80位同学关于奖助学金的调查,并取其中的年级、性别、渴望度三个指标生成列联表,对列联表做定性数据分析。
二、符号说明2χ :卡方统计量 2ln -Λ:似然比统计量 U :统计量p :概率τ :相合性度量统计量三、理论方法理论:列联表一般来说,有二维的r c ⨯ 列联表,假设将n 个个体根据两个属性A 和B 进行分类,属性A 有r 类:1,,r A A ,属性B 有c 类:1,,c B B 。
n 个个体中既属于iA 类又属于jB 类的有ij n 个。
得如下二维的r c ⨯列联表:表一其中,,i ij jn n +=,1,,;i r = j i ij n n +=,1,,,i j ijj c n n n ++===。
如果n 个个体根据三个或三个以上的属性分类,就会有三维或三维以上的列联表,对于高维的列联表一般将其压缩为二维列联表在对数据进行统计分析或对高维列联表进行分层在检验。
方法:对二维表中的数据进行2χ 检验、似然比检验、相合性的度量和检验。
四、数据的来源与数据处理本数据的来自在2014年6月所做的 《关于奖助学金的问卷调查》,本问卷共发放80份,实际回收77份。
其中选年级、性别、渴望程度三个指标统计数据得如下的三维224⨯⨯ 的列联表:(其问卷和原始数据以及选出的三个指标的数据见附录)表二1、列联表的压缩列联表的压缩即把高维列联表某一属性不同情况的数据合并在一起得到低维列联表德尔过程。
将表二中不同年级、不同性别的人数分别合并在一起,将三维224⨯⨯列联表分别压缩为如下的二维列联表。
表三表四2、列联表的分层列联表的分层即将高维列联表按某一个属性分成几个低维列联表,把表二按年级将三维列联表分为两个二维列联表。
表五表六五、检验与分析5.1、描述性统计对表二中的渴望度数据作柱形图和饼图,分析各渴望度所占的多少和比率。
在柱形图和饼图中可以看出,在所以调查的学生中对奖助学金非常渴望的人最多,其次是一般渴望,再次是渴望,最后是无所谓,也就是说大学生都比较渴望得到奖助学金的。
5.2、压缩列联表的检验与分析1、2χ检验和似然比检验(1)假设101:j rj r p p H p p ++==(属性相互独立)111:j rj r p p H p p ++≠≠(属性不独立)(2)检验当两个属性独立时,根据11j rjr p p pp++==可知个体在每一类中的概率ij p 由1,,r p p ++和1,c p p ++ 完全确定,所以二维列联表的独立性检验实际上是带参数时的分类数据检验。
其统计量是自由度为()()11r c -*-的2χ 统计量(2211iji j i jn nn nχ==++=∑∑),在水平α 下2χ检验的拒绝域为2χ>2211iji j i jn nn nχ==++=∑∑也就是说,此时可认为独立性不成立,否则,可认为独立性成立。
二维列联表的独立性检验的似然比检验的统计量为:112ln 2ln()r ci jij i j ijn n nn n++==-Λ=-∑∑。
也可以计算p 来完成检验,p 值等于自由度为()()11r c -*-的2χ变量大于等于2χ 统计量的值的概率,如果p α≥值则拒绝原假设,如果p α≤ 值,则不拒绝原假设。
对压缩后的列联即表三(性别与渴望度)用SPSS 进行2χ检验得2χ 值和p 值如下:性别与渴望度的卡方检验表由上表可知20.356,0.9490.05p χ==>且2ln 0.355,0.9490.05p -Λ==> 所以不拒绝原假设,独立性成立即性别与渴望度是相后独立,也就是说性别与奖助学渴望度无关。
对表四(年级与渴望度)用SPSS 进行2χ检验得2χ 值和p 值如下:年级与渴望度的卡方检验表由上表可知211.298,0.010.05p χ==<且2ln 14.462,0.0020.05p -Λ==<,所以拒绝原假设,独立性不成立即年级与渴望度是相关的,也就是说年级与奖助学渴望度有关。
2.相合性的度量和检验由于2χ检验和似然比检验得年级与渴望度是相关的,所以对年级和渴望度进行相合性度量和检验,属性之间的相合关系有正相合(属性A 比较大的个体,属性B 也往往比较大)、负相合(属性A 比较大的个体,属性B 却往往比较小)。
度量列联表相合性的方法有Kendallτ系数、Gamma 系数和Somers d 系数。
主要用Kendall τ系数来度量年级与渴望度的相合性,其统计量为:τ=11(1)(1),22rc j ji i A B i j n n n n T T ++++==--==∑∑,|z |≤而τ的值在-1和1之间,其值接近1,倾向于认为正相合;值接近于-1,倾向于认为负相合。
相合性的检验是原假设为属性A 和属性B 相互独立,备择属性A 与属性B 正相合的检验,其统计量为:n n n n U -=和22112212211212(1)(n )n n n n n n n n χ++++--= ,在对称度量表中可以看出相合性检验并不显著,也就是说年级与渴望度不是正相合关系。
用SPSS 对年级和渴望度因为经检验得0.040τ=>但远远小于1,且接近于0,而0.750.05p => 也就是说要拒绝原假设,所以可以认为年级与奖助学金的渴望程度相合性的检验不通过。
5.3、分层列联表的检验与分析用SPSS 分别对分层列联表(表五、表六)进行2χ检验和似然比检验得:卡方检验a 3 单元格(50.0%) 的期望计数少于 5。
最小期望计数为 2.08。
b 仅对 PxP 表计算,其中 P 必须大于 1。
大一年级性别与渴望度的卡方检验表从表中可以看出22.895,0.2350.05p χ==>且2ln 2.981,0.2250.05p -Λ==>即大一年级的男女对奖助学金的渴望度是独立的,也就是说性别与渴望度无关。
卡方检验a 5 单元格(62.5%) 的期望计数少于 5。
最小期望计数为 1.65。
b 仅对 PxP 表计算,其中 P 必须大于 1。
大二年级性别与渴望度卡方检验表从表中可以看出21.845,0.6050.05p χ==>且2ln 1.694,0.6380.05p -Λ==>即大二年级的男女对奖助学金的渴望度是独立的,也就是说性别与渴望度无关。
这与表三(性别与渴望度)的2χ检验和似然比检验的结果一致。
六、结论检验、似然比检验及相合性的度量和检验可经过分别对压缩列联表和分层列联表的2以认为不同年级的大学生与奖助学金的渴望度有关系,而不同性别的大学生与奖助学金的渴望度是有关系。
参考文献[1] 王静龙,梁小筠.定性数据统计分析.:中国统计出版社,2008.7附页(数据)附页(问卷)关于奖助学金的问卷调查一.调查目的:深入了解我院来自不同年级,不同环境,不同性别的大学生对奖助学金的使用情况。
二.调查方式:共发放80份,分两组发放,每组发40份。
三.问卷设计:1.你所在的年级:___A.大一B.大二2.你的性别:___A.男B.女3.你来自:___A.农村B.乡镇C.县城D.城市4.你的主要经济来源?___A.勤工俭学B.助学金C.信用借贷D.家庭补助5.你在学期间一个月的伙食费?___A.300元以下B.300到400C.400到500D.500元以上6.你对奖助学金的渴望程度?___A.非常渴望B.一般渴望C.渴望D.无所谓7.你觉得奖助学金对你帮助大吗?___A.很大B.一般C.很小D.没有帮助8.请问你拿奖助学金的目的是:___(多选题)A.为了得到荣誉B.为了经济上的帮助C.为了以后找工作增加砝D.没有注意奖助学金E.其它____________9.获得奖助学金的次数?___A.一次B.两次C.三次D.四次E.未获得过10.当你拿到奖学金后,你是如何安排这笔费用的?___(多选题)A.请客送礼B.学习之用C.犒赏自己D.生活费用E.其它____________11. 拿了奖学金,你用在学习上的去向是什么?___(多选题)A.买参考书、资料书B.交学费C.买学习工具D. 买课外书E.其它____________12. 当你获得助学金时,你打算用多久?___A.一年B.半年C.一至三个月D.一个月以下13.当你获得助学金时,会有什么感受:___(多选题)A.非常开心,下决心科学使用B.蛮开心的,父母一定很欣慰C无所谓 D.习惯了 E.郁闷,又要请客了。