话说呢,这其实是我们概统小组(褚君、刘畅、韩冰、李铖)的小组作业,应广大人民同志的要求,特意发上来~~特别鸣谢:褚君、刘畅两位技术大牛!!!没有你们就没有这篇惊天地泣鬼神的报告!!有木有!!还有冰哥!!@起人来灰常给力!!一、问题提出从古到今,青年男女的恋爱总是大家评论的热门话题。
在中国古代,青年男女秉承父母之命、媒妁之言,通过媒婆相互共同,最终达成秦晋之好。
时至今日,社会风气自由开放,人们更加推崇给予当事人更大自主权的“婚姻自由,恋爱自由”之原则。
因此,选择伴侣的过程由一家之言逐渐演化成为多因素共同决定、相互影响的过程。
具体到大学生而言,由于绝大部分大学生基本已步入成年,对选择伴侣一事已具有一定的自主权与自由,如何能找到最佳的伴侣也成为不少大学生,尤其是男生所考虑的一件事。
而对于究竟何种特质左右着男生“脱光”与否一事,则是仁者见仁,智者见智。
因此,基于以上现状,我们觉得有必要影响对大学男生“脱光”的特质进行探究,以为广大寄希望于在大学生活中收获美满爱情的男生提供具有一定价值与说服力的指导。
二、研究设计(一)实验变量在进行待探究变量的选取时,我们从个人基本信息、生活习惯及恋爱预期三个方面出发进行变量的筛选,其中囊括了连续变量与离散变量,具体如下。
1.连续变量:身高(cm)体重(kg)当前平均绩点意愿为恋爱活动花费的金额上限2.离散变量:年级、现在恋爱状态(是或否)、是否具有恋爱经历(是或否)、进入大学的途径(正常高考、竞赛保送、自主招生)、每周花费在课程学习上的小时数(分段计量)、每周花费在社团活动方面的小时数(分段计量)、在电子游戏方面花费的小时数(分段计量)、各类社交网络方面花费的小时数(分段计量)、每周洗澡的次数每学期剪发的次数、平均每餐饭需要的米饭量、体质健康测试的成绩、《思想道德修养与法律基础》总评成绩、平均每月所需的生活费(分段计量)(二)问卷研究1.问卷目的:充分收集现象,为对总体进行估计提供基础。
2.问卷设计问卷主要由三部分构成:其一,向被调查者说明本组研究目的,并向其承诺问卷调查结果将被严格保密。
其二,个人信息部分,针对被调查者个人的基本状况的调查部分。
其三,主要问题部分,针对被调查者对于各问题偏好的调查部分。
3.问卷测试、发放与回收在正式发放问卷之前,我们首先打印了15份纸质版问卷在私下进行小范围的发放,通过被调查者的反馈与建议,我们对问卷中的措辞及选项设计的不当进行了更正。
正式问卷的发放采用专业的问卷网站“问卷星”进行。
问卷发放采取在人人网等社交网站平台上对符合条件的被调查者(男生)进行邀请的方法。
据统计,本组问卷页面的访问人次达到449次(其中独立IP数为262),最终有效答卷为137份,完成率为30.51%。
word编辑版.三、数据统计与分析(一)统计结果描述1.性别分布由于本研究针对男生进行,因此本次问卷回答者均为男性。
2.年级分布本次接受调查者普遍为本科全日制在校大学生(除两人为研究生),其中,各年级人数分布如下:Figure 1 年级分布由上图可以看出,本次调查中大二年级的同学占绝大多数,达51.2%,其次为大一同学,占23.36%,大三与大四同学分别占到14.6%与9.49%,本科以上学历者仅占到1.46%。
3.现在所处感情状态与感情经历Figure 2 目前感情状态word编辑版.感情经历Figure 3,而有伴侣者3/4由上图可以看出,在本次的被调查人群中,目前无伴侣者约占到总人数的)的调查者曾有过感情经历,3/81/2(总样本的仅占到1/4。
在目前无伴侣的调查者中,约3/8)还未曾有过感情经历。
而另外1/2(总样本的入学途径4.入学途径Figure 4;在关于入学途径的调查中,通过普通高考进入大学的被调查者占绝大多数,达到67.15%。
19.71%;竞赛保送的同学占到13.14%其次为自主招生,占到身高5.word编辑版.本次被调查者的总体身高分布情况,及对应正态分布图线如上图所示。
其中,中位数5.38据统计,本次调查中,被调查者身高的样本均值为175.86cm,标准差为160cm。
,最大值与最小值分别为,众数为170cm192cm与为176cm6.体重本次被调查者总体体重分布情况,及正态分布图线如上图所示。
其中,中位数,标准差为66.56kg8.01据统计,本次调查中,被调查者体重的样本均值为50kg与。
87kg65kg与众数均为,最大值与最小值分别为平均绩点7.word编辑版.(由于被调查人群中大一年级及正态分布图线如上图所示本次被调查者总体绩点分布情况,份调查结果)同学尚未得知其平均绩点,因此仅选择了非大一年级同学的剩余92,3.37其中,中位数为3.33被调查者体重的样本均值为,标准差为0.31。
据统计,本次调查中,。
与2.39众数为3.25,最大值与最小值分别为3.85(二)交叉分析年级与平均身高1.方差分析:单因素方差分析(年级对于平均身高的影响)SUMMARY方差求和平均组(年级)观测数26.62879 2117 176.4167 4 1236.80117 176.3684 3 19 3351527.7598 173.1921 2 61 10564.7226.31613 175.129 1 31 5429方差分析F crit F MS P-value SS df 差异源2.680811 0.2695 0.84728 226.9944 3 75.66481 组间33410.41 119 280.7597 组内33637.4 122 总计法,对获得的身高值与所在年级的数据处理之后的结果。
我们发现,以上为通过ANOVA,非常大,因此我们可以认为,原假设“μ1=μ2=μ3=μ4”可p-value=0.84728观测到的数据的的条件下,α=0.05F值的比较看出来。
由上表我们看出,在以被接受。
这个同样可以通过因此我们同样可以得出结论,远小于前者,值为0.2695,F,F3,119,0.05=2.680811而观测到的原假设应当被接受。
所以,我们得出结论,年级对于男生的身高没有很大的影响。
word编辑版.2. 年级与平均体重的影响方差分析:单因素方差分析(年级对于平均体重的影响)SUMMARY平均方差组(年级)观测数求和809 67.41667 68.08333 4 1265.73684 44.64912 3 19 124965.3362 2 61 4078 66.852461 31 2051 66.16129 77.47312方差分析SS df MS F P-value F crit 差异源31.82613 3 10.60871 0.161914 0.921786 2.680811 组间7796.967 119 65.52073 组内7828.793 122 总计同样的,P-value 明显高于显著性水平,因此我们得出结论:年级对于男生的体重没有显著影响。
3.出生地与绩点方差分析:单因素方差分析(地域对于绩点的影响)SUMMARY组(地区)观测数求和平均方差1 17 56.99 3.352353 0.0421322 76 250.34 3.293947 0.163931方差分析SS df MS F P-value F crit 差异源0.04739 1 0.04739 0.332526 0.565599 3.945694 组间12.96892 91 0.142516 组内13.01631 92 总计类似的,我们做出了不同地域的同学的平均绩点的差异比较。
组1是来自一线城市的同学的数据,组2是来自其他地区城市的同学的相应数据。
我们在本次研究中把“一线城市”定义为:北京,上海,广州,重庆,天津,香港,台北。
通过ANOVA表我们看出,“一线城市”同学的平均绩点要比其他城市同学的要稍微高一点点,可是差别并不显著,因为P-value也较大。
因此我们认为,来自不同地区的同学的成绩并不存在显著的差异。
4.身高与体重word编辑版.的值都很小,说明身高P-value以及β1的由上表及残差图我们可以看出,由回归得出的β0这个回检验的显著性水平和残差图都让我们相信,与体重是具有显著的线性相关关系的。
F体重与身高水平间是具该结果检验了一个大家公认的道理,归模型是可行且有效的。
因此,有明显的相关性的。
(三)针对影响脱光与否的变量的探究1.样本数据的整理等数据,而我们推测这些数据应该与是否脱光有一定联系,由于大一新生缺乏体侧和GPA等数位同学的数据,包括体测与GPA所以做出了两个样本,Sample1包含大二至大四的93Sample2包括大一到大四所有有效问卷的所有变量数据。
据,如果已经脱光的人这个问题就直接跳转对于恋爱史这个问题的回答,由于问卷设计的问题,回归时,百分百Logistic了,所以所有已经脱光的同学的第三题回答都是“跳过”,造成做匹配的错误结果。
回归模型理论回顾及应用2.logistic回归理论:)Logistic 1回归模型是一种概率模型,适合于病例—对照研究、随访研究和横断面研究,且结Logistic可用影响结果变量发生的因素为自变量与因变果发生的变量取值必须是二分的或多项分类。
量,建立回归方程。
未发病(阴性、生存、未治愈等)发病(阳性、死亡、治愈等),y=0 令:y=1回归模型为:之间的P,它与自变量x1, x2,…,xpLogistic发病的概率记为可知,不发病的概率为:word编辑版.经数学变换得:定义:Logistic变换即为:流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露人群发病优势与非暴露人群发病优势之比。
即Xi的优势比为:2)Logistic回归模型在本研究中的应用A. Sample1分析:l 变量说明x5 出生地城市等级x6 填写问卷所用时间x7 年级x8 学习时间x9 社交活动时间x10 游戏时间x11 社交网络时间x12 每周洗澡次数x13 每学期剪发次数x14 每餐饭饭量x15 月平均生活费x16恋爱活动花销上限Logistic regression l127 Number of obs =4.90 chi2(15) = LR0.9930Prob > chi2 =Pseudo R2 = 0.0332Log likelihood = -71.335948word编辑版.方很低,说明模型对数据的解释程度很小,没有发现显著的相关性。
的伪RSample1分析B. Sample 2变量说明lx1 入学途径x2 眼镜度数x3 身高x4 体重x5 出生地城市等级x6 平均绩点x7 学习时间x8 社团活动时间x9 游戏时间x10 社交网络时间x11 每周洗澡次数x12 每学期剪发次数x13 每餐饭饭量x14 体质健康测试成绩x15 《思想品德修养》成绩x16 月平均生活费x17 恋爱活动花销上限x18 填写问卷所用时间x19年级l Logistic regression word编辑版.Number of obs = 9319.76 LR chi2(19) =0.4091Prob > chi2 =Pseudo R2 = 0.1825Log likelihood =-44.25333895% Conf.Interval1.7339650.3323171.0007640.9960310.9537431.0665221.0769050.9171335.5063330.308559 123.27380.8840940.3980871.1531760.6473931.4254420.9188151.9788280.6290721.4189973.84324 30.8715492.0713910.3599870.3865081.926830.9648771.0660610.8835891.0791130.4276291.7737971.0003760.9982550.980861.0002010.4902782.218532C.回归结果分析观察伪R方,为0.1825,因为是取实际数据而且对于总的人口来说,大小为93的样本略小,所以模型拟合度较低也是在接受范围之内。