研究生统计与科研方法复习补一、 选择题略二、 简答题1. 医学参考值范围与区间估计的区别与作用分别是什么?2. 以样本均数与总体均数比较为例说明区间估计与假设检验区别与联系。
3. 线性相关与回归的区别与联系。
4. t 检验与方差分析的区别与联系?5. 某医生在一个有1000名员工的企业,随机调查了200名员工,其中50人患有职业病,其中男40人、女10人,得相对数是80%与20%,由此得结论男性更易患职业病。
此结论是否正确?请陈述理由。
6. 参数检验与非参数检验的区别? 7. 计算相对数的注意事项是什么?8. 两样本均数比较时为什么要做统计检验?9. 假设检验的两类错误是什么?其含义是什么?如何控制? 10.将18名原发性血小板减少症患者按年龄相近的原则配为6个区组,每个区组中的3名患者随机分配到A 、B 、C 三个治疗组中,治疗后测定血小板变化量。
经初步计算,180SS =总,120SS =治疗组,10SS =误差。
试列出该实验数据的方差分析表。
11. 以 t 检验和秩和检验为例,说明参数检验与非参数检验的优缺点。
12.某研究者调查了40名腔隙性脑梗塞患者,其中20例单发,20例多发,记录了与脑梗塞是否多发的可能有关的危险因素情况,其中吸烟量定义如下;不吸烟=0,<10支/天=1,>=10支=3。
数据见下表40名腔隙性脑梗塞患者的调查数据性别 1x 吸烟量 2x 患糖尿病 3x 胆固醇 4x 甘油三脂 5x 低密脂蛋白 6x 高密脂蛋白 7x单发多发y 0 1 1 5.65 2.34 3.61 1.98 0 130 6.23 3.89 2.11 .99 0 ┇ ┇┇┇┇┇┇┇┇┇┇┇┇┇┇┇1 2 1 4.14 .92 2.61 1.23 1 0 0 0 5.09 2.41 2.96 1.03 1问:1)说明吸烟量、低密脂蛋白、单发多发、胆固醇、患糖尿病等指标的变量类型?2)假设低密脂蛋白、高密脂蛋白服从正态分布,胆固醇、甘油三脂服从偏态分布,问用什么方法检验单发与多发在高密脂蛋白、吸烟量、性别三个指标上的差异?3)用什么方法分析脑梗塞是否是影响多发的可能有关因素?4)用什么方法分析影响低密脂蛋白多少的有关因素?5)用什么方法分析低密脂蛋白与甘油三脂之间的关联?13.某研究者调查了80名65岁以上的老人,调查数据资料如下表,其中吸烟量定义如下;不吸烟=0,<10支/天=1,>=10支=2。
80名糖尿病患者的调查数据性别1x 吸烟量2x患糖尿病3x胆固醇4x甘油三脂5x低密脂蛋白6x高密脂蛋白7x饮酒否8x0 1 1 5.65 2.34 3.61 1.98 01 3 0 6.23 3.89 2.11 .99 0 ┇┇┇┇┇┇┇┇┇┇┇┇┇┇┇┇1 2 1 4.14 .92 2.61 1.23 1 0 0 0 5.09 2.41 2.96 1.03 1问:1)说明吸烟量、低密脂蛋白、饮酒否、胆固醇四个指标的变量类型?2)假设低密脂蛋白、高密脂蛋白服从正态分布,胆固醇、甘油三脂服从偏态分布,问用什么方法检验患糖尿病与不患糖尿病人在低密脂蛋白、吸烟量、饮酒上的差异?3)用什么方法分析是否患糖尿病的可能有关因素?4)用什么方法分析影响低密脂蛋白多少的有关因素?5)用什么方法分析高密脂蛋白与甘油三脂之间的关联?13. 某研究者收集了60名呼吸道疾病患者,随机分两组。
其中30例服用新药,30例服用常规药物,记录了WBC及与其可能有关的因素情况,经半个月治疗后,再测这些患者的WBC,数据见下表。
(本题共20分)其中:吸烟量定义(不吸烟=0,<20支/天=1,>=20支=2)药物定义(药物=1为新药药物=0为常规药物)饮酒否饮酒否=1为饮酒饮酒否=0为不饮酒60名呼吸道疾病患者的实验数据药物1x 吸烟量2x饮酒否3xN(中性)4xPLT5x治疗前WBC6x治疗后WBCy0 1 1 75.65 22.34 10.8 8.21 2 0 46.23 33.89 11.1 8.6 ┇┇┇┇┇┇┇┇┇┇┇┇┇┇1 2 1 54.14 29.92 10.5 9.1 0 0 0 65.09 32.41 9.9 7.2问:1)说明吸烟量、WBC、饮酒否三个指标的变量类型?2)假设N(中性)、治疗后WBC服从正态分布,治疗前WBC、PLT服从偏态分布,问用什么方法进行如下分析:①不同用药组N(中性)的差异?写出检验公式。
②新药组在治疗前WBC与治疗后WBC上的差异?写出检验公式。
③描述PLT与治疗后WBC的最佳统计指标分别是?3)用什么方法分析影响治疗后WBC高低的可能有关因素?4)用什么方法分析两种药物的治疗疗效?写出检验公式。
三、随机化题1.用下列随机排列表,将26名门诊病人随机分配到A、B两个实验组,请写出分组过程与结果。
30个自然数的随机排列0 1 2 3 4 5 6 7 8 90 20 1253262117924191 0 14622112829273822 0 15181251647131232.用下列随机排列表,将27名门诊病人随机分配到A、B、C三个实验组,请写出分组过程与结果。
30个自然数的随机排列0 1 2 3 4 5 6 7 8 90 20 125326211792419110212223000 4 6 2 1 8 9 7 0 8 22 0 15181251647131233.用下列随机排列表,将28只老鼠随机分配到实验组(A)与对照组(B)中,请写出分组过程与结果。
(10分)30个自然数的随机排列0 1 2 3 4 5 6 7 8 90 20 1253262117924191 0 14622112829273822 0 1518125164713123四、计算结果分析题。
(一)某医师为研究A、B两药的疗效,随机将门诊病人40名分成两组,分别记录两个观察指标的值,结果如下:A组B组吞噬率退热时间吞噬率退热时间46 25 76 3656 30 77 40┇┇┇┇75 148 88 64某统计师采用SPSS软件进行了分析,分析结果如下,根据所给结果回答如下问题。
1. A 、B 两组两个指标是否均服从正态分布?并说明理由?2. 给出A 、B 两组两个指标的统计描述。
3. A 、B 两组两个指标是否具有差异?并说明理由?4. 两个指标是否具有相关性?请给出统计描述,并说明理由?组别 = A 药 组别 = B 药Statisticsa 20200046.300067.35003.023.489.512.51210.102 1.494.992.99232.750061.750039.000067.000046.000071.0000Valid MissingNMeanSkewnessStd. Error of Skewness KurtosisStd. Error of Kurtosis 255075Percentiles退热时间吞噬率组别 = A 药a.Stat isticsa 2020072.450069.00002.346.824.512.5124.770.269.992.99245.000060.500056.000069.500063.000075.0000Valid MissingNMean SkewnessStd. Error of Skewness KurtosisStd. Error of Kurtosis 255075Percentiles退热时间吞噬率组别 = B 药a.Independent Samples Test3.810.058-1.90138.065-1.90128.067.0681.412.242-.45038.655-.45035.778.655Equal variances assumedEqual variances not assumedEqual variances assumed Equal variances not assumed退热时间吞噬率F Sig.Levene's Test for Equality of Variancest df Sig. (2-tailed)t-test for Equality of MeansTest Statisticsb83.000191.500293.000401.500-3.168-.230.002.818.001a.820aMann-Whitney U Wilcoxon W ZAsymp. Sig. (2-tailed)Exact Sig.[2*(1-tailed Sig.)]退热时间吞噬率Not corrected for ties.a. Grouping Variable: 组别b.Correlations1.033..8404040.0331.840.4040Pearson Correlation Sig. (2-tailed)NPearson Correlation Sig. (2-tailed)N退热时间吞噬率退热时间吞噬率Correlations1.000.219..1754040.219 1.000.175.4040Correlation Coefficient Sig. (2-tailed)NCorrelation Coefficient Sig. (2-tailed)N退热时间吞噬率Spearman's rho退热时间吞噬率(二)某医师为研究A、B、C两药的疗效,随机将门诊病人60名分成两组,分别记录两个观察指标(吞噬率、退热时间)的值,结果如下:A组B组C组吞噬率退热时间吞噬率退热时间吞噬率退热时间46 25 76 36 56 2656 30 77 40 67 42┇┇┇┇┇┇75 148 88 64 88 54某统计师采用SPSS软件进行了分析,分析结果如下,根据所给结果回答如下问题。
1.A、B、C三组两个指标是否均服从正态分布?并说明理由?2.给出A、B、C三组两个指标的统计描述结果。
(用正确的统计表表达)。
3.A、B、C三组两个指标是否具有差异?并说明理由?4.A组两个指标是否具有相关性?请给出统计分析结果,并说明理由?StatisticsA药B药C药退热时间吞噬率退热时间吞噬率退热时间吞噬率N Valid 20 20 20 20 20 20 Missing 0 0 0 0 0 0Mean 46.3000 67.3500 74.9500 69.0000 41.6500 63.7500 Std. Deviation 27.68640 10.04870 54.07254 12.96148 28.92690 16.04886 Skewness 3.023 .489 2.329 .824 3.337 -.128Std. Error ofSkewness.512 .512 .512 .512 .512 .512 Kurtosis 10.102 1.494 4.747 .269 13.024 -.427Std. Error ofKurtosis.992 .992 .992 .992 .992 .992 Minimum 25.00 46.00 36.00 52.00 16.00 34.00 Maximum 148.00 91.00 240.00 98.00 154.00 91.00Percentil es 2532.7500 61.7500 48.5000 60.5000 26.5000 53.25005039.000067.000057.500069.500036.500067.0000 7546.000071.000064.000075.000045.000073.2500Test of Homogeneity of VariancesLeveneStatisticdf1df2Sig. 退热时间 2.953 2 57 .060 吞噬率2.810257.105AN OVA13008.9026504.450 4.310.01886015.70571509.04799024.6059288.3002144.150.821.44510004.3057175.51410292.6059Between Groups Within Groups TotalBetween Groups Within Groups Total退热时间吞噬率Sum of Squares dfMean Square F Sig.NPar TestsKruskal-Wallis TestRanks2025.832044.002021.68602031.202032.702027.6060组别A 药B 药3.00Total A 药B 药3.00Total退热时间吞噬率N Mean RankTest Statisticsa,b 18.530.90522.000.636Chi-SquaredfAsymp. Sig.退热时间吞噬率Kruskal Wallis Test a. Grouping V ariable: 组别b.Correlat ions1.563**..0102020.563**1.010.2020Pearson Correlation Sig. (2-tailed)N Pearson Correlation Sig. (2-tailed)N 退热时间吞噬率组别A 药退热时间吞噬率Correlation is significant at the 0.01 level (2-tailed).**.Correlat ions1.000.680**..0012020.680** 1.000.001.2020Correlation Coefficient Sig. (2-tailed)NCorrelation Coefficient Sig. (2-tailed)N退热时间吞噬率Spearman's rho组别A 药退热时间吞噬率Correlation is significant at the 0.01 level (2-tailed).**.(三)某医师为研究A 、B 、C 三药的疗效,随机将门诊病人60名分成三组,分别记录两个观察指标载脂蛋白(mg/dl )、胆固醇的值(mmol/L ),结果如下:A 组B 组C 组载脂蛋白 胆固载脂蛋白 胆固载脂蛋白 胆固醇醇醇85.7 5.24 96.0 4.89144.5.0105. 2 5.28124.55.12117.4.85┇┇┇┇┇┇109. 5 5.45105.15.16110.4.78某统计师采用SPSS软件进行了分析,分析结果如下,根据所给结果回答如下问题。