分类变量数据分析(1)
参考书:
• 1、Scott Long, J. Scott. 1996. The Analysis of Categorical and Limited Dependent Variables. New York: SAGE
• 2、Daniel A. Powers & Yu Xie 2008. Statistical Methods for Categorical Data Analysis ACADMIC PRESS(中文版)
Observed=Summary + Residual
2.5 准确(accuracy)与简约(parsimony)
• There is always a tension between accuracy and parsimony.
• Occam's Razor: Principle of parsimony.
2.2 Categorical Dependent Variables
• Dependent Variable (response, outcome, endogenous)
• Independent Variable (explanatory, predetermined, exogenous)
分类变量数据分析(Categorical Data Analysis)-应用与实践
ljx@ 2012-02-15
一、课程简介 • 课程缘起 • 课程内容及目标 • 课程讲授方法 二、课程导论 • 基本概念
主要内容:
1)二分变量Logit模型(Binary Logit model) 及二分变量模型的应用实例;
• 3、王济川, 郭志刚 Logistic回归模型 方法 与应用 高教出版社,
二、课程导论
2.1 Categorical Variable • We define categorical variables as those
variables that can be measured using only a limited number of values or categories. • Vs Continuous Variable • 特征属性、行为选择及结果、态度意愿等
• 因变量的测量类型决定了研究者该选何种 统计分析模型或方法。
2.3 Types of Measurement
• Quantitative & Qualitative
Quantitative
Qualitative
Continuous Discrete (Count)
Ordinal
Categorical
Continuous Categorical ANOVA,LR Gender on Inc.
Categorical Continuous Logit/Probit F.Inc on Edu. R
Categorical
Categorical
Loglinear , Logit/Probit R
Race on Edu.
a. LR Model1
• . regress des edu [fweight=freq]
• Source | SS df MS
• -------------+-----------------------------------ห้องสมุดไป่ตู้--------
•
Model | 30.2967799 1 30.2967799
Nominal
2.4 Basics of Regression
• Three interpretations of Regression • Causation
Observed=True Mechanism + Disturbance • Prediction
Observed=Predicted + Error • Description
•
3 | 52 1,565 3,144 40 | 4,801
•
4 | 6 306 555
7 | 874
• -----------+--------------------------------------------+----------
• Total | 140 3,115 7,556 176 | 10,987
• 通过本课程的学习,掌握社会科学中最常 用的分类数据分析方法,并可以较熟练地 进行实际应用,提高学生定量研究方法的 分析技能。
授课方式:
• 本课程以研究生为对象。讲课形式以教师 和学生共讲、讨论为主。要求学生在课前 认真准备,课上积极发言和参与讨论。
成绩评定:
• 课程成绩将由学生出勤、课堂表现(发言、 讨论)和期末成绩而确定。
例1 教育水平与生育意愿
•
|
des
• edu | 0 1
2
3 | Total
• -----------+--------------------------------------------+----------
•
1 | 24 257 960
56 | 1,297
•
2 | 58 987 2,897 73 | 4,015
• The principle states that one should not make more assumptions than the minimum needed.
2.6 Types of Regression
Case 1 2 3 4
D.V
InD.V M. of A. Exam.
Continuous Continuous Correlation, F.Inc.on IQ LR
2)列联表与Loglinear模型;
3)定序变量Logit模型(Ordinal Logit model) 及 定序变量Logit模型的应用实例讨论;
4)多项分类变量Logit模型(Multinomial logit model)及多项分类变量Logit模型的 应用实例等。
• 本课程注重培养学生的实践能力和实际应 用。要求学生具备基本统计知识和方法并 能够使用统计软件。
• Residual | 2877.59218 10985 .261956502
• -------------+--------------------------------------------