当前位置:文档之家› 2015数据分析-期末大作业要求北交大总结

2015数据分析-期末大作业要求北交大总结


汽车销售数据.sav
第7题:回归分析2
以汽车销售数据数据为例(其中销售量数据
为对数转换形式,其分布近似为正态分布,如
此能更好地拟合线性回归):
• 建立多元线性回归模型(需给出最终模型),分析汽
车特征与销售量之间的关系,并利用回归结果给出
改进汽车设计方案的建议,以促进销售量的提高。
• 解释变量采用向后筛选策略,并做多重共线性、 方差齐性和残差的自相关性检验。
• 利用裁判打分的数据进行层次聚类分析,
试分析各国裁判打分标准是否有相似性,
若选出4个代表性的裁判应如何选?
• 要求:选择正确的聚类类型,其中个体距
离采用平方欧式距离,类间距离采用组内
平均链锁距离。输出结果应包括树状图、
冰柱图。
天津食品消费相关数据.sav
第14题:时间序列分析1
• 利用 1950年~ 1990年的天津食品消费数据,分 析这段时间内的人均生活费用年收入的变化情 况。要求:数据进行对数变换后,运用 Brown 线性趋势平滑模型分析。 • (1)输出均方根误差和参数估计结果,给出最终 模型表达式;
• 作业需要包括题号、基本思路、操作步
骤(用文字叙述即可)、结果(重要结果需 要附上图表)、结果的解释和结论(这个很
重要)等。
基本要求:
• • • • • • • • • • 学号尾号为0的学生,做第1,6,11题; 学号尾号为9的学生,做第2,7,12题; 学号尾号为8的学生,做第3,8,13题; 学号尾号为7的学生,做第4,9,14题; 学号尾号为6的学生,做第5,10,15题; 学号尾号为5的学生,做第2,6,15题; 学号尾号为4的学生,做第3,7,14题; 学号尾号为3的学生,做第4,8,12题; 学号尾号为2的学生,做第5,9,11题; 学号尾号为1的学生,做第1,10,13题。
汽车销售数据Βιβλιοθήκη sav第6题:回归分析1以汽车销售数据数据为例(其中销售量数据
为对数转换形式,其分布近似为正态分布,如
此能更好地拟合线性回归):
• 建立多元线性回归模型(需给出最终模型),分析汽
车特征与销售量之间的关系,并利用回归结果给出
改进汽车设计方案的建议,以促进销售量的提高。
• 解释变量采用逐步筛选策略,并做多重共线性、 方差齐性和残差的自相关性检验。
第10题:回归分析5
• 在居民储蓄调查数据中以“什么合算”为因 变量(令Y=1为存款合算 ,Y=0为买东西合算 ), 分析户口类型、年龄、收入情况等对居民存 款偏好的影响。(显著性水平α取0.1,用强制
进入法,需给出最终模型表达式)
购房调查数据.sav
第11题:回归分析6
• 在购房调查数据中以“住房满意度”为因变 量 ( 令 Y=1 为满意 ,Y=0 为不满意 ) ,分析卖掉 现房、是否贷款、人均现住面积等对住房满 意度的影响(需给出最终模型表达式)。
相关回归分析(年人均消费支出和教育).sav
第8题:回归分析3
• 根据收集的 1978 年至 2002 年的数据,分析在 外就餐费用受年人均可支配收入的影响。 (提示:首先绘制两者的散点图。再尝试选择 二次、三次曲线、复合函数和幂函数模型,
利用曲线估计进行本质线性模型分析,需给
出最优的回归模型表达式。)
相关回归分析(年人均消费支出和教育).sav
第9题:回归分析4
• 根据收集的 1981 年至 2002 年的数据,分析住 房人均使用面积随时间的变化趋势。 (提示:首先绘制两者的散点图。再尝试选择 对数、二次、三次曲线模型,利用曲线估计
进行本质线性模型分析,需给出最优的回归
模型表达式。)
居民储蓄调查数据2.sav
居民储蓄调查数据2.sav
第5题:基本统计+方差分析5
利用居民储蓄调查数据2,随机选取90%样本。 (1) 对居民一次存款金额按照什么合算进行分类 ,比较他们的均值、四分位数和标准差。 (2) 分析不同户口的储户对“利率不变准备”是
否持相同的做法。
(3) 检验什么合算(的看法)和收入水平对储户存款 金额的影响(需考虑交互作用)。
• (2) 输出 ACF 和 PACF 图形并对其特征进行分 析,看是否满足白噪声序列的条件; • (3)给出1991-1992的预测值,并输出拟合图。
• 前面的15道题,每人按要求做其中的3道即可 ,且要求11月04日最后一次课交打印稿, 迟交 作业者作为不及格或缺考处理。
• 后面的案例设计题, 11月20日交电子稿即可 ,每3-5人自由组合为一组,最后由组长以压 缩包方式发邮件给我即可。 • 包括word和.sav文件分别以组长学号(姓名)_案 例,学号(姓名)_数据集1,2命名。 • Word文件封面写上各组员姓名学号,文件中还 需要说明清楚每人的分工。
居民储蓄调查数据2.sav
第2题:基本统计+方差分析2
• 利用居民储蓄调查数据,从中随机选取90% 的样本,进行分析,实现以下目标: (2)分析不同收入水平的储户对“物价趋势”是 否持相同的 看法。 (3)检验年龄和收入水平对储户存款金额的影响 (不考虑交互作用)。
(1)分析城镇储户一次存款金额的分布,做直方图。
交通案例设计
• 结合自己专业、科研项目等,设计一个交通案 例(多个也可)。
• 案例需要包括题目、问题、基本思路、软件操 作步骤(用文字叙述即可)、主要输出结果(重要 结果需附上图表)、结果的分析解释与结论等。 • 问题的解决需要用到课本中≥3种方法(描述统计 、交叉列联表、假设检验、方差分析、线性/ 曲线回归、LOGIT回归、聚类分析、因子分析 、时间序列分析等)。
居民储蓄调查数据2.sav
第4题:基本统计+方差分析4
利用居民储蓄调查数据2,随机选取95%样本。 (1)分析收入水平大于3000元的储户一次存款金 额的分布,需做直方图。 (2)分析不同年龄的储户对“未来收入情况”的
预期是否一致。
(3)检验户口类型和收入水平对储户存款金额的 影响(需考虑交互作用)。
• (2) 输出 ACF 和 PACF 图形并对其特征进行分析 ,看是否满足白噪声序列的条件; • (3)给出1991-1992的预测值,并输出拟合图。
天津食品消费相关数据.sav
第15题:时间序列分析2
• 利用 1950 年~ 1990 年的天津食品消费数据, 分析这段时间内的人均生活费用年收入的变 化情况。要求:数据进行对数变换后,运用 Holt线性趋势平滑模型分析。 • (1)输出均方根误差和参数估计结果,给出最 终模型表达式;
居民储蓄调查数据2.sav
第3题:基本统计+方差分析3
• 利用居民储蓄调查数据2,从中随机选取95%的
样本,进行分析,实现以下目标:
(1)对居民一次存款金额分别按照年龄段进行分类
,比较他们的均值、四分位数和标准差。 (2)分析不同年龄的储户对“什么合算”的认同是 否一致。 (3) 检验不同收入水平储户的存款金额有无显著差 异?
汽车销售样本数据.sav
第12题:聚类分析1
• 利用汽车销售样本数据进行层次聚类分析,
对11种车型进行分类,并对各类的竞争力
情况进行简单评价?
• 要求:分成3类,选择正确的聚类类型,
其中个体距离采用欧式距离,类间距离采
用重心距离。输出结果应包括树状图、冰
柱图。
聚类分析(裁判打分).sav
第13题:聚类分析2
期末大作业
最后一次课(考试)时交打印稿 并到前面签到
基本要求:
• 11月04日最后一次课交, 迟交作业者作
为不及格或缺考处理。 • 必须交打印稿,并要求≤8张A4纸,可双
面打印。
• 打印稿的作业需要注明课程名、姓名、 学号。
基本要求:
• 作业按要求做,首先每个人根据自己的
学号尾号做指定的3道题。 • 此外,每3-5人还需要做1道案例设计题。
居民储蓄调查数据2.sav
第1题:基本统计+方差分析1
• 利用居民储蓄调查数据,从中随机选取85%的
样本,进行频数分析,实现以下分析目标:
(1)分析储户一次存款金额的分布, 需做直方
图。 是否持相同的做法。
(3)检验户口和收入水平对储户存款金额的影响 (不考虑交互作用)。
(2)分析城镇储户和农村储户对“物价上涨准备”
• 数据自己收集或查找,也需要与案例一起提交 (只交电子版)。
相关主题