第一章基础知识第一节数据类型及设置在MINITAB系统中,有3种基本数据类型供用户选择,分别是:数值型数据、文本型数据和日期/时间型数据。
一般来说,不同类型的数据应采用不同的统计分析方法进行数据分析。
所以,在应用MINITAB统计分析软件之前,应能够有效地识别不同类型的数据。
1.1.1 数值型(Numeric)数据⑴计量数据(Measurement Data)计量数据,为观测每个观察单位某项指标的大小而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
假如一个数据的所有可能取值充满数轴上一个区间(a,b),则称这样的数据为计量数据,其中a可以是-∞,b可以是+∞,通常称这类数据是连续数据(Continuous Data)。
这种类型的数据往往既可以取整数、小数、分数,有时候(虽然不是全部)还可以取负数。
例如:长度、重量、温度、湿度、体积、误差、速度、时间、寿命等等。
它的统计分析与连续随机变量(Continuous random variable)的分布有关。
在MINITAB 统计分析功能中,这种数据是主要的分析对象,统计分析时,常用的参数和方法有:均值、标准差、t检验、方差分析、回归分析等。
⑵计数数据(Enumeration Data)计数数据又称为定性数据或分类数据(Categorical Data),是将观察单位按某种属性或类别分组计数,分别汇总各组观察单位后而得到的数据,其变量值是定性的,表现为互不相容的属性或类别。
这类数据仅取数轴上有限个点或可列个点,一般只取非负整数,不取小数、分数,更不取负数。
例如:某一单位面积内某一种缺陷的个数、一批产品中不合格品的个数、一个超市每天进入的人数、一个麦穗上的麦粒数等等。
它的统计分析是与具有离散随机变量(Discrete random variable)的分布有关。
在MINITAB的统计分析功能中,常采用非参数分析、2χ检验、二项分布、超几何分布、泊松分布等统计方法。
以上两种数据的分类是相对的,在某些情况下,两种数据可以互相转化。
例如:当观察某一特定人群的年龄时,年龄这个变量是连续的计量值数据,但是在实际统计分析时,为了使统计分析简化,往往按年、月、日进行分类,就变成了计数数据。
⑶等级数据(Ranked Data)例如:对产品的质量情况进行分类,可以分为合格品、不合格品,或者分为一级品、二级品、等外品等等。
在统计分析时这类数据常用比率、等级相关、非参数检验等统计分析方法。
⑷有序数据(Ordinal Data)有序数据又称为有序分类数据(Ordinal Categories)。
例如:评定某种酒或茶叶的品质时,只能评出一个顺序,又如布料和毛皮的手感程度等等。
⑸名义数据(Nominal Data)名义数据或称为无序分类数据(Unordinal Categories)。
有些数据既不是计量的、计数的,也不是有序的,例如人们的姓名、性别,各种不同的颜色赋予相应的不同代码,为不同类的书籍赋予相应的不同代码等等。
⑹截尾反应数据(Censored Responses)截尾反应数据又称为删失数据(Censored Data)、不完全数据(Uncomplete Data)。
例如:在产品可靠性研究领域,研究者通过试验观察到某种产品的使用寿命,这一类数据称为完全数据(Complete Data)或非截尾反应数据(Uncensored Responses)。
有一部分或产品由于各种原因不能观察到其真正的使用寿命,但能够得到“该产品的使用寿命不小于某个数值”这样一个信息。
习惯上,在该数值右上角标以“+”表示。
统计分析时,常使用中位数、生存分析等参数或分析方法。
有的数值类型的数据又可根据实际需要相互转化。
一般来说,不同类型的数据应采用相应的统计方法或图形分析方法进行描述或分析。
在使用MINITAB统计软件进行统计分析时,应识别数据的不同类型,选用恰当的统计/图形模块进行分析,才可得到正确的结果。
在MINITAB统计软件的数据文件中,软件自动识别数据的类型,数值型数据以“C”表示,见图1.1-1。
1.1.2 文本型(Text)数据文本型数据的特征一般由字母(各种文字、单词、句子),空格和指定的特征(各种符号)组成。
文本就是文字,包括汉字和英文字母,但不包括数字,文本型数据不能做加减乘除等数学运算,若硬是将文本型数据加入数学运算,这些数据的默认值就是零,只是作包含、不包含、等于等运算。
【例题1.1-1】已知36个学生的学习成绩,已经建立数据文件数据文件见附件:学生统计表1(1-01).MPJ。
在MINITAB统计软件的数据文件中,软件自动识别数据的类型,文本型数据以“C-T”表示,如图1.1-1a所示。
图1.1-1a 三种数据的表示方法1.1.3 日期/时间型(Data/Time)数据日期/时间型数据可以是日期型数据(例如:Jan-1-2009,或者2/17/2010),时间型数据(例如:08:25:22 PM),或者日期时间型数据两者皆有(例如:2/17/2010 08:25:22 PM)。
用于各种日期和时间的标记。
在MINITAB统计软件的数据文件中,软件自动识别数据的类型,日期/时间型数据以“C-D”表示,见图1.1-1。
1.1.4 数据的格式设定1、数值型数据的设置使用数据文件:学生统计表1(1-01).MPJ。
步骤1:打开数据文件,选定数据所在的列变量,如图1.1-2所示。
光标指定所在列变量,单击鼠标右键,在“格式列”中,选择“数据”,弹出如图1.1-3所示的对话框。
图1.1-2 打开数据文件,选定列变量,打开“格式列”→“数字”对话框图1.1-3 数值型数据的格式设置步骤2:用于指定如何格式化工作表列中的数字数据。
对于数字型数据,可以选择的类别有,如图1.1-3所示。
①自动:选择此项将让Minitab 根据列中的值确定格式。
②固定小数:选择此项可指定固定小数格式。
小数位:键入要显示的小数位数。
③指数:选择此项可指定指数格式。
小数位:键入要显示的小数位数。
④货币:选择此项可指定货币格式。
小数位:键入要显示的小数位数。
符号: 选择货币符号。
可用选项取决于Windows 控制面板中的区域和语言选项。
负数:选择要用于负货币值的格式。
货币类数据的格式设置如图1.1-4所示。
图1.1-4 数值型数据(货币类)的格式设置⑤百分比:选择此项可指定百分比格式。
小数位:键入要显示的小数位数。
步骤3:单击“确定”,完成数值型变量类型的设置。
2、日期/时间型数据的设定仍然上例的数据文件:学生统计表1(1-01).MPJ。
步骤1:打开数据文件,选定数据所在的列变量,如图1.1-5所示。
光标指定所在列变量,单击鼠标右键,在“格式列”中,选择“日期/时间”,弹出如图1.1-6所示的对话框。
图1.1-5 打开数据文件,选定列变量,打开“格式列”→“日期/时间”对话框图1.1-6 日期/时间型数据的格式设置步骤2:在打开的“日期/时间型数据对话框”中,根据需要选择需要的日期/时间类型。
步骤3:单击“确定”,完成日期/时间型变量类型的设置。
1.1.5 列变量公式的设置有时一特定的列变量是由其他的列或其他有公式计算的量来确定的,这是就使用“列变量公式”就非常方便,仍以【例题1.-1】为例。
本例中准备对“数学成绩”进行四舍五入,并取整数(小数点为:0),新生成的变量存储在C9列中。
步骤1:打开数据文件,选定数据所在的列变量。
光标指定所在列变量,单击鼠标右键,选择“公式”命令,如图1.1-7所示。
单击“公式”命令,弹出如图1.1-8所示的对话框。
图1.1-7 选择“公式”图1.1-8 计算公式步骤2:在弹出的“对C9设定公式”对话框中,从函数选项中选择:四舍五入(ROUND),将变量“数学”选入四舍五入的括号中,并设置小数的位数。
步骤3:单击“确定”,根据公式计算得到的新变量就计算出来了,并保存在C9列中。
撤消设定的公式方法是:选定已经设立公式的列,单击右键,选择“撤消将公式分配给列”。
如果你需要再次运行已经设定的公式,步骤与此类似,选定已经设立公式的列,然后单击右键,选择“重做将公式分配给列”,公式就再次运行。
第二节MINITAB的基本操作与数据录入1.2.1 MINITAB的基本数据文件类型MINITAB系统的基本数据文件有三种:以“*.MPJ”表示的是MINITAB的项目数据文件(MINITAB Project File);而以“*.MTW”表示的是MINITAB的工作表数据文件(MINITAB Worksheet File);以“*.MGF”表示的文件,它是MINITAB的图形文件(MINITAB Graph File)。
这个“*.MGF”文件只有当执行MINITAB系统运行生成一个或多个图形(图表)且被保存后,才可以被打开(调用)使用或编辑。
MINITAB的三种格式的文件,即MPJ、MTW 和MGF的区别是:MPJ 保存MINITAB 的所有计算,而MTW 仅保存工作单数据,MGF 仅保存图象。
由MPJ 生成的图象将自动保存为MGF 格式。
除此之外,还有一些通用的文件类型,如:“*.MPJ.BAK”文件,属于备份文件,在其他程序中也存在。
1.2.2 项目数据文件的建立与保存【例题1.2-1】已知36个学生的学习成绩,试建立数据文件。
本例原始数据,其中列变量“编号”、“数学”、“物理”、“语文”和“英语”是数值型计量数据,列变量“分组”是数值型有序分类数据,列变量“姓名”是文本型数据,“出生年月”则是时间/日期型数据。
步骤1:进入MINITAB系统,选择“文件”→“新建”命令,弹出一个对话框,如图1.2-1所示。
“新建”用来创建一个新的数据文件,可以选择工作表数据文件(MINITAB Worksheet File),用“*.MTW”表示;也可以选择项目数据文件(MINITAB Project File),用“*.MPJ”表示。
图1.2-1 新建项目文件对话框步骤2:选择“Minitab项目”,单击“确定”,得到一个空白的数据表(列变量最多是4000个,而行变量可以是26000个),然后将表1.2-1的数据依次输入,得到如图1.1-1所示的数据文件,数据文件见附件:学生统计表1(1-01).MPJ。
本例输入“姓名”的文字内容时,MINITAB的“C2”表头会自动生成为“C2-T”,因为“姓名”是由字符(汉字)组成的,表明这个列变量是文本型数据(Text)。
在输入“出生年月”内容时,“C8”表头会自动生成为“C8-D”,因为“出生年月”属于时间/日期型数据。
步骤3:数据文件的保存,在MINITAB桌面左上角有保存文件的图标,可以直接进行数据文件的保存。