![SPSS统计分析从入门到精通(第五版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/116/47216116/b_47216116.jpg)
3.3.3 实验操作
下面以数据文件“3-3”为例,说明探索分析的具体操作过程。
1.实验数据描述
数据文件“3-3”记录了两个班级学生的数学成绩、语文成绩,以此数据文件为例,利用探索分析该数据文件中的数学和语文成绩的最大值、最小值、众数、平均数等,并检验样本数据的正态性。原始Excel数据文件如图3-22所示。
在SPSS的变量视图中建立变量“id”“Math”“CHINESE”和“SEX”,分别表示学生班级、数学成绩、语文成绩和性别,在“id”变量中将“一班”和“二班”分别赋值为“1”和“2”;在“SEX”变量中将“男”和“女”分别赋值为“1”和“0”,如图3-23所示。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P87_5234.jpg?sign=1739011197-LCEjqI0VgiduBL75ZnVSKyQ2rlWKMS7L-0-0527bb9e4479307b1a39c58268082d19)
图3-22 数据文件“3-3”的原始数据
在SPSS活动数据文件的数据视图中,把相关数据输入到各个变量中。输入后部分数据如图3-24所示。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P88_5240.jpg?sign=1739011197-c8681F2zjGICTXj6sq7kLNZXsa7B2Kbp-0-9437ddcb1e56d67b38336c9f41bb210b)
图3-23 数据文件“3-3”的变量视图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P88_5244.jpg?sign=1739011197-zlcEtRcA8LdrYy0AuAJiIe7Z9Nz7uZYQ-0-adf9092f8fae901e2349a7f031f60042)
图3-24 数据文件“3-3”的数据视图
2.实验操作步骤
打开数据文件“3-3”,进入SPSS Statistics数据编辑器窗口,然后在菜单栏中选择“分析”|“描述统计”|“探索”命令,打开“探索”对话框。
将变量“Math”选入“因变量列表”列表框,将“SEX”选入“因子列表”列表框,将“班级”选入“个案标注依据”列表框。
单击“统计”按钮,在弹出的“探索:统计”对话框中选中“描述”复选框;单击“图”按钮,在弹出的“探索:图”对话框中选中“箱图”选项组的“因子级别并置”单选按钮、“描述”选项组的“茎叶图”复选框以及“含检验的正态图”复选框。
在“探索”对话框中选中“输出”选项组的“两者”单选按钮,然后单击“确定”按钮就可以输出探索分析的结果。
3.实验结果及分析
单击“确定”按钮,SPSS Statistics查看器窗口的输出结果如图3-25~图3-31所示。
图3-25给出了探索分析中的变量样本数据的有效个数和百分比、缺失个数和百分比及总计个数和百分比。通过“个案处理摘要”可以看出本实验中无数据缺失。
图3-26给出了数学成绩按照性别分类的一些统计量,如均值、中值、方差、标准差等。通过该图可以看出女生数学成绩均值要比男生大,而女生数学成绩中值却小于男生的中值。
图3-27给出了因变量样本数据按照因子变量分类的正态性检验结果。列中“统计”表示检验统计量的值,“自由度”表示检验的自由度,“显著性”表示检验的显著水平。对本实验而言,正态检验的原假设是:数据服从正态分布。从“正态性检验”中柯尔莫戈洛夫-斯米诺夫统计量、夏皮洛-威尔克统计量可以看出,女生和男生的数学成绩的显著水平都大于5%,接受原假设,即都服从正态分布。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5268.jpg?sign=1739011197-9lAiTtoqYTuCJhD8StMzLfxpJKFzlaRI-0-a8b9da7e4d3d9dbc3d2ad9ef39038d24)
图3-25 个案处理摘要
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5253.jpg?sign=1739011197-CWJ7JYy8YTzjmxYGbbcVaz4oVutkM2s3-0-2d9366fc5e7e59f73b16a62c5f97c827)
图3-26 变量描述
图3-28给出了女生数学成绩的茎叶图。图中“频率”表示相应数据的频数,“Stem”即茎,“叶”即叶子,两者分别表示数据的整数部分和小数部分,“主干宽度”表示茎宽。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5257.jpg?sign=1739011197-IpzPeBQYfn9SP39FoJPnMwuyoGJBTwBO-0-b586ceec14bc4971058c22828e4d70c7)
图3-27 正态性检验
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5258.jpg?sign=1739011197-eswO4bKDSRXLpJozgPPPtmFD5A1LkD5r-0-63fefbe756f2ba4b4563950f99330fef)
图3-28 茎叶图
图3-29和图3-30分别给出了女生数学成绩的标准Q-Q图和趋降Q-Q图。标准Q-Q图中的观察点都分布在直线附近,趋降Q-Q图中的点除了极个别点外都分布在0值横线附近,因此显示样本数据服从正态分布,这个结论和正态性检验的结论一致。
图3-31给出了按因子变量性别区分的数学成绩的箱图,其中箱图两头的两条实线分别表示最大值和最小值,中间的黑色实线表示中位数,箱体的上下两端为四分位数。在本实验中女生数学成绩有一个编号为1的异常点或离群值。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5272.jpg?sign=1739011197-c1jHBFS3vFFrAK4gHIyNSONFN2D2mwPu-0-7456e6b6b1f76e334c768ebd3610b203)
图3-29 标准Q-Q图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5273.jpg?sign=1739011197-91cXJPCKbrLNAZ9z9mdev2KLe17uh1C5-0-c5f3698b942ea897c67fadafb1defc92)
图3-30 趋降标准Q-Q图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5276.jpg?sign=1739011197-9a0yTyDVMQSZzVvbeT3ND4rz4yQEQMgw-0-fa51e101bec79caf7de4ed900493e1f1)
图3-31 箱图