例 4.1
某厂家生产的挂面包装上写明 “ 净含量 450 克 ” 。在用天平称量了商场中的 48 包挂面之后,得到样本量为 48 的关于挂面重量(单位:克)的一个样本,利用计算机,可以很容易地得到挂面重量的样本均值、总体均值的置信区间等等。下面是 SPSS 的输出。 数据挖掘实验室
用 SPSS 处理数据:
SPSS 数据 noodle.sav 数据挖掘实验室
Spss 选项: 数据挖掘实验室
Analyze-Descriptive Statistics-Explore , 数据挖掘实验室
再选中 x 1 和 x 2 到 Dependent List ;
然后在 Statistics 中选中 Descriptives ,选置信度(默认值是 95% ); 数据挖掘研究院
然后选择 Continue-OK 。
Spss 输出结果汇总 数据挖掘研究院

表 4.1 SPSS 一个总体参数估计输出结果 数据挖掘研究院
我们不仅可以构造一个总体均值(或比例)的置信区间,还可以构造两个总体的均值(或比例)之差的置信区间。 数据挖掘研究院
比如我们想知道两个地区学生成绩的差异,可以构造两个地区成绩均值之差
的置信区间。
如果我们想要比较一个候选人在不同阶段支持率的差异,那就可以构造两个比例之差
的置信区间等。下面再看一个例子。
例 4.2
有两个地区大学生的高度数据( SPSS 数据 height2.sav 或 height21.sav );在 height2.sav 数据中这两个地区学生的高度分别用变量 x 1 和 x 2 表示。而在 height21.sav 数据中,它们为一个变量 height ,但用另一个变量 group 来标明它们属于哪个地区。
(a) 我们想要分别得到这两个总体均值、标准差的点估计(即样本均值和样本标准差)和各自均值的 95% 置信区间。 数据挖掘研究院
(b) 求两个均值差
的点估计和 95% 置信区间。 数据挖掘研究院
(a) 的 Spss 选项与前例相同,结果输出如下:
表 4.2 SPSS 输出结果 数据挖掘研究院
(b) Analyze-Compare Means-Independent Samples T Test , 数据挖掘研究院
Spss 选项: 数据挖掘实验室
在 Test Variables 选入 height ,再在 Grouping Variable 选 group, 在 Define Groups 输入 1 和 2 ;在 Options 选置信度(默认值就是 95% )。 数据挖掘研究院
然后 Continue-OK 。 数据挖掘研究院
Spss 输出结果
两个均值差
的:
Mean Difference=4.960 数据挖掘研究院
Std. Error Difference.=1.455 数据挖掘研究院
95%Confindence Internal of the Difference: 数据挖掘研究院
Lower=2.0732 数据挖掘研究院
Upper=7.8467
4 .关于置信区间的注意点 数据挖掘研究院
常识告诉我们,来自现实世界的数据量越大,我们对现实世界的了解就越准确。 数据挖掘研究院
样本量对置信区间有很大的影响。理想的情况是获得很小的置信区间和很大的置信度。但鱼与熊掌不可兼得,只好固定一个,力求另一个更好。如果固定置信度在某个值,比如 95% ,那么样本量越大,置信区间就越小。如果固定置信区间的宽度,那么样本量越大,置信度就越大。人们可以从需要的置信区间的宽度和置信度求出需要多大的样本量。 数据挖掘研究院
当然,要指明的是,在固定置信度时,置信区间宽度的减少并不是和样本量 n 成反比,而是和
成反比,也就是说当样本量增加一倍(即 2 n )时,置信区间的宽度为原先的
。 数据挖掘研究院
第二节 总体参数的假设检验
一、假设检验的基本问题
1 .假设检验的基本原理 数据挖掘研究院
小概率事件原理 数据挖掘实验室
2 .假设检验的过程
首先,要提出一个原假设 数据挖掘研究院
例如:要对妇女的平均身高进行检验,可以先假设妇女身高的均值等于 160 cm (
)。这种原假设也称为零假设( null hypothesis ),记为 H 0 。
与此同时必须提出对立假设,如妇女身高均值不等于 160 cm (
)。对立假设又称为备选假设或备择假设( alternative hypothesis )记为 H 1 。 数据挖掘研究院
形式上,上面的关于总体均值的 H 0 相对于 H 1 的检验记为: 数据挖掘实验室
我们将
的假设称为双尾检验 ,即前面说述的假设检验。 数据挖掘实验室
如果备选假设为: 数据挖掘研究院
或:
则称为单尾检验。
实际中选择何种备选假设,需根据检验的需要决定。 数据挖掘研究院
需要注意的是:计算机输出结果中的 p 值是双尾检验的概率。 数据挖掘研究院
如果备选假设选择的是单尾检验,则要将计算机给的 p 值除以 2 ,即取 p 值的一半。 数据挖掘研究院
第二,确定检验统计量
有了两个假设,就要根据数据来对它们进行判断。 数据挖掘实验室
根据零假设(不是备选假设!)来判断:如果是检验均值的,那么一般是在正态总体分布的背景下检验的。 数据挖掘实验室
如果是检验比例的,那么就要用到非参数检验。
第三,确定显著性水平 数据挖掘研究院
根据样本所得的数据来拒绝零假设的概率应小于 0.05 ,当然也可能是 0.01 , 0.005 , 0.001 等等。 数据挖掘实验室
显著性水平就是小概率水平,但小概率并不能说明不会发生,仅仅是发生的概率很小罢了。拒绝正确零假设的错误常被称为第一类错误( type I error )。 数据挖掘研究院
有第一类错误,就有第二类错误; 数据挖掘研究院
那是备选假设正确时反而说零假设正确的错误,称为第二类错误( type II error )。
在一般的假设检验问题中,由于备选假设往往不是一个点,所以无法算出犯第二类错误的概率。 数据挖掘研究院
第四,计算检验统计量的值 数据挖掘研究院
根据数据计算检验统计量的实现值( t- 值)和根据这个实现值计算 p- 值; 数据挖掘实验室
这一步一般都可由计算机软件来完成。
第五,进行判断
如果 p - 值小于或等于 α ,就拒绝零假设,这时犯错误的概率最多为 α ;如果 p - 值大于 α ,就不拒绝零假设,因为证据不足。
实际上,多数计算机软件仅仅给出 p - 值,而不给出 α 。这有很多方便之处。比如 α= 0.05 ,而假定所得到的 p - 值等于 0.001 。这时如果采用 p - 值作为新的显著性水平,即新的 α= 0.001 ;于是就可以说,在显著性水平为 0.001 时,拒绝零假设。这样,拒绝零假设时犯错误的概率实际只是千分之一而不是旧的 α 所表明的百分之五。
在这个意义上, p - 值又称为观测的显著性水平( observed significant level )。在统计软件输出 p - 值的位置,有的用 “ p-value ” ,有的用 significant 的缩写 “Sig” 就是这个道理。 数据挖掘研究院
根据数据产生的 p - 值来减少 α 的值以展示结果的精确性总是没有害处的。
这好比一个身高 180 厘米 的男生,可能愿意被认为高于或等于 180 厘米 ,而不愿意说他高于或等于 155 厘米 ,虽然这第二种说法数学上没有丝毫错误。
3 .关于 “ 临界值 ” 的注:
过去的统计教科书中,使用临界值的概念进行假设检验,不计算 p - 值。只比较统计量的取值和临界值的大小。使用临界值而不是 p - 值来判断拒绝与否是前计算机时代的产物。当时计算 p - 值不易,只采用临界值的概念。现在计算机软件都不给出 α 和临界值,但都给出 p - 值和统计量的实现值,让用户自己决定显著性水平是多少。
在一些基本统计教科书中会有不能拒绝零假设就 “ 接受零假设 ” 的说法。这种说法是不对的。 数据挖掘研究院
首先,如果你说 “ 接受零假设 ” ,那么就应该负责任地提供接受零假设时可能犯第二类错误的概率。这就要算出在备选假设正确的情况下错误接受零假设的概率。但是,这只有在备选假设仅仅是一个与零假设不同的确定值(而不是范围)时才有可能。多数基本统计教科书的备选假设是一个范围,这时根本无法确定犯第二类错误的概率。其实,不能拒绝这些零假设,仅仅是说明对于这些假设,没有足够证据拒绝而已。
对于同一个假设检验问题,往往都有多个检验统计量;而且人们还在构造更优良的检验统计量。人们不可能把所有的目前存在的和将来可能存在的检验都实施。因此,只能够说,按照目前的证据,不足以拒绝零假设而已。 数据挖掘研究院
显然,在确定要检验什么之后只要计算出 p - 值就大功告成了。下面具体说明对一些特定总体的关于均值和比例的检验。
二、正态总体均值的检验
1 .正态总体均值检验的类型
正态总体均值的检验主要有以下三种类型: 数据挖掘实验室
根据一个样本对其总体均值大小进行检验( One-Sample T Test ),如妇女身高的检验。 数据挖掘实验室
根据来自两个总体的独立样本对其总体均值的检验( Indepent Two-Sample T Test ),如两个班平均成绩的检验。
成对样本的检验( Pari-Sample T Test ),如减肥效果的检验。 数据挖掘研究院

