第8章 假设检验

黄晗
Spring, 2019

第8章 假设检验

  • 假设检验的基本问题
  • 一个总体参数的检验
  • 两个总体参数的检验
  • 假设检验中的其他问题

假设检验与参数估计的差别

参数估计 假设检验
用样本统计量估计总体参数 先对总体参数进行假设
总体参数在估计前未知 利用样本信息检验假设是否成立

8.1 假设检验的基本问题

  • 假设问题的提出

  • 一个总体参数的检验

  • 两个总体参数的检验

  • 检验问题的进一步说明

8.1.1 假设问题的提出

由统计资料得知,1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中随机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异?

差异:\( 3210-3190=20 \)克

  • 是什么原因造成的差异?
    • 抽样的随机性
    • 确实是1990年新生儿平均体重增加

问题的表达:用\( \mu \)表示1990年新生儿体重,\( \mu_0 \)表示1989年新生儿体重,假设可以表示为:\( \mu-\mu_{0}=0 \)。我们通过检验假设是否成立回答这个问题。

什么是假设检验

假设:对总体参数的的数值所作的一种陈述

  • 总体参数包括总体均值、比例、方差等
  • 分析之前必需陈述

什么是假设检验?

  • 事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立
  • 有参数假设检验和非参数假设检验
  • 采用逻辑上的反证法,依据统计上的小概率原理

8.1.2 假设的表达式

原假设采用等式的方式:\( H_{0} : \mu=3190 \)克

\( H_0 \)表示原假设(null hypothesis),也称为零假设;\( \mu \)是待检验的参数,即1990年新生儿总体体重的均值;含义为1990年的新生儿与1989年的新生儿在体重上没有差异。

如果原假设不成立,就要拒绝原假设,而需要在另一个假设中做出选择,这个假设称为备择假设(alternative hypothesis),或称为替换假设,可以表示为\( H_{1} : \mu_{1} \neq 3190 \)克。

8.1.3 提出原假设和备择假设

什么是原假设?(null hypothesis)

  • 待检验的假设
  • 研究者想收集证据予以反对的假设
  • 总是有等号:=、≤、≥
  • 表示为\( H_0: \mu= \)某一数值

什么是备择假设?(alternative hypothesis)

  • 与原假设对立的假设,也称“研究假设”
  • 研究者想收集证据予以支持的假设
  • 总是有不等号:≠、<、>
  • 表示为\( H_1: \mu < \)某一数值,或者\( H_1: \mu > \)某一数值

某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的均值\( x=1.39 \),检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为\( \alpha=0.05 \),,则下列正确的假设形式是( )。

  • A. \( \mathrm{H}_{0} : \mu=1.40, \mathrm{H}_{1} : \mu \neq 1.40 \)
  • B. \( \mathrm{H}_{0} : \mu \leq 1.40, \mathrm{H}_{1} : \mu>1.40 \)
  • C. \( \mathrm{H}_{0} : \mu<1.40, \mathrm{H}_{1} : \mu \geq 1.40 \)
  • D. \( \mathrm{H}_{0} : \mu \geq 1.40, \mathrm{H}_{1} : \mu<1.40 \)

某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为( )

  • A. \( \mathrm{H}_{0} : \pi \leq 0.2, \mathrm{H}_{1} : \pi>0.2 \)
  • B. \( \mathrm{H}_{0} : \pi=0.2, \mathrm{H}_{1} : \pi \neq 0.2 \)
  • C. \( \mathrm{H}_{0} : \pi \geq 0.3, \mathrm{H}_{1} : \pi<0.3 \)
  • D. \( \mathrm{H}_{0} : \pi \geq 0.3, \mathrm{H}_{1} : \pi<0.3 \)

8.1.3 假设检验中的两类错误

第一类错误(弃真错误)

  • 原假设为真时拒绝原假设
  • 会产生一系列后果
  • 第一类错误的概率为\( \alpha \),被称为显著性水平

第二类错误(取伪错误)

  • 原假设为假时接受原假设
  • 第二类错误的概率为\( \beta \)

\( \alpha \)错误和\( \beta \)错误的关系

  • 原假设为真时拒绝原假设
  • 会产生一系列后果
  • \( \alpha \)错误和\( \beta \)错误是此消彼长的关系
  • 不能同时减少两类错误

在假设检验中,不拒绝原假设意味着( )

  • A. 原假设肯定是正确的
  • B. 原假设肯定是错误的
  • C. 没有证据证明原假设是正确的
  • D. 没有证据证明原假设是错误的

在假设检验中,第一类错误是指( )

  • A. 当原假设正确时拒绝原假设
  • B. 当原假设错误时拒绝原假设
  • C. 当备择假设正确时拒绝备择假设
  • D. 当备择假设不正确时未拒绝备择假设

8.1.4 假设检验的流程

  1. 提出假设
  2. 确定适当的检验统计量
  3. 规定显著性水平\( \alpha \)
  4. 计算统计检验量的值
  5. 作出统计决策

8.1.4.1 确定适当的检验统计量

用于假设检验决策的统计量

选择统计量的方法与参数估计相同,需考虑

  • 是大样本还是小样本
  • 总体方差已知还是未知

检验统计量的基本形式为\[ Z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}} \]

8.1.4.2 规定显著性水平

什么是显著性水平?

  • 是一个概率值

  • 原假设为真时,拒绝原假设的概率

    • 被称为抽样分布的拒绝域
  • 表示为\( \alpha \)

    • 常用的\( \alpha \)值有0.01, 0.05, 0.10
  • 由研究者事先确定

8.1.4.3 做出统计决策

计算检验的统计量

根据给定的显著性水平\( \alpha \),查表得出相应的临界值\( z_\alpha \)或者\( t_\alpha \)

将检验统计量的值与\( \alpha \)水平的临界值进行比较

得出拒绝或不拒绝原假设的结论

8.1.5 利用P值进行决策

什么是P值?

是一个概率值

如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率

  • 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积
  • 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积

被称为观察到的(或实测的)显著性水平

  • \( H_0 \)能被拒绝的最小值

双侧检验的P值

A4GyDA.png

左侧检验的P值

A4Gh8S.png

右侧检验的P值

A4GTDs.png

利用P值决策的准则

若P值\( > \alpha \),不拒绝原假设

若P值\( < \alpha \),拒绝原假设

P值越小( )。

  • A. 拒绝原假设的可能性越小
  • B. 拒绝原假设的可能性越大
  • C. 拒绝备择假设的可能性越大
  • D. 不拒绝备择假设的可能性越小

8.1.6 单侧检验和双侧检验

假设 双侧检验 左侧检验 右侧检验
\( H_0 \) \( \mu=\mu_0 \) \( \mu \geq \mu_0 \) \( \mu \leq \mu_0 \)
\( H_1 \) \( \mu \neq \mu_{0} \) \( \mu < \mu_0 \) \( \mu > \mu_0 \)

8.1.6.1 双侧检验

属于决策中的假设检验

不论是拒绝原假设还是不拒绝原假设,都必需采取相应的行动措施

  • 例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格
  • 我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立

建立的原假设与备择假设应为

  • \( H_{0} : \mu=10 \)
  • \( H_{1} : \mu \neq 10 \)

指出下列假设检验哪一个属于左侧检验( )

  • A. \( \mathrm{H}_{0} : \mu=\mu_{\mathrm{0}}, \mathrm{H}_1 : \mu \neq \mu_{\mathrm{0}} \)
  • B. \( \mathrm{H}_{\mathrm{0}} : \mu \geq \mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu<\mu_{\mathrm{0}} \)
  • C. \( \mathrm{H}_{\mathrm{0}} : \mu \leq \mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu>\mu_{\mathrm{0}} \)
  • D. \( \mathrm{H}_{\mathrm{0}} : \mu>\mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu \leq \mu_{\mathrm{0}} \)

指出下列假设检验形式的写法哪一个是错误的?( )

  • A. \( \mathrm{H}_{0} : \mu=\mu_{\mathrm{0}}, \mathrm{H}_1 : \mu \neq \mu_{\mathrm{0}} \)
  • B. \( \mathrm{H}_{\mathrm{0}} : \mu \geq \mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu<\mu_{\mathrm{0}} \)
  • C. \( \mathrm{H}_{\mathrm{0}} : \mu \leq \mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu>\mu_{\mathrm{0}} \)
  • D. \( \mathrm{H}_{\mathrm{0}} : \mu>\mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu \leq \mu_{\mathrm{0}} \)

设\( z_c \)为检验统计量的计算值,检验的假设为\( \mathrm{H}_{\mathrm{0}} : \mu \leq \mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu>\mu_{\mathrm{0}} \),当\( z_c=1.645 \)时,计算出的P值为( )。

  • A. \( 0.025 \)
  • B. \( 0.05 \)
  • C. \( 0.01 \)
  • D. \( 0.1 \)

8.1.6.2 左单侧检验

某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从正态分布,标准差为200个小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?

检验的形式为:\( H_{0} : \mu \geq 1000 \)和\( H_{1} : \mu<1000 \)

A4t3jg.md.png

8.1.6.3 右单侧检验

某种大量生产的袋装食品,按规定重量不得少于250克。今从一批该种食品中随机抽取50袋,发现有6袋重量低于250克,若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂?

检验的形式为:\( H_{0} : \mu \leq 5 \% \)和\( H_{1} : \mu>5 \% \)

A4t03T.md.png

8.2 一个总体参数的检验

  • 检验统计量的确定
  • 总体均值的检验
  • 总体比例的检验
  • 总体方差的检验

8.2.1 检验统计量的确定

A4NwdA.png

8.2.2 总体均值的检验

\( \sigma^2 \)已知或\( \sigma^2 \)未知的大样本

假定条件

  • 总体服从正态分布
  • 若不服从正态分布,但是为大样本(\( n \geq 30 \))

统计量

  • \( \sigma^2 \)已知:\( z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}} \sim N(0,1) \)
  • \( \sigma^2 \)未知:\( z=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}} \sim N(0,1) \)

例8.4

某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为\( \mu_{0}=0.081 mm \),总体标准差为\( \sigma=0.025 \)。今换一种新机床进行加工,抽取\( n=200 \)个零件进行检验,得到的椭圆度为\( 0.076mm \)。试问新机床加工零件的椭圆度的均值与以前有无显著差异?

提出假设:\( H_{0} : \mu=0.081 m m, H_{1} : \mu \neq 0.081 m m \)

由题意可知,\( \mu_{0}=0.081 {mm}, s=0.025 {mm}, \overline{x}=0.076 {mm} \),因为\( n>30 \),故选用\( z \)统计量。

\[ z=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}=\frac{0.076-0.081}{0.025 / \sqrt{200}}=-2.83 \]

\( \alpha=0.05 \),所以\( z_{\frac{\alpha}{2}}=\pm 1.96 \),\( |z|>\left|z_{\frac{\alpha}{2}}\right| \),拒绝原假设。

例8.5

某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从正态分布,标准差为200个小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?

\( H_{0} : \mu \geq 1000, H_{1} : \mu<1000 \)

由题意可知,\( \mu_{0}=1000, \overline{x}=960, \sigma=200, n=100, \alpha=0.05 \),所以\( z_{\alpha}=-1.645 \)。

\[ z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}=\frac{960-1000}{200 / \sqrt{100}}=-2 \]

由于\( |z|>\left|z_{\alpha}\right| \),因此拒绝\( H_0 \)。即这批灯泡的使用寿命低于1000小时,批发商不应购买。

例8.6

某电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了20件作为样本,测得平均使用寿命1245小时。能否说该厂生产的电子元件质量显著地高于规定标准?\( \alpha=0.05 \)

\( H_{0} : \mu \leq 1200, H_{1} : \mu>1200 \)

由题意可知,\( \mu_{0}=1200, \overline{x}=1245, \sigma=150, n=20, \alpha=0.05 \),虽然\( n<30 \),但由于\( \sigma \)已知,,可以使用\( z \)统计量。

\[ z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}=\frac{1245-1200}{150 / \sqrt{20}}=1.34 \]

\( z \)位于非拒绝域,所以不拒绝\( H_0 \)。即不能说该厂产品质量显著地高于规定标准。

例8.7

某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。

\( H_{0} : \mu=5, H_{1} : \mu \neq 5 \)

由题意可知,\( \mu_{0}=5, \overline{x}=5.3, s=0.3, n=10, \alpha=0.05 \),由于\( \sigma \)未知,样本量\( n \)较小,采用\( t \)统计量。\[ t=\frac{\overline{x}-\mu_{0}}{s / \sqrt{n}}=\frac{5.3-5}{0.3 / \sqrt{10}}=3.16 \]

当\( \alpha=0.05 \),自由度\( n-1=9 \),查表 \( t_{\alpha/2} (9)=2.2622 < t \),故拒绝\( H_0 \)。说明该机器的性能不好。

练习

设我国出口凤尾鱼罐头,标准规格是每罐净重250克,根据以往经验,标准差是3克。现在某食品工厂生产一批供出口用的这种罐头,从中抽取100罐检验,其平均净重是251克。假定罐头重量服从正态分布,按规定显著性水平\( \alpha=0.05 \),问这批罐头是否合乎标准,即净重确为250克?

设我国出口凤尾鱼罐头,标准规格是每罐净重250克,根据以往经验,标准差是3克。现在某食品工厂生产一批供出口用的这种罐头,从中抽取100罐检验,其平均净重是251克。假定罐头重量服从正态分布,按规定显著性水平\( \alpha=0.05 \),问这批罐头是否合乎标准,即净重确为250克?

市场管理部门意欲对某厂生产的大瓶碳酸饮料进行检查,以确定是否符合其标签上注明的“容量至少是3磅”的说法。现抽取一由20瓶组成的随机样本,样本平均值为2.89,样本标准差为0.148, 假定该饮料包装重量近似服从正态分布,市场管理部门能否由此断该厂生产的大瓶碳酸饮料包装重量不足,并对其提出投诉?\( \alpha=0.05 \)

8.2.3 总体比例的检验

假定条件

  • 总体服从二项分布

  • 可以用正态分布近似(\( np > 5 \)和\( nq > 5 \))

  • 通常采用\( z \)统计量

计算公式

\[ z=\frac{p-\pi_{0}}{\sqrt{\frac{\pi_{0}\left(1-\pi_{0}\right)}{n}}} \]

  • \( p \)为样本比例,\( \pi_0 \)为总体比例\( \pi \)的假设值

例8.8

一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(\( \alpha=0.05 \))

\( H_{0} : \pi=14.7 \%, H_{1} : \pi \neq 14.7 \% \)

由题意可知\( p=\frac{57}{400}=14.25 \% \)

\[ z=\frac{p-\pi_{0}}{\sqrt{\frac{\pi_{0}\left(1-\pi_{0}\right)}{n}}}=\frac{0.1425-0.147}{\sqrt{\frac{0.147 \times(1-0.147)}{400}}}=-0.254 \]

这是一个双侧检验,当\( \alpha=0.05 \)时,有\( z_{\frac{\alpha}{2}}=\pm 1.96 \),不能拒绝原假设,可以认为调查结果支持了该市老年人口所占比例为\( 14.7\% \)的看法。

练习

某企业的产品畅销于国内市场。据以往调查,购买该产品的顾客有50%是30岁以上的男子。该企业负责人关心这个比例是否发生了变化(无论是增加还是减少)?于是,该企业委托了一家咨询公司机构进行调查,这家咨询机构从众多的购买者手中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平\( \alpha=0.05 \)下检验“50%的顾客是30岁以上的男子”这个假设。

一位关于环境保护的公共福利团体的发言人宣称:“在这个工业区域内,遵守政府制订的空气污染标准法则的工厂不到60%”。但环境保护局的工程师却相信至少60%的工厂是遵守这个法则的。于是他从这个工业区域内抽查出了60家工厂并发现33家是尊遵守空气污染法则的。现环保局想知道真正的比率是否少于60%?\( \alpha=0.05 \)

8.2. 总体方差的检验

方差反映稳定性,方差大,反映产品性能不稳定

检验一个总体的方差或标准差

假设总体近似服从正态分布

检验统计量\[ \chi^{2}=\frac{(n-1) s^{2}}{\sigma^{2}} \]

例8.9

某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000ml)的饮料误差上下不超过1ml。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000ml),得到如下结果。检验该机器的性能是否达到设计要求 。 \( \alpha=0.05 \)

0.3 -0.4 -0.7 1.4 -0.6
-0.3 -1.5 0.6 -0.9 1.3
-1.3 0.7 1 -0.5 0
-0.6 0.7 -1.5 -0.2 -1.9
-0.5 1 -0.2 -0.6 1.1

\( H_{0} : \sigma^{2} \leq 1, H_{1} : \sigma^{2}>1 \)

已知\( \alpha=0.05, d f=25-1=24 \)

\[ \chi^{2}=\frac{(n-1) s^{2}}{\sigma^{2}}=\frac{(25-1) \times 0.866}{1}=20.8 \]

查卡方分布表可知,\( \chi_{0.05}^{2}(24)=36.415 \)

因此不能拒绝原假设。

练习

从某个正态分布总体抽出一个容量为21的随机样本,样本方差为10,试检验原假设\( \sigma^{2}=15 \)。(\( \alpha=0.05 \))

8.3 两个总体参数的检验

  • 检验统计量的确定
  • 两个总体均值之差的检验
  • 两个总体比例之差的检验
  • 两个总体方差比的检验
  • 检验中的匹配样本

8.3.1 检验统计量的确定

两个正态总体参数的检验

  • 均值之差检验

    • \( \sigma^2 \)已知或未知,大样本

    \( z \)统计量

    • \( \sigma^2 \)未知,小样本

    \( t \)统计量

  • 比例之差检验

    \( z \)统计量

  • 方法比检验

    \( F \)统计量

8.3.2 两个总体均值之差的检验

\( \sigma_1^2 \)和\( \sigma_2^2 \)已知

假定条件

  • 两个总体服从正态分布
  • 或不服从正态分布,但是为大样本
  • \( \sigma_1^2 \)和\( \sigma_2^2 \)已知

统计量

\[ z=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}} \]

例8.10

有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为\( n_{1}=32, n_{2}=40 \),测得\( \overline{x}_{1}=50 \)公斤,\( \overline{x}_{2}=44 \)公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?\( \alpha=0.05 \)

\( H_{0} : \mu_{1}-\mu_{2}=0, H_{1} : \mu_{1}-\mu_{2} \neq 0 \)

由于\( \sigma_1^2 \)和\( \sigma_2^2 \)已知,应选用\( z \)统计量,已知\( \overline{x}_{1}=50 \)公斤,\( \overline{x}_{2}=44 \)公斤,且\( n_{1}=32, n_{2}=40 \),\( \sigma_{1}^{2}=8^{2}, \sigma_{2}^{2}=10^{2} \),故 \[ z=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}=\frac{50-44-0}{\sqrt{\frac{64}{32}+\frac{100}{40}}}=2.83 \]

\( z_{\frac{\alpha}{2}}=1.96 \),因为\( Z>Z \frac{\alpha}{2} \),所以拒绝\( H_0 \)。即两种方法生产的产品抗拉强度有显著差异。如果计算p值,是多少呢?

8.3.2 两个总体均值之差的检验

\( \sigma_1^2 \)和\( \sigma_2^2 \)未知且相等,小样本

假定条件

  • 两个总体的方差未知
  • 并且皆为小样本
  • \( \sigma_{1}^{2}=\sigma_{2}^{2} \)

统计量

\[ t=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{s_{p} \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}} \]

  • \( t \)的自由度为\( n_1+n_2-2 \)

\( \sigma_1^2 \)和\( \sigma_2^2 \)未知且不等,小样本

假定条件

  • 两个总体的方差未知
  • 并且皆为小样本
  • \( \sigma_{1}^{2} \neq \sigma_{2}^{2} \)

统计量

\[ t=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}} \]

  • \( t \)的自由度\( v=\frac{\left(\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}\right)^{2}}{\frac{\left(\frac{s_{1}^{2}}{n_{1}}\right)^{2}}{n_{1}-1}+\frac{\left(\frac{s_{2}^{2}}{n_{2}}\right)^{2}}{n_{2}-1}} \)

例8.11

“多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果。检验该假设。\( \alpha=0.05 \)

原始数据见课本

提出假设:\( H_{0} : \mu_{1}-\mu_{2} \geq 0, H_{1} : \mu_{1}-\mu_{2}<0 \)

\( \sigma_{1}^{2}, \sigma_{2}^{2} \)未知,\( \sigma_{1}^{2} \neq \sigma_{2}^{2} \),采用\( t \)分布,自由度为\( v \)。经过计算,得到\( \overline{x}_{1}=589.67 \),\( s_{1}^{2}=2431.429 \),\( s_{2}^{2}=3675.461 \),\( v=32.34 \),若取\( v=32 \),由\( t \)分布表可知\( t_{0.05}(32)=1.694 \),检验统计量\( t \)值为: \[ t=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}=\frac{(589.67-629.25)-0}{\sqrt{\frac{2431.429}{15}+\frac{3675.461}{20}}}=-2.128 \] 由于\( |t|>\left|t_{\alpha}\right| \),故拒绝\( H_0 \)。

如何使用\( P \)值进行决策?

练习

有2种方法可用于制造2种以抗拉强度为重要特征的产品,经验表明,用这2种方法生产出的产品的抗拉强度都近似服从正态分布。方法1给出的标准差\( \sigma_1=6 \)千克,方法2给出的标准差\( \sigma_{2}=8 \)千克。从方法1中的产品中抽取样本容量为12的一个样本,得到样本均值为40千克。从方法2生产的产品中抽取样本容量为16的一个样本,得到样本均值为34千克。管理部门想知道这2种方法所生产出来的产品的平均抗拉强度是否相同?

某地区高考负责人想知道能不能说某年来自城市中学考生的平均成绩比来自农村的中学考生的平均成绩高。已知总体服从正态分布且方差大致相同,由抽样获得以下资料:

  • 城市中学考生: \( \overline{x}_{1}=454, \mathrm{s}_1=50, \mathrm{n}_1=17 \)
  • 农村中学考生:\( \overline{x}_{2}=495, \mathrm{s}_2=55, \mathrm{n}_2=16 \)

能否说明农村学生的成绩好于城市学生。

某纺织厂可以从2个地区购买原纱。这2个地区的原纱从各方面来看都不相上下,但抗断强度除外。如果有理由认为A地区的产品(价格较低)其抗断强度不低于B地区的话,该厂将购买Α地区的产品。现从Α、B两地区的库存中各抽取一个随机样本,得到下列结果:\( {n}_{1}=10, \overline{x}_{1}=94, s_{1}^{2}=14 \),\( {n}_{2}=12, \overline{x}_{2}=98, s_{2}^{2}=9 \)。假定抗断强度近似服从正态分布。假定2个总体方差不等,根据\( \alpha=0.05 \)水平下的适当假设检验,你是否建议该纺织厂厂长购买价格便宜的原纱(即Α地区的原纱)?

8.3.2 两个总体比例之差的检验

检验两个总体比例相等的假设

假定条件

  • 两个总体是独立的
  • 两个总体都服从二项分布
  • 可以用正态分布近似
  • 假设\( H_{0} : \pi_{1}-\pi_{2}=0 \),\( H_{1} : \pi_{1}-\pi_{2} \neq 0 \)
  • 原假设成立的条件下,最佳的方差是\( p(1-p) \),其中\( p=\frac{x_{1}+x_{2}}{n_{1}+n_{2}} \)

统计量

\[ z=\frac{\left(p_{1}-p_{2}\right)}{\sqrt{p(1-p)\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}} \sim N(0,1) \]

例8.12

人们普遍认为麦当劳的主要消费群体是青少年,但对市场的进一步细分却发现有不同的看法。一种观点认为小学生更喜欢麦当劳,另一种观点认为中学生对麦当劳的喜爱程度不亚于小学生。某市场调查公司对此在某地区进行了一项调查,随机抽取了100名小学生和100名中学生,调查的问题是如果有麦当劳和其他中式快餐(如兰州拉面),你会首选哪种作为经常性午餐。调查结果如下:小学生(样本1)100人中有76人把麦当劳作为首选的经常性午餐,中学生(样本2)100人中有69人做出同样的选择。调查结果支持哪种观点?

作为第三方调查公司,其立场应该是中立的,所以建立的假设应该为:\( H_{0} : \pi_{1}-\pi_{2}=0 \),\( H_{1} : \pi_{1}-\pi_{2} \neq 0 \)

\[ p=\frac{x_{1}+x_{2}}{n_{1}+n_{2}}=\frac{76+69}{100+100}=0.725 \] \[ \begin{array}{l}{z=\frac{\left(p_{1}-p_{2}\right)}{\sqrt{p(1-p)\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{0.76-0.69}{\sqrt{0.725 \times(1-0.725) \times\left(\frac{1}{100}+\frac{1}{100}\right)}}} \\ {=1.11}\end{array} \]

\( z=1.11 \)落入接受域,所以调查结果支持原假设,说明该地区小学生和中学生对麦当劳的偏爱成都没有显著差异。

8.3.2 两个总体比例之差的检验

检验两个总体比例之差不为0的假设

假定条件

  • 两个总体是独立的
  • 两个总体都服从二项分布
  • 可以用正态分布近似
  • 假设\( H_{0} : \pi_{1}-\pi_{2}=d_{0} \),其中\( d_{0} \neq 0 \)

统计量

\[ z=\frac{\left(p_{1}-p_{2}\right)-d_{0}}{\sqrt{\frac{p_{1}\left(1-p_{1}\right)}{n_{1}}+\frac{p_{2}\left(1-p_{2}\right)}{n_{2}}}} \sim N(0,1) \]

例8.13

有一项研究报告说青少年经常上网聊天,男生的比例至少超过女生10个百分点,即\( \pi_{1}-\pi_{2} \geq 10 \% \)(\( \pi_1 \)为男生比例,\( \pi_2 \)为女生比例)。现对150个男生和150个女生进行上网聊天的频度调查,其中经常聊天的男生有68人,经常聊天的女生有54人。调查结果是否支持研究报告的结论。

\( H_{0} : \pi_{1}-\pi_{2} \geq 10 \%, H_{1} : \pi_{1}-\pi_{2}<10 \% \)

由题意可知,\( n_{1}=n_{2}=150 \),\( p_{1}=\frac{68}{150}=0.45 \),\( p_{2}=\frac{54}{150}=0.36 \),\( d_{0}=10 \% \)。

\[ \begin{array}{l}{z=\frac{\left(p_{1}-p_{2}\right)-d_{0}}{\sqrt{\frac{p_{1}\left(1-p_{1}\right)}{n_{1}}+\frac{p_{2}\left(1-p_{2}\right)}{n_{2}}}}=\frac{0.45 \times(1-0.45)}{\sqrt{\frac{0.45 \times(1-0.45)}{150}+\frac{0.36 \times(1-0.36)}{150}}}} \\ {=-0.177}\end{array} \]

这是左单侧检验,落入非拒绝域,故无法推翻原假设,调查结果支持研究报告的结论。

练习

甲、乙2公司属于同一行业,有人问这2个公司的工人是愿意得到特定增加的福利费,还是愿意得到特定增加的基本工资。在甲公司150名工人的简单随机样本中,有75人愿意得到增加基本工资;在乙公司200名工人的随机样本中,103人愿意得到增加的基本工资。在每个公司,样本容量占全部工人数的比率不超过5%。在\( \alpha=0.01 \)的显著性水平下,可以判定这2个公司中愿意增加基本工资的工人所占比例不同吗?

某厂质量检验人员认为该厂一车间的产品一级品的比率比二车间产品一级品的比率大于5%,现从一车间和二车间分别抽出2个独立随机样本,得到如下数据:\( n_{1}=150 \),其中一级品为数为113;\( n_{2}=160 \),其中一级品为104。试根据这些数据检验质量研究人员的观点。

8.4 检验问题的进一步说明

  • 关于检验结果的解释

  • 单侧检验中假设的建立

8.4.1 关于检验结果的解释

不拒绝原假设意味着我们所构造的与原假设相矛盾的小概率事件没有发生,但可能还有许多其他的与原假设矛盾的小概率事件,我们也无法证实所有的这些小概率事件不会发生;

我们把假设检验中出现接受原假设的结果解释为“没有发现充足的证据反对原假设”,或更严格地解释为“在显著性水平\( \alpha \)下没有发现充足的证据反对原假设”,而不用“接受原假设”,因为我们无法证明原假设是真的。

8.4.2 单侧检验中假设的建立

某种灯泡的质量标准是平均燃烧寿命不得低于1000小时。已知灯泡批量产品的燃烧寿命服从正态分布,且标准差为100小时。商店欲从工厂进货,随机抽取81个灯泡检查,测得\( \bar x = 990 \)小时,问商店是否决定购进这批灯泡。

这里可以有两种假设:

  • 第一种认为该厂生产的灯泡不会低于规定的质量标准,故检验\( \mu \geq 1000 \)小时是否成立;
  • 第二种认为该厂生产的灯泡很有可能低于规定的质量标准,故检验\( \mu \leq 1000 \)小时是否成立。