黄晗
Spring, 2019
| 参数估计 | 假设检验 |
|---|---|
| 用样本统计量估计总体参数 | 先对总体参数进行假设 |
| 总体参数在估计前未知 | 利用样本信息检验假设是否成立 |
假设问题的提出
一个总体参数的检验
两个总体参数的检验
检验问题的进一步说明
由统计资料得知,1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中随机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显著差异?
差异:\( 3210-3190=20 \)克
问题的表达:用\( \mu \)表示1990年新生儿体重,\( \mu_0 \)表示1989年新生儿体重,假设可以表示为:\( \mu-\mu_{0}=0 \)。我们通过检验假设是否成立回答这个问题。
假设:对总体参数的的数值所作的一种陈述
原假设采用等式的方式:\( H_{0} : \mu=3190 \)克
\( H_0 \)表示原假设(null hypothesis),也称为零假设;\( \mu \)是待检验的参数,即1990年新生儿总体体重的均值;含义为1990年的新生儿与1989年的新生儿在体重上没有差异。
如果原假设不成立,就要拒绝原假设,而需要在另一个假设中做出选择,这个假设称为备择假设(alternative hypothesis),或称为替换假设,可以表示为\( H_{1} : \mu_{1} \neq 3190 \)克。
某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的均值\( x=1.39 \),检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为\( \alpha=0.05 \),,则下列正确的假设形式是( )。
某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为( )
在假设检验中,不拒绝原假设意味着( )
在假设检验中,第一类错误是指( )
用于假设检验决策的统计量
选择统计量的方法与参数估计相同,需考虑
检验统计量的基本形式为\[ Z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}} \]
是一个概率值
原假设为真时,拒绝原假设的概率
表示为\( \alpha \)
由研究者事先确定
计算检验的统计量
根据给定的显著性水平\( \alpha \),查表得出相应的临界值\( z_\alpha \)或者\( t_\alpha \)
将检验统计量的值与\( \alpha \)水平的临界值进行比较
得出拒绝或不拒绝原假设的结论
是一个概率值
如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率
被称为观察到的(或实测的)显著性水平


若P值\( > \alpha \),不拒绝原假设
若P值\( < \alpha \),拒绝原假设
P值越小( )。
| 假设 | 双侧检验 | 左侧检验 | 右侧检验 |
|---|---|---|---|
| \( H_0 \) | \( \mu=\mu_0 \) | \( \mu \geq \mu_0 \) | \( \mu \leq \mu_0 \) |
| \( H_1 \) | \( \mu \neq \mu_{0} \) | \( \mu < \mu_0 \) | \( \mu > \mu_0 \) |
属于决策中的假设检验
不论是拒绝原假设还是不拒绝原假设,都必需采取相应的行动措施
建立的原假设与备择假设应为
指出下列假设检验哪一个属于左侧检验( )
指出下列假设检验形式的写法哪一个是错误的?( )
设\( z_c \)为检验统计量的计算值,检验的假设为\( \mathrm{H}_{\mathrm{0}} : \mu \leq \mu_{\mathrm{0}}, \mathrm{H}_{1} : \mu>\mu_{\mathrm{0}} \),当\( z_c=1.645 \)时,计算出的P值为( )。

例8.4
某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为\( \mu_{0}=0.081 mm \),总体标准差为\( \sigma=0.025 \)。今换一种新机床进行加工,抽取\( n=200 \)个零件进行检验,得到的椭圆度为\( 0.076mm \)。试问新机床加工零件的椭圆度的均值与以前有无显著差异?
提出假设:\( H_{0} : \mu=0.081 m m, H_{1} : \mu \neq 0.081 m m \)
由题意可知,\( \mu_{0}=0.081 {mm}, s=0.025 {mm}, \overline{x}=0.076 {mm} \),因为\( n>30 \),故选用\( z \)统计量。
\[ z=\frac{\overline{X}-\mu_{0}}{s / \sqrt{n}}=\frac{0.076-0.081}{0.025 / \sqrt{200}}=-2.83 \]
\( \alpha=0.05 \),所以\( z_{\frac{\alpha}{2}}=\pm 1.96 \),\( |z|>\left|z_{\frac{\alpha}{2}}\right| \),拒绝原假设。
例8.5
某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从正态分布,标准差为200个小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?
\( H_{0} : \mu \geq 1000, H_{1} : \mu<1000 \)
由题意可知,\( \mu_{0}=1000, \overline{x}=960, \sigma=200, n=100, \alpha=0.05 \),所以\( z_{\alpha}=-1.645 \)。
\[ z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}=\frac{960-1000}{200 / \sqrt{100}}=-2 \]
由于\( |z|>\left|z_{\alpha}\right| \),因此拒绝\( H_0 \)。即这批灯泡的使用寿命低于1000小时,批发商不应购买。
例8.6
某电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了20件作为样本,测得平均使用寿命1245小时。能否说该厂生产的电子元件质量显著地高于规定标准?\( \alpha=0.05 \)
\( H_{0} : \mu \leq 1200, H_{1} : \mu>1200 \)
由题意可知,\( \mu_{0}=1200, \overline{x}=1245, \sigma=150, n=20, \alpha=0.05 \),虽然\( n<30 \),但由于\( \sigma \)已知,,可以使用\( z \)统计量。
\[ z=\frac{\overline{X}-\mu_{0}}{\sigma / \sqrt{n}}=\frac{1245-1200}{150 / \sqrt{20}}=1.34 \]
\( z \)位于非拒绝域,所以不拒绝\( H_0 \)。即不能说该厂产品质量显著地高于规定标准。
例8.7
某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。
\( H_{0} : \mu=5, H_{1} : \mu \neq 5 \)
由题意可知,\( \mu_{0}=5, \overline{x}=5.3, s=0.3, n=10, \alpha=0.05 \),由于\( \sigma \)未知,样本量\( n \)较小,采用\( t \)统计量。\[ t=\frac{\overline{x}-\mu_{0}}{s / \sqrt{n}}=\frac{5.3-5}{0.3 / \sqrt{10}}=3.16 \]
当\( \alpha=0.05 \),自由度\( n-1=9 \),查表 \( t_{\alpha/2} (9)=2.2622 < t \),故拒绝\( H_0 \)。说明该机器的性能不好。
练习
设我国出口凤尾鱼罐头,标准规格是每罐净重250克,根据以往经验,标准差是3克。现在某食品工厂生产一批供出口用的这种罐头,从中抽取100罐检验,其平均净重是251克。假定罐头重量服从正态分布,按规定显著性水平\( \alpha=0.05 \),问这批罐头是否合乎标准,即净重确为250克?
设我国出口凤尾鱼罐头,标准规格是每罐净重250克,根据以往经验,标准差是3克。现在某食品工厂生产一批供出口用的这种罐头,从中抽取100罐检验,其平均净重是251克。假定罐头重量服从正态分布,按规定显著性水平\( \alpha=0.05 \),问这批罐头是否合乎标准,即净重确为250克?
市场管理部门意欲对某厂生产的大瓶碳酸饮料进行检查,以确定是否符合其标签上注明的“容量至少是3磅”的说法。现抽取一由20瓶组成的随机样本,样本平均值为2.89,样本标准差为0.148, 假定该饮料包装重量近似服从正态分布,市场管理部门能否由此断该厂生产的大瓶碳酸饮料包装重量不足,并对其提出投诉?\( \alpha=0.05 \)
总体服从二项分布
可以用正态分布近似(\( np > 5 \)和\( nq > 5 \))
通常采用\( z \)统计量
\[ z=\frac{p-\pi_{0}}{\sqrt{\frac{\pi_{0}\left(1-\pi_{0}\right)}{n}}} \]
例8.8
一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(\( \alpha=0.05 \))
\( H_{0} : \pi=14.7 \%, H_{1} : \pi \neq 14.7 \% \)
由题意可知\( p=\frac{57}{400}=14.25 \% \)
\[ z=\frac{p-\pi_{0}}{\sqrt{\frac{\pi_{0}\left(1-\pi_{0}\right)}{n}}}=\frac{0.1425-0.147}{\sqrt{\frac{0.147 \times(1-0.147)}{400}}}=-0.254 \]
这是一个双侧检验,当\( \alpha=0.05 \)时,有\( z_{\frac{\alpha}{2}}=\pm 1.96 \),不能拒绝原假设,可以认为调查结果支持了该市老年人口所占比例为\( 14.7\% \)的看法。
练习
某企业的产品畅销于国内市场。据以往调查,购买该产品的顾客有50%是30岁以上的男子。该企业负责人关心这个比例是否发生了变化(无论是增加还是减少)?于是,该企业委托了一家咨询公司机构进行调查,这家咨询机构从众多的购买者手中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平\( \alpha=0.05 \)下检验“50%的顾客是30岁以上的男子”这个假设。
一位关于环境保护的公共福利团体的发言人宣称:“在这个工业区域内,遵守政府制订的空气污染标准法则的工厂不到60%”。但环境保护局的工程师却相信至少60%的工厂是遵守这个法则的。于是他从这个工业区域内抽查出了60家工厂并发现33家是尊遵守空气污染法则的。现环保局想知道真正的比率是否少于60%?\( \alpha=0.05 \)
方差反映稳定性,方差大,反映产品性能不稳定
检验一个总体的方差或标准差
假设总体近似服从正态分布
检验统计量\[ \chi^{2}=\frac{(n-1) s^{2}}{\sigma^{2}} \]
例8.9
某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000ml)的饮料误差上下不超过1ml。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000ml),得到如下结果。检验该机器的性能是否达到设计要求 。 \( \alpha=0.05 \)
| 0.3 | -0.4 | -0.7 | 1.4 | -0.6 |
|---|---|---|---|---|
| -0.3 | -1.5 | 0.6 | -0.9 | 1.3 |
| -1.3 | 0.7 | 1 | -0.5 | 0 |
| -0.6 | 0.7 | -1.5 | -0.2 | -1.9 |
| -0.5 | 1 | -0.2 | -0.6 | 1.1 |
\( H_{0} : \sigma^{2} \leq 1, H_{1} : \sigma^{2}>1 \)
已知\( \alpha=0.05, d f=25-1=24 \)
\[ \chi^{2}=\frac{(n-1) s^{2}}{\sigma^{2}}=\frac{(25-1) \times 0.866}{1}=20.8 \]
查卡方分布表可知,\( \chi_{0.05}^{2}(24)=36.415 \)
因此不能拒绝原假设。
练习
从某个正态分布总体抽出一个容量为21的随机样本,样本方差为10,试检验原假设\( \sigma^{2}=15 \)。(\( \alpha=0.05 \))
两个正态总体参数的检验
均值之差检验
\( z \)统计量
\( t \)统计量
比例之差检验
\( z \)统计量
方法比检验
\( F \)统计量
\[ z=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}} \]
例8.10
有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为\( n_{1}=32, n_{2}=40 \),测得\( \overline{x}_{1}=50 \)公斤,\( \overline{x}_{2}=44 \)公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?\( \alpha=0.05 \)
\( H_{0} : \mu_{1}-\mu_{2}=0, H_{1} : \mu_{1}-\mu_{2} \neq 0 \)
由于\( \sigma_1^2 \)和\( \sigma_2^2 \)已知,应选用\( z \)统计量,已知\( \overline{x}_{1}=50 \)公斤,\( \overline{x}_{2}=44 \)公斤,且\( n_{1}=32, n_{2}=40 \),\( \sigma_{1}^{2}=8^{2}, \sigma_{2}^{2}=10^{2} \),故 \[ z=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}=\frac{50-44-0}{\sqrt{\frac{64}{32}+\frac{100}{40}}}=2.83 \]
\( z_{\frac{\alpha}{2}}=1.96 \),因为\( Z>Z \frac{\alpha}{2} \),所以拒绝\( H_0 \)。即两种方法生产的产品抗拉强度有显著差异。如果计算p值,是多少呢?
\[ t=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{s_{p} \sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}} \]
\[ t=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}} \]
例8.11
“多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者(总体1),一类为非经常谷类食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果。检验该假设。\( \alpha=0.05 \)
原始数据见课本
提出假设:\( H_{0} : \mu_{1}-\mu_{2} \geq 0, H_{1} : \mu_{1}-\mu_{2}<0 \)
\( \sigma_{1}^{2}, \sigma_{2}^{2} \)未知,\( \sigma_{1}^{2} \neq \sigma_{2}^{2} \),采用\( t \)分布,自由度为\( v \)。经过计算,得到\( \overline{x}_{1}=589.67 \),\( s_{1}^{2}=2431.429 \),\( s_{2}^{2}=3675.461 \),\( v=32.34 \),若取\( v=32 \),由\( t \)分布表可知\( t_{0.05}(32)=1.694 \),检验统计量\( t \)值为: \[ t=\frac{\left(\overline{x}_{1}-\overline{x}_{2}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}=\frac{(589.67-629.25)-0}{\sqrt{\frac{2431.429}{15}+\frac{3675.461}{20}}}=-2.128 \] 由于\( |t|>\left|t_{\alpha}\right| \),故拒绝\( H_0 \)。
如何使用\( P \)值进行决策?
练习
有2种方法可用于制造2种以抗拉强度为重要特征的产品,经验表明,用这2种方法生产出的产品的抗拉强度都近似服从正态分布。方法1给出的标准差\( \sigma_1=6 \)千克,方法2给出的标准差\( \sigma_{2}=8 \)千克。从方法1中的产品中抽取样本容量为12的一个样本,得到样本均值为40千克。从方法2生产的产品中抽取样本容量为16的一个样本,得到样本均值为34千克。管理部门想知道这2种方法所生产出来的产品的平均抗拉强度是否相同?
某地区高考负责人想知道能不能说某年来自城市中学考生的平均成绩比来自农村的中学考生的平均成绩高。已知总体服从正态分布且方差大致相同,由抽样获得以下资料:
能否说明农村学生的成绩好于城市学生。
某纺织厂可以从2个地区购买原纱。这2个地区的原纱从各方面来看都不相上下,但抗断强度除外。如果有理由认为A地区的产品(价格较低)其抗断强度不低于B地区的话,该厂将购买Α地区的产品。现从Α、B两地区的库存中各抽取一个随机样本,得到下列结果:\( {n}_{1}=10, \overline{x}_{1}=94, s_{1}^{2}=14 \),\( {n}_{2}=12, \overline{x}_{2}=98, s_{2}^{2}=9 \)。假定抗断强度近似服从正态分布。假定2个总体方差不等,根据\( \alpha=0.05 \)水平下的适当假设检验,你是否建议该纺织厂厂长购买价格便宜的原纱(即Α地区的原纱)?
\[ z=\frac{\left(p_{1}-p_{2}\right)}{\sqrt{p(1-p)\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}} \sim N(0,1) \]
例8.12
人们普遍认为麦当劳的主要消费群体是青少年,但对市场的进一步细分却发现有不同的看法。一种观点认为小学生更喜欢麦当劳,另一种观点认为中学生对麦当劳的喜爱程度不亚于小学生。某市场调查公司对此在某地区进行了一项调查,随机抽取了100名小学生和100名中学生,调查的问题是如果有麦当劳和其他中式快餐(如兰州拉面),你会首选哪种作为经常性午餐。调查结果如下:小学生(样本1)100人中有76人把麦当劳作为首选的经常性午餐,中学生(样本2)100人中有69人做出同样的选择。调查结果支持哪种观点?
作为第三方调查公司,其立场应该是中立的,所以建立的假设应该为:\( H_{0} : \pi_{1}-\pi_{2}=0 \),\( H_{1} : \pi_{1}-\pi_{2} \neq 0 \)
\[ p=\frac{x_{1}+x_{2}}{n_{1}+n_{2}}=\frac{76+69}{100+100}=0.725 \] \[ \begin{array}{l}{z=\frac{\left(p_{1}-p_{2}\right)}{\sqrt{p(1-p)\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{0.76-0.69}{\sqrt{0.725 \times(1-0.725) \times\left(\frac{1}{100}+\frac{1}{100}\right)}}} \\ {=1.11}\end{array} \]
\( z=1.11 \)落入接受域,所以调查结果支持原假设,说明该地区小学生和中学生对麦当劳的偏爱成都没有显著差异。
\[ z=\frac{\left(p_{1}-p_{2}\right)-d_{0}}{\sqrt{\frac{p_{1}\left(1-p_{1}\right)}{n_{1}}+\frac{p_{2}\left(1-p_{2}\right)}{n_{2}}}} \sim N(0,1) \]
例8.13
有一项研究报告说青少年经常上网聊天,男生的比例至少超过女生10个百分点,即\( \pi_{1}-\pi_{2} \geq 10 \% \)(\( \pi_1 \)为男生比例,\( \pi_2 \)为女生比例)。现对150个男生和150个女生进行上网聊天的频度调查,其中经常聊天的男生有68人,经常聊天的女生有54人。调查结果是否支持研究报告的结论。
\( H_{0} : \pi_{1}-\pi_{2} \geq 10 \%, H_{1} : \pi_{1}-\pi_{2}<10 \% \)
由题意可知,\( n_{1}=n_{2}=150 \),\( p_{1}=\frac{68}{150}=0.45 \),\( p_{2}=\frac{54}{150}=0.36 \),\( d_{0}=10 \% \)。
\[ \begin{array}{l}{z=\frac{\left(p_{1}-p_{2}\right)-d_{0}}{\sqrt{\frac{p_{1}\left(1-p_{1}\right)}{n_{1}}+\frac{p_{2}\left(1-p_{2}\right)}{n_{2}}}}=\frac{0.45 \times(1-0.45)}{\sqrt{\frac{0.45 \times(1-0.45)}{150}+\frac{0.36 \times(1-0.36)}{150}}}} \\ {=-0.177}\end{array} \]
这是左单侧检验,落入非拒绝域,故无法推翻原假设,调查结果支持研究报告的结论。
练习
甲、乙2公司属于同一行业,有人问这2个公司的工人是愿意得到特定增加的福利费,还是愿意得到特定增加的基本工资。在甲公司150名工人的简单随机样本中,有75人愿意得到增加基本工资;在乙公司200名工人的随机样本中,103人愿意得到增加的基本工资。在每个公司,样本容量占全部工人数的比率不超过5%。在\( \alpha=0.01 \)的显著性水平下,可以判定这2个公司中愿意增加基本工资的工人所占比例不同吗?
某厂质量检验人员认为该厂一车间的产品一级品的比率比二车间产品一级品的比率大于5%,现从一车间和二车间分别抽出2个独立随机样本,得到如下数据:\( n_{1}=150 \),其中一级品为数为113;\( n_{2}=160 \),其中一级品为104。试根据这些数据检验质量研究人员的观点。
关于检验结果的解释
单侧检验中假设的建立
不拒绝原假设意味着我们所构造的与原假设相矛盾的小概率事件没有发生,但可能还有许多其他的与原假设矛盾的小概率事件,我们也无法证实所有的这些小概率事件不会发生;
我们把假设检验中出现接受原假设的结果解释为“没有发现充足的证据反对原假设”,或更严格地解释为“在显著性水平\( \alpha \)下没有发现充足的证据反对原假设”,而不用“接受原假设”,因为我们无法证明原假设是真的。
某种灯泡的质量标准是平均燃烧寿命不得低于1000小时。已知灯泡批量产品的燃烧寿命服从正态分布,且标准差为100小时。商店欲从工厂进货,随机抽取81个灯泡检查,测得\( \bar x = 990 \)小时,问商店是否决定购进这批灯泡。
这里可以有两种假设: