搜索Statlect上的概率和统计信息
统计 章程
指数 > Fundamentals of statistics > Hypothesis testing

关于平均值的假设测试

经过 ,博士学位

这次讲座呈现了一些例子 Hypothesis testing, 专注于 关于平均值的假设的测试,即,在使用样本 执行关于未知分布的平均值的假设的测试。

目录

正常的IID样本 - 已知方差

在此示例中,我们在集合示例中进行了相同的假设 估计有权的卑鄙 Set 估计平均普通的IID样本。读者很强烈 建议在阅读此之前阅读该示例。

例子

在此示例中,样本  $ xi _ {n} $ is made of n 独立于一个独立的抽奖 普通的 distribution having unknown mean  亩 and known variance  西格玛^ 2. . 具体来说,我们观察 n realizations  $ x_ {1} $ , ...,  $ x_ {n} $ of n 独立随机变量 X_1, ...,  X_N. , 所有都有正常分布,平均值  亩 and known variance  西格玛^ 2. . The sample is the n - 一维 vector [eq1], 这是一个实现的 random vector [eq2].

零假设

We test the null hypothesis that the mean  亩 等于特定值  $ mu _ {0} $ :[eq3]

替代假设

We assume that the parameter space 是整个实线,即, $ mu {211d} $. Therefore, the alternative hypothesis is[eq4]

测试统计信息

To construct a 测试 statistic , 我们 use the sample mean[eq5]

The test statistic is[eq6] 这 经常调用测试统计 z统计 或者 普通的 z-statistic 基于这种统计数据的假设测试是 called Z-Test. 或者 正常Z检验.

关键地区

Let [eq7]. 我们拒绝零假设  $ h_ {0} $ if $ z_ {n}>z$ or if $ z_ {n}<-z$. In other words, the critical region is[eq8] 因此, the 批判的 values 的 the test are  $ -z $ and  $ z $ .

功率功能

The power function 的 the test is[eq9] 在哪里 Z is a 标准正常随机变量 和 the notation $ qtr {rm} {p} _ {mu} $ is 用来表示拒绝零的概率 假设在真正的假设下计算,即真正的平均值等于  亩 .

证明

可以写入功率函数 as[eq10] 在哪里 we have defined[eq11] 作为 在题为题为题为的讲座中展示 Point 估计平均值样本意味着  xbar_n. 具有平均值的正态分布  亩 and variance $ sigma ^ {2} / n $, 鉴于样本上的假设  $ xi _ {n} $ 我们上面制作。从中减去正常随机变量的平均值 随机变量本身并将其除以其方差的平方根,一个 获得标准的正常随机变量。因此,变量 Z 具有标准的正态分布。

测试的大小

在此时评估时 $ mu = mu _ {0} $, 功率函数等于提交a的概率 Type I error,即,概率 当零假设是真的时拒绝零假设。这 概率被称为 size of the test 和 it is equal to [eq12] 在哪里 Z 是标准的正常随机变量(这是琐碎的 substituting  亩 with  $ mu _ {0} $ 在上面发现的功率功能的公式中)。

正常的IID样本 - 未知方差

此示例类似于前一个。唯一的区别是我们 现在放宽假设分布的方差是已知的。

例子

在此示例中,样本  $ xi _ {n} $ is made of n 独立于具有未知平均值的正态分布  亩 and unknown variance  西格玛^ 2. . 具体来说,我们观察 n realizations  $ x_ {1} $ , ...,  $ x_ {n} $ of n 独立随机变量 X_1, ...,  X_N. , 所有都有正常分布,平均值  亩 and unknown variance  西格玛^ 2. . The sample is the n - 一维 vector [eq13], 这是随机载体的实现 [eq2].

零假设

我们测试了含义的假设  亩 等于特定值  $ mu _ {0} $ :[eq3]

替代假设

我们假设参数空间是整个实线,即, $ mu {211d} $. 因此,替代假设 is[eq16]

测试统计信息

我们通过使用样本构建两个测试统计数据 mean[eq5] 和 either the unadjusted sample variance[eq18] 或者 the adjusted sample variance[eq19]

两个测试统计 are[eq20] 在哪里 the superscripts  $ U $ and a 指示测试统计是基于未调整的还是调整的 样本方差。通常调用这两个测试统计数据 T统计 或者 学生的T统计 and 称为基于这些统计数据的假设的测试 T-Tests. 或者 学生的t检验.

关键地区

Let [eq7]. 我们拒绝零假设  $ h_ {0} $ if $ z_ {n} ^ {i}>z$ or if $ z_ {n} ^ {i}<-z$ (for  $ i = U $ or  $ i = $ )。 In other words, the critical region is[eq22] 因此, 测试的临界值是  $ -z $ and  $ z $ .

功率功能

基于未调整的样本方差的测试功率功能 is[eq23] 在哪里 the notation $ qtr {rm} {p} _ {mu} $ is 用来表示拒绝零的概率 假设在真正的假设下计算,即真正的平均值等于  亩 and  $ w_ {n-1} $ is a 非中央标准学生的t distribution with $n-1$ 自由度和非中心性参数等 to[eq24]

证明

可以写入功率函数 as[eq25] 在哪里 we have defined[eq26] 给予 样本上的假设  $ xi _ {n} $ 我们上面制作,样本是指  xbar_n. 具有平均值的正态分布  亩 and variance $ sigma ^ {2} / n $ (see 点估计平均值 ), 所以 that the random variable[eq27] 已 标准正态分布。此外,不调整的样本方差 $ s_ {n} ^ {2} $ has a Gamma distribution 和 parameters $n-1$ and [eq28] (see 点估计方差 ), so that the random variable[eq29] 已 具有参数的伽马分布 $n-1$ and 1. Adding a constant  $ C $ 标准正态分布并将由此获得的总和分开 伽马随机变量与参数的平方根 $n-1$ and 1, 一个人获得非中央标准学生的T分发 $n-1$ 自由度和非中心性参数  $ C $ . 因此,随机变量  $ w_ {n-1} $ 有一个非中央标准学生的T分配 $n-1$ 自由度和非中心性 parameter[eq30]

基于调整后的样本方差的测试功率功能 is[eq31] 在哪里 the notation $ qtr {rm} {p} _ {mu} $ is 用来表示拒绝零的概率 假设在真正的假设下计算,即真正的平均值等于  亩 and  $ w_ {n-1} $ 是非中央标准学生的T分发 $n-1$ 自由度和非中心性参数等 to[eq32]

证明

可以写入功率函数 as[eq33] 在哪里 we have defined[eq34] 给予 样本上的假设  $ xi _ {n} $ 我们上面制作,样本是指  xbar_n. 具有平均值的正态分布  亩 and variance $ sigma ^ {2} / n $ (see 点估计平均值 ), 所以 that the random variable[eq27] 已 标准正态分布。此外,调整后的样本方差 $ s_ {n} ^ {2} $ 具有参数的伽玛分布 $n-1$ and  西格玛^ 2. (see 点估计方差 ), so that the random variable[eq36] 已 具有参数的伽马分布 $n-1$ and 1. Adding a constant  $ C $ 标准正态分布并将由此获得的总和分开 伽马随机变量与参数的平方根 $n-1$ and 1, 一个人获得非中央标准学生的T分发 $n-1$ 自由度和非中心性参数  $ C $ . 因此,随机变量  $ w_ {n-1} $ 有一个非中央标准学生的T分配 $n-1$ 自由度和非中心性 parameter[eq30]

注意,对于固定的  $ z $ , 基于未调整的样本方差的测试比 基于调整后的样本方差测试, i.e.,[eq38] 因为 [eq39] 和, as a consequence[eq40]

测试的大小

基于未调整的样本方差的测试的大小等于 [eq41] 在哪里  $ w_ {n-1} $ is a 标准学生的T分配 with $n-1$ degrees of freedom.

证明

在此时评估时 $ mu = mu _ {0} $, 功率函数等于测试的大小,即概率 提交I类型错误。功率函数评估在  $ mu _ {0} $ is[eq41] 在哪里  $ w_ {n-1} $ 是非中央标准学生的T分发 $n-1$ 自由度和非中心性参数等 to[eq43]所以, when $ mu = mu _ {0} $, 非中心性参数等于 0 and  $ w_ {n-1} $ 只是一个标准的学生的T分配。

基于调整后的样本方差的测试的大小等于 [eq44] 在哪里  $ w_ {n-1} $ 是一个标准的学生的t分发 $n-1$ degrees of freedom.

证明

在此时评估时 $ mu = mu _ {0} $, 功率函数等于测试的大小,即概率 提交I类型错误。功率函数评估在  $ mu _ {0} $ is[eq45] 在哪里  $ w_ {n-1} $ 是非中央标准学生的T分发 $n-1$ 自由度和非中心性参数等 to[eq43]所以, when $ mu = mu _ {0} $, 非中心性参数等于 0 and  $ w_ {n-1} $ 只是一个标准的学生的T分配。

注意,对于固定的  $ z $ , 基于未调整的样本方差的测试具有比尺寸更大 基于调整后的样本方差测试,因为如上所述, 前者也具有比任何价值的更大的力量 parameter  亩 .

解决练习

下面可以找到一些练习解释的解决方案。

练习1

Denote by [eq47] the 分配功能 非中央标准学生的T分配 n 自由度和非中心性参数等于 k. 假设统计学家观察 $100$ 正常随机变量的独立实现。意思和 统计学家不知道的随机变量的方差是 equal to 1 and $4$ 分别。是什么 probability,表达了 terms of [eq48], 统计名人将拒绝 null hypothesis 那 the mean is 如果她基于的T-Test,则等于零 $100$ 观察到的实现,她套 $z=2$ 作为临界值,并且她使用调整后的样本方差来计算 the t-statistic?

解决方案

拒绝null的概率 hypothesis $ mu _ {0} = 0 $ 通过评估测试的功率函数来获得  $ mu = 1 $ :[eq49] 在哪里 the notation $ qtr {rm} {p} _ {mu} $ is 用来表示拒绝零的概率 假设在真正的假设下计算,即真正的平均值等于  $ mu = 1 $ , and  $ w_ {99} $ 是非中央标准学生的T分发 $99$ 自由度和非中心性 parameter[eq50] 因此, 拒绝零假设的概率是相等的 to[eq51]

练习2

Denote by [eq52] 标准学生T分配的分布函数 n 自由度,以及 [eq53] 它的反向。假设统计学家观察 $100$ 对正常随机变量的独立实现,她执行了一个 Null假设的t检验,变量的平均值等于零, based on the $100$ 观察到的实现,并使用未调整的样本方差来计算 T型统计。她应该使用什么临界值以产生一种类型 我错误的概率10%?表达它 [eq54].

解决方案

null时提交I型错误 假设是真的,但它被拒绝了。拒绝null的概率 hypothesis $ mu _ {0} = 0 $ is [eq55] 在哪里  $ z $ 是临界价值,和  $ w_ {99} $ 是一个标准的学生的t分发 $99$ 自由程度。可以表达这种概率 as[eq56] 在哪里: in step  $ box {a} $ 我们已经使用了标准学生的T分发的密度 对称左右。因此,我们需要设置  $ z $ in such a way that[eq57] 这 is accomplished by[eq58]

如何引用

请引用:

Taboga, Marco (2017). "关于平均值的假设测试", Lectures on probability theory and mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.enerxy-china.com/fundamentals-of-statistics/hypothesis-testing-mean.

这本书

本网站上发现的大多数学习材料现在都以传统的教科书格式提供。