在Statlect上搜索概率和统计术语
统计列克特
指数 > Fundamentals of statistics

假设检验

经过 博士

假设检验是一种通过以下方法进行统计推断的方法 建立一个假设,称为零假设,并使用一些数据 决定是否拒绝该假设。

目录

零假设

正如我们在名为“ 统计推断,统计 推论是关于概率分布的陈述, sample $ xi $ 已被绘制。例子 $ xi $ 可以看作是一个 random vector $ Xi $, whose unknown joint 分配功能 [eq1] 假定属于一组分布函数 $菲$, 称为统计模型。

In 假设检验 我们发表关于模型的声明 涉及子集的限制 [eq2] 原始模型的我们做出的陈述是在两个可能的选择 statements:

  1. 拒绝限制 [eq3];

  2. 不要拒绝限制 [eq3].

粗略地说,我们从大范围开始 $菲$ 可能已经产生样本的分布 $ xi $ 我们希望将注意力集中在较小的一组 $ Phi _ {R} $. 在假设检验中,我们使用样本 $ xi $ 决定是否确实将我们的注意力限制在较小的集合上 $ Phi _ {R} $.

如果我们有一个参数模型,我们也可以对 hypothesis.

请记住,在参数模型中,分布函数集 $菲$ 与一套对应 [eq5] of p尺寸 实向量称为 parameter space。的要素 $ Theta $ are called parameters 和 the true 参数表示为 $ heta _ {0} $. true参数是与未知分布关联的参数 function [eq6] 从哪个样本 $ xi $ 实际被绘制。为简单起见, $ heta _ {0} $ 假定是唯一的。

在参数假设检验中,我们有一个限制 [eq7] 在参数空间上,我们选择以下两个语句之一: the restriction:

  1. 拒绝限制 [eq8];

  2. 不要拒绝限制 [eq8].

为了具体起见,在此我们将集中于参数假设检验 讲座,但是我们要说的大多数内容都非常简单 总体上对假设检验的修改。

限制为真的假设称为 空值 hypothesis 通常用 $ H_ {0} $:

[eq10]

替代假设

The restriction [eq11] (where $ Theta _ {R} ^ {c} $ is the complement of $ Theta _ {R} $) is often called 替代假设 和 it is denoted by $ H_ {1} $:[eq12]

对于某些作者,“拒绝原假设 $ H_ {0} $" 和“接受替代假设 $ H_ {1} $" 是同义词。但是,对于其他作者,“拒绝原假设 $ H_ {0} $" 不一定意味着“接受替代假设 $ H_ {1} $ ”。 尽管这主要是语言问题,但可以设想 拒绝后的情况 $ H_ {0} $, 进行第二次假设检验,从而 $ H_ {1} $ 成为新的原假设并被拒绝(这种情况可能发生在 如果模型是 mis-specified)。在这些 情况下,如果“拒绝原假设” $ H_ {0} $" 和“接受替代假设 $ H_ {1} $" 被当作​​同义词,那么会引起一些混乱,因为第一个测试 leads to "accept $ H_ {1} $" 而第二项测试导致“拒绝 $ H_ {1} $ ”。

另请注意,某些统计学家有时会将 替代假设的集合小于 $ Theta _ {R} ^ {c} $. 在这些情况下,原假设和替代假设不存在 涵盖参数空间考虑的所有可能性 $ Theta $.

错误类型

当我们决定是否拒绝限制时,我们可以 导致两种类型的错误:

  1. 拒绝限制 [eq8] 当限制为真时;这称为 第一个错误 kind 或一个 类型I错误;

  2. 不要拒绝限制 [eq8] 当限制为假时;这称为 秒的错误 kind 或一个 II型错误.

关键区域

记住样品 $ xi $ 被视为随机向量的实现 $ Xi $ having support $ R_ {Xi} $.

假设检验通常通过显式或隐式进行 细分支持 $ R_ {Xi} $ 分为两个不相交的子集。两个子集之一,用表示 $ C_ {Xi} $ is called the 关键区域 (要么 拒绝 region),它是的所有值的集合 $ xi $ 原假设为 rejected:[eq15]这 其他子集只是关键的补充 region:[eq16] 和 当然是这样 that[eq17]

测试统计

通常根据测试统计量隐式定义关键区域 以及测试统计数据的关键区域。一个 测试 statistic 是一个 random variable $ S $ 其实现取决于样本 $ xi $. In symbols,[eq18]

关键区域 $ S $ is a subset [eq19] 实数集,然后根据测试执行测试 statistic, as follows:[eq20]

如果关键区域的互补 $ C_ {S} $ 是一个间隔,那么它的极端称为 危急 values 的 the test. See this glossary entry for more details 关于临界值。

电源功能

The 幂函数 假设检验的功能是 关联拒绝的可能性 $ H_ {0} $ to each parameter $ theta中的$. 用以下方式表示关键区域 $ C_ {Xi} $, the power function [eq21] is defined as follows:[eq22]哪里 the notation [eq23] 用于表示概率是使用 分配功能 [eq24] 与参数关联 $ heta $.

测试大小

When [eq25], the power function [eq26] 告诉我们犯I型错误的可能性,即 当原假设为真时,拒绝原假设。最大值 犯I型错误的可能性是 therefore,[eq27]这 最大概率称为 测试的大小。规模 一些作者还称该测试为 重要程度 of the test。但是,根据其他作者,他们分配了一个 术语的含义略有不同,测试的显着性水平为 测试大小的上限,即一个常数 $ lpha $ 就统计学家所知, satisfies[eq28]

评估测试的标准

假设检验最常根据其大小和功效进行评估。 理想测试的大小应等于 0 (即,当null为零时,拒绝null假设的概率 假设是真的应该是 0) and power equal to 1 when [eq29] (即,当无效值为零时拒绝无效假设的概率 假说应该是假的 1 )。 当然,这种理想的测试在实践中从来没有发现,但是我们可以做到最好 希望的是一种具有很小尺寸和很高概率的测试 拒绝错误的假设。然而,这种理想习惯上被用来 在不同测试之间选择:例如,在两个测试之间选择 具有相同的尺寸,我们将始终利用具有较高尺寸的测试 power when [eq30]; 同样,当在两个具有相同功效的测试之间进行选择时 [eq31], 我们将始终利用尺寸较小的测试。

除功效和尺寸外,还有其他几个标准可用于评估 假设。我们在这里不讨论它们,但是我们请读者参考 Berger和Casella(2002)的精彩论述。

例子

在以下讲座中可以找到假设检验的例子:

  1. 关于均值的假设检验 (关于未知分布平均值的假设检验示例);

  2. Hypothesis 关于方差的检验 (关于 未知分布的方差)。

参考文献

Berger,R. L.和G. Casella(2002),“统计推断”,Duxbury Advanced Series.

如何引用

请引用为:

Taboga, Marco (2017). "假设检验", Lectures on probability theory and mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.enerxy-china.com/fundamentals-of-statistics/hypothesis-testing.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。