在Statlect上搜索概率和统计术语
统计 列克特
指数 > Glossary

统计模型

经过 博士

统计模型是关于概率分布的一组假设 产生了一些观察到的数据。用数学术语来说,这些假设是 制定为对可能的概率分布集的限制 已经生成了数据。

 目录

例子

我们在这里提供一些统计模型的例子。

假设我们随机画 n 来自特定人群的个体并测量其身高。这 测量可以认为是 realizations of n random variables [eq1]. 原则上,这些随机变量可以具有任何概率分布。 如果我们假设他们有一个 normal distribution,因为通常需要进行高度测量,所以我们 制定统计模型:我们对 可能已经生成数据的概率分布。

在前面的示例中,随机变量 [eq2] 原则上可以具有某种形式的依赖性。如果我们假设它们是 statistically independent,那么我们将对其进行进一步的限制 joint distribution , 是,我们在统计模型中添加了一个假设。

假设同样 n 个人我们也收集体重测量值 [eq3], 我们假设体重和身高之间存在线性关系, described by a regression equation[eq4] 哪里  $ lpha $ and  $ eta $ 是回归系数和  $ arepsilon _ {i} $ 是一个错误术语。这是一个统计模型,因为我们放置了一个 对可能会产生 couples [eq5]: 我们已经排除了两个变量都具有的所有联合分布 非线性关系(例如二次关系)。

如果我们假设所有错误  $ arepsilon _ {i} $ 在先前的回归方程中具有相同的 variance (i.e., the errors are not heteroskedastic ), 那么我们对数据生成的集合设置了进一步的限制 分布。因此,我们还有另一个统计模型。

参数模型

前面的示例说明,模型只是一组 可能已生成观测数据的概率分布。表示 such a set by  $菲$ .

When the set  $菲$ 与一套对应 [eq6] 实向量,那么我们有一个参数模型。

The set  $ Theta $ is called 参数 space 和 any one of its members $ \ theta \ in \ Theta $ is called a parameter.

如果像上面的第一个示例那样假设高度 measurements [eq7] 来自正态分布,然后集合  $菲$ 是所有正态分布的集合。但是正态分布是 完全以其均值为特征  亩 and its variance  sigma ^ 2 . 结果,每个成员  $菲$ 与参数向量相对应 [eq8]. The mean  亩 可以取任何实际值和方差  sigma ^ 2 需要积极。因此,参数空间为 [eq9].

如何使用统计模型?

选择统计模型后,即 我们关注一套  $菲$ 可能已经产生数据的概率分布(以及 parameter space  $ Theta $ 对应于  $菲$ )?

我们要做的典型事情是:

流行款

统计模型不计其数,因为它们的数量仅受 统计人员的想象力。但是,您可能想熟悉一下自己 有两种最受欢迎​​的型号:

更多细节

有关统计建模的更多详细信息,请参见以下内容: statistical inference.

继续阅读词汇表

上一个条目: 固定序列

下一个条目: 支持随机变量

如何引用

请引用为:

Taboga, Marco (2017). " 统计模型 ", Lectures on probability theory and mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.enerxy-china.com/glossary/statistical-model.

这本书

该网站上提供的大多数学习材料现在都以传统教科书格式提供。