搜索Statlect上的概率和统计信息
统计章程
指数 > Fundamentals of statistics

马尔可夫链蒙特卡罗(MCMC)诊断

经过 ,博士学位

马尔可夫链Monte Carlo(MCMC)诊断是可用于的工具 检查是否使用MCMC算法生成的样本的质量是 足以提供目标分布的精确近似。

特别是,MCMC诊断用于检查:

目录

了解MCMC的基础知识

在整个讲座中,我们将假设您熟悉 这 basics of the 马尔可夫链蒙特卡罗方法.

以下是您需要牢记的一些重要事实。

MCMC算法产生序列 [eq1] 随机变量(或向量)。该序列具有以下属性:

当我们运行MCMC算法时 $ t $ 期间,我们得到了第一个MCMC样本 $ t $ realizations of the chain:[eq2]和 then we use the empirical distribution 样品近似目标分布。

了解什么可能出错

MCMC诊断尝试发现什么样的问题?基本上,有 两个主要问题

问题1 - 绘制了大部分样本 从与目标显着不同的分布

一般来说,起始值的分布 X_1 与目标分布不同。结果,也是 distributions of [eq3] 与目标分布不同,虽然差异变成了 较小和更小 $ t $ 增加,因为,通过建设,分布 $ x_ {t} $ 收敛到目标分配 $ t $ tends to infinity.

它可能发生的是,链条速度缓慢,即在许多人之后 迭代,绘制的分布仍然是截然不同的 目标分布。通常,这将在初始值时发生 $ x_ {1} $ 位于目标分布指定非常小的区域 probability.

当链条缓慢收敛时,我们的大部分MCMC样本可能是 由显着的分布绘制的观察结果组成 与目标分布不同。

如果我们能够发现这种问题,我们可以尝试解决它:

这两种修复都具有增加绘制比例的效果 从与目标类似的分布中提取 distribution.

问题2 - 样本的有效尺寸是 too small

请记住,通常,链条的两项条款 $ x_ {t} $ and $ x_ {t + n} $ 不是独立的。但是,它们几乎独立为 n gets large.

假设我们能够找到最小的数字 $ n_ {0} $ such that, for any $ t $, $ x_ {t} $ and $ x_ {t + n_ {0}} $ 可以被认为是独立的所有实际目的(他们的程度 依赖可以忽略不计)。为了简单起见,还假设 sample size $ t $ is a multiple of $ n_ {0} $. Then, we can form a sub-sample[eq4]的 相互独立的变量的实现。这个的维度 次样本,我们打电话 有效的样本大小, 是 $ t / n_ {0} $.

粗略地说,MCMC样本是 相等的 到 a sample 独立观察大小 $ t / n_ {0} $. 在马尔可夫链条之间的依赖依赖的依赖越慢 is, the larger $ n_ {0} $, 并且有效的样本大小越小。

当依赖衰减非常缓慢 ($ n_ {0} $ 非常大),很容易发生有效的样本大小 ($ t / n_ {0} $) MCMC样本太小,在意义上是有限的尺寸 样本使其经验分布非常嘈杂/不精确的近似值 目标分布。

如果我们能够发现这种问题,我们可以尝试解决它:

这两种固定都具有增加有效样品尺寸的效果。

笔记: 给出了有效样本大小的定义 here is not rigorous 并且通常与定义不同 在MCMC教科书和论文中找到。它唯一的目的是清楚地说明 可以缓慢腐烂依赖来生成的问题。

许多MCMC诊断背后的基本原则

大多数MCMC诊断测试没有描述的问题1和2 above.

特别是,不存在问题1和2,以下 假设 hold:

  1. 来自MCMC样本中的大部分观察结果 与目标分布非常相似的分布;

  2. 样品的有效尺寸不太小。

如果这两个假设保持,那么 含义 is that:

通过大块,我们的意思是表示一个相邻绘图的子样本 总体样品的重要部分(参见下面的实施例1)。

许多诊断用于测试上面的含义(调用它 好的 large chunks)。如果诊断告诉我们大块不是 很好,然后我们的样本受到问题1或2的折磨,其质量是 not sufficient.

样品分裂

诊断MCMC示例中问题的最简单方法是拆分样本 进入两个或多个块,并检查我们是否获得相同的结果 chunks.

例子 假设我们的MCMC样本由 $ t $ draws (with $ t $ even):[eq5]在哪里 a generic draw $ x_ {t} $ is a Kx1 随机矢量。然后,我们可以将样品划分为两个 chunks[eq6]和 compute their sample means[eq7]如果 两个样本手段有显着差异(我们可以运行正式的 统计测试检查差异),那么这是一种症状 MCMC样本的质量不足。

在前面的示例中,我们已经比较了两者的样本装置 子样本,但可以在其他样本上进行比较 例如,瞬间在 sample variances.

这种简单诊断背后的理由非常简单。如果我们发现那个 两块样本的块具有显着不同的经验分布, 然后必须是至少两个中的至少一个不是很好的近似 目标分布。这与漂亮的大块原则相矛盾。 因此,我们样本的质量不足。

多个链条

诊断问题的另一种简单方法是运行MCMC算法 一旦用不同的(可能,非常不同)的起点 $ x_ {1} $, 以便获得多个MCMC样本。然后,我们检查我们是否相同 结果所有样品(可能在丢弃烧坏后)。我们可以 通过测试样品手段或其他样本时刻进行检查 与不同的MCMC样本有显着差异,类似于 我们在上一节中所做的(样本拆分)。

跟踪情节

跟踪情节可以帮助我们了解什么样的问题(如果有的话)会影响 our MCMC sample.

假设我们的MCMC样本由 $ t $ draws[eq8]在哪里 a generic draw $ x_ {t} $ is a Kx1 random vector.

跟踪绘图是一个有限的界图:

下图包含三个跟踪图,说明典型情况 we may encounter.

三种不同MCMC样本的微量曲线

在第一痕量图(链1)中,没有明显的异常。那里 似乎是连续绘制和链之间的温和串行相关性 似乎很多次探索样品空间。

在第二图(链2)中,样品的第一部分(直到周围 $ t = 1,500美元) 看起来与剩下的部分不同。最有可能,最初的 链条后续条款的分布和分布是 与目标分布非常不同,但随后链慢慢地 融合到目标分布(周围) $ t = 1,500美元)。 我们有问题1:从分布中绘制了大块的样本 与目标分布显着不同。

在第三个曲线(链3)中,有很多串行相关性 连续的画。探索样品空间时,链条非常缓慢。这 示例空间仅探讨了几次。换句话说,似乎 在我们的样本中是几乎没有独立观察。很可能,我们有问题 2:我们样本的有效尺寸太小。

接下来的两种微量绘图显示如何解决问题1和2。

两种不同MCMC样本的微量曲线

在第一个图中,使用来自链2的相同样品,但烧伤( first $ 2,500美元 观察)被丢弃。

在第二个图中,产生来自链3的新样本,但样品 大小急剧增加(来自 10,000美元 to $ 1,000,000美元 绘制)以增加有效的样本大小并让链条探索 许多次样本空间。

在这两种情况下,问题似乎已经解决了:MCMC的微量图 样品不显示任何明显的异常。

我们注意到,虽然跟踪情节非常简单,但非正式的诊断 工具,它们似乎是最常使用的:如果您正在尝试发布 在科学期刊中的MCMC研究,很可能你会 要求在研究中包含您的微量地块!

自相关函数(ACF)情节

通过检查跟踪情节,我们可以获得序列的程度 绘制的相关性。要精确测量串行相关性,我们可以使用 所谓的ACF(自相关函数)图,也称为相关图。从 这些绘图您可以看到如何自相关的样本 随着滞后的函数,链条减少(见讲座 autocorrelation for more details).

下一个数字包含三个MCMC样本的样本ACF图 在上一节中讨论了跟踪图。

三种不同MCMC样本的ACF曲线

链条1的ACF图表明,在短暂的滞后,自相关是大的,但是 然后快速进入零(记住跟踪情节没有提供 有任何问题的证据)。

链条2和3的曲线表明,不仅自相关是大的 短暂的滞后,但它也会非常缓慢地消失。有趣的是ACF的样本 即使跟踪情节提供证据,链2和3也非常相似 两条链受到不同问题的影响(问题1和2 分别)。根据我们的经验,这是一个发生的事情 经常。虽然ACF地块有助于我们评估存在 问题并让我们更好地量化自相关,很难 从ACFS讲述问题是什么。因此,建议使用痕迹 情节和ACF绘图在一起。

不要依赖单一诊断

我们应该注意,MCMC专家普遍就以下事实达成一致:

  1. 没有单一的诊断是完美的;

  2. 我们永远不能100%确定MCMC样品的质量是足够的 (诊断可以帮助我们发现问题,但他们无法保证 没有问题)。

出于这些原因,我们能做的最好的事情是分析我们的MCMC样本 尽可能准确地使用许多不同的诊断来评估 their quality.

只要你可以跑你的链条

曾说过,表演许多诊断总是一个好主意,我们觉得 喜欢给另一件建议:永远像你一样跑你的链条 可以,用不同的起点运行很多链条,并不备用 计算资源。这是避免问题的最佳方式。

如何引用

请引用:

Taboga, Marco (2017). "马尔可夫链蒙特卡罗(MCMC)诊断", Lectures on probability theory and mathematical statistics, Third edition. Kindle Direct Publishing. Online appendix. //www.enerxy-china.com/fundamentals-of-statistics/Markov-Chain-Monte-Carlo-diagnostics.

这本书

本网站上发现的大多数学习材料现在都以传统的教科书格式提供。