定义的问题它也是估计的问题

Dive into business data optimization and best practices.
Post Reply
Bappy11
Posts: 471
Joined: Sun Dec 22, 2024 9:30 am

定义的问题它也是估计的问题

Post by Bappy11 »

杰克·鲍尔斯:让我为不熟悉基于随机化的统计推断的读者提供一些背景知识。

随机设计为我们在实证研究中提出的两个最常见的问题提供了明确的答案:解释问题:“ A组的人与B组的人的行为不同意味着什么?”和信息问题:“我们对A与B的总结有多精确?”(或者,更防御性地说,“我们真的有足够的信息来区分A和B吗?”)。

如果我们随机分配了 A 组与 B 组干预,那么我们可以非常简单地回答解释问题:“如果 A 组与 B 组不同,那只是因为 A 组与 B 组干预。随机化应该消除 A 组和 B 组之间任何其他先前存在的差异。”

在回答信息问题时,仅凭随机化也能让我们描述实验可能出现的其他结果:“如果我们将 A 组与 B 组的干预措施重新随机分配到实验池中,同时假设 A 组和 B 组没有差异,则以下是 A 组和 B 组可能出现的所有差异。如果这些差异中很少有(或没有)与我们观察到的差异一样大,那么我们就会有很多信息反对 A 组和 B 组没有差异的观点。如果这些差异中有许多与我们观察到的差异一样大,那么我们就没有太多信息来反驳 A 组和 B 组没有差异的论点。”

当然,这些并不是人们应该问的唯一研究问题,解释也不应该以知道输入产生了输出而结束。然而,这些对意义和信息的关注是根本性的,随机化允许的答案为从观察中学习提供了一个特别明确的起点。事实上,许多基于随机化的总结信息问题答案的方法往往即使在样本量较小的情况下也能保证有效性。如果我们真的以所有可能的方式重复实验,并多次重复一个常见的假设检验,即使我们只观察了 8 个人,我们拒绝真实零假设的概率也不会超过 α%(Rosenbaum 2002,第 2 章)。

事实上,一个只有八个城市的项目推动了本文的撰写。Costa Panagopoulos在美国八个城市进行了一项报纸广告和投票率的实地实验,他和我开始讨论如何对广告对投票率的影响问题给出实质性、易于解释且统计有效的答案。我们是否可以假设,例如,三个处理过的城市的影响为零,而其中一个处理过的城市的影响大于零?答案是肯定的。

我意识到,关于因果关系的假设并不需要简单,而且,它们可以非常直接地代表实质性的理论模型。很快,马克·弗雷德里克森和我开始思考实质性模型,在这些模型中,对一个城市的治疗可能会对另一个城市产生影响。写下这些 发薪日数据 模型似乎很简单。我们读过彼得·阿罗诺和保罗·罗森鲍姆关于无影响和干扰的尖锐零模型的论文,所以我们不认为我们完全没有根据地想象,如果我们回避对平均治疗效果的估计,专注于测试假设,我们就可以了解一些我们称之为“干扰模型”的东西。但是,我们以前没有见过这样做。因此,部分原因是我们担心我们是否正确地写下并测试从单位间溢出或干扰模型中产生的假设是多么简单,我们写了“干扰推理”论文,看看我们对 Panagopoulos 的八个城市所做的工作是否具有可扩展性,以及它是否会像基于随机化的测试那样表现。这篇论文证明我们是正确的。

R. Michael Alvarez:在您的论文中,您重点讨论了当代因果模型文献中广泛讨论的“无干扰”假设。这个假设是什么?为什么它很重要?


第二个项目涉及使用嵌入在线调查的 Google 地图来获取手绘地图,这些地图代表人们在被要求划定“当地社区”边界时的反应。到目前为止,我们从对加拿大人的大规模调查中获得了 7000 多张这样的地图,我们计划在明年将这个模块的数据用于英国选举研究和美国合作国会选举研究。我们正在使用这些地图和相关数据来补充“环境/邻里效应”文献,以了解个人对地点的心理理解与人口普查测量以及个人对群体间关系和公共物品供应的态度之间的关系。

标题图片来源:抽象城市和统计数据。CC0 via Pixabay。

杰克·鲍尔斯是伊利诺伊大学香槟分校政治学和统计学副教授。他在
Post Reply