基础数据审计:杜尚式数据大放异彩的地方

Dive into business data optimization and best practices.
Post Reply
jrineakter
Posts: 825
Joined: Thu Jan 02, 2025 7:15 am

基础数据审计:杜尚式数据大放异彩的地方

Post by jrineakter »

EURITO 项目提供了一个令人兴奋的机会,可以考虑分析大量数据源,以便更好地了解和监测欧洲的 R&I 格局。这种广泛性是 EDAF 基本数据审计步骤结构的根本,它允许框架用户轻松快速地捕获可能感兴趣的数据源,仅记录概念框架维度(即组、维度、构造、数据源)、简短描述和 URL。

为什么要以如此简约的方式留出空间来捕获数据源,而故意将对数据访问、覆盖范围和其他重要因素的更严格的审计留到第 4 步?简而言之,我们认为这种方法反映了我们处理 R&I 证据的不断发展的范式。这一点值得注意,因为不久前,如果有人提出数据源(而不是假设)可以作为实证研究的起点,他或她很可能会因为抽样偏差和错误发现而受到强烈反对。然而,数据可用性和计算能力的显著进步为探索性分析、数据挖掘和数据驱动的假设生成开辟了新的、有希望的途径(Salganik,2018 年和 Carmichael,I. & Marron,JS,2018 年)。虽然从假设或数据源开始的严格二分法可能过于鲜明,但承认这场争论及其对 EURITO 项目的影响仍然是一种有益的框架。

普林斯顿大学的马修·萨尔加尼克 (Matthew Salganik) 提供了一种简单而优雅的方式来思考这种不断扩大的证据范围。萨尔加尼克博士在他 2017 年出版的优秀著作《点点滴滴:数字时代的社会研究》中,使用了“现成”和“定制”这两个术语来描述这种转变范式。“现成”描述了马塞尔·杜尚的作品,他因将普通物品重新用于艺术而闻名。因此,“现成”数据源将包括社交媒体或管理数据等,这些数据最初收集/制作时并没有明确用于研究或政策。值得注意的是,这一类别还包括专利和同行评审出版物的数据库。另一方面,米开朗基罗花了数年时间用大理石等原材料创作了宏伟的“定制”雕塑。从这个角度来看,“定制”数据包括通过社区创新调查等收集的数据——这是一种精心设计的工具,其开发和部署的明确目的是收集可用于研究和政策的数据。

EDAF 的基本审计阶段明确为 R&I 领域中的杜尚 GCash 数据 数据留出了空间,因为米开朗基罗式的 R&I 数据已在过去的项目中得到了广泛的盘点(例如,参见在使用数据挖掘制定、监测和评估 R&I 政策的项目中开发的清单)。

试点思路:耐心等待证据
EDAF 的第三步为“试点”想法提供了一个软着陆点。在这种情况下,最简单的思考试点的方式是将其视为一个过程,通过该过程我们围绕将新数据和分析应用于 R&I 政策问题开发概念验证。换句话说,试点让我们能够探索使用新数据(或新数据组合)或分析是否可行、合适,并且可能具有稳健性和可扩展性,同时留出空间来放弃那些最终不太可能在长期内产生价值的想法。EDAF 中目前捕获的试点想法是在项目构思期间以及通过与政策利益相关者的接触确定的。我们正在探索的第三条(实验性)途径是通过我们的wiki 调查对现有想法进行排名并收集新想法——请花点时间尝试一下!

至关重要的是,EDAF 的这一步将基础数据审计(捕获有趣且可能具有洞察力的数据源,而不太关注它们是否可以解决与政策相关的问题)与高级数据审计(在特定的 R&I 政策问题的背景下深入探究数据的细微差别)联系起来。

高级数据审计:试点想法的建立或破灭之处
高级数据审计是 EDAF 的一个阶段,在此阶段,试点想法与数据源相遇,从而引发对数据结构、覆盖范围、细微差别和潜在局限性的深入探索。表 1 概述了我们期望捕获的数据的特征,并预期这些类别可能会随着我们开始高级审计过程而发生变化。

表 1:高级数据审计的类别和描述
请注意,在撰写本文时,尚未进行高级数据审核,因为我们尚未决定将进一步开发哪些试点想法。

更大的图景:超越审计
EURITO 项目最令人兴奋的方面之一是它提供了必要的时间和空间来探索 R&I 政策问题和数据源中的各种可能性。EDAF 将用于使我们从分散的探索状态转向集中于特定的试点想法。

如上所述,审计过程(广义上概念化)涉及循证政策和学术界的几场当代辩论,例如调查是否可以/应该从数据源或理论假设开始,以及处理“现成”数据(即最初不用于研究或统计的数据)的机会和挑战。我们认为,EDAF 提供了一个起点,可以从中开始解决其中一些问题,但它只是一个更大的难题中的一块碎片。许多其他因素最终将影响选择和开发哪些数据和试点想法,以及哪些试点将在项目过程中继续扩展为完整的 RITO 指标。

如果您有兴趣参与定义 EURITO 的未来,请不要忘记完成我们的维基调查!

致谢和脚注
EDAF 由 EURITO 联盟成员共同开发,其中许多人也对这篇博文提供了有益的反馈。如果您有兴趣了解有关 EURITO 项目的更多信息,请参阅以下信息或阅读有关该项目的第一篇博文。

请注意,自原始 EDAF 开发以来的进步导致这里使用的术语/结构和项目文档略有不同。
Post Reply