如何查找和使用数据来报道冲突事件

作者Sherry Ricchiardi
Jun 2, 2021 发表在 数据新闻
Data

在《纽约时报》(New York Times)对叙利亚政府酷刑室网络的调查中,记者安妮·巴纳德(Anne Barnar)指出数据在计算人员伤亡人数方面发挥的重要作用。

前纽约时报贝鲁特分社巴纳德写道:“我们加倍努力报道这个故事,因为人权组织稳步汇编了有关数十个酷刑设施、数万名叙利亚人失踪以及在虚假审判后处决平民反对派分子的数据报道武装冲突的首席和资深人士。”

她的新闻报道指出:“根据叙利亚人权网络的说法,近 128,000 人从未再次出现过,据推测要么已经死亡,要么仍在拘留中,这是一个保持最严格统计的独立监测组织。近 14,000 人‘被酷刑杀害’。”

有关冲突事件的统计数据随处可见,但记者如何确定要使用的正确数据库?他们如何评估众多数据源?他们应该在数据中寻找什么?

“数量大的数据不一定就是更好的数据。我们需要知道它来自哪里,包括什么,不包括什么。记者不应将所有数据都视为公正的事实,”冲突数据领域的主要参与者、奥斯陆和平研究所高级研究员安德烈亚斯·福罗·托勒夫森 (Andreas Foro Tollefsen) 说。

审查冲突事件数据集的主要生产者及其专业有助于缩小搜索范围。以下是媒体报道和学术研究中经常引用的三个数据收集项目示例。

普萨拉冲突数据计划 (UCDP):关于冲突和维和的数据集,包括和平协议、州内武装冲突、非国家冲突、单方面暴力和冲突终止。提供有关有组织的暴力和建立和平的数据集,可通过 UCDP 下载网站免费下载。还提供说明性图表、图形和地图。
武装冲突地点和事件数据集 (ACLD):被描述为一个分解的数据收集、分析和危机映射平台。收集有关全球各地报告的政治暴力和抗议事件的地点、日期、演员、死亡人数和类型的实时数据。用户可以通过交互式仪表板探索数据。
奥斯陆和平研究所(PRIO):探索冲突如何爆发和解决;调查不同类型的暴力如何影响人们并研究社会如何应对危机。他们的数据项目有助于研究暴力持续时间并跟踪年度战斗死亡人数。活跃的研究项目按字母顺序列出,包括数十个主题。

  • 普萨拉冲突数据计划(Uppsala Conflict Data Program,UCDP):关于冲突和维和的数据集,包括和平协议、州内武装冲突、非国家冲突、单方面暴力和冲突终止。提供有关有组织的暴力和建立和平的数据集,可通过 UCDP 下载网站免费下载。该网站还提供说明性图表、图形和地图。 
  • 武装冲突地点和事件数据集(Armed Conflict Location & Event Dataset,ACLED): 被描述为一个分解的数据收集、分析和危机映射平台。收集有关全球各地报告的政治暴力和抗议事件的地点、日期、演员、死亡人数和类型的实时数据。用户可以通过交互式仪表板探索数据。
  • 奥斯陆和平研究所(Peace Research Institute, Oslo,PRIO): 探索冲突如何爆发和解决;调查不同类型的暴力如何影响人们并研究社会如何应对危机。他们的数据项目有助于研究暴力持续时间并跟踪年度战斗死亡人数。活跃的研究项目按字母顺序列出,包括数十个主题。

[延伸阅读:如何避免普通数据可视化错误]

这些数据如何转化为现实世界中的新闻报道? 

数据可以显示某一趋势、可视化为地图和模式,以此来突出显示一个地区的暴力是增加还是减少,以及这与影响平民的移民或流离失所等条件有何关系。 例如,这一则基于 ACLED 数据的故事展示了莫桑比克北部的冲突如何使超过 50 万人流离失所。

救助儿童会的研究人员在他们最近的报告《冲突中针对儿童的性暴力》(Sexual violence against children in conflict)中结合了 PRIO 的数据和其他来源。 统计数据显示,与 30 年前的 850 万人相比,现在面临风险的儿童增加了近 10 倍。

《华盛顿邮报》(The Washington Post)使用 ACLED 数据来探索 COVID-19 对暴力冲突风险的影响。 他们跟踪了一段时间内冲突事件的数量,以了解在世界卫生组织( World Health Organization)于 2020 年 3 月宣布全球疫情爆发之后或在各国宣布封锁之后趋势是否发生了变化。

如歌衡量数据准确性、可靠性与公平性?以下是来自专家的建议

哈佛大学研究员凯利格林希尔(Kelly Greenhill)探索了冲突统计数据的滥用以及错误估计如何产生“适得其反的后果”。 例如,错误数据可能有助于延长战争或为政府提供不采取行动的借口。

记者如何做才能做到正确? 格林希尔建议记者随时保持以下疑问:

数字的来源是什么?
资料来源采用什么定义,究竟测量什么?
提供数字的人的利益是什么?
如果有问题的统计数据被接受或不被接受,这些参与者将获得或失去什么?
在获取数字时采用了哪些方法?
是否存在潜在的竞争数据,如果存在,对它们的来源、测量和方法了解多少?

  • 数字的来源是什么?
  • 资料来源采用什么定义,究竟测量什么?
  • 提供数字的人的利益是什么?
  • 如果有问题的统计数据被接受或不被接受,这些参与者将有何收益或损失? 
  • 在获取数据时采用了哪些方法?
  • 是否存在潜在的竞争数据,如果存在,对它们的来源、测量和方法了解多少?

[延伸阅读:健康报道:寻找数据并证实专家观点 ]

 

评估数据集中的异同是另一种评估方法。在一份报告中,ACLED 的研究和创新主管鲁达贝·基希(Roudabeh Kishi)比较了几个知名来源的冲突数据。在主要指标中,她指出

  •  数据来源:“广泛的回溯源头——包括来自当地合作伙伴和当地语言的媒体——提供了关于政治暴力和示威的最全面、最准确的信息,以及平民在家庭和社区中所经历的风险的最准确呈现。”
  • 透明度:“如果要依赖数据集进行定期分析,数据集必须可用,并且用户应该能够访问冲突数据如何编码和收集的每个细节。”
  • 覆盖范围和分类:“清晰、连贯和正确的分类对用户很重要,因为冲突不是同质的:障碍事件的频率、顺序和强度各不相同。”

“重要的是要记住,这些是具有不同方法论、定义的不同项目,通常基于特定的任务,”基希解释说。 “注意数据集使用的来源。这真的有很大的不同。”

其他资源:

  • ACLED 2021 年需要担心的十大冲突(ACLED’s Ten Conflicts to Worry About in 2021): ACLED 建议直接通过“导出工具”访问数据,并在“资源库”下查找有关方法论的信息,视频引导用户完成数据收集过程。
  • UCDP 的冲突百科全书(The UCDP’s Conflict Encyclopedia): 该组织自我描述为“有组织的暴力数据的主要提供者和最古老的内战数据收集项目,具有近 40 年的历史。” 该组织提供了一个基于网络的系统,包括关于有组织的暴力和建立和平的免费数据集
  • 国际特赦组织(Amnesty International): 以四种语言提供两门关于开源调查的免费课程,包括阿拉伯语、波斯语、英语和西班牙语。 课程作为在实践中使用开源研究方法的指南,重点是人权调查和宣传。

本文改编自最初发布在 DataJournalism.com 上。 IJNet 经许可重新编辑发布。

作者Sherry Ricchiardi博士 是 ICFJ 的灾难和危机报道指南的合著者和国际媒体培训师,曾与世界各地的记者合作处理冲突报道、创伤和安全问题。