这一周里全球数据新闻社群都在发布什么推文?GIJN的NodeXL #ddj把4月8号到14号的内容汇总,发现一份聚焦机器学习驱动的由@bxrobertz 制作的调查新闻电子杂志,一段@FT 制作的解释性视频,内容关于大企业是真的慷慨做慈善还是仅仅在避税,@knowtheory 以及@amandabeereviewing 七个光学确认工具,还有@workbenchdata 一份关于视觉化推特数据的辅导书。
AI-驱动的调查新闻
计算机记者Brandon Roberts制作了一份关于机器学习可以被用于调查新闻的有趣电子杂志。在第一期,他采访了尼阿波利斯明星论坛报的Chase Davis,介绍了一个新的网络抓取工具以及剖析机器学习驱动的调查可以如何被应用于地方房产税逃税之中。
Just checked out this awesome first edition of Artificial Informer, a web zine about machine learning and investigative journalism. Slick design and a great interview with @chasedavis https://t.co/AfvoFrBPvF
— Ben Hancock (@benghancock) April 10, 2019
慈善还是避税?
在今年的世界经济论坛上,经济史学家Rutger Bregman质疑了大公司以及其老板们是真的慷慨捐赠数十亿给慈善事业,还是仅仅为了避税。《金融时报》记者Federica Cocco和John Burn-Murdoch试图调查Bregman的这个问题并以图表、虚拟资金以及糖果来解释他们的发现。
An interesting (and accessible) description of just how much corporations are paying in tax versus what they are giving away philanthropically. An interesting add-on to what historian Rutger Bregman argued at Davos a few months ago. https://t.co/mgEFOW5jLX #philanthropy #davos
— Thoughtful Philanthropy (@laurenjanus) April 11, 2019
从PDF文件中总结数据
尝试从烦人的PDF文件中得到数据但是不确定应该用什么工具?Ted Han以及Amanda Hickman,来自Factful,分析了七个光学文字识别工具,所以你不必亲自做这些工作。这里是他们对于这些工具的评论和详尽比较。
Nice comparison of #OCR engines: https://t.co/c74qysNx8I #ddj
— Timo Grossenbacher (@grssnbchr) April 9, 2019
视觉化推特数据
想要在四步内分析和视觉化推特数据吗?Workbench准备了一份关于如何使用推特API下载推文并从账户中获取数据并将这个账号发布某个特定词汇的结果视觉化的指南。数据新闻Turkey翻译了这份指南的土耳其语版本。
Here's detailed explainer on how @sergiospagnuolo used Workbench to power a Twitter monitoring bot - https://t.co/D8M1NoUUJO …
— Workbench (@workbenchdata) April 4, 2019
Get started working with Twitter data in few minutes with this tutorial:https://t.co/rQQL6PreQT … ⚡️#ddj https://t.co/O6xNUXGc26
谷歌的数据分享
谷歌新闻计划正在以更多的培训、在线资源和工具帮助振兴数据新闻领域。即将登场的有:为美国和加拿大的新闻机构进行的免费数据培训,合作伙伴是调查记者和编辑,以及与专业记者协会合作的谷歌工具培训。同样,数据新闻慕课将会在这个秋天与每周奈特新闻中心合作推出。
SPJ and @GoogleNewsInit expect to train an estimated 4,000 journalists at major conferences, conventions and regional SPJ events, reaching an estimated 4,000 journalists by March 2020. @nickdigitalhttps://t.co/0v9X5BZYs8 pic.twitter.com/Eii1VqFUP5
— Society of Professional Journalists (@spj_tweets) April 10, 2019
Python服务于记者
Datajournalism.com发布了一个四节课的模块,内容关于致力于数据新闻的Python。听一听数据新闻培训者Winny de Jong教授你如何在你的电脑上设置Python,清理乱七八糟的数据库,分析数据并且进行网络抓取。最关键的,这个课程是免费的!
Python for Journalists - FREE video series! 4+ hours, videos, very clear. https://t.co/Trs6Lvzndt #python #journalism
— Mindy McAdams (@macloo) April 4, 2019
不平等的收入分配
“看起来越漂亮,收入不平等就越严重。” SRF数据关注了瑞士的收入差距问题并构建了一个互动式地图显示在所有社群的收入分配情况。最悬殊的是 Anières,日内瓦的一个城市。(德语)
Einkommensverteilung in der 🇨🇭
— Sandro Lüscher (@sandroluescher) April 11, 2019
▪️Einkommensstarke & ungleiche Gemeinden in Seegebieten
▪️Einkommensstarke & gleiche Gem. v.a. im Mittelland/Agglo
▪️Einkommensschwache & ungleiche Gem. in Tourismusregionen
▪️Einkommensschwache & gleiche Gem. auf dem Land.https://t.co/HJedKEgY7g
英国的性别收入鸿沟
BBC记者们深挖了英国企业报告的关于男女收入差距的数据。他们发现8,124家企业支付男性更高薪酬,而仅有1,424支付女性更高薪酬。
The numbers tell the real story. Lack of balance at senior levels across all industries is the key driver of the gender pay gap. That’s the action we need to focus on as businesses @BalanceInBizIE @30percentclubIE https://t.co/iecBEo66xm
— Gillian Harford (@gillian_harford) April 10, 2019
药房与医生的关系
在瑞士,药企向负责培训医生的医药公司投资数以百万计。Le Temps调查了关于大型药企和医疗社群之间的关系,发现相关讨论对于医生的独立性和公正性提出了质疑。这里是这个团队如何调查这个故事。(法语)
Excellente enquête sur ces financements qui jettent le doute sur l'impartialité de nos médecins: Les sociétés médicales infiltrées par les pharmas, par @sylvielogean et @MarieMaurissehttps://t.co/D8RxGDcl77 par @sylvielogean
— Koller Frédéric (@frederickoller) April 11, 2019
进球心理学
时间进行到一半时的进球会很显著地影响比赛的结果吗?《明镜周刊》分析了四大欧洲联盟超过45,000场比赛以得出结论。
In German football journalism a goal scored just before half time (min 45 and extra time) is referred to as 'psychologically important'. @PatrickStotz analysed the data and it turns out that such goals are actually very impactful. Source: https://t.co/tJ4dVdo9un pic.twitter.com/Tr4hoDo80v
— Simon Kuestenmacher (@simongerman600) April 14, 2019