Le monde du data-journalisme peut être intimidant pour beaucoup. Pourtant, tout le monde peut proposer et produire un article de data-journalisme, à condition d'être capable de saisir les bons concepts.
Pour ceux qui débutent dans ce domaine, et même pour les journalistes expérimentés qui souhaitent commencer à faire des reportages qui s’appuient sur des données, ces six outils peuvent vous aider à mieux réaliser vos articles et à améliorer vos pitchs aux responsables éditoriaux :
Savoir coder est indispensable
Connaître un langage de programmation est crucial. Même les connaissances les plus élémentaires en matière de code peuvent avoir un impact sur votre travail. Vous pourrez ainsi vous affranchir des simples feuilles de calcul, qui, bien que couramment utilisées dans le data-journalisme, ne sont pas les plus conseillées pour une analyse approfondie, car elles ne permettent pas de traiter autant d'informations.
Le code vous permettra de manipuler vos données plus facilement. Il est rare qu'un jeu de données soit complètement propre ou qu'il corresponde exactement à vos besoins. La possibilité de nettoyer et de passer rapidement au peigne fin les fichiers les plus petits peut résoudre certains des plus gros casse-têtes.
Apprendre à coder peut également vous ouvrir des portes comme le web scraping et l’apprentissage automatique ou machine learning, deux compétences qui peuvent donner une nouvelle dimension à votre travail. Bien que ces techniques ne soient pas simples, il est possible de les apprendre.
Tous les langages de programmation ne sont pas aussi accessibles. Python est le langage le plus facile et le plus souple à apprendre. Ce langage est gratuit et peut être appris beaucoup plus rapidement que R ou C++. Un autre avantage de Python est qu'il est plus facile de trouver des réponses en ligne aux codes d'erreur lorsqu'ils surviennent, et qu'il offre davantage d'aide gratuite par le biais de forums en ligne facilement consultables.
Savoir comment vos données seront illustrées est important, même si vous ne pensez pas vous en servir plus tard
Les responsables éditoriaux ont besoin de voir à quoi ressemblent vos données. Même si vous ne prévoyez pas d'utiliser des visualisations dans votre article, le fait de pouvoir représenter visuellement les informations que vous utiliserez ne fera que renforcer votre pitch. Cela montre également au rédacteur en chef votre compréhension du sujet et des données sur lesquelles il s’appuie.
L'outil de visualisation le plus couramment employé est Datawrapper, une plateforme gratuite qui permet de transférer facilement des données. Il est facile à maîtriser et peut être utilisé pour tout créer, des graphiques simples aux cartes plus complexes. Datawrapper utilise le langage HTML de base, mais fournit des guides sur la façon d'inscrire du code HTML dans son interface.
L'intégration de vos graphiques Datawrapper dans un logiciel Adobe peut également améliorer les visuels, mais rend certaines choses plus compliquées. Adobe propose des essais gratuits, qui peuvent être utilisés pour aider à déterminer si le paiement d'un abonnement en vaut la peine. Comme Adobe est plus difficile à apprendre que Datawrapper, il est préférable de l'utiliser comme un complément, à moins de l'utiliser pour un projet et non un pitch.
Les couleurs sont cruciales dans les visualisations, même en brouillon
Le cours d'art plastiques que vous avez suivi au lycée est extrêmement utile pour concevoir des visualisations de données.
Les couleurs sont un outil essentiel dans la visualisation de données, en raison du fonctionnement de notre cerveau. Nous comprenons les couleurs comme un autre élément d'information qui peut soit représenter efficacement des données, soit les déformer complètement. Tout, jusqu'à l'opacité de la couleur, peut affecter la compréhension des données qu'un lecteur visualise.
Les couleurs comme le gris, le blanc ou le noir doivent toujours être utilisées avec modération ou lorsqu'on essaie d'attirer l'attention du lecteur sur un point de données spécifique. Il est facile de comprendre comment utiliser les couleurs, et c'est extrêmement important.
Il existe plusieurs codes permettant de produire des couleurs, tels que Hex, RGB et HTML. Ils sont utilisés pour indiquer à l'ordinateur exactement laquelle des millions de couleurs et de teintes choisir afin de les utiliser avec HTML. Il n'est pas nécessaire de mémoriser les codes à six chiffres pour chaque couleur, mais il faut savoir qu'ils existent, surtout si vous essayez de reproduire une couleur exacte ou de faire correspondre des couleurs dans différentes visualisations de données.
Pour obtenir un code de couleur, il existe plusieurs outils en ligne. HTML Color Codes.com est un générateur de codes de couleur utile car gratuit, mais il en existe beaucoup d'autres. Se sentir à l'aise avec quelques schémas et avoir quelques préréglages que vous appréciez sera utile à long terme.
Votre approche d’un sujet est essentielle
Lorsque vous proposez un article, pensez au produit fini avant les données. Contrairement à un sujet classique, le data-reportage repose davantage sur vos capacités à travailler avec les données disponibles que sur la quantité d'informations que contient un ensemble.
Bien qu'il existe des milliers de bases de données à votre disposition, vous devez savoir comment vous comptez utiliser un jeu de données avant de l'utiliser. Cela vous aidera à évaluer vos capacités et éviter de vous retrouver face à un ensemble de données brillant avec lequel vous voulez faire des choses étonnantes, mais qui est trop fastidieux ou difficile à décortiquer.
Pour ce faire, définissez une hypothèse que vous comptez tester et les moyens que vous utiliserez pour y parvenir. Créez un storyboard qui décrit la manière dont vous voulez tester cette théorie et définit les données disponibles. Ensuite, trouvez vos données et commencez vos entretiens.
Un outil comme Trello vous aidera. Il est gratuit pour un usage individuel, mais pas pour des équipes.
Faire des demandes de données peut être votre meilleure chance ou bien votre plus grand risque
Demander des données à une entité ou une organisation gouvernementale peut être un excellent moyen d'obtenir des informations, mais cela s'accompagne des tracas supplémentaires que l'on retrouve dans toute demande de document classique. Cela est particulièrement vrai pour les ensembles de données qui sont inutilement désordonnés.
Il est important de savoir que même si vous demandez des données très spécifiques dans un format spécifique, il se peut qu’elles ne soient pas complètement utilisables. Passer ce temps à demander les données, puis attendre de les recevoir peut s'avérer coûteux, surtout si vous travaillez en freelance.
Au lieu de demander des données, il peut être plus intéressant de trouver des données ouvertes en ligne. Pour les États-Unis, la plupart des États ont un site web de données ouvertes qui contient presque tout ce dont vous avez besoin sans devoir passer par une demande de FOIA.
Avoir une bibliothèque de données est important, même si vous ne pensez pas faire davantage de data-journalisme
Pour les journalistes qui ne sont pas des experts des données, avoir des jeux de données en main et prêts à l'emploi est essentiel. Tous les data-journalistes en conservent, et avoir votre propre bibliothèque personnelle est nécessaire.
La création d'un compte gratuit Github qui servira de bibliothèque pour vos données peut être utile en tant que référence. Cela peut également vous permettre d'étoffer votre portfolio et de créer un site web distinct sur lequel les employeurs potentiels pourront voir ce que vous avez fait.
Photo de Markus Spiske sur Unsplash.