“Las cinco preguntas del periodismo de datos” (“The five Ws of data journalism”) fue tomado del material de Introducción al Periodismo de Datos, un curso online masivo y abierto que se realizó a principios de este año. Puedes leer más sobre el curso aquí.
¿Quién?
¿De dónde vienen los datos? Esta podría ser la pregunta más importante. Porque los datos, como cualquier tipo de información, pueden ser equivocados y mientras menos confiable sea la fuente, más chances hay de que no sean correctos. La transparencia en este sentido también es importante: si tu lector puede ver de dónde provienen los datos, más probabilidades hay de que te crea. Pero si no te cree, entonces lo que estás haciendo no vale nada.
Esto es importante porque buena parte del periodismo de datos tiene sus raíces en datos que son públicos o a los que se accedió gracias a la legislación sobre libertad de acceso a la información que existe en buena parte del mundo, que le ha permitido a los periodistas crear reportajes a partir de datos que de otra forma estarían ocultos por el gobierno.
Pero tener un portal de datos abiertos no te convierte automáticamente en un paraíso de la libertad: incluso Bahrein y Arabia Saudita tienen hoy portales de datos abiertos. Y es aquí donde los periodistas de datos entran en escena: al exponer e interrogar a los datos podemos no solo enterarnos de qué tan precisos son, sino también combinarlos con otros conjuntos de datos para producir resultados que aporten algo novedoso al mundo de las noticias.
Tradicionalmente, los periodistas han tratado a los datos con una confianza ciega que nunca le concederían a una fuente humana. Se cree en los números porque investigarlos genera miedo. El experiodista de la BBC Michael Blastland examinó el brote de norovirus de 2008 –el microbio de invierno que causaba infección estomacal– y mostró lo inmensamente fácil que es obtener números equivocados. En aquel momento un artículo decía que tres millones de personas habían contraído esta enfermedad el año anterior.
Blastland se fijó en los intervalos de confianza –la manera para saber qué tan confiables eran esos números– y se dio cuenta de que el virus podía alcanzar sin problemas a 280.000 infectados. Pero también a 34 millones. ¿La verdad? Nadie la sabía, pero al artículo se escribió de todas maneras.
¿Qué?
¿Qué estás intentando decir? ¿A qué puntos estás tratando de llegar? No eres un académico presentando pacientemente toda clase de argumentos. El mejor periodismo de datos cuenta una historia de una manera clara que puede entenderse fácilmente, lo que no suele darse en todos los informes académicos sobre cualquier tema. Los informes estadísticos no están dirigidos al público en general, pero tu trabajo sí lo está. Tu deber es editar esa información en bruto y hacerla comprensible.
Aquí va un ejemplo: el Art Market for Dummies ganó el Data Journalism Awards de 2013 ("Premio de Periodismo de Datos de 2013"). Este proyecto extrajo datos de varias fuentes y los hilvanó en un trabajo visual que cuenta una historia. El proyecto utilizó datos que ya estaban disponibles en el mercado del arte, tomados de una base de información llamada Artprice. Además, convirtió archivos PDF a Excel. El autor también convocó a expertos para que lo ayudaran a traducir la jerga del mundo artístico y sus obras. Tuvo que usar herramientas como Outwit, un complemento de Firefox para convertir archivos PDF a Excel; Open Refine para limpiar y combinar conjuntos de datos, y el conversor de divisas de Google para uniformar los valores monetarios. D3.js y Hichcharts fueron las plataformas utilizadas para visualizar los datos.
Fue el papel del autor en la traducción de esos datos para que todo el mundo los comprendiera lo que lo convirtió en el ganador del Data Journalism Award. Tu trabajo, pues, consiste en cerrar esa brecha entre los datos y el usuario, lo que significa responder a la pregunta de qué quieren decir esas cifras.
¿Cuándo?
¿Qué tan viejos son tus datos? Al momento en que hayas obtenido un conjunto de datos oficiales, lo más probable es que estos tengan al menos un año de antigüedad, que es todo una era en tiempos en que las noticias se suceden rápidamente y las reacciones son instantáneas. Es en parte por esa razón que los periodistas de datos están cada vez más interesados en métodos de recolección más actualizados, por ejemplo:
Datos casi en tiempo real recogidos de fuentes oficiales, como este mapa de homicidios de Chicago, basado en los informes inmediatos más recientes de criminalidad de la ciudad. Recolectados de un mapa constantemente actualizado (que también permite al usuario descargar los datos), esta información proporciona una fuente incesante de noticias para los periodistas, como esta historia escrita tras un período inusualmente alto de asesinatos en una zona de la ciudad.
Datos de redes sociales recogidos en tiempo real desde distintos servicios de redes sociales pueden proporcionar un monitoreo instantáneo de noticias de última hora, de fuentes para periodistas y hasta un análisis de las reacciones causadas por un evento determinado. El sitio de noticias de negocios Quartz siguió los tweets publicados por @J_tsar, la cuenta vinculada a Dzhokhar Tsarnaev, uno de los acusados de plantar una bomba en la maratón de Boston, y elaboró sus patrones de sueño basándose en el calendario de sus tweets.
Periodismo de sensores: una tecnología nueva y barata puede generar datos inmediatamente para su análisis y cobertura. El equipo de datos de WNYC llevó adelante un proyecto que monitoreaba la llegada de los grillos a la costa este de Estados Unidos, y alentó a sus lectores a que lo ayudaran mediante la construcción de sus propios sensores baratos. Esto es en realidad un nuevo tipo de periodismo de datos: el periodismo de sensores. El equipo de Jonh Keefe ha sido pionero en este camino al mostrar de qué manera cualquiera puede llevar adelante un proyecto de estas características. Puedes leer más al respecto aquí.
Periodismo colaborativo ("crowdsourcing"): a raíz de un acontecimiento importante, el poder de los lectores puede ser aprovechado para producir datos reales e inmediatos que luego pueden utilizarse en la cobertura de una noticia. Necesitas lectores activos que se preocupen y quieran estar involucrados en el reportaje. Los datos en bruto que recojan pueden servir para producir historias. Esto no es algo caro de implementar. Aquí te mostramos de qué manera puedes hacerlo en pocos pasos y a través de herramientas simples y gratuitas:
- Incrusta un formulario de Google en una página para recopilar las respuestas de los lectores.
- Que los periodistas hagan una edición de los datos para compensar la información repetitiva u ofensiva.
- Importa los datos a Google Fusion Tables.
- Haz que el mapa o el sitio que funciona en base a los datos se actualice cada vez que exista información nueva.
También hay un montón de peligros, particularmente en las respuestas que son autoseleccionadas, pero echa un vistazo al trabajo de Zooniverse, que se especializa en el periodismo colaborativo basado en una comunidad pequeña pero activa.
¿Dónde?
La geolocalización de datos es un tema de vital importancia. Una parte clave del periodismo de datos implica la capacidad de combinar diferentes bases de datos para así poder crear nuevos tipos de reportajes. Este mapa sobre tasas de homicidio por armas de fuego y posesión de armas solo fue posible debido a que se establecieron parámetros idénticos a nivel de países para este caso. Mientras más locales sean los parámetros geográficos con los que se obtienen los datos, más difícil se hace la posibilidad de crear mapas con información de nivel local que puedan combinarse. Esta es la maldición de los datos públicos abiertos producidos en diferentes niveles del gobierno. Conocer la naturaleza de la geografía es sumamente importante, pero también te permitirá crear nuevos tipos de reportajes.
¿Por qué?
Esta es la pregunta más difícil que un periodista de datos debe responder. Este periodismo puede ser muy bueno para mostrar qué es lo que está pasando, pero puede no serlo para correlacionar esos datos con un análisis de causa y efecto. Es decir, solo porque un país tenga una alta tasa de propiedad de armas de fuego y de homicidios por arma de fuego, no significa que lo primero ocasione lo segundo, por más obvio que parezca. El periodismo de datos debe contener a menudo las preguntas periodísticas más simples:
- ¿Qué tan grande es algo?
- ¿Ha crecido o ha disminuido?
- ¿Cómo lo comparas con otras cosas o con otro lugar?
En ocasiones, el periodismo de datos produce reportajes enormes que utilizan el análisis estadístico sofisticado para poder crear grandes historias. Pero en esos casos se emplean técnicas muy avanzadas y raras. A menudo, estas historias se hacen en colaboración con expertos, lo que supone otra gran diferencia con el periodismo tradicional basado en documentos fuente estándar.
La pirámide invertida
Paul Bradshaw ha desarrollado una pirámide invertida del periodismo de datos (cursos de periodismo de todo el mundo hablan acerca de la pirámide invertida del periodismo) que explica claramente cómo funciona el proceso. Puedes leer más sobre esta pirámide aquí.
Fundamentalmente, Bradshaw escribe que:
El periodismo de datos comienza en una de estas dos maneras: o bien tienes una pregunta que necesita datos, o bien tienes un conjunto de datos que necesitan ser interrogados. Sea lo que sea, la compilación de los datos es lo que define a un acto de este tipo de periodismo.
Este punto es crucial. Hay algo en lo que estás haciendo que se diferencia de lo que sería simplemente publicar los datos: la idea editorial detrás de ese proceso, la idea de que aquí hay una historia que contar.
Me encantaría saber qué le falta esta lista. ¿Qué añadirías tú?
Este post fue publicado originalmente en el blog de Simon Rogers y es reproducido por IJNet con permiso.
Imagen principal con licencia Creative Commons en Flickr, vía Ian. Imagen secundaria cortesía de Paul Bradshaw.