Planeando un reportaje basado en datos, desde el inicio hasta el final

porAntoine Laurent
May 29, 2014 en Periodismo de datos

Este post resume las notas del primer taller de la Escuela de Periodismo de Datos, organizado por el Centro Europeo de Periodismo, la Open Knowledge Foundation y el Festival Internacional de Periodismo. La sesión fue dirigida por Steve Doig, asesor Knight especializado en periodismo asistido por ordenadores, es decir, en el uso de computadoras y técnicas de las ciencias sociales para ayudar a los periodistas a hacer un mejor trabajo.

Puedes descargar la presentación de Steve aquí.

¿Por qué el periodismo de datos?

Steve Doig cree que el periodismo de datos permite a los periodistas ir más allá de las anécdotas y basar sus reportajes en hechos y evidencias. Al utilizar datos para los reportajes, es posible buscar los mejores puntos de análisis, aquellos que sean los más ilustrativos de una historia en particular.

Entonces, ¿cómo pueden los periodistas encontrar ideas para un reportaje basado en datos? En primer lugar, trata de fijarte en aquellos temas que ya cubres, ya sea deportes, elecciones, desastres, investigación de delitos, flujos de dinero, etc. Casi todos los temas que los periodistas frecuentemente cubren producen datos que pueden ser analizados. Otros mecanismos por los que puedes obtener ideas para historias de periodismo de datos incluyen:

  • Mirar qué es lo que otros periodistas están haciendo. Si algo está sucediendo en otra ciudad, existen chances de que eso también ocurra en la tuya.
  • Observar algunos proyectos que figuran en DataDrivenJournalism.net.
  • Revisar la fuente web de IRE's Extra Extra.
  • Tener en cuenta el Datablog de The Guardian.
  • Leer los documentos producidos por agencias gubernamentales y académicos que coleccionan largos compendios de datos. Poner atención a los pies de página y a las bibliografías, ya que estas referencias nos pueden llevar a obtener datos interesantes.

¿Cómo conviertes una idea en un reportaje?

Plantea tu idea al revés:

Piensa en las afirmaciones que quieres comunicar

Comienza con una hipótesis como “el crimen está empeorando en mi área”. Para esta hipótesis debes realizar algunas afirmaciones como: el crimen se ha incrementado por “x” por ciento, el número de crímenes por cada 1000 personas es “w”, y en las ciudades “z” y ”k” el crimen es el peor de nuestra área, etc.

Piensa qué variables necesitarás para realizar esas afirmaciones

Piensa en función de una tabla de información (las columnas serían las variables y las filas se compondrían de datos individuales).

Hay dos tipos diferentes de variables:

  • Categóricas: son variables con etiquetas, como el género, el tipo de crimen y el código postal.
  • Numéricas: son contables, como el número de delitos, de accidentes, de arrestos, etc.

Un ejemplo de estas variables aplicadas conjuntamente sería: tipo de delito, población del lugar en que el crimen está ocurriendo, fecha del crimen, hora, ubicación, número de víctimas y si existió o no un arresto.

Piensa en quién tiene los datos

Una vez que conocemos las variables comprueba quién puede tener esos datos. Las agencias y organizaciones de gobierno y corporaciones suelen poseer una gran cantidad de información, por lo que la mayoría de las veces no tendremos que obtener los datos por nuestros propios medios.

Toma los datos de allí

Ahora nos enfrentamos al problema de obtener los datos. En los Estados Unidos hay leyes relativamente firmes sobre los archivos públicos. En Europa también la mayoría de los países tienen leyes de libertad de información o existe una forma oficial para solicitar datos a las agencias públicas.

No te dejes intimidar por los diferentes formatos. Ten en cuenta de qué forma vas a querer trabajar con los datos, por ejemplo, utilizando Excel. Para eso no es necesario obtener los datos en archivos xls, ya que puedes usar algunos programas para trasladar la información de un formato a otro. ¡Encuentra a un experto en datos que pueda ayudarte! Puedes encontrar buenos expertos en formularios o listas de email, por ejemplo:

Un formato que se debe tratar de evitar es el PDF, debido a que no se importa bien a otros formatos. Si únicamente pudiste obtener un archivo PDF, hay algunas herramientas como Tabula que te permiten exportar los datos de ese archivo a otros formatos.

Limpia los datos

Trabajar con datos a veces es complicado. Un ejemplo clásico es la información del financiamiento de una campaña completada por voluntarios, en la que los nombres de las ciudades siempre están mal escritos. En este caso necesitas encontrar todas las ciudades que están mal redactadas y corregirlas, para que luego puedas informar, por ejemplo, cuánto se recolectó en una población específica. La gente que recoge los datos lo hace a menudo con fines burocráticos y a veces no le importa qué tan limpia pueda estar la información. Pero las personas que usan los datos para su análisis requieren más precisión y por lo tanto necesitan limpiarlos. Algunas herramientas para facilitar esta tarea son:

  • Open refine.
  • Notepad ++ u otros editores de texto (con funciones de “búsqueda” y “cambiar por”).
  • Hojas de cálculo.

Una vez que tienes los datos limpios, ¿qué haces con ellos?

¡Busca tendencias y patrones comunes! Valores más altos, más bajos, máximos, mínimos, promedios, etc. Piensa profundamente en la forma que adquieren esos datos y busca valores atípicos, cualquier cosa que se vea extraña y se destaque. Ten en cuenta que muchos temas de reportajes fueron descubiertos al hacer cosas sencillas como ordenar datos. Existen algunas herramientas que pueden ayudarte para esto:

  • Usa las funciones simples de las hojas de cálculo, tales como ordenadores, filtros, funciones matemáticas y tablas dinámicas.
  • Otra herramienta es tu cerebro: matemáticas y estadísticas, algo que es muy parecido a 1+1 = 2. Un recurso para las matemáticas es: http://t.co/CaZg5qS0jM

Por último, es importante recordar que en el periodismo de datos los reportajes se realizan de mejor forma en equipo. Hay muchos roles para cubrir: reporteros, editores, diseñadores gráficos, fotógrafos, camarógrafos, diseñadores de página, diseñadores web, desarrolladores de aplicaciones, etc.

Antoine Laurent es experto en estrategia y gerente de proyectos del Centro Europeo de Periodismo. Anteriormente fue subdirector de la Global Editors Network y fundador y director de los Data Journalism Awards, del Editor's Lab Hackdays y de otros emprendimientos de medios.

_Este post fue publicado originalmente en DataDrivenJournalism.net y es reproducido en IJNet con permiso, bajo licencia Creative Commons. Esta iniciativa para el periodismo de datos fue creada por el Centro Europeo de Periodismo buscando enseñar a periodistas de todo el mundo a usar los datos para mejorar la calidad de sus reportajes._

Texto traducido del inglés al español por Andrea Arzaba.

Imagen con licencia Creative Commons, vía Intel Free Press en Flickr.