Cómo aprovechar tus datos al máximo

porAlex Ludka
Jul 10, 2015 en Periodismo de datos

Muchos periodistas cuentan con un verdadero tesoro de datos públicos disponibles para utilizar en sus reportajes. Pero aunque tengan la libertad para usarlos, no siempre les será fácil encontrarlos. Y una vez que al fin pudieron localizarlos, suele ser difícil descifrarlos.

Jeff South, profesor asociado y director de estudios de pregrado de la Escuela de Comunicación Masiva de la Universidad de la Commonwealth de Virginia, habló con 16 periodistas latinoamericanos que se encuentran en Estados Unidos como parte del programa de ICFJ "Digital Path to Entrepreneurship and Innovation for Latin America" ("Un camino digital hacia el emprendedurismo y la innovación en Latinoamérica") acerca de cuál es la mejor forma de encontrar, comprender y visualizar datos.

Usando un gráfico creado por Paul Bradshaw, de OnlineJournalismBlog.com, South describió los pasos necesarios para comunicar eficazmente a través del periodismo de datos.

Compila

“El primer paso, por supuesto, es encontrar lo datos”, dijo South. “Tal vez los encuentres online, tal vez en un PDF del que necesitas extraerlos. Dondequiera que estén, necesitas compilarlos”.

Más allá de las técnicas usuales para encontrar información como, por ejemplo, el uso de redes sociales o motores de búsqueda, South enfatizó la importancia de buscar en la Internet profunda.

“Mucha información online no está en la web abierta. Está en bases de datos gubernamentales que, en el caso de Estados Unidos, no vas a encontrar a menos que sepas a dónde ir”, dijo. “Muchos datos de gobierno están abiertos, pero a menos que sepas dónde mirar no vas a dar con ellos”.

South compartió con el grupo algunas bases de datos útiles de Estados Unidos que los participantes del programa pueden usar en sus trabajos periodísticos, como la del Registro Federal, la de la Comisión de Seguridad e Intercambios y la de la Comisión Electoral Federal.

Limpia

“Muchas veces los datos están muy sucios, lo que significa que los nombres no son consistentes”, señaló South. “Si mi nombre estuviese en una base de datos, podría aparecer como ‘South, Jeff’, 'South, Jeffrey', o también ‘South, J.C.’. Los datos pueden estar muy sucios y hay que limpiarlos antes de poder utilizarlos".

Para esta tarea de limpieza, sugirió usar herramientas gratuitas online como TextWrangler u OpenRefine.

Contextualiza

Luego de haber compilado y limpiado tus datos, necesitas comprenderlos. Esto significa hacerte preguntas como: ¿quién reunió los datos? ¿Cuándo? ¿Qué metodología utilizó?

Una vez que entiendas los datos podrás usarlos con precisión para tu reportaje.

Combina

A menudo los periodistas utilizan más de un set de datos para obtener información para sus reportajes. South usó el ejemplo de reunir una lista con los conductores de ómnibus de la ciudad con otra de todas las personas que han sido procesadas por conducir ebrias. Al combinar ambas listas podrías encontrar que un alto porcentaje de conductores de ómnibus han sido condenados previamente por conducir ebrios, lo que sería un buen reportaje.

De cualquier modo, South también advirtió que mantener los datos en su contexto es muy importante durante este paso. “La correlación no es igual a una relación de causalidad”, dijo. Es preciso ser consciente de eventuales factores externos que podrían influir en los datos.

Además de los cuatro pasos señalados en el gráfico de Bradshaw, South incluyó un quinto: la visualización.

“La visualización de datos puede ser muy importante para comunicarle al público lo que estamos haciendo”, dijo.

Por eso aconsejó utilizar herramientas como Timeline JS para hacer líneas de tiempo, Infogram para infografías y Chartbuilder para cuadros. Con ellas podrás crear visualizaciones que te ayudarán a contar tu historia.

Este post fue publicado originalmente en el sitio del Centro Internacional para Periodistas y es reproducido en IJNet con permiso.

Imagen con licencia Creative Commons en Flickr, vía Intel Free Press. Imagen secundaria por Paul Bradshaw de OnlineJournalismBlog.com.