Este artículo fue extraido de nuestro kit de herramientas sobre Periodismo de Datos y transparencia. Para ver ver otros recursos como este, haz clic aquí.
Es frecuente que se formule la pregunta “¿qué es en realidad en periodismo de datos?”, cuando en realidad y por definición los periodistas venimos usando datos desde el origen de la profesión. Corresponde en realidad llamarlo “periodismo de base de datos”, pero por uso y costumbre, predomina la denominación más corta.
Básicamente involucra:
- Grandes volúmenes de datos, que muchas veces ni siquiera podían alojarse en una hoja de cálculo.
- Visualización interactiva.
- Incorporación del programador al equipo periodístico para desarrollar tareas que van desde la extracción de datos la depuración de los sets de datos, hasta el diseño de aplicaciones de noticias (news apps).
¿Cuáles son los productos del periodismo de datos?
Hay al menos 6 productos diferentes, generalmente complementarios, que surgen de esta práctica
- Artículos basados en datos
- Visualizaciones Interactivas
- Conjuntos de datos abiertos o Datasets
- Aplicaciones de Noticias o News Apps
- Blogs de datos
- Canales de datos o secciones de datos en medios digitales.
Artículos basados en datos:
Generalmente son artículos cortos, construidos a partir de grandes volúmenes de datos como los que podrían estar contenidos en bases de datos o conjuntos de datos diseñados a partir de una o varias bases de datos.
Ejemplos:
83% de los mayores de 60 años en todo el país aún no fue vacunado
Quiénes fueron los donantes a la campaña del presidente Mauricio Macri
Quiénes fueron los donantes a la campaña de Alberto Fernández
Visualizaciones interactivas:
En general son un complemento de los artículos basados en datos, pero pueden ser contenidos en sí mismos sin necesidad de que exista un artículo referencial: en algunos casos es suficiente un título, una bajada o subtítulo y una explicación a la audiencia sobre cómo leer los datos desde la visualización. Puedes mirar este ejemplo.
[Lee más: Cómo buscar datos en la web profunda]
Conjunto de datos abiertos (Datasets o set de datos):
Generalmente trabajamos con grandes volúmenes de datos que podemos extraer, limpiar, procesar y finalmente analizar. Un set de datos es un conjunto de atributos cuantitativos y cualitativos que nos describe una situación, un hecho, un problema, una realidad, etc.
Los datos pueden gestionarse o administrarse desde plataformas sencillas y gratuitas como Google Drive. Aquí tienes un ejemplo de un set de datos.
Aplicaciones de noticias:
Conocidas en inglés como “News Apps”, son el fruto de la labor de periodistas y programadores informáticos. Muchas veces el volumen de datos es tan grande que resulta imposible encontrar una noticia si no se diseña una aplicación que nos permita agrupar y analizar variables, por ejemplo por localización geográfica, por fecha, por nombre de compañía, etc. Aquí puedes ver un ejemplo.
Blogs de datos:
Publican algunos o todos los elementos anteriores en formato Blog. Aquí tienes algunos ejemplos:
Canales de datos:
Equivalen a una sección dentro de un medio digital. Puedes ver estas secciones de Infobae o The Guardian.
Los canales de datos incluyen notas, catálogos, aplicaciones de noticias, etc.
[Lee más: Consejos y recursos esenciales para practicar el periodismo de datos]
Formatos abiertos:
El periodismo de datos o de base de datos trabaja con datos abiertos y por ende estos archivos se presentan en formatos igualmente abiertos.
El concepto datos abiertos es una filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control.
Los formatos más conocidos por los periodistas son PDF, Excel (o cualquier hoja de cálculo), Word, TXT, etc.
Un PDF es un formato cerrado, ya que se requiere de una aplicación con licencia para poder acceder al mismo.
En datos abiertos hay un formato que utilizan los gobiernos y organizaciones internacionales muy usado por ser liviano, reutilizable y fácil de estructurar: el CSV (del inglés comma-separated values): es un tipo de documento en formato abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por comas y las filas por saltos de línea. Aquí puedes ver un ejemplo de un archivo en formato CVS.
La solución para estructurar estos datos y darle formato estructurado en columnas pueden ser dos:
Solución 1:
Descargar el archivo en la computadora, luego subirlo a Google Drive y abrirlo como hoja de cálculo. Finalmente, marcar la primera columna, luego hacer clic en “Datos” y, finalmente, clic en “Dividir texto en columnas”.
Solución 2 (generalmente son archivos de descarga que se recopilan de la Web en sitios de open data y OpenGov):
Descargar el archivo como CSV a la computadora.
Abrir el archivo con cualquier aplicación de hoja de cálculo que disponga en su computadora (puede ser Excel u Open Office).
Marcar la primera columna y hacer Clic en “Datos”. Seleccionar "Texto en columnas", luego "Delimitados" y “Continuar”.
Luego, marcar tabulación y comas o puntos y comas.
Para finalizar, ajustar anchos de columnas y filas, y definir los encabezados.
Finalmente, en YouTube hay variedad de videos que enseñan paso a paso cómo convertir un CSV en una hoja de cálculo como Excel.
Aquí puedes ver un ejemplo con el paso a paso.
Imagen de Jonathan Quezada.