De las infecciones a la movilidad: claves para encontrar y analizar datos sobre el COVID-19

porRowan Philp
Jul 9, 2020 en Cobertura del coronavirus
People walking

El crimen organizado está cambiando sus rutas de tráfico bajo las sombras que le ofrece el COVID-19. Los contrabandistas de madera en la Amazonía están impulsando su comercio en ausencia de supervisión. Las tasas de desempleo y dependencia del alcohol están aumentando, y el cambio climático avanza sin cesar.

El mundo está transformándose en casi todos los niveles a la sombra de la pandemia de coronavirus, dice Giannina Segnini, directora del Programa de Periodismo de Datos de la Universidad de Columbia en los Estados Unidos.

Pero Segnini agrega que hay datos y herramientas disponibles para investigar y analizar estos cambios, y que los periodistas pueden rastrear muchos de ellos en tiempo real, incluidos los cambios de comportamiento.

Data ideas for the post-COVID-19 landscape
Ideas de datos para el panorama post-COVID-19. Imagen: Universidad de Columbia y CLIP.

 

“Tus nietos hablarán sobre la era anterior y posterior al COVID-19. Estamos presenciando una situación histórica", dijo en un seminario web el 18 de junio pasado, parte de la serie Investigating the Pandemic de la Red Global de Periodismo de Investigación (GIJN). “Esto recién comienza. Mucho de lo que está sucediendo a través de las fronteras no está siendo controlado. Pero hay datos para monitorear lo que está pasando, y nunca como antes los datos han sido una mejor herramienta para dar sentido al mundo que nos rodea”.

[Lee más: Claves para visualizar datos sobre el COVID-19]

 

Cofundadora del Centro Latinoamericano de Periodismo de Investigación (CLIP), Segnini y su colega especialista en datos Rigoberto Carvajal, compartieron ideas sobre cómo encontrar fuentes de datos para investigar este nuevo mundo.

 

Más allá de las amenazas directas a la salud que presenta el COVID-19, Segnini dijo que las redacciones podrían crear paneles de datos que muestren cambios en la vida cotidiana de sus comunidades.

"Utilizando la integración de datos automatizada y escalas estandarizadas, pueden crearse paneles que reflejen cambios en variables como, por ejemplo, multas de tránsito, arrestos, precios de alimentos y desalojos", dijo. “Todos estos cambios van a suceder en la sociedad más temprano que tarde. Y hay quienes se están aprovechando del hecho de que todos estamos distraídos por el nuevo coronavirus. La trata de personas y la corrupción no han frenado, pero están cambiando de rutas y métodos. Hay cambios en las cadenas de suministro y en los envíos y las aerolíneas debido a las restricciones por la pandemia".

 

Newsrooms could create their own dashboards
Aunque los números son ficticios en esta maqueta, Segnini dijo que las redacciones podrían crear sus propios tableros con datos de la "vida ordinaria" superpuestos en los datos del COVID-19 para mostrar los impactos más amplios. Imagen: Universidad de Columbia y CLIP.

 

Segnini se desempeñó como jefa de la unidad de investigaciones en el periódico La Nación de Costa Rica, y el trabajo de su equipo condujo al enjuiciamiento de más de 50 figuras públicas, incluidos tres ex presidentes.

En su cargo anterior en el Consorcio Internacional de Periodistas de Investigación, Carvajal fue uno de los expertos en datos en la investigación de los Panama Papers.

Carvajal dijo que los datos de los casos de COVID-19 proporcionados por los gobiernos van desde números brutos y cuadros básicos a datos agregados descargables —la forma más común—, y la mejor forma, pero la más rara: datos granulares, caso por caso. En América Latina, dijo, México, Colombia y Perú se han destacado por ofrecer los datos de casos más completos.

[Lee más: Cómo el periodismo de datos está cubriendo la pandemia en Latinoamérica]

 

"La mejor manera de obtener una rica visualización del conocimiento de los conjuntos de datos es extraer datos granulares, con registros individuales [anonimizados] para cada paciente [caso]", dijo Carvajal.

Agregó que es importante utilizar programas "ETC" (extraer, transformar, cargar) para importar automáticamente esos datos en paneles o visualizaciones debido a su gran volumen. Él utiliza la herramienta de código abierto Talend Open Studio para la integración de datos.

Sin embargo, dado que los datos del COVID-19 aún no son confiables en muchos países, Segnini dijo que minar los datos de exceso de mortalidad (el número de muertes por encima del promedio), continúa siendo una técnica poderosa para mostrar los impactos más amplios de la pandemia.

“Ya sea que tengas datos granulados o agregados, sabemos que no se cuentan todos los casos, porque muchos mueren en su hogar, porque no fueron testeados y la política solo cita a  las personas con resultado positivo, o porque los sistemas de información son inadecuados o imprecisos", detalló. “Muchos tienen miedo de ir a los hospitales, y podrían haber muerto por complicaciones. Existe una metodología que te permite calcular ese exceso de mortalidad. Debes tener datos sobre todas las muertes anteriores durante el mismo período de tiempo en años anteriores. Puedes representarlos con números absolutos o como porcentajes. Cuantos más años anteriores tengas, mejor será el cálculo”.

Dijo que la aparición de datos de movilidad, donde las señales personales de los teléfonos móviles se pueden anonimizar y agregar, representa una nueva y poderosa herramienta para describir los cambios veloces.

Herramientas recomendadas

  • Datos de movilidad: los Informes de Movilidad Local COVID-19 de Google muestran las tendencias de desplazamiento de la población en respuesta a las políticas del COVID-19. La Red de Datos de Movilidad COVID-19, por su parte, consiste en un grupo de epidemiólogos que utilizan datos anónimos de compañías de telefonía móvil y tecnología para rastrear el comportamiento.
  • Análisis de movilidad: Utilizando solicitudes de direcciones en Apple Maps, Apple crea informes de desplazamiento preservando la privacidad individual en sus Apple Mobility Trends Reports. Un catálogo que simplifica el análisis geoespacial del movimiento de personas es la Plataforma de Laboratorios Descartes.
  • Herramientas de integración de datos de código abierto, como Talend Open Studio. La descarga e integración automatizadas son esenciales para muchos paneles y visualizaciones relacionados con la pandemia.
Talend data integration
Imagen: Columbia University y CLIP

Este artículo fue publicado originalmente en la Red Global de Periodismo de Investigación y es reproducido en IJNet con permiso. Para más información sobre su serie de webinarios sobre la pandemia visita su sitio web.

Rowan Philp colabora con GIJN. Se desempeñó como reportero jefe del Sunday Times de Sudáfrica. Como corresponsal extranjero, ha informado sobre política, corrupción y conflictos en más de 24 países.

Imagen con licencia Creative Commons en Unsplash, vía Ryoji Iwata