Redacciones de todo el mundo han comenzado a explorar formas de convertir su periodismo en diferentes formatos usando IA: por ejemplo, desde artículos de texto a videos, pasando por pódcasts, infografías y más.
Al hacerlo, el principal desafío no es solo la precisión, sino la rigurosidad. Los periodistas se esfuerzan por transmitir los hechos con exactitud, atribuirlos con claridad, evitar sesgos, verificar afirmaciones y mantener la transparencia. Cuando se utiliza IA para convertir un trabajo periodístico de un formato a otro, esa misma rigurosidad puede no trasladarse.
“Uno de los mayores desafíos es que todos los modelos de IA y la mayoría de las herramientas que impulsan no están incorporados con los estándares editoriales a los que estamos acostumbrados como periodistas”, explicó Sannuta Raghu, directora del Laboratorio de IA de Scroll.in y exbecaria Knight del ICFJ. “Están entrenados con datos amplios y generalizados, y a menudo optimizados para la fluidez del lenguaje y la forma, pero no para la precisión, la atribución o la intención editorial”.
Los obstáculos que Raghu enfrentó al adaptar contenidos con IA pueden, sin duda, resultar difíciles de entender, especialmente para quienes no tienen formación técnica. Para ella, el fenómeno de la "memoria de destello" —en el que los recuerdos vividos de eventos críticos en la vida de una persona se distorsionan con el tiempo— resultó una analogía útil para enmarcar los desafíos que enfrentan los periodistas al usar IA para transformar contenidos. Investigadores estudiaron este fenómeno después del 11-S y descubrieron que los sujetos recordaban los atentados con gran viveza y confianza, pero al repetir y reempaquetar sus experiencias, los detalles se alejaban cada vez más de la realidad.
Raghu trabaja en estandarizar el principio de "fidelidad a la fuente". Durante su beca, mapeó cómo se “estructura, estiliza y presenta” el periodismo digital, y compiló sus hallazgos en lo que llama un "Directorio de Contenido Líquido".
El directorio está estructurado según cómo los usuarios reciben las noticias y el periodismo en línea: Infeaestructura física → Capa de red y transporte → Protocolos de aplicación → Canales de entrega → Contenedor de contenido → Formato de contenido → Bloques de construcción → Dispositivos e interfaces. Centrándose en los últimos cinco puntos, Raghu ha comenzado a crear un sistema modular capaz de convertir un formato periodístico en otro.
En los próximos meses, describirá cada entrada del directorio y codificará respuestas a preguntas como:
-
¿Un artículo de texto es un contenedor o un formato?
-
¿Un boletín es un canal de entrega, un contenedor o un formato?
-
¿Una línea de tiempo es un formato o un bloque de construcción?
Este mapa y sus descripciones podrían servir como conjunto de datos base para entrenar un modelo en formas periodísticas, de modo de preservar el razonamiento editorial que informa el diseño noticioso.
Hablé con Raghu sobre la fidelidad a la fuente, el diseño de noticias y la responsabilidad de los periodistas de preservar los estándares editoriales cuando trabajan con herramientas de IA.
Aquí esta nuestra conversación:
¿Cómo definirías "fidelidad a la fuente"?
Raghu: La fidelidad no es igual en todos los formatos, pero su concepto base es: ¿Este formato preserva la intención editorial y la rigurosidad del trabajo original? Se trata de traducir la lógica editorial para que un modelo pueda generar cada formato.
Tomemos el caso de pasar de un artículo de texto a un video corto: Fidelidad a la fuente significa que los hechos son los mismos; la lógica narrativa del original se mantiene (un informe noticioso se convierte en un video informativo, un artículo explicativo en un video explicativo, etc.); las citas se atribuyen con precisión y no se transforman en declaraciones narradas; los hechos no se condensan ni se dramatizan para generar impacto emocional; palabras y frases como “según se informa” o “de acuerdo con las autoridades cívicas” no se eliminan; y el tono coincide con el original.
Para un artículo de texto transformado en una calculadora interactiva, es distinto: cada variable y dato está vinculado a un hecho reportado; se incluyen advertencias e incertidumbres; el alcance se mantiene (la calculadora no “alucina” resultados más allá de lo informado); y tanto el resultado como su lógica pueden verificarse.
La fidelidad debe definirse específicamente para cada formato.
¿Qué elementos en una historia suelen distorsionarse o perderse?
Raghu: Uno de los desafíos más persistentes es situar correctamente el tiempo en los formatos transformados. Es un problema con varias capas.
En lo más básico, tomemos esta frase: “El lunes, los trabajadores levantaron la huelga de 21 días”.
Este hecho fue probablemente publicado después del lunes, o ese mismo lunes. Contiene una idea que establece una fecha precisa de inicio. La mayoría de los modelos lo resumirían como: “Los trabajadores levantaron la huelga”, eliminando completamente el contexto temporal.
A nivel más complejo, los problemas se agravan cuando se busca contexto o se construyen líneas de tiempo a partir de datos archivados vectorizados (almacenados como secuencias numéricas para que los lea una computadora). Los sistemas de recuperación (bases vectoriales con modelos lingüísticos) devuelven frases similares semánticamente sin importar cuándo ocurrieron. Si busco artículos sobre un "rescate del FMI al país X en julio de 2025, quiero contexto sobre ese rescate. Pero suelo obtener resultados de rescates de otros años, por similitud semántica, no precisión temporal. Esto es crítico al crear cronologías, antecedentes o resúmenes actualizados.
Las citas también son problemáticas: se simplifican o se presentan sin atribución. Si un ministro dice: “No lo descartaría por completo, pero es poco probable que lo impulsemos este año”, el modelo lo transformará en: “El ministro dijo que era poco probable”. Las citas anidadas también fallan: “El vocero dijo a la prensa que el ministro señaló que no lo descartaba, pero era poco probable”, puede reducirse a: “El ministro dijo que era poco probable". Estas distorsiones cambian el significado y la intención editorial.
¿Qué desafíos enfrentan los periodistas al trabajar con IA?
Raghu: Los modelos están optimizados para la fluidez y forma del idioma inglés, no para la rigurosidad periodística. Si miras FineWeb, uno de los conjuntos de datos usados para entrenar modelos, verás que incluye artículos de noticias, pero evalúa solo la calidad del lenguaje, no el estándar editorial.
Otro desafío es que el resultado parece pulido y autoritario, incluso cuando tergiversa matices. Por ejemplo, “supuestamente” o “probablemente” casi siempre se transforman en afirmaciones categóricas. Las citas se simplifican, se eliminan referencias temporales clave. Como el contenido parte del trabajo del periodista, se asume que es seguro. Pero las transformaciones asistidas por IA no son neutrales; tienen su propia lógica.
El reto no es solo evitar “alucinaciones”, sino también preservar el significado, la intención y la confianza en cada versión. Y esto se vuelve exponencialmente más difícil al incluir otros idiomas o matices culturales, sobre todo porque, como sabemos, no existen suficientes datasets ricos que reflejen esas sutilezas del mundo real.
¿Cómo se ve la “fidelidad a la fuente” en la práctica?
Raghu: Yo respondería con otra pregunta: ¿Cómo le enseñas a un modelo que domina el idioma inglés (y está mejorando en otros) los matices del periodismo? Comenzaría examinando la lógica que un periodista sigue de forma intuitiva. Algunas preguntas iniciales para un modelo serían:
-
Al resumir un artículo, ¿cuándo nombras una fuente y cuándo la generalizas?
-
¿Cómo resumes citas anidadas? ¿Y las indirectas?
-
¿Qué debés hacer o evitar al resumir una cita?
-
¿Cómo decides qué conservar o eliminar al reescribir una noticia compleja?
-
¿Qué entiendes por “resumir”, “acortar”, “parafrasear”, “reescribir” y “reformular”? (Esta es mi favorita.)
LMArena es una excelente herramienta para hacer pruebas comparativas entre modelos y establecer puntos de referencia editoriales.
El siguiente paso sería crear una guía de transformación, como un manual de estilo editorial que cada redacción ya tiene. Este sería un conjunto de datos que daría cuenta de cómo se debe manejar la cautela y la incertidumbre editorial en función de los puntos de referencia, cómo mantener la lógica y la secuencia de hechos, cómo respetar el alcance y los límites (cómo no disminuir ni hacer que un hecho sea más grande de lo que es) y cómo lidiar con la compresión de la producción (resumen, paráfrasis, reescritura en una cantidad determinada de palabras). Sería necesario definir:
-
Cómo manejar la cautela y la incertidumbre editorial;
-
Cómo mantener la lógica y secuencia de los hechos;
-
Cómo respetar el alcance (sin exagerar ni minimizar);
-
Cómo lidiar con compresión del contenido (resúmenes, parafraseos, límites de palabras).
Luego, hay que pensar cómo escalar esto: ¿Qué procedimientos y listas de control necesitamos?
¿En qué etapa se introduce un periodista capacitado en el proceso?
Son preguntas que deberemos resolver pronto.
Foto de Immo Wegmann en Unsplash.