L'état des informations générées par IA sur les moteurs de recherche et comment les journalistes peuvent s’adapter

13 août 2024 dans Innovation dans les médias
Des grahiques montrant les données du trafic d'un site internet

En janvier, 404 Media a publié un article affirmant que Google News privilégie les articles d'actualité réutilisés et générés par IA plutôt que ceux originaux édités par des humains. 

Dans son article, le journaliste Joseph Cox passe en revue plusieurs exemples de “plagiat” de l’IA. Il affirme que les classements de Google News sont “un système opaque, mais apparemment manipulable” et que Google “n’est peut-être pas prêt à modérer son service d’actualités à l’ère de l’IA accessible au grand public.” 

Nous savons que l'IA modifie la manière dont les journalistes recueillent et rapportent les informations, mais Google rend-il plus difficile l'accès des lecteurs au travail des journalistes ? Voici ce que nous savons et comment les journalistes peuvent s'adapter.

Google répond

Un représentant de Google qui a souhaité garder l'anonymat a contesté l'affirmation selon laquelle les algorithmes de l'entreprise donnent la priorité aux informations générées par IA. “Prétendre que nos systèmes de classement ‘boostent’ le contenu est trompeur,” déclare le représentant. “Nos systèmes de classement ne présentaient pas, par défaut, ce contenu en haut des résultats.” 

Les systèmes de classement par défaut en fonction de la pertinence, a poursuivi le représentant, ont été délibérément contournés pour l'article 404 Media : “Le contenu qui apparaît en haut d'une recherche triée par date ne correspond pas à son affichage pour les requêtes ordinaires utilisant notre classement par défaut en fonction de la pertinence.” 

Lors du classement des résultats de recherche par date, “le contenu le plus récent correspondant aux termes sera affiché, et les résultats peuvent changer rapidement à mesure que de nouveaux contenus apparaissent,” affirme le représentant. La raison pour laquelle Google Search pourrait proposer des informations générées par IA avant celles générées par l’homme est une question de vitesse : NewsGuard Tech a découvert que World-Today-News.com, site de copie d’informations par IA, produit en moyenne 1 200 articles par jour ; en comparaison, le New York Times publie environ 150 articles originaux par jour.

Les journalistes humains ne peuvent pas suivre ce rythme, ce qui peut avoir un impact sur le type de contenu visible dans les résultats de recherche. Google affirme que dans le cas mis en évidence par M. Cox, les résultats générés par IA sont apparus en premier parce que la fonction de recherche était filtrée par date, ce qui met indirectement en évidence la rapidité avec laquelle se multiplient les informations générées par IA.

Que Google privilégie ou non les informations générées par  IA plutôt que par les humains, les fermes de contenu d’IA – des opérations en ligne qui produisent des appâts à clics de mauvaise qualité destinés à générer des revenus publicitaires massifs – produisent du contenu qui se retrouve face aux lecteurs, et la publicité programmatique alimente cette frénésie. Les nouveaux sites d’actualités qui s’appuient sur l’IA ont une apparence plus soignée que leurs cousins ​​des fermes de contenu, mais l’objectif est le même : attirer les spectateurs vers les publicités, et non vers les informations. Ces sites réécrivent fréquemment ou plagient simplement les informations de sites légitimes. Parallèlement, il a été démontré que certains outils d’IA provoquent des “hallucinations” d’informations – les faux contenus se propagent à leur tour sur Internet plus rapidement, et plus largement que la vérité. 

“Nous prenons très au sérieux la qualité de nos résultats et avons des politiques claires contre le contenu créé dans le but premier d’être bien classé dans les actualités, et nous supprimons les sites qui enfreignent cette règle,” déclare le représentant de Google. En juillet 2023, Google a publié un document expliquant que son système de classement récompense les articles avec plusieurs éléments, notamment la pertinence du contenu, la notoriété et l’autorité. Ce système de classement s’applique à tout matériel écrit, quelle que soit la manière dont il a été créé.

Bien que Google s’efforce de réduire la probabilité que les résultats produits par les fermes de contenu d’IA apparaissent en haut des résultats de recherche, des centaines de ces fermes continuent de diffuser des articles qui ont plagié des reportages d’origine humaine et qui contiennent des informations trompeuses ou fausses. Un rapport récent de NewsGuard Tech a identifié plus de 800 sites de ce type où les “informations” sont produites “avec peu ou pas de surveillance humaine.” 

 

Reconnaître la nouvelle normalité

Certains observateurs, comme Sony Kassam, ancienne journaliste de Bloomberg et actuelle responsable du contenu de la newsletter 1440, pensent que Google et d'autres sociétés de moteurs de recherche tentent de distinguer le contenu généré par IA dans leurs résultats. Cependant, les propres créations de Google pourraient rendre cette tâche plus difficile. 

Prenons l’exemple du modèle d’intelligence artificielle surpuissante de Google, Gemini, qui peut comprendre du texte, du code et des images et qui, selon Mme Kassam, “perturberait gravement la capacité d’un journaliste à se faire connaître du public via Google Search” car il répond aux requêtes de recherche avec son propre contenu original. Plutôt que de s’inspirer d’un article de presse, Gemini peut simplement faire référence à une ressource populaire sur Internet pour répondre à une requête. “Donc, à moins que vous ne puissiez pirater l’algorithme, certains articles risquent d’être enterrés,”  déclare Mme Kassam. 

Star Kashman, experte en cybersécurité et en droit de la vie privée, convient que l’IA peut potentiellement modifier le travail des journalistes, de l’identification des sources à la vérification des faits et à la rédaction. “Les journalistes peuvent se retrouver plagiés ou leurs droits d’auteur violés, car ils peuvent faire partie d’un ensemble de données en constante évolution sur lequel s’appuie l’IA,” déclare Mme Kashman. En fait, plusieurs poursuites sont actuellement en cours contre Microsoft et OpenAI pour violation du droit d’auteur. Mon père, Nicholas Basbanes, est l’un des plaignants.

Les agrégateurs d’informations, notamment ceux basés sur l’intelligence artificielle comme Techpresso et Morning Brew, ne feront que gagner en popularité. Dans le même temps, le nombre de journalistes en activité ne cesse de diminuer : plus de 21 000 emplois ont été supprimés en 2023, et jusqu’à présent, 2024 a également été une année difficile pour les journalistes. Plus de 500 ont été licenciés rien qu’en janvier, et la tendance se poursuit depuis. 

Les journalistes qui resteront sur place joueront un rôle encore plus important dans la création et le maintien d'un discours solide dans les médias et sur les plateformes de réseaux sociaux. Google, ainsi que Facebook, WhatsApp et X, sont nos places publiques modernes ; les journalistes qui adoptent les algorithmes des plateformes survivront pour publier davantage d'articles.

Les avantages et les limites de l’IA

Pour le Dr Shawn P. Daly, professeur à l’Université de Niagara, l’adoption de l’IA dans les rédactions est inévitable, mais pas totalement apocalyptique. La technologie offre des avantages aux journalistes prêts à l’utiliser. 

Les journalistes et autres créateurs de contenu utilisent déjà l’IA de manière de plus en plus sophistiquée : depuis la détermination du nombre d’articles gratuits auxquels les lecteurs peuvent accéder avant  d’atteindre un paywall, jusqu’à la relecture des articles.

Ces changements ont toutefois des conséquences, notamment pour les petits médias indépendants. “Un travail véritablement original,” comme le journalisme d’investigation approfondi, sera quasiment impossible à produire dans les petits médias, qui sera laissé aux titans du secteur, comme le New York Times et le Wall Street Journal, prévient M. Daly. 

“Le journalisme d’investigation consiste à la fois à rassembler des faits existants (publics) et à découvrir de nouvelles données (cachées). Guidée par des humains, l’IA peut développer de nouvelles explications, théories et rationalisations en recombinant les informations disponibles pour en faire de nouvelles histoires,” déclare-t-il.

Aujourd’hui, ce sont les humains – et non l’IA – qui sont encore les seuls capables de mener des entretiens et des enquêtes approfondies.

S'adapter à l'IA et à la recherche Google Actualités

Si vous ne pouvez pas vaincre l’IA, adoptez-la – mais fixez des limites, conseillent Mme Kassam et Mme Kashman. “L’innovation dans le journalisme obligera les journalistes à exploiter l’IA afin d’améliorer leurs reportages, raconter des histoires et analyser des données de manière attrayante, tout en maintenant leur pertinence et leur autorité dans leur domaine,” déclare Mme Kashman. 

Les journalistes doivent partir du principe que l’IA fera partie du processus de reportage, conseille M. Kassam. “Il est extrêmement important pour les journalistes et les organisations de presse en général de réfléchir de manière critique à la manière dont ils possèdent et gèrent leurs canaux de distribution et à la manière dont ils communiquent directement avec le public,” affirme-t-il. “Cela peut signifier avoir des newsletters robustes qui atteignent directement les boîtes de réception des lecteurs ou développer de solides stratégies sociales pour atteindre les lecteurs là où ils se trouvent, plutôt que de compter uniquement – ​​ou en grande partie – sur des algorithmes extérieurs pour se faire connaître.”

La newsletter gratuite 1440 de Mme Kassam compte 3,4 millions d'abonnés, ce qui souligne l'idée que les gens recherchent des informations rapportées de manière juste et graviteront vers les médias qui les fournissent. Dans le cadre d'un article sur les biais médiatiques, Snopes a classé 1440 en plein milieu du spectre politique. 

Si l’on admet que Google se concentre sur le contenu de haute qualité pour ses classements de recherche, quelle que soit son origine, les journalistes devraient s’en tenir à des stratégies éprouvées, comme démontrer une connaissance approfondie et une fiabilité. “Assurez-vous que le travail est original et témoigne d’une réelle expertise. Partager des informations claires sur l’auteur des articles et la manière dont ils ont été rédigés renforce la confiance,” déclare Ilija Sekulov, responsable SEO et marketing chez Mailbutler

Voici quelques conseils que les experts interrogés pour cet article ont donnés pour vous aider à vous repérer dans cette rédaction réinventée : 

  • Utilisez l'IA avec intégrité plutôt que comme un simple moyen d'obtenir un meilleur classement dans les résultats de recherche. La capacité de Google à trouver et à classer du contenu d’IA bien écrit ne fera que s'améliorer à chaque itération.
  • Concentrez-vous sur la production de contenu qui met l’accent sur la profondeur, le contexte et les nuances.
  • Engagez-vous directement auprès des communautés, adoptez le multimédia et les meilleures pratiques de référencement pour améliorer la visibilité et l’impact de votre travail. 
  • Diffusez du contenu sur plusieurs plateformes et ne vous fiez pas uniquement aux informations diffusées sur les moteurs de recherche. 
  • Servez-vous de l’IA pour automatiser les tâches routinières, analyser les données et découvrir des modèles. 

Utiliser l’IA de manière intelligente aidera les journalistes à enrichir leurs reportages et à garantir que leur produit reste indéniablement humain.

 


Photo de Luke Chesser sur Unsplash.