L’intelligence artificielle (IA) dans le secteur de l’édition progresse régulièrement depuis plus d’une décennie, certains grands médias adoptant des systèmes automatisés pour produire du contenu. Initialement utilisée pour couvrir les prévisions météorologiques , les récapitulatifs sportifs et les rapports financiers , cette automatisation s'est étendue pour couvrir un spectre plus large de tâches créatives .
Dans les années 2020, l’attention s’est largement portée sur l’IA générative capable de traiter et d’imiter le langage humain. Cela était principalement dû aux modèles avancés d’apprentissage automatique identifiant des modèles au sein d’ensembles de données non structurés. Ces modèles pourraient analyser des millions d’images, de livres et d’articles pour générer un contenu écrit original et remarquablement humain, basé sur des paramètres d’entrée spécifiques.
La sortie de ChatGPT en novembre 2022 a considérablement accru l'intérêt du public pour les technologies d'IA, suscitant l'inquiétude des professionnels des médias quant à la perte de leur emploi au profit des robots. L'interface conviviale du chatbot a permis à davantage de personnes d'explorer les capacités de traitement du langage naturel (NLP), et la qualité globale de son contenu a incité des pionniers tels que Nature Publishing Group et PNAS Journals à réviser leurs politiques éditoriales.
ChatGPT a acquis 100 millions d'utilisateurs à un rythme sans précédent , catapultant son développeur, OpenAI, à accumuler plus d'un milliard de dollars de revenus . Ce succès sans précédent a stimulé les investissements en capital-risque dans les entreprises d'IA, qui ont atteint 40 milliards de dollars au premier semestre 2023 et ont exhorté les entreprises à explorer les capacités de l'IA dans de nombreux secteurs.
Le marché mondial de l’IA dans les médias et le divertissement devrait passer d’un montant prévu de 16,1 milliards de dollars en 2023 à 85,6 milliards de dollars en 2030. Source : Research and Markets
Compte tenu de la quantité toujours croissante de calcul disponible pour la formation de modèles, les chatbots PNL avancés n’ont pas encore atteint leur plein potentiel. Cependant, l’IA a déjà eu un impact profond sur le monde de l’édition, à l’instar de l’émergence d’Internet.
Une enquête WAN-IFRA auprès des éditeurs de presse a montré qu'en mai 2023, environ la moitié utilisaient activement ChatGPT ou des outils similaires, et 70 % s'attendaient à ce qu'ils aident les journalistes. Source : WAN-IFRA
La nouvelle technologie a transformé le paysage du secteur de l'édition, présentant des défis et des avantages pour les écrivains et de nouvelles opportunités pour les fournisseurs de contenu. L'approche basée sur les données exige que les entreprises s'adaptent à ces changements, ce qui rend la maîtrise des outils basés sur l'IA essentielle pour que les journalistes et les rédacteurs puissent consolider leur position.
Qu’est-ce que l’IA générative ?
L'IA artificielle générative (IA) est un modèle d'apprentissage automatique capable de générer de nouveaux contenus, notamment du texte, des images, de la musique, des animations ou du code. De tels modèles traitent d’énormes quantités de contenu produit par l’homme en utilisant un format d’apprentissage auto-supervisé qui leur permet d’imiter les créateurs humains.
Pendant longtemps, l’IA s’est principalement développée autour de l’interprétation des données, notamment en entraînant des algorithmes d’apprentissage automatique pour comprendre le contenu d’une image. Cependant, la nouvelle technologie a attiré l’attention lorsque les chercheurs sont passés de la reconnaissance d’images à la génération d’images. En janvier 2021, OpenAI a publié DALL-E , un modèle qui convertit les descriptions textuelles des utilisateurs en illustrations.
La couverture du magazine Economist a été réalisée avec Midjourney, un autre générateur d'art, qui est devenu un succès après son lancement en 2022. Source : The Economist
Les applications d'IA générative traitent les entrées via de grands modèles de langage (LLM). Les LLM, inspirés du cerveau humain, considèrent les mots et parties de mots comme des nœuds sur une carte multidimensionnelle . Ils s'efforcent de définir la distance entre ces nœuds et ainsi de prédire le mot le plus susceptible de venir ensuite dans une séquence particulière. Avec plus de données, un LLM peut rédiger une copie plus complexe ou créer des visuels pertinents pour le sujet.
Microsoft a confirmé que son chatbot Bing fonctionne sur le LLM GPT-4 d'OpenAI, également disponible pour les abonnés ChatGPT. Ceux qui préfèrent ne pas s'abonner peuvent toujours accéder librement à GPT-3.5. Les deux services offrent des expériences diverses , tandis que Bard de Google est alimenté par un modèle différent .
Les capacités de ces chatbots avancés englobent bien plus que la génération de texte. Ils modifient notre interaction avec les moteurs de recherche, rendant les requêtes et les résultats plus conversationnels. Google prétend franchir une nouvelle étape dans cette transformation avec sa Search Generative Experience (SGE) , disponible via Google Labs aux États-Unis et au Royaume-Uni.
L'image ci-dessus montre comment SGE organise la page de résultats pour aider les utilisateurs à tirer le meilleur parti d'une seule recherche. Source : Laboratoires Google
SGE suggère un aperçu d'un sujet et l'accompagne de liens vers des ressources pour une exploration plus approfondie. Cela donne une idée des questions auxquelles une publication particulière répondra.
Ces résumés et compilations rapides simplifient la navigation des utilisateurs. Cependant, ils soulèvent certaines questions pour les créateurs de contenu quant à savoir s'ils doivent autoriser les moteurs de recherche à utiliser leur contenu à des fins de formation .
En fin de compte, les moteurs de recherche et les chatbots peuvent utiliser les informations créées par l’homme pour aider leurs utilisateurs sans renvoyer les lecteurs vers leurs pages sources.
Où l’IA est-elle utilisée aujourd’hui ?
Les algorithmes d'intelligence artificielle (IA) sont utilisés dans l'ensemble du secteur de l'édition, depuis l'élaboration de la diffusion d'informations jusqu'à la personnalisation du parcours des abonnés d'un paywall .
Par exemple, Reuters a utilisé son outil News Tracer dès 2016 pour repérer et vérifier automatiquement les dernières nouvelles sur Twitter. Initialement, l’IA visait à automatiser les processus pour aider les éditeurs à se concentrer sur la création de contenu.
Le New York Times a expérimenté une interface basée sur l'IA en 2015, automatisant les tâches quotidiennes de balisage et d'annotation. Source : NYTLabs
Le New York Times a également été pionnier dans l'utilisation d' analyses prescriptives pour gérer son paywall. Le Dynamic Meter a appris de la manière dont les abonnés interagissaient avec le contenu pour décider du nombre d'articles que les utilisateurs non enregistrés pouvaient lire gratuitement.
De nouvelles capacités ont élargi les applications de l'IA pour inclure la création et la conservation de contenu.
Selon l'enquête mondiale JournalismAI, 90 % des rédactions ont recours à l'IA à différentes étapes de la production de contenu. Source : JournalismeAI
Tendances et détection de sujets
Les services de surveillance tels que Google Trends ou CrowdTangle aident les éditeurs à identifier les sujets d'actualité pour des régions ou des données démographiques particulières. De plus, les outils d’IA peuvent faciliter le brainstorming, les suggestions servant de point de départ à des discussions plus approfondies.
En juin 2023, des scientifiques ont présenté AngleKindling, un outil basé sur GPT-3 pour aider les journalistes à explorer les communiqués de presse. Source : Github (téléchargement PDF)
Transcription et traduction
La transcription d'interviews et de discussions a toujours été l'un des aspects les plus détestés du travail d'un journaliste. Cependant, les assistants de réunion tels qu'Otter , Sembly et Airgram peuvent générer des notes et des résumés, permettant aux créateurs de contenu de se concentrer sur des tâches plus intéressantes.
Ces services fonctionnent dans un nombre limité de langues, mais le journal numérique danois Zetland a développé la plateforme Good Tape , capable de transcrire l'audio dans plus de 90 langues.
La traduction automatisée pour différentes langues s'est également développée de manière inégale, mais permet principalement de transmettre un message avec un risque minimal de désinformation ou d'insulte.
En 2022, la chaîne publique finlandaise Yle a lancé un service destiné aux réfugiés ukrainiens qui proposait des reportages traduits automatiquement et également vérifiés par un locuteur natif. Yle avait déjà commencé à donner des informations en somali, arabe, kurde et farsi pendant la pandémie.
Rédaction et édition
Les grands modèles linguistiques (LLM) peuvent vérifier la grammaire et proposer des résumés de contenu concis, créer des notifications, les adapter aux newsletters ou aux plateformes de médias sociaux et transformer des copies écrites en scripts pour des podcasts ou des vidéos.
ChatGPT, Bing, Claude et d'autres services basés sur LLM peuvent suggérer des listes de titres attrayants. Bien qu’ils nécessitent encore une validation, les algorithmes d’apprentissage automatique simplifient les processus de production de contenu et augmentent leur vitesse.
L'enquête d'AuthorityHacker auprès de 3 812 spécialistes du marketing numérique a révélé que 85,1 % de ceux qui utilisaient l'IA l'utilisaient pour écrire des articles ou des blogs. Source : AuthorityHacker
En juillet 2023, News Corp Australia a révélé que la technologie de l’IA permettait à quatre membres du personnel de produire 3 000 articles d’actualité locale par semaine . Cela a contribué à ce que les mastheads hyperlocaux représentent 55 % de tous les abonnements.
Cependant, News Corp a précisé plus tard que l'automatisation implique principalement des informations basées sur des modèles , telles que les mises à jour des prix du carburant ou les listes d'audience quotidiennes, et que tous les articles sont vérifiés par l'équipe humaine.
Créer des visuels
Les réseaux de neurones tels que Midjourney, DALL-E ou Stable Diffusion permettent aux auteurs et éditeurs de créer des illustrations pour leurs articles et publications. Il a fallu environ sept minutes pour créer, choisir et modifier l'image de couverture de base de cet article avant que des superpositions de marque supplémentaires ne soient ajoutées.
Le coût pour créer une image unique est un abonnement de 8 $ par mois, ce qui est relativement mineur, étant donné que les images uniques ont de meilleures chances d'être classées dans la recherche d'images de Google que les photos d'archives.
Une autre image créée spécialement pour cet article en utilisant Midjourney
Diffusion de contenu
L'IA aide les éditeurs à segmenter leurs clients et à identifier les meilleurs canaux, formats et délais pour fournir un contenu pertinent à un groupe particulier de lecteurs. Divers sites Web adaptent leurs pages d'accueil en fonction des caractéristiques démographiques et du comportement antérieur du visiteur.
La personnalisation du contenu comprend la traduction automatique d'articles, des campagnes de marketing par e-mail dynamiques ou l'adaptation du contenu existant pour différentes plateformes de médias sociaux.
Des outils dédiés aux médias sociaux, par exemple WordStream ou Emplifi, offrent une planification intelligente, une optimisation des campagnes publicitaires, un suivi avancé et des informations sur l'audience.
Avantages de l'IA dans l'édition
L'intelligence artificielle (IA) offre aux maisons d'édition, aux médias et aux journalistes individuels la possibilité d'économiser du temps et de l'argent grâce à des opérations quotidiennes plus rapides et des décisions plus éclairées. Cela permet également aux éditeurs d'améliorer leurs relations avec leurs lecteurs, d'attirer de nouveaux publics et d'améliorer la qualité de leurs textes.
Rapport coût-efficacité
L'IA peut réduire considérablement les coûts opérationnels des éditeurs en rationalisant les tâches manuelles répétitives et en réduisant la charge de travail de leurs employés. Les algorithmes d'apprentissage automatique fournissent des informations exploitables pour optimiser leur contenu et leurs stratégies marketing sans les coûts élevés associés aux études de marché. Associé aux outils disponibles pour la création de contenu, il permet aux petites équipes de fonctionner à plus grande échelle.
Le ciblage avancé du public, la génération d'images rapide et bon marché et les assistants de rédaction et d'édition, tels que Grammarly, offrent des opportunités sans précédent pour la publication numérique. Une distribution plus précise permet aux médias de niche d'entrer en contact avec les lecteurs sans investir lourdement dans la publicité. À mesure que les éditeurs gagnent en efficacité, ils peuvent couvrir un plus large éventail d’événements.
Aide à la recherche et vérification des faits
L’IA peut aider les journalistes à parcourir de grandes quantités de texte pour identifier des histoires pertinentes et des liens cachés entre des faits, des événements, des entités et des personnes.
new/s/leak , géré par la technologie linguistique de l'université de Hambourg, est un outil gratuit conçu pour passer au crible les informations distribuées par Wikileaks. Un autre exemple de projet d'IA pour enquêter sur le journalisme est le DMINR .
L’IA aide à distinguer les faits des faux en comparant les informations récemment publiées avec des ensembles de données de sources fiables ou en retraçant l’historique des images depuis leur première détection par les moteurs de recherche.
Une capture d'écran confirmant que les « robots » du SoFi Stadium de Los Angeles étaient des acteurs faisant la publicité du film The Creator. Sources : Reuters , Fact Check Explorer
Personnalisation du contenu
Malgré les problèmes de confidentialité, la demande d’expériences personnalisées ne cesse de croître. Une enquête a montré que cette demande pourrait inciter plus de la moitié des consommateurs à devenir des acheteurs réguliers (téléchargement PDF) , en hausse de 7 % sur un an.
Les outils basés sur l'IA permettent aux organisations médiatiques de personnaliser leur contenu pour une distribution ciblée. En 2020, le Washington Post a publié des mises à jour audio sur les élections alimentées par l'IA , personnalisées pour correspondre à la localisation de ses auditeurs de podcasts politiques.
Captures d'écran d'un chatbot avancé personnalisé pour les entreprises médiatiques. Source : Techcrunch
L'IA générative offre aux éditeurs la possibilité d'interagir personnellement avec leurs lecteurs, et ils peuvent désormais intégrer les modèles existants dans leurs services de support client.
En février 2023, les cofondateurs d'Instagram ont lancé Artifact , une application d'actualités personnalisée qui suggère des articles fiables et vérifiés en fonction des préférences des lecteurs. De plus, Artifact permet aux utilisateurs de choisir entre lire et écouter, car il applique un modèle de synthèse vocale avec des voix au son naturel.
Une capture d'écran montre que les utilisateurs d'Artifact peuvent écouter des rapports et des histoires lues avec les voix de Snoop Dogg ou de Gwyneth Paltrow. Source : Médium
Cas de réussite de l'IA dans l'édition
Les cas d'utilisation de l'intelligence artificielle (IA) dans l'édition continuent de croître, créant de nouvelles opportunités pour une efficacité améliorée. Explorons quelques réussites existantes pour mieux comprendre comment cette technologie façonne l'industrie.
5 projets médiatiques basés sur l'IA
1. BuzzFeed
BuzzFeed a annoncé en janvier 2023 qu'il expérimentait ChatGPT pour automatiser son processus de création de quiz.
Le test a été un succès en termes de génération d’un plus grand engagement des utilisateurs. Les visiteurs ont passé 40 % de temps en plus sur les quiz générés par l'IA que sur ceux créés par des éditeurs humains.
Une page BuzzFeed entière dédiée aux quiz générés par l'IA. Source : BuzzFeed
2Forbes
Le géant de l'information financière a déployé Bertie , une plateforme de publication exclusive, en juillet 2018. Ce système de gestion de contenu (CMS) a fourni aux journalistes et aux contributeurs des salles de rédaction des listes de sujets d'actualité basées sur leurs publications antérieures.
De plus, il proposait des titres attrayants et des images pertinentes, même s'il n'essayait pas d'écrire des articles entiers. Après le lancement du système, Forbes a doublé le nombre de ses visiteurs mensuels.
Le Bertie CMS suggère des idées de titres. Source : Forbes
3.Bloomberg
Bloomberg a dévoilé BloombergGPT , un modèle de langage spécifique à un domaine basé sur 50 milliards de paramètres, en mars 2023.
Contenu de nos partenaires
Le tableau montre comment BloombergGPT surpasse les modèles ouverts existants de taille similaire sur les tâches financières. Source : arXiv
4. Le BMJ
Le British Medical Journal (BMJ) a examiné la capacité du GPT-3 à produire des titres attrayants sur le thème de Noël pour des articles de recherche. Il est intéressant de noter que les personnes interrogées ont jugé les titres générés par l’IA au moins aussi agréables que ceux créés par des auteurs humains.
Le test présenté par BMJ suggère de reconnaître les titres générés automatiquement. Source : BMJ
5. Le Globe and Mail
Le journal canadien a vendu sa plateforme de curation et d'analyse de contenu , Sophi Inc., à la société mondiale de gestion des revenus Mather Economics en août 2023. L'outil basé sur l'IA a été conçu pour faire fonctionner les paywalls du Globe and Mail, mais il s'est étendu à d'autres domaines après la transition. .
Défis liés à la mise en œuvre de solutions d'IA
Les organisations qui adoptent l’intelligence artificielle (IA) sont souvent confrontées à des contraintes financières et techniques. Par exemple, les petits médias peuvent manquer de financement pour embaucher des ingénieurs qualifiés.
Les éditeurs doivent également prendre en compte les risques juridiques et de réputation que peut entraîner une application imprudente de l’IA.
Plus de 40 % des responsables média sont confrontés à des défis techniques, notamment le besoin de financement supplémentaire, lors des projets d'intégration de l'IA. Source : JournalismeAi
Problèmes techniques
Malgré les avantages de l’adoption d’une nouvelle technologie, la difficulté de surmonter la courbe d’apprentissage initiale peut décourager les éditeurs. Non seulement ils doivent obtenir l’adhésion de la rédaction, mais ils doivent également intégrer de nouvelles solutions dans les systèmes existants. Il y a aussi la peur de devenir dépendant de quelque chose qu’ils ne comprennent pas complètement.
Qualité du contenu
La copie générée peut ne pas répondre aux attentes, suscitant de sévères critiques à l'encontre des éditeurs . De plus, les grands modèles linguistiques (LLM) ont tendance à perpétuer les erreurs des ensembles de données sur lesquels ils ont été formés.
Un problème notable est la perpétuation de divers préjugés, une caractéristique commune de l’IA, constamment soulignée par la recherche .
Défis éthiques
Les préjugés posent un problème éthique qui doit être résolu. Un autre défi concerne les risques professionnels causés par l’IA, en particulier pour les postes de cols blancs. Sa mise en œuvre peut susciter des appréhensions chez les collaborateurs, nécessitant une communication interne proactive.
Risques juridiques
L’IA soulève également des problèmes de sécurité des données, étant donné qu’elle doit traiter des volumes importants de données utilisateur pour générer du contenu personnalisé. De plus, les entreprises s’inquiètent de plus en plus des fuites de données dues à la saisie d’informations sensibles par les utilisateurs pour une analyse de texte automatisée.
De plus, le contenu produit par l’IA se trouve toujours dans une zone grise en termes de protection des droits d’auteur, car les dossiers sont toujours en cours de traitement dans le système.
Les éditeurs ne sont pas prêts à s'appuyer entièrement sur le contenu généré par l'IA. Source : WAN-IFRA
D’autres risques incluent la surautomatisation et la perte ultérieure d’un ton de voix unique et d’une touche humaine générale. Mais cela nous amène directement à la nécessité d’une surveillance continue de la part de l’équipe de publication.
Dernières pensées
On s’attend à ce que 90 % du contenu en ligne soit généré de manière synthétique d’ici 2026. Si cette prévision s’avère exacte, l’intelligence artificielle (IA) devrait avoir un impact profond sur l’industrie de l’édition et de la création de contenu dans son ensemble.
Rédacteurs en chef de journaux, créateurs de TikTok, designers, écrivains : tout le monde dans l’espace créatif ressentira d’une manière ou d’une autre l’impact de cette mise à l’échelle. Cela modifiera les marchés du travail, soulignant l’importance des compétences en ingénierie des données et des connaissances techniques pour les journalistes.
À mesure que l’intégration de l’IA progresse, les éditeurs doivent adopter des stratégies transparentes et éthiques et former des groupes de travail dédiés. Les aspirations commerciales du secteur de l'édition s'aligneront plus étroitement sur les valeurs éthiques, compte tenu de la nécessité de vérifier les faits pour se prémunir contre les risques de réputation.
Cela dit, les éditeurs doivent toujours tirer parti de l’IA pour maintenir leur autorité, explorer le comportement des lecteurs et atteindre un public plus large s’ils veulent rester compétitifs.