L’idée originale du World Wide Web a émergé dans un tourbillon de réflexion scientifique vers la fin de la Seconde Guerre mondiale. Tout a commencé avec une machine hypothétique appelée « memex », proposée par Vannevar Bush, directeur du Bureau américain de la recherche scientifique et du développement, dans un article intitulé As We May Think , publié dans l’Atlantic Monthly en 1945.
Le memex nous aiderait à accéder à toutes les connaissances, instantanément et depuis notre bureau. Il disposait d'un index consultable et les documents étaient liés entre eux par les « traces » tracées par les utilisateurs lorsqu'ils associaient un document à un autre. Bush a imaginé le memex en utilisant des microfiches et des photographies, mais conceptuellement, il s’agissait presque de l’Internet moderne.
La véritable valeur de cette première idée résidait dans les liens : si vous souhaitiez explorer davantage, il existait un moyen simple et intégré de le faire. Quiconque a passé des heures à suivre des liens aléatoires sur Wikipédia et à découvrir des choses dont il ignorait l'intérêt reconnaîtra cette valeur. (Il existe bien sûr une page Wikipédia sur ce phénomène.)
Les liens ont fait du Web ce qu'il est. Mais alors que les plateformes de médias sociaux, les outils d’IA générative et même les moteurs de recherche s’efforcent de garder les utilisateurs sur leur site ou leur application, ce modeste lien commence à ressembler à une espèce en voie de disparition.
Les lois des liens
Les moteurs de recherche modernes ont été développés dans l’ombre du memex, mais ils ont d’abord été confrontés à des problèmes juridiques inattendus. Aux débuts d’Internet, il n’était pas clair si « explorer » des pages Web pour les intégrer dans l’index d’un moteur de recherche constituait une violation du droit d’auteur.
Il n’était pas non plus clair si, en créant des liens vers des informations susceptibles d’aider quelqu’un à fabriquer une bombe, à frauder quelqu’un ou à mener une autre activité néfaste, les moteurs de recherche ou les hébergeurs de sites Web étaient des « éditeurs ». Être éditeurs les rendrait légalement responsables du contenu qu’ils hébergent ou auquel ils sont liés.
Le problème de l'exploration du Web a été résolu par une combinaison d'utilisation équitable, d'exemptions spécifiques à chaque pays en matière d'exploration et de dispositions de « sphère de sécurité » de la loi américaine sur le droit d'auteur du millénaire numérique . Ceux-ci permettent l'exploration du Web à condition que les moteurs de recherche ne modifient pas l'œuvre originale, ne créent pas de liens vers celle-ci, ne l'utilisent que pour une durée relativement courte et ne profitent pas du contenu original.
La question du contenu problématique a été résolue (du moins dans la juridiction américaine très influente) via une législation appelée Section 230 . Celui-ci offre l'immunité aux « fournisseurs ou utilisateurs de services informatiques interactifs » qui fournissent des informations « fournies par un autre fournisseur de contenu ».
Sans cette loi, Internet tel que nous le connaissons ne pourrait pas exister , car il est impossible de vérifier manuellement chaque page liée ou chaque publication sur les réseaux sociaux pour détecter tout contenu illégal.
Cela ne signifie pas pour autant qu’Internet est un véritable Far West. L'article 230 a été contesté avec succès sur la base d' une discrimination illégale , lorsqu'un questionnaire obligatoire sur le logement demandait la race. Plus récemment, une affaire intentée contre TikTok a suggéré que les plateformes ne sont pas à l’abri lorsque leurs algorithmes recommandent des vidéos spécifiques.
Le contrat social du Web échoue
Cependant, toutes les lois qui ont créé Internet se sont appuyées sur des liens. Le contrat social est qu'un moteur de recherche peut gratter votre site, ou qu'une société de médias sociaux peut héberger vos mots ou vos images, à condition qu'ils vous donnent, à vous et à la personne qui l'ont créé, du crédit (ou du discrédit si vous donnez de mauvais conseils). . Le lien n'est pas seulement la chose que vous suivez dans un terrier de lapin Wikipédia, c'est un moyen de donner du crédit et de permettre aux créateurs de contenu de profiter de leur contenu.
Les grandes plateformes, dont Google , Microsoft et OpenAI , ont utilisé ces lois, et le contrat social qu'elles impliquent, pour continuer à ingérer du contenu à l'échelle industrielle.
Cependant, la fourniture de liens, de regards et de crédit est en baisse car l’IA n’établit pas de lien avec ses sources. Pour prendre un exemple, les extraits d’actualité fournis dans les moteurs de recherche et les réseaux sociaux ont tellement remplacé les articles originaux que les plateformes technologiques doivent désormais payer pour ces extraits en Australie et au Canada .
Les grandes entreprises technologiques apprécient de garder les internautes sur leurs sites, car les clics peuvent être monétisés en vendant des publicités personnalisées.
Un autre problème avec l’IA est qu’elle réapprend généralement rarement et conserve du contenu obsolète. Même si les derniers outils de recherche basés sur l’IA prétendent faire mieux sur ce front, on ne sait pas vraiment à quel point ils sont efficaces.
Et, comme pour les extraits d’actualités, les grandes entreprises sont réticentes à accorder du crédit et des opinions à d’autres. Il existe de bonnes raisons, centrées sur les personnes, pour lesquelles les sociétés de médias sociaux et les moteurs de recherche souhaitent que vous n'ayez pas à partir. Une valeur clé de ChatGPT est de fournir des informations sous une forme unique et condensée afin que vous n'ayez jamais à cliquer sur un lien, même s'il en existe un.
Droit d'auteur et créativité
Mais la mise à l’écart des liens est-elle une bonne chose ? De nombreux experts soutiennent que ce n’est pas le cas.
Utiliser du contenu sans crédit constitue sans doute une violation du droit d'auteur . Remplacer les artistes et les écrivains par l'IA réduit la créativité dans la société .
Contenu de nos partenaires
Résumer les informations, sans établir de lien avec les sources originales, réduit la capacité des gens à vérifier les faits, est sujet aux préjugés et peut réduire l'apprentissage, la réflexion et la créativité soutenus par la navigation dans de nombreux documents. Après tout, Wikipédia ne serait pas amusant sans le terrier du lapin, et Internet sans liens n’est qu’un livre en ligne écrit par un robot.
Une réaction de l’IA se profile
Alors, que nous réserve l’avenir ? Ironiquement, les mêmes systèmes d’IA qui ont aggravé le problème de liaison ont également augmenté la probabilité que les choses changent.
Les exemptions de droits d'auteur qui s'appliquent à l'exploration et à la création de liens sont contestées par les créatifs dont le travail a été incorporé dans des modèles d'IA. Les modifications proposées à l’article 230 de la loi pourraient signifier qu’il est plus sûr pour les plateformes numériques de créer des liens vers du matériel plutôt que de le reproduire.
Nous avons également le pouvoir de changer : là où des liens existent, cliquez dessus. Vous ne savez jamais où suivre un sentier pourrait vous mener.
Vamsi Kanuri, professeur agrégé de marketing, Université de Notre Dame .
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lisez l' article original .