Après que ChatGPT ait pris d'assaut le monde à la fin de l'année dernière, il était rafraîchissant de voir l'annonce de la semaine dernière de l'arrivée imminente de la prochaine itération du chatbot recevoir une couverture relativement modeste.
La publication allemande Heise a cité la semaine dernière des hauts responsables de la direction de Microsoft dans le pays disant que le GPT-4 arriverait cette semaine.
Le directeur technique de Microsoft Allemagne, Andreas Braun, a déclaré : « Nous présenterons le GPT-4 la semaine prochaine, nous aurons là des modèles multimodaux qui offriront des possibilités complètement différentes – par exemple des vidéos », a déclaré Braun. ChatGPT (ou GPT-3.5) a été lancé en décembre 2022, tandis que GPT-3 a été lancé en 2020.
Braun et la PDG de Microsoft Allemagne, Marianne Janik, ont souligné que même si l'IA générative changeait la donne, elle ne remplacerait pas les emplois humains. Le grand point à retenir de l'annonce du GPT-4 était le fait qu'il sera "multimodal", ce qui signifie qu'il sera capable de générer du texte, de l'audio, des images et des vidéos.
Cela peut sembler un gros problème, mais en réalité, il s'agit simplement d'une consolidation des technologies d'IA préexistantes, y compris le propre générateur d'images DALL-e d'OpenAi. En fait, GPT-4 semble marcher sur les pieds d'une gamme de logiciels tiers, notamment MidJourney, ElevenLabels et D-ID, qui, ensemble, peuvent créer un avatar animé par l'IA avec voix off .
Petites étapes
Dans l'ensemble, c'est un petit pas en avant et pourrait décevoir d'autres qui s'attendaient à quelque chose de plus profond. Cependant, cela confirme le point que le PDG d'OpenAI, Sam Altman, a fait valoir en janvier lorsqu'il a averti que « les gens supplient d'être déçus» par GPT-4 ».
Altman n'a pas mâché ses mots lorsqu'il a parlé à StrictlyVC, écartant les projections virales selon lesquelles le nombre de paramètres dans GPT-4 grimperait à 100 000 milliards contre 175 milliards dans GPT-3 comme une "connerie complète".
Et pourtant, Altman a reconnu qu'il avait été pris au dépourvu par le train de battage publicitaire ChatGPT. Il a dit qu'il considérait simplement GPT-3.5 comme une étape itérative par rapport à GPT-3, qui n'a pas suscité autant d'enthousiasme lors de son lancement.
Il semble qu'Altman ait sous-estimé la préoccupation de l'humanité pour le soi. Il y a un certain nombre de raisons pour lesquelles il est important pour nous de voir notre propre réflexion , y compris le fait que les réflexions "nous aident à développer notre sens de soi". ChatGPT est le programme d'IA qui se rapproche le plus de la capacité de conversation des humains, créant une ampoule partagée pour la conscience culturelle.
Il a réussi cela grâce à la formation ciblée sur un ensemble de données plus petit et avec un retour humain. Je ne vais même pas essayer de distiller le côté technique de cette entreprise ici, mais si vous voulez une vision plus approfondie du processus de développement de GPT-3.5, dirigez-vous vers l'exploration par Jesus Rodriguez de l'apprentissage par renforcement avec rétroaction humaine . (RLHF) .
Un outil est un outil
En fin de compte, ChatGPT n'est qu'un outil, bien qu'excitant et puissant. Bien que cela nous montre le potentiel de l'IA générative, nous devons encore travailler de notre côté pour en tirer le meilleur parti .
Au cours du week-end, j'ai lu le point de vue d'Aaron Mok de Business Insider sur l'utilisation des outils d'IA pour augmenter sa productivité . En bref, ces outils lui ont rendu la vie plus difficile, à une exception notable près. Cela m'a fait réfléchir à nos attentes en matière de courbes d'apprentissage des logiciels.
La meilleure solution logicielle est celle qui rend la technologie sous-jacente invisible . À toutes fins utiles, Google est l'un des meilleurs exemples ici. En ce qui concerne l'IA, ChatGPT est également à l'avant-garde en matière d'invisibilité. Les gens voient un monde où une entrée conversationnelle low-tech avec un chatbot mène à des déclarations de revenus remplies.
Contenu de nos partenaires
Et ce monde arrive, mais nous sommes encore loin. Dans l'état actuel des choses, les outils d'IA dont nous disposons actuellement peuvent fournir des résultats très spécifiques et nous devons nous en souvenir, sinon nous serons inutilement indignés chaque fois que l' IA générative hallucinera des informations .
La célèbre citation d'Abraham Maslow sur les marteaux et les clous ne correspond pas tout à fait au contexte de ce sujet, mais je vais l'enfoncer malgré tout. Nous devons cesser de considérer l'IA comme une solution unique aux problèmes de productivité. L'IA se présente sous de nombreuses formes qui nécessitent chacune un engagement de temps sérieux de la part de leurs utilisateurs pour extraire la vraie valeur - en d'autres termes, les humains doivent améliorer leurs compétences.
Ramasser un marteau ne signifie pas que vous pouvez construire une maison. Vous aurez besoin d'un éventail d'autres outils pour faire le travail et, même dans ce cas, si vous n'avez aucune compétence, vous ne faites que demander des ennuis.