Qui n’a pas entendu parler de Chat-GPT ? Les exploits de cette intelligence artificielle suscitent débats et passions, craintes et espoirs pour l’avenir. Pour comprendre de quoi il est question, essayons déjà de savoir comment fonctionne ce gigantesque réseau de neurones !

Depuis novembre 2022, l’agent conversationnel Chat-GPT, qui est développé par l’entreprise américaine OpenAI (https://openai.com), est sur toutes les lèvres et dans tous les journaux, tant ses productions sont impressionnantes (pas toujours en mathématiques cependant). GPT est un acronyme pour « transformeur génératif pré-entraîné » (generative pre-trained transformer dans la langue d’Alan Turing) ; autrement dit, c’est une intelligence artificielle (IA), et plus précisément un réseau de neurones, c’est-à-dire une fonction mathématique très élaborée dont les paramètres ont été estimés grâce à un grand nombre de données, et entraîné pour pouvoir générer du contenu textuel. La version GPT-3 est un modèle de langue large : les capacités de calculs et les données disponibles aujourd’hui permettent la création de réseaux de neurones de plus en plus grands. À titre d’exemples, GPT-3 possède 175 milliards de paramètres, là où son « ancêtre » sorti en 2019, GPT-2, en avait « à peine » 1,5 milliard.

 

 

Tout est vecteur…

 

La modélisation d’un texte passe par la « vectorisation » : un texte est vu comme une suite de mots, et chaque suite de mots est représentée par un vecteur dans l’espace de tout le vocabulaire utilisable. L’algorithme GPT consiste « simplement » à prédire le mot n+1 connaissant les mots 1 à n. Pour cela, on ... Lire la suite


références

Intelligence artificielle. Bibliothèque Tangente 68, 2019.
Les formations mathématiques au cœur de l’emploi. Bibliothèque Tangente 73, 2021