Une nouvelle classe de modèles d’IA incroyablement puissants a rendu possibles les récentes avancées.
Les progrès des systèmes d’IA semblent souvent cycliques. Tous les deux ou trois ans, les ordinateurs peuvent soudainement faire quelque chose qu’ils n’avaient jamais pu faire auparavant. « Voyez ! » proclament les vrais adeptes de l’IA, « l’ère de l’intelligence artificielle générale est à portée de main ! » « N’importe quoi ! » disent les sceptiques. « Vous vous souvenez des voitures autonomes ? »
La vérité se situe généralement quelque part entre les deux.
Nous sommes entrés dans un nouveau cycle, cette fois avec l'IA générative. Les gros titres des médias sont dominés par les nouvelles sur l'art de l'IA, mais on observe également des progrès sans précédent dans de nombreux domaines très disparates. Des vidéos à la biologie, en passant par la programmation, l'écriture, la traduction et bien d'autres, l'IA progresse au même rythme incroyable.
Pourquoi tout cela arrive-t-il maintenant ?
Vous connaissez peut-être les dernières nouveautés dans le monde de l'intelligence artificielle. Vous avez vu des œuvres d'art primées, entendu des interviews entre personnes décédées et lu des articles sur les avancées dans le domaine du repliement des protéines. Mais ces nouveaux systèmes d'intelligence artificielle ne se contentent pas de produire des démonstrations intéressantes dans les laboratoires de recherche. Ils sont rapidement transformés en outils pratiques et en véritables produits commerciaux que tout le monde peut utiliser.
Il y a une raison pour laquelle tout cela s'est produit en même temps. Ces avancées sont toutes soutenues par une nouvelle classe de modèles d'IA, plus flexibles et plus puissants que tout ce qui a été fait jusqu'à présent. Comme ils ont d'abord été utilisés pour des tâches linguistiques telles que répondre à des questions et rédiger des essais, on les appelle souvent grands modèles linguistiques (LLM). GPT3 d'OpenAI, BERT de Google, etc. sont tous des LLM.