Lexique de l’IA : 15 mots pour mieux comprendre l’intelligence artificielle
L’intelligence artificielle : un domaine en constante évolution
Machine learning, big data, chatbot : derrière ces anglicismes indissociables du domaine de l’intelligence artificielle se cachent des concepts, méthodes ou systèmes qui semblent obscurs. Pourtant, leurs applications sont multiples, font l’actualité depuis plusieurs mois et sont scrutées par les instances. Vous avez déjà entendu parler d’unsupervised learning, d’IA générative ou de prompt, mais vous avez du mal à à comprendre ce qui ce cache concrètement derrière ces expressions ? Pas de panique : dans cet article, nous expliquons, le plus simplement et succinctement possible, la signification des termes les plus couramment utilisés.
15 termes indissociables de l’intelligence artificielle
Algorithme : désigne prosaïquement « une suite d’étapes permettant d’obtenir un résultat à partir des éléments fournis en entrée » selon la CNIL, qui compare le principe à une recette de cuisine. Dans le domaine de l’intelligence artificielle, l’algorithme s’appuie sur des modèles mathématiques complexes. Il n’est pas déterministe mais « auto-apprenant » : le traitement et l’analyse d’une immense quantité de données lui permettent de s’adapter, d’évoluer et de se reconfigurer pour fournir des résultats précis. Machine learning : correspond à un champ d’étude de l’intelligence artificielle appelé « apprentissage automatique » en français. Concrètement, le machine learning regroupe plusieurs méthodologies dont la finalité est d’enseigner l’autonomie à un programme informatique. Après une phase d’entraînement préliminaire sur un large corpus de données, le programme est capable de résoudre des problèmes pour lesquels il n’a pas été développé. Supervised learning : relatif à un procédé de machine learning baptisé « apprentissage supervisé » en français. Le principe : entraîner un programme à prédire un résultat en fonction d’occurrences constatées sur une base d’exemples. L’apprentissage supervisé est principalement utilisée pour classifier et détecter des anomalies ou établir des probabilités dans un contexte donné. Exemple : la détection de spams. Unsupervised learning : aussi appelée « apprentissage non-supervisé » en français, cette méthode d’apprentissage automatique doit, comme son nom l’indique, permettre à un programme de produire un résultat sans supervision à partir de données brutes. Selon la CNIL, le principe s’articule autour de « la détection de similarités » entre les données étudiées. L’apprentissage non-supervisé peut être, par exemple, utilisé par les algorithmes de recommandations, à même de prédire un comportement ou besoin en fonction des habitudes de navigation. Reinforcement learning : ou « apprentissage par renforcement » en français, ce procédé de machine learning est comparé à du dressage car il s’articule autour d’un système de récompenses. En bref, l’apprentissage par renforcement apprend à un programme à fonctionner en autonomie, en le confrontant à des situations dont il tire des leçons. « Au fil des expériences, le système cherche un comportement décisionnel optimal, en ce sens qu’il maximise la somme des récompenses au cours du temps » complète la CNIL. Réseaux de neurones artificiels : exploités par les voitures autonomes ou les assistants virtuels, les réseaux de neurones artificiels s’inspirent de la structure du cerveau humain. Pour faire simple, le modèle se divise en plusieurs couches de neurones « auto-apprenants » qui ont préalablement ingéré de l’information. Assemblés en réseaux, les neurones se multiplient et interagissent pour réaliser une tâche ou résoudre un problème. IA générative : désigne un système capable de générer du texte, des images ou d’autres types de contenus (audio, vidéo, etc.) à l’aide d’une requête textuelle. Plutôt que de classer ou prédire, les IA génératives produisent du contenu en s’appuyant sur un modèle de langage (voir plus bas) entraîné sur une large base de données. Chatbot : aussi appelé « agent conversationnel » en français, le chatbot est un programme capable de mener une conversation avec un utilisateur en mimant le comportement humain. Il peut répondre à des requêtes en fonction de scénarios prédéfinis ou en autonomie grâce à l’apprentissage automatique. Big Data : traduit le phénomène de massification des données numériques avec le développement des nouvelles technologies, ainsi que le domaine dédié au traitement de ces « mégadonnées » par le biais d’algorithmes.
IA faible : correspond au périmètre de l’intelligence artificielle tel qu’on le connaît, selon l’UNESCO. En résumé, une IA faible est capable d’exécuter une (ou plusieurs) tâches de façon autonome, mais dans un cadre défini par l’homme. Elle n’a pas de conscience ou de sensibilité à l’inverse de l’IA forte : un concept qui relève de la fiction à ce jour, rappelle l’organisme. Prompt : traduction littérale de « réplique » en français, le terme désigne les requêtes textuelles adressées par les utilisateurs à des systèmes d’IA génératives tels que ChatGPT, DALL-E ou Midjourney. En fonction de l’affinage et de la contextualisation du prompt, la réponse apportée sera plus ou moins exhaustive. Transformer : correspond à un réseau de neurones artificiels développé initialement pour le traitement automatique du langage, notamment pour la traduction ou la génération de textes. Les Transformers peuvent « réaliser l’essentiel, voire tout leur apprentissage de manière non supervisée, c’est-à-dire sur des textes « bruts » sans plus d’information ou d’annotation sur leur contenu » selon Michel Poujol, expert de l’IA interrogé par BDM. Modèle de langage : désigne un programme capable de comprendre et imiter le langage humain après une analyse complète de la structure d’une langue, ses règles implicites ou explicites et ses nuances. GPT-4 : acronyme de Generative Pre-trained Transformer 4, modèle de langage multimodal développé par la société américaine OpenAI pour, notamment, alimenter son agent conversationnel ChatGPT. PaLM-2 : acronyme de Pathways Language Model-2, modèle de langage développé par Google et entraîné sur plusieurs milliards de paramètres. Il est destiné à alimenter Google Bard, le générateur de texte lancé par la firme en février 2023.
Vous connaissez d’autres termes utilisés dans le domaine de l’intelligence artificielle ? N’hésitez pas à les partager en commentaire !
Source: BDM