Qu’est-ce que l’Intelligence Artificielle ?
L’intelligence artificielle (IA) désigne l’ensemble des techniques permettant à des machines de simuler certaines capacités humaines comme l’apprentissage, la compréhension, la prise de décision ou la résolution de problèmes.
Aujourd’hui, l’IA est présente dans de nombreux domaines de notre quotidien : téléphones, transports, médecine, jeux vidéo ou encore Internet.
L’IA ne se limite pas aux IA génératives
L’IA ne se résume pas aux IA génératives ou aux grands modèles de langage. De nombreuses IA existent sans produire de texte, d’images ou de vidéos. Ces IA sont souvent invisibles mais essentielles au fonctionnement de nombreux systèmes.
👉 Une IA non-générative analyse, décide ou optimise.
_________________________________________________________________________
Qu’est-ce qu’une IA générative ?
Une IA générative est une intelligence artificielle capable de créer du contenu original à partir de données existantes.
Elle peut générer du texte, des images, des vidéos, du son ou du code informatique.
Contrairement aux IA classiques qui se contentent d’analyser ou de classer, les IA génératives produisent de nouvelles données.
Les IA génératives sont utilisées pour :
- rédiger des textes ou répondre à des questions,
- créer des images ou des œuvres artistiques,
- générer des vidéos ou des animations,
- aider à la programmation informatique,
- produire des voix ou de la musique.
👉 Une IA générative crée du contenu nouveau.
Classification en 3 grandes catégories d’IA génératives
1️⃣ IA Génératives Textuelles
Ces IA produisent du texte : réponses, résumés, traductions, scripts, articles, dialogues…
Présentation
Elles reposent sur des modèles de langage capables de comprendre et générer des textes cohérents. Elles sont utilisées dans les chatbots, la rédaction de contenus, l’analyse de documents, etc.
|
✅ Avantages |
❌ Inconvénients |
|
|
|
|
|
|
|
|
⭐ Principales IA / outils
ChatGPT est une IA conversationnelle capable de comprendre et générer du texte.
Elle est utilisée pour répondre à des questions, rédiger des contenus, expliquer des notions, aider à programmer et analyser des documents.
Claude est une IA textuelle conçue pour être particulièrement fiable et sécurisée.
Elle est très performante pour la lecture de longs documents, les résumés et l’analyse approfondie de textes complexes.
Gemini est l’IA de Google spécialisée dans le raisonnement et le multimodal (texte, images, données).
Elle est intégrée à l’écosystème Google et efficace pour la recherche, l’analyse et la compréhension de contenus variés.
LLaMA est une famille de modèles de langage développée par Meta.
Elle est souvent utilisée dans des projets de recherche ou des applications open source, permettant aux développeurs de créer leurs propres IA.
Mistral est une IA européenne spécialisée dans les modèles de langage performants et légers.
Elle est appréciée pour sa rapidité, son efficacité et son orientation open source.
Perplexity AI combine recherche sur Internet et génération de texte.
Elle fournit des réponses synthétiques accompagnées de sources, ce qui la rend utile pour la veille et la recherche d’informations fiables.
Ces IA sont spécialisées dans la création de contenus marketing et professionnels.
Elles servent principalement à rédiger des articles, des publicités, des emails ou des publications pour les réseaux sociaux.
2️⃣ IA génératives visuelles
Ce type d’intelligence artificielle a pour but de créer, produire ou modifier des images/vidéos suite à une consigne formulée par un humain. Cette consigne est généralement écrite.
Présentation
Pour comprendre le principe des IA génératives visuelles, il faut rompre avec le principe de créativité et d’imagination dont sont dotés les êtres humains. Une IA créer des images ou des vidéos grâce à une régularité statistique. En fait, elle est « entrainée » sur une base de données à engranger des informations, et à les associer à des images ; c’est le principe « d’apprendre à voir ».
On lui donne plein de consignes comme « représente un chat noir », et on lui montre des images de chat noir. Petit à petit, l’IA va enregistrer que tel mot correspond à telle forme et sera de reproduire des images liées aux consignes demandées.
Le côté créatif que l’IA peut donner comme impression avec ses images, c’est simplement dû au fait qu’elle a enregistré plein d’images, de textures…et elle les combine différemment.
|
✅ Avantages |
❌ Inconvénients |
|
|
|
|
|
|
|
|
⭐ Principales IA / outils
IA développée par OpenAI qui génère des images à partir de descriptions textuelles, capable de produire des images réalistes ou artistiques.
IA spécialisée dans la création d’images artistiques et stylisées, très utilisée par les designers et artistes numériques.
IA open source de génération d’images qui peut être utilisée localement et personnalisée selon les besoins des utilisateurs.
IA générative d’Adobe intégrée aux outils créatifs, conçue pour un usage professionnel et respectant les droits d’auteur.
Outils d’IA intégrés à Canva permettant de créer rapidement des visuels, illustrations et designs à partir de texte.
IA orientée vers la génération et l’édition d’images et de vidéos, très utilisée dans le cinéma et la création de contenus.
3️⃣ IA génératives multimodales et agentiques
Les IA génératives multimodales sont capable de produire et de réaliser des actions diverses, tandis que les IA agentiques savent prendre des décisions d’elles mêmes.
Présentation
Tentons de comprendre ce type d’IA isolément : pour l’intelligence artificielle multimodale, le fonctionnement est au sein du nom lui-même. « Modalité », c’est un type de donnée ; donc quand on parle de multimodalité, ça signifie que l’IA sait réaliser plusieurs actions. Cela peut prendre la forme de texte, d’images, d’audios, de vidéos, de codes… Aujourd’hui les IA que nous connaissons sont plutôt multimodales. Mais ça n’existe que depuis peu de temps, avant, il s’agissait plutôt d’IA monomodales.
Maintenant, intéressons nous aux IA agentiques. Pareil, il faut s’intéresser au nom pour en comprendre son rôle. Il s’agit d’une IA ayant le rôle d’un agent, c’est-à-dire qu’elle sait agir de elle-même. Au-delà de simplement répondre, elle agit aux demandes. Elle est capable de prendre des décisions, de réaliser des actions, d’utiliser des outils. Elle est donc un agent autonome avec généralement un objectif précis. On peut prendre comme exemple une IA planificatrice de voyage : elle sait planifier dans notre agenda, comparer les prix, chercher des vols…
La combinaison de ces deux types d’IA génératives peut être donc très puissante. Elle serait capable de répondre à diverses consignes/actions, tout en agissant avec des outils. Il existe des IA de ce type aujourd’hui comme les systèmes de maintenance industrielle (tel que WAKU, Intelligent maintenance system), capable d’observer par caméra, de consulter des documentations, diagnostiquer des problèmes, alerter en cas d’anomalies…
|
✅ Avantages |
❌ Inconvénients |
|
|
|
|
|
|
|
|
⭐ Principales IA / outils
Comprend et génère texte, images et audio dans une même conversation.
Elle est multimodale, mais pas autonome.
IA expérimentale qui se crée et priorise des tâches pour atteindre un objectif.
C’est une IA agentique simple, peu multimodale.
Peut comprendre texte/images, planifier, utiliser des outils (navigation, calcul, fichiers) et ajuster ses actions.
C’est multimodale + agentique sous contrôle humain.
Voient, se déplacent, prennent des décisions et exécutent des tâches.
C’est une IA multimodale et agentique incarnée.
Utilise caméras (vision), capteurs et IA pour percevoir et agir en temps réel.
C’est multimodale + agentique dans le monde physique.
Analyse documents, emails, réunions, puis agit dans les logiciels (Word, Excel, Outlook).
C’est une IA agentique en environnement réel, multimodale limitée.
Voici une vidéo pour approfondir le sujet :