Les types d’intelligence artificielles (B) | Le site du cours d'informatique du CPES (Groupe A)

Qu’est-ce que l’Intelligence Artificielle ?
L’intelligence artificielle (IA) désigne l’ensemble des techniques permettant à des machines de simuler certaines capacités humaines comme l’apprentissage, la compréhension, la prise de décision ou la résolution de problèmes.
Aujourd’hui, l’IA est présente dans de nombreux domaines de notre quotidien : téléphones, transports, médecine, jeux vidéo ou encore Internet.

L’IA ne se limite pas aux IA génératives

L’IA ne se résume pas aux IA génératives ou aux grands modèles de langage. De nombreuses IA existent sans produire de texte, d’images ou de vidéos. Ces IA sont souvent invisibles mais essentielles au fonctionnement de nombreux systèmes.

Les IA en robotique permettent à des machines de percevoir leur environnement, de se déplacer et d’interagir avec des objets ou des humains.
Elles sont utilisées dans les robots industriels, les drones ou les robots médicaux.

Dans la logistique, l’IA sert à optimiser les itinéraires de livraison, gérer les stocks et anticiper la demande.
Elle permet de réduire les coûts, les délais et les erreurs humaines.

Les IA des jeux vidéo contrôlent le comportement des personnages non-joueurs (PNJ).
Elles adaptent leur stratégie en fonction des actions du joueur afin de rendre le jeu plus réaliste et immersif.

Ces IA analysent de grandes quantités de données pour détecter des tendances, faire des prédictions ou repérer des anomalies.
Elles sont très utilisées en finance, en santé et en cybersécurité.

👉 Une IA non-générative analyse, décide ou optimise.

_________________________________________________________________________

Qu’est-ce qu’une IA générative ?

Une IA générative est une intelligence artificielle capable de créer du contenu original à partir de données existantes.
Elle peut générer du texte, des images, des vidéos, du son ou du code informatique.

Contrairement aux IA classiques qui se contentent d’analyser ou de classer, les IA génératives produisent de nouvelles données.

Les IA génératives sont utilisées pour :

rédiger des textes ou répondre à des questions,
créer des images ou des œuvres artistiques,
générer des vidéos ou des animations,
aider à la programmation informatique,
produire des voix ou de la musique.

👉 Une IA générative crée du contenu nouveau.

Classification en 3 grandes catégories d’IA génératives

1️⃣ IA Génératives Textuelles

Ces IA produisent du texte : réponses, résumés, traductions, scripts, articles, dialogues…

Présentation

Elles reposent sur des modèles de langage capables de comprendre et générer des textes cohérents. Elles sont utilisées dans les chatbots, la rédaction de contenus, l’analyse de documents, etc.

✅ Avantages	❌ Inconvénients
Très polyvalentes (rédaction, code, explication…)	Possibilité d’erreurs factuelles (hallucinations)
Interaction naturelle en langage humain	Risque de produire des contenus biaisés
Très rapides pour traiter ou créer de grandes quantités de texte	Dépendent fortement des données d’entraînement
Capables de résumer ou expliquer des documents complexes	Peuvent manquer de créativité réelle dans certains cas

⭐ Principales IA / outils

ChatGPT (OpenAI)
Claude (Anthropic)
Gemini (Google)
LLaMA (Meta)
🇫🇷 Mistral
Perplexity AI
Outils rédactionnels (Jasper, Writer, Copy AI)

ChatGPT est une IA conversationnelle capable de comprendre et générer du texte.
Elle est utilisée pour répondre à des questions, rédiger des contenus, expliquer des notions, aider à programmer et analyser des documents.

Claude est une IA textuelle conçue pour être particulièrement fiable et sécurisée.
Elle est très performante pour la lecture de longs documents, les résumés et l’analyse approfondie de textes complexes.

Gemini est l’IA de Google spécialisée dans le raisonnement et le multimodal (texte, images, données).
Elle est intégrée à l’écosystème Google et efficace pour la recherche, l’analyse et la compréhension de contenus variés.

LLaMA est une famille de modèles de langage développée par Meta.
Elle est souvent utilisée dans des projets de recherche ou des applications open source, permettant aux développeurs de créer leurs propres IA.

Mistral est une IA européenne spécialisée dans les modèles de langage performants et légers.
Elle est appréciée pour sa rapidité, son efficacité et son orientation open source.

Perplexity AI combine recherche sur Internet et génération de texte.
Elle fournit des réponses synthétiques accompagnées de sources, ce qui la rend utile pour la veille et la recherche d’informations fiables.

Ces IA sont spécialisées dans la création de contenus marketing et professionnels.
Elles servent principalement à rédiger des articles, des publicités, des emails ou des publications pour les réseaux sociaux.

2️⃣ IA génératives visuelles

Ce type d’intelligence artificielle a pour but de créer, produire ou modifier des images/vidéos suite à une consigne formulée par un humain. Cette consigne est généralement écrite.

Présentation

Pour comprendre le principe des IA génératives visuelles, il faut rompre avec le principe de créativité et d’imagination dont sont dotés les êtres humains. Une IA créer des images ou des vidéos grâce à une régularité statistique. En fait, elle est « entrainée » sur une base de données à engranger des informations, et à les associer à des images ; c’est le principe « d’apprendre à voir ».

On lui donne plein de consignes comme « représente un chat noir », et on lui montre des images de chat noir. Petit à petit, l’IA va enregistrer que tel mot correspond à telle forme et sera de reproduire des images liées aux consignes demandées.

Le côté créatif que l’IA peut donner comme impression avec ses images, c’est simplement dû au fait qu’elle a enregistré plein d’images, de textures…et elle les combine différemment.

✅ Avantages	❌ Inconvénients
Création rapide et accessible puisqu’un simple texte suffit pour créer des images, même sans compétence artistique	On a parfois des problèmes quant a la fiabilité des images ou vidéos produites. Il peut y avoir des incohérences…
Ce type d’IA génère des images très variées, avec des styles différents.	Des questions éthiques peuvent se poser, surtout face aux droits d’auteurs : l’IA s’inspire tout de même du réel.
On a une démocratisation de la création d’images via l’IA. Ce n’est plus seulement réservé aux experts	Il y a un risque de « deepfake », ce qui peut contribuer à la mise en place de fake news. On peut avoir tendance à ne plus faire confiance aux IA visuelles
C’est également utile comme outil d’inspiration, pas seulement pour créer des images, mais pour donner des idées	Il y a donc un impact pour les métiers du visuel et les métiers créatifs. Les IA pourraient à terme les remplacer. C’est le cas de plus en plus dans les publicités télévisées.

⭐ Principales IA / outils

DALL·E
Midjourney
Stable Diffusion
Adobe Firefly
Canva (IA générative)
Runway

IA développée par OpenAI qui génère des images à partir de descriptions textuelles, capable de produire des images réalistes ou artistiques.

IA spécialisée dans la création d’images artistiques et stylisées, très utilisée par les designers et artistes numériques.

IA open source de génération d’images qui peut être utilisée localement et personnalisée selon les besoins des utilisateurs.

IA générative d’Adobe intégrée aux outils créatifs, conçue pour un usage professionnel et respectant les droits d’auteur.

Outils d’IA intégrés à Canva permettant de créer rapidement des visuels, illustrations et designs à partir de texte.

IA orientée vers la génération et l’édition d’images et de vidéos, très utilisée dans le cinéma et la création de contenus.

3️⃣ IA génératives multimodales et agentiques

Les IA génératives multimodales sont capable de produire et de réaliser des actions diverses, tandis que les IA agentiques savent prendre des décisions d’elles mêmes.

Présentation

Tentons de comprendre ce type d’IA isolément : pour l’intelligence artificielle multimodale, le fonctionnement est au sein du nom lui-même. « Modalité », c’est un type de donnée ; donc quand on parle de multimodalité, ça signifie que l’IA sait réaliser plusieurs actions. Cela peut prendre la forme de texte, d’images, d’audios, de vidéos, de codes… Aujourd’hui les IA que nous connaissons sont plutôt multimodales. Mais ça n’existe que depuis peu de temps, avant, il s’agissait plutôt d’IA monomodales.

Maintenant, intéressons nous aux IA agentiques. Pareil, il faut s’intéresser au nom pour en comprendre son rôle. Il s’agit d’une IA ayant le rôle d’un agent, c’est-à-dire qu’elle sait agir de elle-même. Au-delà de simplement répondre, elle agit aux demandes. Elle est capable de prendre des décisions, de réaliser des actions, d’utiliser des outils. Elle est donc un agent autonome avec généralement un objectif précis. On peut prendre comme exemple une IA planificatrice de voyage : elle sait planifier dans notre agenda, comparer les prix, chercher des vols…

La combinaison de ces deux types d’IA génératives peut être donc très puissante. Elle serait capable de répondre à diverses consignes/actions, tout en agissant avec des outils. Il existe des IA de ce type aujourd’hui comme les systèmes de maintenance industrielle (tel que WAKU, Intelligent maintenance system), capable d’observer par caméra, de consulter des documentations, diagnostiquer des problèmes, alerter en cas d’anomalies…

✅ Avantages	❌ Inconvénients
Elles assurent une meilleure compréhension des situations complexes, car elles savent s’adapter à de multiples types d’actions.	La fiabilité de ce type d’IA peut parfois être imparfaite. On ne peut donc pas toujours tout reposer sur une IA, il faut des hommes pour assurer
Dans le domaine de l’industrie et de la production, cela peut permettre aux entreprises de cibler des métiers sur des domaines importants et déléguer certaines missions à l’IA	Comme souvent pour l’IA, cela peut limiter des postes, notamment dans le cas de la surveillance ici.
Cela assure une IA utilisable tout le temps, notamment dans le domaine de la surveillance. C’est donc très utile.	Question de savoir à qui revient la responsabilité en cas d’erreur commise par l’IA
Ce type d’IA peut même permettre d’anticiper certaines actions ou certains risques en prévention : à chaque anomalie, l’homme est prévenu	Il y a également un risque en terme de cybersécurité, puisqu’on peut avoir affaire à des données biaisées

⭐ Principales IA / outils

ChatGPT (OpenAI)
BabyAGI
ChatGPT avec outils
Robots industriels autonomes (Boston Dynamics…)
Tesla FSD (Full Self-Driving)
Microsoft Copilot

Comprend et génère texte, images et audio dans une même conversation.

Elle est multimodale, mais pas autonome.

IA expérimentale qui se crée et priorise des tâches pour atteindre un objectif.
C’est une IA agentique simple, peu multimodale.

Peut comprendre texte/images, planifier, utiliser des outils (navigation, calcul, fichiers) et ajuster ses actions.
C’est multimodale + agentique sous contrôle humain.

Voient, se déplacent, prennent des décisions et exécutent des tâches.

C’est une IA multimodale et agentique incarnée.

Utilise caméras (vision), capteurs et IA pour percevoir et agir en temps réel.
C’est multimodale + agentique dans le monde physique.

Analyse documents, emails, réunions, puis agit dans les logiciels (Word, Excel, Outlook).
C’est une IA agentique en environnement réel, multimodale limitée.

Voici une vidéo pour approfondir le sujet :

Auteur / autrice

Voir toutes les publications