Cartographie des Outils IA

🗺️ Sommaire

📝 LLM
🖼️ Multimodales
🎙️ Audio / Voix
🤖 Agents autonomes
🔬 Spécialisées

Cette cartographie n’est pas un comparatif marketing. C’est un outil d’aide au choix responsable : pour chaque catégorie d’IA, nous indiquons les usages adaptés, les risques principaux et le niveau de supervision humaine recommandé.

Mise à jour prévue tous les 3 à 6 mois. v1.0 — Mars 2026

Niveaux de supervision : Faible = vérification recommandée / Moyenne = relecture humaine nécessaire / Élevée = validation experte requise / Totale = validation humaine obligatoire avant toute diffusion ou action externe.

Cadre méthodologique

Critères d’évaluation : documentation officielle des éditeurs, usages déclarés, risques structurels identifiés.
Logique de supervision : basée sur le niveau d’impact potentiel, la réversibilité des actions et le cadre réglementaire applicable.
Aucun score commercial : aucun modèle n’est classé ou noté. Aucun lien affilié sur cette page.
Mise à jour semestrielle : révision prévue tous les 6 mois. Version et date visibles en haut de page.

Tableau 1

LLM — Grands modèles de langage

Modèles développés pour analyser et générer du langage naturel à partir de vastes corpus textuels.

Modèle	Éditeur	Type	Spécialité dominante	Usage adapté	Risque principal	Supervision recommandée
GPT-4o	OpenAI	Propriétaire	Polyvalent, multimodal	Rédaction, code, analyse, image	Hallucinations, dépendance API	Moyenne
Claude 3.7 Sonnet	Anthropic	Propriétaire	Raisonnement, instructions longues	Analyse documentaire, code, éthique	Refus de tâches légitimes	Moyenne
Gemini 2.0 Flash	Google DeepMind	Propriétaire	Intégration écosystème Google	Productivité, recherche, G Workspace	Dépendance à l’écosystème Google	Moyenne
Mistral Large 2	Mistral AI	Hybride	Multilangue, efficacité européenne	Entreprise, RGPD, déploiement EU	Couverture corpus plus restreinte	Moyenne
DeepSeek R1	DeepSeek	Open-source	Raisonnement mathématique, code	Maths, science, analyse logique	Données hébergées hors UE (Chine)	Élevée
Grok 3	xAI	Propriétaire	Accès temps réel à X/Twitter	Actualité, veille, sujets récents	Biais éditorial lié à la plateforme	Élevée
Perplexity	Perplexity AI	Propriétaire	Recherche web augmentée avec sources	Fact-checking, veille, questions factuelles	Qualité variable des sources citées	Élevée
Kimi k1.5	Moonshot AI	Propriétaire	Contexte très long (1M tokens)	Analyse de longs documents, corpus	Données hébergées hors UE (Chine)	Élevée
LLaMA 3.3 70B	Meta	Open-source	Déployable localement, personnalisable	Fine-tuning, usage local, souveraineté	Risque de mauvais déploiement non filtré	Élevée
Command R+	Cohere	Hybride	RAG et usage entreprise structuré	Recherche documentaire, bases de données	Dépendance infrastructure cloud	Moyenne

Propriétaire : accès via API ou interface, code source non public. Open-source : poids du modèle accessibles, modèle économique via services cloud ou support entreprise. Hybride : version open disponible, offre commerciale distincte.

Tableau 2

IA Multimodales — Vision, image, vidéo

Modèles capables de traiter et/ou générer des contenus visuels (images, vidéos) seuls ou en combinaison avec du texte.

Modèle	Éditeur	Type	Spécialité dominante	Usage adapté	Risque principal	Supervision recommandée
GPT-4o Vision	OpenAI	Propriétaire	Analyse et description d’image	Lecture documents, interprétation visuelle	Hallucinations sur détails visuels	Élevée
Gemini 2.0 Vision	Google DeepMind	Propriétaire	Multimodal natif texte+image+audio	Analyse de schémas, OCR, documents mixtes	Erreurs d’interprétation contextuelles	Élevée
Claude 3.7 Vision	Anthropic	Propriétaire	Analyse UI, diagrammes, screenshots	Revue d’interface, code visuel, maquettes	Confiance excessive sur contenu ambigu	Élevée
Midjourney v6.1	Midjourney Inc.	Propriétaire	Génération d’images artistiques	Illustration, concept art, moodboard	Droits d’auteur, réutilisation styles	Totale
DALL-E 3	OpenAI	Propriétaire	Génération image fidèle au prompt texte	Illustration, support marketing, mockup	Contenu sensible, filtres parfois excessifs	Élevée
Stable Diffusion 3.5	Stability AI	Open-source	Génération image locale, fine-tunable	Déploiement local, usage personnalisé	Contenu non filtré si mal configuré	Totale
Runway Gen-3 Alpha	Runway	Propriétaire	Génération vidéo courte haute qualité	Vidéo créative, animation, transitions	Production de deepfakes, faux contexte	Totale
Sora	OpenAI	Propriétaire	Vidéo longue réaliste à partir de texte	Production créative, prototypage vidéo	Désinformation visuelle, deepfakes	Totale
Kling 1.6	Kuaishou	Propriétaire	Vidéo IA style cinématographique	Contenu vidéo, storytelling visuel	Données hébergées hors UE (Chine)	Totale
Flux.1	Black Forest Labs	Open-source	Génération image haute résolution rapide	Photographie IA, design produit, mockup	Droits d’auteur, usage non encadré	Élevée

Supervision “Totale” : tout contenu généré doit être validé humainement avant toute diffusion, en raison des risques élevés de deepfakes ou de violation de droits.

Tableau 3

IA Audio et voix

Modèles de transcription, synthèse vocale, clonage de voix et génération musicale.

Modèle	Éditeur	Type	Spécialité dominante	Usage adapté	Risque principal	Supervision recommandée
Whisper v3	OpenAI	Open-source	Transcription automatique multilingue	Sous-titrage, STT, archives audio	Erreurs sur accents et langues rares	Moyenne
ElevenLabs	ElevenLabs	Propriétaire	Clonage et synthèse vocale réaliste	Audiobooks, doublage, voix off	Usurpation d’identité vocale (deepfake audio)	Totale
Suno v4	Suno AI	Propriétaire	Génération musicale complète (paroles+son)	Jingles, démo musicale, création rapide	Droits d’auteur, styles protégés	Totale
Udio	Udio AI	Propriétaire	Génération musicale multi-styles	Production musicale, prototypage	Droits musicaux, plagiat involontaire	Totale
Mubert	Mubert	Propriétaire	Musique générative temps réel	Fond sonore, streaming, ambiance	Originalité limitée, style répétitif	Faible
Adobe Podcast Enhance	Adobe	Propriétaire	Amélioration qualité audio par IA	Podcasting, visioconférence, voix pro	Artefacts sur voix très dégradées	Faible
Descript	Descript	Propriétaire	Édition audio/vidéo par transcription	Podcast, montage, suppression de mots	Erreurs de transcription dans l’édition	Moyenne
NotebookLM Audio	Google	Propriétaire	Génération de podcast IA depuis documents	Formation, veille, synthèse audio	Simplification excessive du contenu source	Élevée
Kokoro TTS	Hexgrad	Open-source	Synthèse vocale légère déployable en local	Applications embarquées, TTS local	Voix moins naturelle que solutions cloud	Faible
Bark	Suno / HuggingFace	Open-source	Synthèse vocale expressive et bruitages	Prototypage, voix avec émotion, effets	Qualité variable, lent sans GPU	Moyenne

La supervision “Totale” sur les outils de clonage vocal et génération musicale reflète les risques juridiques (droits voisins, usurpation d’identité) et éthiques associés à ces technologies.

Tableau 4

Agents autonomes

Systèmes capables d’exécuter des séquences de tâches de façon autonome, avec ou sans intervention humaine intermédiaire.

Modèle	Éditeur	Type	Spécialité dominante	Usage adapté	Risque principal	Action externe	Supervision recommandée
AutoGPT	Significant Gravitas	Open-source	Enchaînement autonome de tâches LLM	Tests, automatisation expérimentale	Erreurs en cascade, boucles infinies	Oui	Totale
Devin	Cognition AI	Propriétaire	Développement logiciel autonome de bout en bout	Code complet, debugging, PR GitHub	Erreurs silencieuses en prod, sécurité code	Oui	Élevée
Claude Computer Use	Anthropic	Propriétaire	Contrôle d’interface graphique (souris/clavier)	Automatisation bureau, tests UI	Accès non contrôlé au système	Oui	Totale
Microsoft Copilot Agents	Microsoft	Propriétaire	Agents intégrés dans l’écosystème M365	Productivité entreprise, workflows Office	Fuites de données internes, autorisations	Partielle	Élevée
Google Agentspace	Google Cloud	Propriétaire	Agents d’entreprise multimodaux sur GCP	Workflows, recherche interne, data	Confidentialité données, lock-in cloud	Partielle	Élevée
Manus	Manus AI	Propriétaire	Agent autonome web + code + fichiers	Recherche, automatisation multi-étapes	Supervision difficile, actions irréversibles	Oui	Totale
LangGraph	LangChain Inc.	Open-source	Framework agents LLM stateful	Développement d’agents custom, RAG avancé	Complexité de déploiement et débogage	Partielle	Élevée
CrewAI	CrewAI	Open-source	Coordination multi-agents collaboratifs	Pipelines complexes, division de tâches	Erreurs de coordination inter-agents	Partielle	Élevée
n8n AI Agents	n8n GmbH	Open-source	Automatisation no-code avec IA intégrée	Intégrations API, workflows métier	Configuration incorrecte, accès non bornés	Oui	Élevée
Vertex AI Agent Builder	Google Cloud	Propriétaire	Agents RAG sur données cloud entreprise	Bases documentaires, APIs internes	Coûts d’usage, dépendance GCP	Partielle	Élevée

“Action externe” = capacité de l’agent à interagir avec des systèmes tiers (web, fichiers, APIs, interfaces graphiques) sans validation humaine à chaque étape.

Tableau 5

IA Spécialisées par domaine

Modèles ou plateformes entraînés ou fine-tunés pour un domaine métier spécifique, avec des données et contraintes propres à ce secteur.

Modèle	Éditeur	Domaine	Usage adapté	Risque principal	Supervision recommandée
Harvey	Harvey AI	Juridique	Recherche jurisprudence, rédaction contrats	Erreurs légales non détectées, hallucinations juridiques	Totale
Med-PaLM 2	Google Health	Médical	Questions cliniques, aide au diagnostic	Erreurs diagnostiques, responsabilité médicale	Totale
BloombergGPT	Bloomberg	Finance	Analyse financière, NLP sur données marché	Données obsolètes, décisions d’investissement automatisées	Élevée
GitHub Copilot	Microsoft / GitHub	Code	Complétion, refactoring, génération de tests	Code vulnérable généré, dépendances non vérifiées	Élevée
Eightfold AI	Eightfold	Ressources humaines	Matching compétences, tri de candidatures	Biais algorithmique, discrimination indirecte	Totale
Jasper AI	Jasper	Marketing	Rédaction publicitaire, SEO, emails	Contenu générique, ton non adapté à la marque	Moyenne
AlphaFold 3	Google DeepMind	Science / Biologie	Prédiction structure protéines et molécules	Mauvaise interprétation des résultats hors spécialité	Élevée
Khanmigo	Khan Academy	Éducation	Tutorat personnalisé, aide aux devoirs	Dépendance outil, réponses directes sans apprentissage	Moyenne
Darktrace	Darktrace	Cybersécurité	Détection d’anomalies réseau en temps réel	Faux positifs, fatigue d’alerte, sur-confiance	Élevée
Elicit	Ought	Recherche académique	Synthèse de littérature scientifique, extraction de données d’études	Résumés inexacts, sélection biaisée de sources	Élevée

Les IA spécialisées en médecine, droit et RH sont soumises à des cadres réglementaires stricts (EU AI Act Art. 6, RGPD). Leur usage en production nécessite une validation humaine systématique.

Limites structurelles communes à tous les LLM

Nature probabiliste — Un LLM génère la suite statistiquement la plus probable d’un texte. Il ne raisonne pas au sens formel du terme : chaque réponse est une inférence, non une déduction certaine.
Hallucination possible — Un modèle peut produire des informations factuellement incorrectes avec un niveau de confiance apparent élevé. Ce phénomène est inhérent à l’architecture, non un bug corrigeable à court terme.
Sensibilité au framing — La formulation de la question influence significativement la réponse. Un même sujet posé différemment peut produire des réponses contradictoires (effet miroir prédictif).
Pas de compréhension consciente — Les LLM traitent des patterns de tokens. Ils ne “comprennent” pas le sens au sens cognitif : ils associent des séquences selon leur distribution d’entraînement.
Contexte limité — Même avec des fenêtres de contexte longues (jusqu’à 1M tokens), la cohérence et la précision se dégradent sur de très longs documents ou conversations complexes.
Données d’entraînement figées — La connaissance d’un modèle s’arrête à sa date de coupure. Sans accès web ou RAG, il ne connaît pas les événements récents ni les mises à jour réglementaires.
Pas de validation automatique — Un LLM ne vérifie pas ses propres affirmations. Il est incapable de distinguer ce qu’il “sait” de ce qu’il “invente” sans mécanisme externe de vérification des faits.

Cartographie des IA