Cette cartographie n’est pas un comparatif marketing. C’est un outil d’aide au choix responsable : pour chaque catégorie d’IA, nous indiquons les usages adaptés, les risques principaux et le niveau de supervision humaine recommandé.
Mise à jour prévue tous les 3 à 6 mois. v1.0 — Mars 2026
Niveaux de supervision : Faible = vérification recommandée / Moyenne = relecture humaine nécessaire / Élevée = validation experte requise / Totale = validation humaine obligatoire avant toute diffusion ou action externe.
Cadre méthodologique
- Critères d’évaluation : documentation officielle des éditeurs, usages déclarés, risques structurels identifiés.
- Logique de supervision : basée sur le niveau d’impact potentiel, la réversibilité des actions et le cadre réglementaire applicable.
- Aucun score commercial : aucun modèle n’est classé ou noté. Aucun lien affilié sur cette page.
- Mise à jour semestrielle : révision prévue tous les 6 mois. Version et date visibles en haut de page.
LLM — Grands modèles de langage
Modèles développés pour analyser et générer du langage naturel à partir de vastes corpus textuels.
| Modèle | Éditeur | Type | Spécialité dominante | Usage adapté | Risque principal | Supervision recommandée |
|---|---|---|---|---|---|---|
| GPT-4o | OpenAI | Propriétaire | Polyvalent, multimodal | Rédaction, code, analyse, image | Hallucinations, dépendance API | Moyenne |
| Claude 3.7 Sonnet | Anthropic | Propriétaire | Raisonnement, instructions longues | Analyse documentaire, code, éthique | Refus de tâches légitimes | Moyenne |
| Gemini 2.0 Flash | Google DeepMind | Propriétaire | Intégration écosystème Google | Productivité, recherche, G Workspace | Dépendance à l’écosystème Google | Moyenne |
| Mistral Large 2 | Mistral AI | Hybride | Multilangue, efficacité européenne | Entreprise, RGPD, déploiement EU | Couverture corpus plus restreinte | Moyenne |
| DeepSeek R1 | DeepSeek | Open-source | Raisonnement mathématique, code | Maths, science, analyse logique | Données hébergées hors UE (Chine) | Élevée |
| Grok 3 | xAI | Propriétaire | Accès temps réel à X/Twitter | Actualité, veille, sujets récents | Biais éditorial lié à la plateforme | Élevée |
| Perplexity | Perplexity AI | Propriétaire | Recherche web augmentée avec sources | Fact-checking, veille, questions factuelles | Qualité variable des sources citées | Élevée |
| Kimi k1.5 | Moonshot AI | Propriétaire | Contexte très long (1M tokens) | Analyse de longs documents, corpus | Données hébergées hors UE (Chine) | Élevée |
| LLaMA 3.3 70B | Meta | Open-source | Déployable localement, personnalisable | Fine-tuning, usage local, souveraineté | Risque de mauvais déploiement non filtré | Élevée |
| Command R+ | Cohere | Hybride | RAG et usage entreprise structuré | Recherche documentaire, bases de données | Dépendance infrastructure cloud | Moyenne |
Propriétaire : accès via API ou interface, code source non public. Open-source : poids du modèle accessibles, modèle économique via services cloud ou support entreprise. Hybride : version open disponible, offre commerciale distincte.
IA Multimodales — Vision, image, vidéo
Modèles capables de traiter et/ou générer des contenus visuels (images, vidéos) seuls ou en combinaison avec du texte.
| Modèle | Éditeur | Type | Spécialité dominante | Usage adapté | Risque principal | Supervision recommandée |
|---|---|---|---|---|---|---|
| GPT-4o Vision | OpenAI | Propriétaire | Analyse et description d’image | Lecture documents, interprétation visuelle | Hallucinations sur détails visuels | Élevée |
| Gemini 2.0 Vision | Google DeepMind | Propriétaire | Multimodal natif texte+image+audio | Analyse de schémas, OCR, documents mixtes | Erreurs d’interprétation contextuelles | Élevée |
| Claude 3.7 Vision | Anthropic | Propriétaire | Analyse UI, diagrammes, screenshots | Revue d’interface, code visuel, maquettes | Confiance excessive sur contenu ambigu | Élevée |
| Midjourney v6.1 | Midjourney Inc. | Propriétaire | Génération d’images artistiques | Illustration, concept art, moodboard | Droits d’auteur, réutilisation styles | Totale |
| DALL-E 3 | OpenAI | Propriétaire | Génération image fidèle au prompt texte | Illustration, support marketing, mockup | Contenu sensible, filtres parfois excessifs | Élevée |
| Stable Diffusion 3.5 | Stability AI | Open-source | Génération image locale, fine-tunable | Déploiement local, usage personnalisé | Contenu non filtré si mal configuré | Totale |
| Runway Gen-3 Alpha | Runway | Propriétaire | Génération vidéo courte haute qualité | Vidéo créative, animation, transitions | Production de deepfakes, faux contexte | Totale |
| Sora | OpenAI | Propriétaire | Vidéo longue réaliste à partir de texte | Production créative, prototypage vidéo | Désinformation visuelle, deepfakes | Totale |
| Kling 1.6 | Kuaishou | Propriétaire | Vidéo IA style cinématographique | Contenu vidéo, storytelling visuel | Données hébergées hors UE (Chine) | Totale |
| Flux.1 | Black Forest Labs | Open-source | Génération image haute résolution rapide | Photographie IA, design produit, mockup | Droits d’auteur, usage non encadré | Élevée |
Supervision “Totale” : tout contenu généré doit être validé humainement avant toute diffusion, en raison des risques élevés de deepfakes ou de violation de droits.
IA Audio et voix
Modèles de transcription, synthèse vocale, clonage de voix et génération musicale.
| Modèle | Éditeur | Type | Spécialité dominante | Usage adapté | Risque principal | Supervision recommandée |
|---|---|---|---|---|---|---|
| Whisper v3 | OpenAI | Open-source | Transcription automatique multilingue | Sous-titrage, STT, archives audio | Erreurs sur accents et langues rares | Moyenne |
| ElevenLabs | ElevenLabs | Propriétaire | Clonage et synthèse vocale réaliste | Audiobooks, doublage, voix off | Usurpation d’identité vocale (deepfake audio) | Totale |
| Suno v4 | Suno AI | Propriétaire | Génération musicale complète (paroles+son) | Jingles, démo musicale, création rapide | Droits d’auteur, styles protégés | Totale |
| Udio | Udio AI | Propriétaire | Génération musicale multi-styles | Production musicale, prototypage | Droits musicaux, plagiat involontaire | Totale |
| Mubert | Mubert | Propriétaire | Musique générative temps réel | Fond sonore, streaming, ambiance | Originalité limitée, style répétitif | Faible |
| Adobe Podcast Enhance | Adobe | Propriétaire | Amélioration qualité audio par IA | Podcasting, visioconférence, voix pro | Artefacts sur voix très dégradées | Faible |
| Descript | Descript | Propriétaire | Édition audio/vidéo par transcription | Podcast, montage, suppression de mots | Erreurs de transcription dans l’édition | Moyenne |
| NotebookLM Audio | Propriétaire | Génération de podcast IA depuis documents | Formation, veille, synthèse audio | Simplification excessive du contenu source | Élevée | |
| Kokoro TTS | Hexgrad | Open-source | Synthèse vocale légère déployable en local | Applications embarquées, TTS local | Voix moins naturelle que solutions cloud | Faible |
| Bark | Suno / HuggingFace | Open-source | Synthèse vocale expressive et bruitages | Prototypage, voix avec émotion, effets | Qualité variable, lent sans GPU | Moyenne |
La supervision “Totale” sur les outils de clonage vocal et génération musicale reflète les risques juridiques (droits voisins, usurpation d’identité) et éthiques associés à ces technologies.
Agents autonomes
Systèmes capables d’exécuter des séquences de tâches de façon autonome, avec ou sans intervention humaine intermédiaire.
| Modèle | Éditeur | Type | Spécialité dominante | Usage adapté | Risque principal | Action externe | Supervision recommandée |
|---|---|---|---|---|---|---|---|
| AutoGPT | Significant Gravitas | Open-source | Enchaînement autonome de tâches LLM | Tests, automatisation expérimentale | Erreurs en cascade, boucles infinies | Oui | Totale |
| Devin | Cognition AI | Propriétaire | Développement logiciel autonome de bout en bout | Code complet, debugging, PR GitHub | Erreurs silencieuses en prod, sécurité code | Oui | Élevée |
| Claude Computer Use | Anthropic | Propriétaire | Contrôle d’interface graphique (souris/clavier) | Automatisation bureau, tests UI | Accès non contrôlé au système | Oui | Totale |
| Microsoft Copilot Agents | Microsoft | Propriétaire | Agents intégrés dans l’écosystème M365 | Productivité entreprise, workflows Office | Fuites de données internes, autorisations | Partielle | Élevée |
| Google Agentspace | Google Cloud | Propriétaire | Agents d’entreprise multimodaux sur GCP | Workflows, recherche interne, data | Confidentialité données, lock-in cloud | Partielle | Élevée |
| Manus | Manus AI | Propriétaire | Agent autonome web + code + fichiers | Recherche, automatisation multi-étapes | Supervision difficile, actions irréversibles | Oui | Totale |
| LangGraph | LangChain Inc. | Open-source | Framework agents LLM stateful | Développement d’agents custom, RAG avancé | Complexité de déploiement et débogage | Partielle | Élevée |
| CrewAI | CrewAI | Open-source | Coordination multi-agents collaboratifs | Pipelines complexes, division de tâches | Erreurs de coordination inter-agents | Partielle | Élevée |
| n8n AI Agents | n8n GmbH | Open-source | Automatisation no-code avec IA intégrée | Intégrations API, workflows métier | Configuration incorrecte, accès non bornés | Oui | Élevée |
| Vertex AI Agent Builder | Google Cloud | Propriétaire | Agents RAG sur données cloud entreprise | Bases documentaires, APIs internes | Coûts d’usage, dépendance GCP | Partielle | Élevée |
“Action externe” = capacité de l’agent à interagir avec des systèmes tiers (web, fichiers, APIs, interfaces graphiques) sans validation humaine à chaque étape.
IA Spécialisées par domaine
Modèles ou plateformes entraînés ou fine-tunés pour un domaine métier spécifique, avec des données et contraintes propres à ce secteur.
| Modèle | Éditeur | Domaine | Usage adapté | Risque principal | Supervision recommandée |
|---|---|---|---|---|---|
| Harvey | Harvey AI | Juridique | Recherche jurisprudence, rédaction contrats | Erreurs légales non détectées, hallucinations juridiques | Totale |
| Med-PaLM 2 | Google Health | Médical | Questions cliniques, aide au diagnostic | Erreurs diagnostiques, responsabilité médicale | Totale |
| BloombergGPT | Bloomberg | Finance | Analyse financière, NLP sur données marché | Données obsolètes, décisions d’investissement automatisées | Élevée |
| GitHub Copilot | Microsoft / GitHub | Code | Complétion, refactoring, génération de tests | Code vulnérable généré, dépendances non vérifiées | Élevée |
| Eightfold AI | Eightfold | Ressources humaines | Matching compétences, tri de candidatures | Biais algorithmique, discrimination indirecte | Totale |
| Jasper AI | Jasper | Marketing | Rédaction publicitaire, SEO, emails | Contenu générique, ton non adapté à la marque | Moyenne |
| AlphaFold 3 | Google DeepMind | Science / Biologie | Prédiction structure protéines et molécules | Mauvaise interprétation des résultats hors spécialité | Élevée |
| Khanmigo | Khan Academy | Éducation | Tutorat personnalisé, aide aux devoirs | Dépendance outil, réponses directes sans apprentissage | Moyenne |
| Darktrace | Darktrace | Cybersécurité | Détection d’anomalies réseau en temps réel | Faux positifs, fatigue d’alerte, sur-confiance | Élevée |
| Elicit | Ought | Recherche académique | Synthèse de littérature scientifique, extraction de données d’études | Résumés inexacts, sélection biaisée de sources | Élevée |
Les IA spécialisées en médecine, droit et RH sont soumises à des cadres réglementaires stricts (EU AI Act Art. 6, RGPD). Leur usage en production nécessite une validation humaine systématique.
- Nature probabiliste — Un LLM génère la suite statistiquement la plus probable d’un texte. Il ne raisonne pas au sens formel du terme : chaque réponse est une inférence, non une déduction certaine.
- Hallucination possible — Un modèle peut produire des informations factuellement incorrectes avec un niveau de confiance apparent élevé. Ce phénomène est inhérent à l’architecture, non un bug corrigeable à court terme.
- Sensibilité au framing — La formulation de la question influence significativement la réponse. Un même sujet posé différemment peut produire des réponses contradictoires (effet miroir prédictif).
- Pas de compréhension consciente — Les LLM traitent des patterns de tokens. Ils ne “comprennent” pas le sens au sens cognitif : ils associent des séquences selon leur distribution d’entraînement.
- Contexte limité — Même avec des fenêtres de contexte longues (jusqu’à 1M tokens), la cohérence et la précision se dégradent sur de très longs documents ou conversations complexes.
- Données d’entraînement figées — La connaissance d’un modèle s’arrête à sa date de coupure. Sans accès web ou RAG, il ne connaît pas les événements récents ni les mises à jour réglementaires.
- Pas de validation automatique — Un LLM ne vérifie pas ses propres affirmations. Il est incapable de distinguer ce qu’il “sait” de ce qu’il “invente” sans mécanisme externe de vérification des faits.
