Aller au contenu

Intelligence Artificielle 2021 — DALL-E, Copilot et la Multimodalité

  • par
Regard Watshmi

2021 marque l’extension de l’IA générative au-delà du texte. OpenAI publie DALL-E (génération d’images à partir de texte) et CLIP, ouvrant la voie à la multimodalité. GitHub Copilot, basé sur Codex dérivé de GPT-3, entre en bêta et devient le premier cas d’usage professionnel massif de l’IA générative. La Commission Européenne publie sa première proposition de règlement sur l’IA (AI Act). Les NFT et le métaverse capturent l’attention médiatique mais détournent la discussion des avancées réelles en LLM.

Chronologie 2021

Janvier OpenAI publie DALL-E et CLIP : génération image depuis texte
Février Google publie Switch Transformer (1.6T paramètres, sparse)
Mars EleutherAI publie GPT-Neo, premier LLM open-source significatif
Avril Hugging Face : l’écosystème open source IA s’organise
Mai GitHub Copilot en : IA dans l’IDE
Juin Commission Européenne publie la proposition AI Act
Juillet OpenAI publie Codex (GPT-3 fine-tuné sur code)
Août DeepMind publie AlphaFold DB : 350 000 structures protéiques disponibles
Septembre GitHub Copilot : débat sur droits d’auteur des suggestions de code
Octobre Meta publie ESMFold pour protéines, Facebook rebrand Meta + métaverse
Novembre DeepMind publie Gopher (280B params)
Décembre Google Brain publie GLaM (: article sur efficacité énergétique

Modèles sortis en 2021

Modèle Organisation Date Particularité
DALL-E v1 OpenAI Janvier 2021 Texte-vers-image
CLIP OpenAI Janvier 2021 Vision-langage
Codex OpenAI Juillet 2021 Coding
Gopher DeepMind Novembre 2021 280B paramètres
GPT-Neo EleutherAI 2021 Open source
GLaM Google Décembre 2021 Sparse MoE

Régulations et débats

Proposition AI Act Europe, droits d’auteur du code généré par Copilot, biais dans la génération d’images, concentration des capacités frontier IA, impact environnemental des grands modèles.

Ce que ça a changé

L’IA générative sort du laboratoire pour entrer dans les outils professionnels (Copilot). La multimodalité devient un objectif de recherche central. L’Europe prend les devants réglementaires.

Regard Watshmi

2021 est l’année où l’IA a commencé à toucher les flux de travail quotidiens des développeurs. Le signal : la génération de code par IA était viable. Le bruit : le métaverse et les NFT ont aspiré l’attention médiatique d’une percée , la multimodalité. Copilot allait changer le développement logiciel plus profondément que tout ce qui a été annoncé avec fanfare cette année-là.

Ce que ça a changé concrètement pour vous

En 2021, les outils IA ont commencé à entrer dans les environnements professionnels réels. GitHub Copilot a transformé le quotidien des développeurs, réduisant le temps de codage répétitif de façon mesurable. DALL·E a montré que la génération d’images par description textuelle était crédible. Pour les équipes marketing et design, de nouveaux usages ont émergé : illustration, prototypage visuel, variation de contenu. Les directions IT ont commencé à évaluer sérieusement les fournisseurs d’IA. Pour les métiers du savoir, 2021 marque le passage de la démo à l’usage opérationnel, posant la question concrète : comment intégrer ces outils sans déstabiliser les équipes existantes ?

Pour comprendre le contexte technique de cette période :

Formation IA gratuite → Ressources gratuites →

Sources : OpenAI Blog · DeepMind Research · ArXiv · Nature Machine Intelligence · The Verge · TechCrunch · Commission Européenne