NL2SQL
NL2SQL Expliqué : Ce que c'est, pourquoi cela a échoué et comment cela est en train d'être réinventé
Date
18 juil. 2025
Auteur
David Alinat
Ventes : “Quels produits ont rapporté le plus de revenus ce trimestre ?”
Marketing : “Quel est le taux de conversion de l'inscription à l'achat cette semaine ?”
Logistique : “Quels fournisseurs ont livré des expéditions en retard le mois dernier ?”
Ressources humaines : “Quel est le salaire moyen par département ?”
Finances : “Quel est le montant impayé des factures ?”
Si vous travaillez dans l'un de ces rôles, vous avez entendu une variation d'au moins une de ces questions ; bien plus de fois que vous ne pouvez le compter, et probablement plus souvent que vous ne le souhaiteriez.
Mais si vous travaillez dans les données, vous les avez toutes entendues ; chaque variation, des milliers de fois, jour après jour.
Les effets secondaires incluent : entendre vos collègues dans vos cauchemars.
Maintenant, imaginez si vous pouviez simplement demander directement à votre base de données, comme si elle était un ami ?
Un ami sur lequel vous pouvez compter parce qu'il est (agaçant) intelligent, ne ment jamais et garde toujours vos secrets en sécurité.
L'essor (et la chute) du NL2SQL
Le traitement du langage naturel ou NLP (la science qui consiste à faire parler les ordinateurs) s'est considérablement amélioré ces dernières années.
La technologie LLM comme ChatGPT, Claude, Gemini sont des exemples évidents.
Mais il y a aussi des cas d'utilisation très spécifiques où le NLP a été appliqué, roulement de tambour s'il vous plaît…
… pour écrire de bons vieux SQL traditionnels.
Et c'est ainsi que le NL2SQL est né.
Lorsque les premiers outils sont sortis, le NL2SQL était le fils prodigue de l'analyse de données.
Le "El Dorado" du BI avec une promesse en or :
Obtenir des réponses basées sur les données aux questions d'analytique commerciale, aussi rapidement et facilement que de parler. Pas de SQL requis.
En théorie, en traduisant le langage courant en requêtes SQL structurées ; le NL2SQL donne soudainement à tout le monde (marketeurs, analystes commerciaux, ventes, ressources humaines, finances) un accès direct pour interagir avec les bases de données, explorer les données et obtenir des insights.
Même en tant qu'analyste de données ou personne familière avec le SQL, cela :
Vous libère du besoin d'écrire manuellement des requêtes SQL
Vous permet de vous concentrer sur une analyse stratégique de haut niveau
Supprime les frictions pour une analyse approfondie et itérative
Avec le NL2SQL, vous pourriez simplement penser :
“Je me demande quelles campagnes marketing ont entraîné le plus d'inscriptions qui sont ensuite devenues des clients payants dans les 30 jours ?"
Et au lieu d'avoir à faire une séquence complexe de plusieurs requêtes SQL qui prennent des jours à écrire et qui ressemblent à traîner votre cerveau dans le sable, vous obtiendrez simplement une réponse.
C'était la théorie en tout cas.
Limitations du NL2SQL dans l'analyse de données du monde réel
Il est facile de voir pourquoi le NL2SQL semble génial sur le papier. Le problème est que les versions originales de la technologie n'étaient pas capables d'apporter dans des situations réelles.
Schemas de données
Tout d'abord, la plupart des entreprises (même les géants corporatifs de plusieurs milliards de dollars) ont des environnements de données plus chaotiques qu'elles ne voudraient l'admettre. Des schémas de données bien structurés sont rares, et les entreprises modernes peuvent avoir des centaines, voire des milliers de tables, réparties sur plusieurs bases de données.
Ainsi, lorsque un utilisateur demande des “affaires d'entreprise du T1”, comment un IA NL2SQL est censé savoir quels ensembles de données sont pertinents ou non ?
Contexte & Ambiguïté
Le deuxième problème est que les utilisateurs - en particulier les utilisateurs non techniques - posent souvent des questions ambiguës. Demander des “clients principaux” peut signifier beaucoup de choses différentes.
Est-ce combien ils ont dépensé ? Combien de commandes ils ont passées ? Leur valeur à vie ?
Sans clarté ou contexte, l'IA peut générer SQL qui ne comprend pas la question ou les résultats attendus.
NL2SQL en une seule fois
Enfin, les outils de première génération NL2SQL ne fournissaient qu'une traduction en une seule fois.
Question entrée -> requête SQL sortie -> Résultats
Aucune nuance. Aucune question de suivi. Pas de creuser plus profondément.
Cela a aidé à gagner du temps, mais ce n'était pas la véritable “conversation de style chatbot avec vos données” que les analystes attendaient. Gardez à l'esprit que tout cela se produisait alors que nous découvrions des LLM comme ChatGPT, Claude et Gemini - donc il y avait un décalage clair.
Agents IA NL2SQL : L'avenir de l'analytique commerciale
Si vous craigniez que nous vous donnions une liste de problèmes et que vous laissiez tomber, j'ai de bonnes nouvelles.
Il y a une solution : Un agent IA pour l'analyse de données.
Une nouvelle ère dans les copilotes NL2SQL qui comprend la nuance, raisonne comme un humain et s'adapte aux réalités des données commerciales.
Avec ces nouveaux agents de données de génération, vous pourriez simplement penser :
“Je me demande quelles campagnes marketing ont entraîné le plus d'inscriptions qui sont ensuite devenues des clients payants dans les 30 jours ?"
Et au lieu d'avoir à faire une séquence complexe de plusieurs requêtes SQL qui prennent des jours à écrire et qui ressemblent à traîner votre cerveau dans le sable, vous obtiendriez juste une réponse.

En termes plus techniques pour les analystes de données, les agents NL2SQL :
Comprennent véritablement le contexte commercial, les métadonnées et les couches sémantiques
Passent par des protocoles de validation des résultats avant de les rendre à l'utilisateur
Fournissent une justification de sortie et un accès entièrement auditable au flux de travail de l'IA
Comment Myriade améliore le NL2SQL
Au risque de sembler cliché, Myriade est un agent intelligent pour l'analyse de données, qui a été véritablement conçu par des analystes de données pour des analystes de données.
Nous avons construit le copilote que nous aurions toujours souhaité avoir.
Parce que les réponses dont vous avez besoin devraient être le strict minimum que vous attendez d'un copilote de données IA.
Myriade itère, affine, vérifie, et explique comme un agent IA devrait le faire… mais la puissance et la rapidité ne devraient pas se faire au détriment de la sécurité - et la commodité est toujours un plus.
C'est pourquoi Myriade a été conçu spécifiquement pour inclure :
Architecture sécure par conception (lecture seule, protection sans connaissance, zéro rétention de données…)
Explicabilité intégrée à chaque réponse
Intégration plug & play aux bases de données/lacs de données (<5 minutes)
Solutions open-source ou cloud optionnelles
Si vous êtes intéressé par un essai, il vous suffit de cliquer ici. C'est gratuit (pas de carte de crédit requise), et ça prend quelques minutes à configurer. Votre agent d'analyse de données pourrait être en marche avant que votre café ne devienne froid.