NL2SQL expliqué : ce que c'est, pourquoi cela n'a pas fonctionné, et comment cela est en train d'être réinventé
18 juil. 2025
7min read
Article
Ventes : « Quels produits ont généré le plus de revenus ce trimestre ? »
Marketing : « Quel est le taux de conversion de l'inscription à l'achat cette semaine ? »
Logistique : « Quels fournisseurs ont livré des expéditions en retard le mois dernier ? »
RH : « Quel est le salaire moyen par département ? »
Finance : « Quel est le montant restant des factures impayées ? »
Si vous travaillez dans l'un de ces rôles, vous avez certainement entendu une variation d'au moins une de ces questions ; bien plus de fois que vous ne pouvez le compter, et probablement plus souvent que vous ne le souhaiteriez.
Mais si vous travaillez dans les données, vous les avez toutes entendues ; chaque variation, des milliers de fois, jour après jour.
Les effets secondaires incluent : entendre vos collègues dans vos cauchemars.
Imaginez maintenant que vous puissiez simplement demander directement à votre base de données, comme si c'était un ami ?
Un ami sur lequel vous pouvez compter parce qu'il est (agaçant) intelligent, ne ment jamais et garde toujours vos secrets en sécurité.
L'essor (et la chute) de NL2SQL
Le traitement du langage naturel ou NLP (la science qui permet aux ordinateurs de communiquer) s'est considérablement amélioré ces dernières années.
La technologie LLM comme ChatGPT, Claude, Gemini en sont des exemples évidents.
Mais il existe également des cas d'utilisation très spécifiques où le NLP a été appliqué, tambours s'il vous plaît…
… pour écrire le bon vieux SQL traditionnel.
Et c'est ainsi que NL2SQL est né.
Lorsque les premiers outils sont sortis, NL2SQL était le fils prodigue de l'analyse des données.
Le "El Dorado" de la BI avec une promesse en or :
Obtenir des réponses basées sur les données aux questions d'analytique commerciale, aussi rapidement et facilement que de parler. Aucun SQL requis.
En théorie, en traduisant le langage courant en requêtes SQL structurées ; NL2SQL donne soudainement à tout le monde (marketeurs, analystes commerciaux, ventes, RH, finance) un accès direct pour interagir avec les bases de données, explorer les données et obtenir des idées.
Même en tant qu'analyste de données ou personne familière avec SQL, cela :
Vous libère de devoir écrire manuellement des requêtes SQL
Vous permet de vous concentrer sur une analyse stratégique de niveau supérieur
Élimine les frictions pour les analyses approfondies itératives
Avec NL2SQL, vous pourriez simplement penser :
« Je me demande quelles campagnes marketing ont conduit au plus grand nombre d'inscriptions qui sont ensuite devenues des clients payants dans les 30 jours ?"
Et au lieu de devoir faire une séquence complexe de plusieurs requêtes SQL qui prennent des jours à écrire et semblent tirer votre cerveau à travers le sable, vous obtiendriez simplement une réponse.
Voilà au moins la théorie.
Les Limitations de NL2SQL dans l'Analyse de Données Réelle
Il est facile de voir pourquoi NL2SQL semble génial sur papier. Le problème est que les versions originales de la technologie n'étaient pas capables de livrer dans des situations réelles.
Schémas de Données
Tout d'abord, la plupart des entreprises (même les géants corporatifs de plusieurs milliards de dollars) ont des environnements de données plus désordonnés qu'elles ne voudraient l'admettre. Des schémas de données bien structurés sont rares, et les entreprises modernes peuvent avoir des centaines, voire des milliers de tables, réparties sur plusieurs bases de données.
Donc, lorsque qu'un utilisateur demande des « affaires enterprise du T1 », comment un AI NL2SQL est-il censé savoir quels ensembles de données sont pertinents ou non ?
Contexte & Ambiguïté
Le deuxième problème est que les utilisateurs - en particulier ceux qui ne sont pas techniques - posent souvent des questions ambiguës. Demander des « clients importants » peut signifier beaucoup de choses différentes.
Est-ce combien ils ont dépensé ? Combien de commandes ils ont passées ? Leur valeur à vie ?
Sans clarté ni contexte, l'IA peut générer du SQL qui ne comprend pas la question ou les résultats attendus.
NL2SQL à un Coup
Enfin, les outils NL2SQL de première génération ne proposaient qu'une traduction à un coup.
Question dans -> Requête SQL sortie -> Résultats
Aucune nuance. Pas de questions de suivi. Pas de plongée plus profonde.
Cela a aidé à gagner du temps, mais ce n'était pas la véritable « conversation de style chatbot avec vos données » que les analystes attendaient. Gardez à l'esprit que tout cela se déroulait alors que nous découvrions des LLM comme ChatGPT, Claude et Gemini - donc il y avait un décalage clair.
Agents AI NL2SQL : L'Avenir de l'Analyse Commerciale
Si vous craigniez que nous vous donnions une liste de problèmes et que vous laissions en plan, j'ai de bonnes nouvelles.
Il existe une solution : un agent AI pour l'analyse des données.
Une nouvelle ère dans les copilotes NL2SQL qui comprend la nuance, raisonne comme un humain et est adapté aux réalités des données commerciales.
Avec ces nouveaux agents de données générationnelle, vous pourriez simplement penser :
« Je me demande quelles campagnes marketing ont conduit au plus grand nombre d'inscriptions qui sont ensuite devenues des clients payants dans les 30 jours ?"
Et au lieu de devoir faire une séquence complexe de plusieurs requêtes SQL qui prennent des jours à écrire et semblent tirer votre cerveau à travers le sable, vous obtiendriez simplement une réponse.

En termes plus techniques pour les analystes de données là-bas, les agents NL2SQL :
Comprennent véritablement le contexte commercial, les métadonnées et les couches sémantiques
Passent par des protocoles de validation des résultats avant de les rendre à l'utilisateur
Fournissent une justification des résultats et un accès entièrement auditable au workflow de l'IA
Comment Myriade Améliore NL2SQL
Au risque de paraître cliché, Myriade est un agent intelligent pour l'analyse des données, qui a vraiment été conçu par des analystes de données pour des analystes de données.
Nous avons construit le copilote que nous avons toujours souhaité avoir.
Parce que vous, les réponses dont vous avez besoin devraient être le minimum que vous attendez d'un copilote de données AI.
Myriade itère, affine, double vérifie, et explique comme un agent AI devrait… mais la puissance et la vitesse ne devraient pas se faire au détriment de la sécurité - et la commodité est toujours un plus.
Voilà pourquoi Myriade a été conçu spécifiquement pour inclure :
Une architecture sécurisée par conception (lecture seule, protection contre la connaissance zéro, zéro conservation des données…)
Une explicabilité intégrée dans chaque réponse
Une intégration Plug & Play sur des bases de données/lacs de données (<5 minutes)
Des solutions open-source ou cloud optionnelles
Si cela vous intéresse d'essayer, il vous suffit de cliquer ici. C'est gratuit (pas de carte de crédit requise), et prend quelques minutes à mettre en place. Votre agent d'analyse de données pourrait être opérationnel avant que votre café ne refroidisse.