Skip to content
L'IA pour les fondateurs

Le ROI de l'IA pour les fondateurs : mesurer ce que l'IA vaut vraiment

Un cadre défendable pour mesurer le rendement de l'investissement en IA : le point de référence, les quatre indicateurs qui comptent et les pièges qui détruisent discrètement l'analyse de rentabilité.

Équipe SDEN11 min de lecture

La prémisse

Le rendement du capital investi en IA est le changement mesurable dans les résultats d'affaires — temps par dossier, coût par dossier, débit, taux de conversion ou qualité — qu'on peut attribuer à un déploiement d'IA, net du coût de sa construction et de son exploitation. Le chiffre est défendable lorsqu'il existe une base de référence, une fréquence de mesure et un modèle d'attribution explicite. Sans ces trois éléments, c'est une histoire.

La plupart des chiffres de ROI d'IA que nous voyons dans les présentations au conseil sont des histoires. Le schéma est constant : l'équipe choisit la métrique qui a bougé, attribue tout l'écart à la fonctionnalité d'IA, ignore les effets saisonniers et de gamme de produits, et rapporte un pourcentage assez grand pour justifier le prochain investissement. La conversation passe ensuite à autre chose. Trois trimestres plus tard, quand le prochain investissement en IA doit lui aussi être justifié, l'impact réel de la fonctionnalité originale a discrètement cessé d'être mesuré.

Ce texte est le cadre que SDEN utilise pour rendre le ROI de l'IA mesurable. Les quatre métriques qui comptent, la discipline de base de référence qui les rend défendables, les modes d'échec d'attribution qui détruisent discrètement le dossier, et à quoi ressemble la réussite au premier mois, au troisième mois et au douzième mois.

La discipline de la base de référence

Si vous ne mesurez pas l'avant, vous ne pouvez pas mesurer l'après

La principale raison pour laquelle les chiffres de ROI d'IA ne sont pas défendables, c'est que personne n'a saisi l'avant.

Un déploiement d'IA sans base de référence documentée avant le déploiement n'est pas mesurable. Peu importe à quel point les tableaux de bord post-déploiement sont sophistiqués — sans un chiffre de l'avant, chaque comparaison se fait par rapport à une impression mémorisée de la lenteur ou du coût de l'ancien processus, et la mémoire humaine des métriques opérationnelles n'est pas fiable. Nous avons audité des déploiements où l'équipe était certaine que la fonctionnalité d'IA faisait économiser 40 % sur le temps par dossier ; le chiffre réel, par rapport à la base de référence récupérée, était de 12 %. Nous avons aussi vu l'inverse : une équipe qui trouvait la fonctionnalité d'IA décevante, alors que la base de référence récupérée montrait une véritable amélioration de 25 % que personne n'avait portée à son crédit, parce que le nouveau processus donnait la même impression.

La base de référence n'est pas difficile à saisir. Pour la plupart des flux opérationnels, ce sont quatre mesures : le temps par dossier (médiane et p95), le coût par dossier (pleinement chargé du temps humain), le débit (dossiers traités par personne par semaine) et la qualité (un audit échantillonné de l'exactitude, habituellement 30 à 50 dossiers). Cela prend une semaine, parfois deux si les données sont éparpillées dans plusieurs outils, et c'est l'étape à plus fort levier de tout mandat d'IA.

Nous refusons de livrer une fonctionnalité d'IA sans base de référence saisie. Non pas parce que nous voulons bien paraître — mais parce que sans elle, la fonctionnalité n'a aucun chemin de gouvernance. Personne ne peut la retirer quand elle cesse de fonctionner, parce que personne ne peut prouver qu'elle a déjà fonctionné.

Fig.: Si vous ne mesurez pas l'avant, vous ne pouvez pas mesurer l'après
Les quatre métriques qui comptent

Temps, coût, débit, qualité — et le piège de la cinquième

Les déploiements d'IA font bouger quatre métriques. Le temps par dossier est le plus visible : combien de temps faut-il pour traiter une instance du flux, du début à la fin. Le coût par dossier est la version pleinement chargée : le temps par dossier multiplié par le coût des personnes qui le font, plus le coût de l'IA elle-même. Le débit est la vue à l'échelle de l'équipe : combien de dossiers l'équipe traite-t-elle en une semaine, à effectif constant. La qualité est la discipline contre le théâtre de l'optimisation : les dossiers sont-ils traités correctement, échantillonnés par rapport au même audit qu'avant.

La plupart des équipes rapportent l'une de ces métriques et appellent cela du ROI. La version honnête rapporte les quatre, parce qu'optimiser l'une sans les autres est habituellement la façon dont les déploiements d'IA échouent discrètement. Le schéma classique : la fonctionnalité d'IA réduit le temps par dossier de 50 %, l'équipe traite 80 % plus de dossiers par semaine, la direction rapporte un gain de productivité. Six mois plus tard, l'audit de qualité montre que les taux d'erreur ont doublé — l'équipe s'est précipitée, le modèle a raté des cas limites, et le coût des erreurs a abouti en aval sous forme d'attrition de clients ou d'obligations de remboursement. Le ROI réel était négatif ; personne ne l'a mesuré.

La cinquième métrique — le piège — est la « satisfaction de l'équipe » ou le « temps économisé » tel que rapporté dans un sondage. Ce sont des signaux utiles ; ce ne sont pas des métriques de ROI. Les gens surestiment systématiquement le temps que les outils d'IA leur font économiser, par des facteurs de deux à trois dans les études auxquelles nous nous fions. Utilisez les données de sondage pour la rétroaction sur le produit. Ne les utilisez pas pour justifier le prochain investissement en IA.

Fig.: Temps, coût, débit, qualité — et le piège de la cinquième
Modes d'échec d'attribution

Trois façons dont le chiffre de ROI ment

Le premier mode d'échec est celui des changements concurrents non attribués. La fonctionnalité d'IA a été livrée le même trimestre qu'une refonte de l'expérience utilisateur, un nouveau programme de formation et un changement de gamme de produits. La métrique a bougé ; la fonctionnalité d'IA reçoit le crédit de tout l'écart. La parade est un groupe témoin, un test A/B, ou au minimum une liste explicite des changements concurrents documentée dans la note de service sur le ROI. Par défaut, nous utilisons un petit groupe témoin sur chaque déploiement, sauf si le flux le rend impossible.

Le deuxième mode d'échec est le pépin de saisonnalité. La base de référence a été saisie durant un trimestre tranquille ; la mesure post-déploiement provient d'un trimestre de pointe. L'amélioration semble réelle et est en partie saisonnière. Parade : comparer d'une année à l'autre si le cycle est annuel, ou utiliser une base de référence glissante de quatre semaines qui contrôle la variance à court terme.

Le troisième mode d'échec est la dérive de qualité silencieuse. Le modèle fonctionne bien au lancement, la performance s'érode lentement sur six mois, personne ne réinitialise la base de référence, et le ROI rapporté continue d'utiliser le chiffre de qualité du trimestre de lancement. Le déploiement semble en santé sur le tableau de bord pendant que les clients remarquent la dégradation. Parade : la qualité est mesurée à la même fréquence que le coût et le temps, et le tableau de bord fait ressortir la dérive explicitement.

Fig.: Trois façons dont le chiffre de ROI ment
Avant / après

Ce que change réellement une mesure de ROI disciplinée

Quatre changements que nous avons observés lorsque le ROI de l'IA passe du récit à la discipline. Aucun n'est sophistiqué ; tous dépendent du travail de saisie de la base de référence.

Avant

La direction rapporte une amélioration de productivité de 40 % grâce au nouveau flux d'IA. Le chiffre provient d'un sondage d'équipe ; la métrique opérationnelle sous-jacente n'a jamais été saisie.

Après

L'amélioration réelle du temps par dossier est de 18 %, par rapport à une base de référence saisie. Le chiffre est plus petit, défendable, et survit à une remise en question du conseil. Le prochain investissement en IA est approuvé sur la force d'un chiffre réel, et non contesté.

À retenir · Des chiffres plus petits mais défendables achètent plus de crédibilité que des chiffres plus grands mais contestés.

Avant

Un déploiement d'IA est déclaré réussi au lancement sur la base des métriques du premier mois. Six mois plus tard, l'équipe a cessé de l'utiliser ; personne n'a mesuré pourquoi.

Après

La revue mensuelle du ROI fait ressortir la dérive au quatrième mois. L'équipe ajuste l'invite et l'index de récupération ; l'utilisation reprend. La fonctionnalité est vivante au douzième mois, avec une qualité documentée.

À retenir · Le ROI est une discipline continue, pas un événement de lancement. C'est la chute que vous mesurez.

Avant

Le flux d'IA des ventes s'attribue le crédit d'une hausse de 25 % de la conversion. Un nouveau changement de prix et la panne d'un concurrent sont tous deux survenus le même trimestre.

Après

Un petit groupe témoin montre que la contribution réelle du flux d'IA est de 9 points de pourcentage. Le changement de prix en explique 11 autres ; la panne du concurrent, 5 de plus. Le récit est plus brouillon et plus honnête, et le plan du trimestre suivant reflète ce qui a réellement fonctionné.

À retenir · La discipline d'attribution empêche le prochain investissement de courir après la mauvaise cause.

Avant

Un assistant d'IA pour le soutien affiche des temps de première réponse 50 % plus rapides. Les scores de satisfaction des clients dérivent à la baisse en silence sur six mois.

Après

Un audit de qualité est ajouté à la revue mensuelle du ROI. La dérive est attribuée à l'assistant d'IA qui achemine les cas complexes vers des représentants juniors. L'acheminement est corrigé ; le CSAT remonte. Le chiffre de 50 % reste — au même niveau de qualité qu'avant.

À retenir · La qualité est la métrique retardée qui piège les histoires de ROI paresseuses. Mesurez-la dès le premier jour.

Fig.: Ce que change réellement une mesure de ROI disciplinée
Comment SDEN mène le ROI

Trois engagements sur la mesure de l'IA

Nous ne livrons pas une fonctionnalité d'IA sans les trois. Ils sont la barre du mandat, pas des options facultatives.

Base de référence saisie avant le lancement

Nous ne livrons pas tant que le temps, le coût, le débit et la qualité ne sont pas mesurés pour le processus pré-IA. Sans les quatre chiffres, le déploiement ne peut pas être gouverné par la suite.

Groupe témoin ou facteurs de confusion documentés

Par défaut, un groupe témoin. Quand ce n'est pas possible, la note de service sur le ROI nomme chaque changement concurrent du même trimestre, ainsi que le modèle d'attribution qui les gère.

Revue mensuelle, horizon de douze mois

Les mêmes quatre métriques sont révisées chaque mois, affichées en continu sur un tableau de bord, et réétalonnées chaque année. Le test honnête est de savoir si la fonctionnalité fonctionne encore au douzième mois — et non au premier.

À quoi ressemble la réussite

Un portefeuille d'IA avec des chiffres défendables

Au bout de douze mois, l'équipe de direction peut défendre chaque investissement en IA avec un chiffre qui survit à une remise en question du conseil.

Les entreprises qui réussissent le ROI de l'IA ne sont pas celles qui ont les plus gros chiffres. Ce sont celles dont les chiffres survivent à l'examen. Le directeur financier peut rattacher chaque point de pourcentage d'impact à une méthodologie de mesure. Le PDG peut expliquer lors d'une réunion du conseil quels investissements en IA ont fonctionné et lesquels non, et ce que l'entreprise a appris des échecs. Le responsable de l'ingénierie peut retirer une fonctionnalité d'IA quand les chiffres cessent de bouger — et l'a réellement fait, au moins une fois, sans coût politique.

L'effet plus large, c'est que l'IA cesse d'être une catégorie d'investissement spéciale et devient une catégorie normale. Un nouveau cas d'usage arrive avec une base de référence, est livré avec une évaluation, est révisé chaque mois, et est abandonné quand il cesse de rapporter. La discipline que l'entreprise applique aux dépenses publicitaires ou aux expériences de prix — appliquée à l'IA. Voilà à quoi ressemble un portefeuille d'IA mature.

Les chiffres sont aussi plus petits. Les entreprises dotées d'une mesure de ROI rigoureuse rapportent des améliorations de 15 à 35 % sur les flux qu'elles ciblent — et non les améliorations de 200 à 400 % qui apparaissent dans les études de cas des fournisseurs. Les chiffres plus petits sont les vrais, ils se cumulent à travers le portefeuille, et ils survivent à l'audit.

Fig.: Un portefeuille d'IA avec des chiffres défendables
FAQ

L'IA pour les fondateurs:
les questions qu'on nous pose.

Des réponses directes aux questions qu'on nous pose le plus souvent. Si la vôtre n'y est pas, écrivez à l'équipe.

Au travail

Un projet qui en vaut la peine ?

Parlez-nous de votre projet. Nous travaillons avec un nombre limité de clients à la fois, et nous vous revenons en moins de 24 heures ouvrables avec un premier avis d'ingénieur, sans engagement.

WhatsAppChat with the team
LinkedInFollow SDEN
X@sdenengineering