Une IA invente normes et références avec aplomb. En cas de litige, c'est l'ingénieur qui signe qui répond. Les garde-fous concrets pour un bureau d'études : score de certitude, IA de contrôle, validation humaine.
L'essentiel :
Quand on découvre l'IA sur un cas métier, le premier réflexe c'est la confiance. Le texte est bien tourné, la réponse est rapide, le ton est sûr. Et puis un jour, sur une question qu'on maîtrise, on voit passer une norme qui n'existe pas. Ou un article de CCAG inventé. Ou un chiffre que rien ne justifie.
Ce n'est pas de la malchance. Les chercheurs d'OpenAI l'ont écrit noir sur blanc en septembre 2025 (Why Language Models Hallucinate) : un modèle de langage hallucine parce que son entraînement le récompense quand il devine, et le pénalise quand il dit « je ne sais pas ». On a appris à ces systèmes à toujours répondre, jamais à douter. D'où l'aplomb.
Il y a pire, et c'est tout aussi documenté. Une IA a tendance à épouser votre avis plutôt qu'à vous contredire. Anthropic a publié un travail là-dessus (la « sycophantie » des modèles) : sur cinq assistants de pointe, le modèle préfère parfois la réponse qui vous fait plaisir à la réponse correcte. Ce n'est pas théorique : en avril 2025, OpenAI a dû retirer une mise à jour de son modèle quatre jours après sa sortie parce qu'il était devenu, selon les mots de son patron, « trop flatteur ».
Mettez les deux ensemble. Une machine qui devine au lieu de douter, et qui a tendance à vous donner raison. Pour un BET qui pose une question technique, c'est exactement le profil de l'erreur qu'on ne voit pas passer.
L'IA ne signe rien. Elle n'a pas de responsabilité décennale, pas d'assurance pro, pas de nom au bas du mémoire. Vous, si.
En octobre 2025, Deloitte a remboursé environ 97 000 dollars australiens au gouvernement australien pour un rapport facturé près de 290 000 dollars. Le motif : des références inventées et une citation de juge erronée, repérées par un chercheur de l'université de Sydney. Un cabinet de ce calibre, avec ses process, s'est fait prendre.
Côté justice, c'est encore plus net. Dans l'affaire Kettering v. Collier (tribunal du district sud de l'Ohio, décision du 25 février 2026), des avocats ont été sanctionnés pour avoir déposé des citations fabriquées par une IA, et les avoir maintenues après avoir été prévenus. Ce n'est pas le premier cas (l'affaire Mata v. Avianca avait déjà fait jurisprudence aux États-Unis en 2023), et ce ne sera pas le dernier.
Transposez au bâtiment. Une norme hallucinée dans un CCTP. Un article de CCAG inventé dans un courrier de réclamation. Une référence projet attribuée à votre BET alors que vous ne l'avez jamais réalisée. Le jour où ça se voit, ce n'est pas l'IA qui est en face du maître d'ouvrage ou de l'avocat. C'est votre signature.
Une ingénieure d'un bureau d'études nous l'a résumé à sa façon, à propos de la relecture technique d'un CCTP avec deux outils du marché : « c'est faux et archi-faux, et les juniors n'ont pas accès aux normes pour le voir. » Le risque n'est pas que l'IA se trompe. C'est qu'elle se trompe devant quelqu'un qui n'a pas les moyens de la corriger.
Bannir l'IA, c'est se priver d'un vrai levier. Lui faire confiance les yeux fermés, c'est s'exposer. Entre les deux, il y a une troisième voie, et c'est là que se joue le métier.
Le réglage de base : demander à l'IA de noter sa propre confiance, ligne par ligne, et de citer la source de chaque affirmation. Une donnée présente dans les pièces fournies en vert, une donnée inférée en orange, une donnée plausible mais non sourcée en rouge, à vérifier par un humain.
L'effet est double. L'IA se challenge elle-même avant de remplir, donc elle hallucine moins. Et surtout, vous lisez le tableau à l'envers : vous vérifiez d'abord le rouge et l'orange, vous validez le vert en bloc. Vous ne relisez pas tout, vous relisez ce qui compte. C'est ce que recommandent, mot pour mot, les chercheurs d'OpenAI : créditer l'incertitude au lieu de récompenser le faux-confiant.
Un seul regard ne suffit pas. On met une deuxième IA en position de contrôleur : un agent qualité qui relit la production du premier, ancré sur le référentiel du client (normes applicables, DTU, CCTP types validés) et pas sur la culture générale du modèle.
L'analogie parle à tout le monde dans le bâtiment : c'est l'AMO qui contrôle la MOE. Le bureau de contrôle qui passe derrière. On empile les regards pour faire baisser le risque. La nuance qui change tout : l'agent ne juge que par rapport au corpus du client, et il cite sa source (la clause, la norme, la page). Pas d'opinion, des preuves.
La règle ne bouge pas : sur tout ce qui engage la responsabilité de la boîte (note de calcul, plan, mémoire, courrier contractuel), l'IA propose, l'humain valide et signe. Le garde-fou n'est pas là pour ralentir. Il est là pour protéger celui qui met son nom au bas du document.
C'est aussi ce qui désamorce la peur, légitime, des équipes : l'IA prend les tâches répétitives, pas la décision. La valeur de l'ingénieur ne disparaît pas, elle se déplace vers le statut de garant. Ce rôle-là ne se délègue pas à une machine.
Il y a un dernier piège, plus discret. Beaucoup d'outils verticaux promettent la « validation humaine » et la « transparence » comme des arguments commerciaux, tout en restant des boîtes noires : vous ne voyez pas comment ils décident, et vos garde-fous dépendent de leur bon vouloir.
L'autre approche, c'est d'installer ces garde-fous chez vous. Le référentiel normatif qui sert de juge, la méthode de contrôle, le score de certitude : c'est du capital que vous possédez et que vous gardez, quelle que soit l'IA que vous utilisez derrière. L'outil devient une brique remplaçable. La sécurité, elle, reste à vous.
Pas par un grand chantier IA. Par un diagnostic court (une demi-journée, autour de 1 500 €, déduit si vous continuez) : on regarde où l'IA est déjà utilisée dans votre BET, souvent en shadow-IT, on repère les endroits où une erreur non détectée vous coûterait cher, et on installe un premier garde-fou qui tourne (le score de certitude sur un livrable réel). Ensuite, on monte les marches : accompagnement mensuel, puis les lots qui comptent, dont un agent qualité ancré sur vos normes. À votre rythme, et vous restez propriétaire de la méthode.
Pas les yeux fermés, et ce n'est pas un avis isolé : les labos qui conçoivent ces modèles documentent eux-mêmes que l'IA devine au lieu de douter et tend à épouser votre avis. La confiance se construit par des garde-fous : un niveau de certitude par ligne, une citation systématique des sources, une IA de contrôle ancrée sur votre référentiel, et un humain qui signe ce qui engage. On ne vise pas le zéro erreur, on rend l'erreur détectable et corrigée avant qu'elle sorte.
Celui qui signe. L'IA n'a ni assurance pro ni responsabilité juridique. En octobre 2025, Deloitte a remboursé une partie d'un rapport pour des références inventées par une IA, et dans l'affaire *Kettering v. Collier* (Ohio, février 2026) des avocats ont été sanctionnés pour des citations fabriquées par IA. La responsabilité reste attachée à la validation humaine, ce qui rend le contrôle non négociable sur tout ce qui engage la boîte.
Trois réglages qui se cumulent : (1) la consigne « ne jamais inventer, si l'info n'est pas dans les pièces, le signaler » ; (2) un score de certitude par ligne avec citation des sources ; (3) une IA de contrôle qui ne juge que par rapport à votre corpus normatif (DTU, CCTP types, normes applicables) et cite la clause exacte. Le tout sous validation humaine sur les points sensibles.
Pour aller plus loin : L'IA pour les bureaux d'études · Glossaire : hallucination, RAG, agent IA · La méthode Mister ConTech.
Un diagnostic d'entrée (une demi-journée) pose votre situation et chiffre la prochaine marche — vous repartez avec une feuille de route, pas un abonnement.