Sanitized AI Team

L'Illusion du Refus (Opt-Out) : Pourquoi Désactiver l'Entraînement de l'IA ne Rend pas vos Données Sûres

Une responsable de la confidentialité avec qui j'ai parlé le mois dernier est entrée dans le bureau de son CISO avec ce qu'elle pensait être une bonne nouvelle. Le compte ChatGPT Enterprise de l'entreprise avait désactivé l'entraînement de l'IA. Les données n'étaient pas utilisées pour améliorer les modèles. Le service juridique avait examiné le DPA. Tout le monde a soufflé de soulagement.

Deux semaines plus tard, un ingénieur a copié l'historique médical complet d'un client dans un prompt pour rédiger une réponse d'assistance. Le refus d'entraînement (opt-out) fonctionnait exactement comme annoncé. Mais les données ont tout de même quitté l'entreprise.

C'est cette lacune qui continue de surprendre les organisations. « Ne vous entraînez pas sur nos données » est une promesse étroite concernant une utilisation spécifique en aval. Cela ne dit presque rien sur qui peut voir la requête en transit, où elle est enregistrée pour surveiller les abus, combien de temps elle reste dans les files de conservation, ou ce que votre employé vient de taper en premier lieu.

Le contrôle que vous avez acheté n'est pas celui dont vous aviez besoin

La plupart des accords d'IA d'entreprise résolvent le problème de l'entraînement des modèles parce que c'est la préoccupation médiatisée qui est apparue très tôt dans les débats sur la confidentialité. Les fournisseurs ont réagi. Les options de désactivation de l'entraînement sont désormais la norme.

La surface de risque réelle est différente en pratique. Un ensemble de données réglementé ne devient pas non réglementé parce que le fournisseur a promis de ne pas apprendre de lui. L'HIPAA, le RGPD et la plupart des obligations de confidentialité contractuelles se préoccupent de la divulgation, pas de l'entraînement. À l'instant où un enregistrement protégé quitte un environnement autorisé, vous avez un événement d'exposition, indépendamment de ce que le destinataire en fait ensuite.

Le bouton de désactivation de l'entraînement est une couverture de confort sur un problème beaucoup plus vaste.

Là où la vraie fuite se produit

La fuite commence presque jamais avec le modèle. Elle commence avec une personne sous pression pour respecter un délai, demandant à l'outil le plus performant dont elle dispose de l'aider avec la tâche à accomplir. Ils copient-collent un contrat. Le dossier d'un patient. Un document du conseil d'administration. Une liste d'e-mails clients.

La décision qui comptait a eu lieu avant que le prompt ne soit envoyé. Une fois qu'il est dans la requête réseau, tout contrôle en aval n'est que limitation des dégâts.

C'est pourquoi la gouvernance construite uniquement autour des accords avec les fournisseurs continue d'échouer aux audits et de surprendre les conseils d'administration. Elle optimise la mauvaise couche. Le point de défaillance est la frappe au clavier, pas le contrat.

Ce qui change lorsque vous agissez en amont

Si vous voulez une adoption sûre de l'IA plutôt qu'une adoption restreinte de l'IA, le contrôle doit se trouver là où le risque est réellement créé : au moment où le prompt est composé, sur l'appareil, avant que quoi que ce soit ne traverse le réseau. Cela signifie inspecter ce qui s'apprête à partir, signaler le contenu réglementé et donner à l'employé une solution qui ne le force pas à choisir entre son délai et la politique de l'entreprise.

C'est le principe derrière Sanitized AI : la prévention au moment de la rédaction du prompt, traitée localement, de sorte que le refus d'entraînement (opt-out) reste un engagement utile du fournisseur plutôt qu'un pilier porteur.

La question de l'entraînement est réelle. Ce n'est tout simplement pas celle qui détermine si vos données restent là où elles doivent être.