Détection de contenu généré par l'IA : Google rend son outil de filigrane de texte SynthID open source

Google fait partie des 7 grandes entreprises de l’IA à s’être engagées à soutenir le développement d’une IA responsable, en juillet 2023, notamment à filigraner le contenu audio et visuel pour indiquer clairement que le contenu est généré par l’IA. La société vient de rendre open source SynthID-Text, afin de mettre à la disposition des développeurs et entreprises des outils de filigrane pour la génération de texte. Cette technologie est disponible via sa boîte à outils "Google Responsible Generative AI Toolkit".

La détection de contenu généré par IA est essentielle pour lutter contre la désinformation et les deepfakes, mais la tâche reste complexe. D'ailleurs, Google reconnaît que SynthID n'est pas parfait.

Initialement, SynthID a été développé par Google DeepMind et amélioré en collaboration avec Google Research pour évaluer la probabilité qu’une image ait été créée par Imagen. Il permet d'intégrer le filigrane numérique directement dans les pixels d'une image, le rendant invisible à l’œil nu et très difficile à falsifier sans endommager l’image. Le filigrane résiste aux modifications courantes (recadrage, filtres, compression), assurant ainsi une traçabilité même après des changements mineurs.

L'outil, qui permet aujourd'hui de détecter le contenu généré par l'IA que ce soit du texte, de la musique, des images ou des vidéos, a ensuite été étendu au filigrane et à l’identification du texte généré par Gemini.

Comment SynthID-Text fonctionne-t-il ?

SynthID-Text utilise des modèles de deep learning pour intégrer un filigrane imperceptible directement dans le processus de génération de texte.

Lorsqu’un LLM génère du texte, il décompose ce texte en jetons (mots, phrases, etc.) et prédit quel jeton est le plus susceptible d’en suivre un autre, un jeton à la fois.

SynthID ajuste subtilement les scores de probabilité des jetons lors de leur sélection, ajoutant des informations de marquage sans altérer la qualité, la lisibilité ou la créativité du texte. Ces ajustements discrets rendent le filigrane difficile à retirer sans compromettre l'intégrité du contenu généré.

Les développeurs et les entreprises peuvent également l'utiliser pour scanner un texte afin de rechercher des filigranes numériques et déterminer si le contenu, ou une partie de celui-ci, a été généré par l'IA.

[caption id="attachment_60451" align="alignnone" width="928"] Crédit Google : Un morceau de texte généré par Gemini avec le filigrane surligné en bleu.[/caption]

Avantages et limites

Google prévient que SynthID n'est pas une solution miracle pour identifier le contenu généré par l’IA, mais constitue un élément important pour développer des outils d’identification de l’IA plus fiables. S'il s'agit d'un outil autonome, il peut aussi être combiné avec d'autres méthodes de détection, ce qui améliore la couverture sur différents types de contenu et plateformes.

On peut l'utiliser pour un texte contenant au minimum trois phrases, mais il est plus performant sur des textes plus longs. Il fonctionne particulièrement bien pour les contenus générés en réponse à des invites créatives, telles que des essais, des scénarios ou des e-mails, car ces formats offrent davantage de possibilités de marquage discret.

Cette technique résiste aussi à certaines modifications mineures, comme le recadrage de segments de texte, le remplacement de quelques mots ou une légère paraphrase. Cependant, ses performances sont limitées pour les réponses très factuelles, où peu de variation est attendue, car les ajustements de jetons pourraient compromettre l'exactitude des réponses. La fiabilité du score de confiance diminue également lorsque le texte est complètement réécrit ou traduit.

Google souligne que, bien que SynthID puisse compliquer l'utilisation malveillante du contenu généré par l'IA, il ne constitue pas une protection contre les adversaires sophistiqués, comme les cyberattaquants, qui pourraient contourner ces techniques.

Il est possible de l'essayer sur Hugging Face.

Tendances

Comprendre l'IA

Applications de l'IA

Détection de contenu généré par l'IA : Google rend son outil de filigrane de texte SynthID open source

Sommaire

Comment SynthID-Text fonctionne-t-il ?

Avantages et limites