Intelligence artificielle

Intelligence artificielle : de quoi s’agit-il vraiment lorsqu'on parle d’"opt-out" ?

Quelle est la part de créativité humaine quand un auteur utilise l'intelligence artificielle ?

Intelligence artificielle : de quoi s’agit-il vraiment lorsqu'on parle d’"opt-out" ?

Dans les débats autour de l'intelligence artificielle dans l'édition, la notion d'opt-out revient sans cesse. Pourtant, difficile d’embrasser correctement tout ce que relève cette notion issue de la tech. Définition, enjeux et solution : on fait le point sur ce concept au cœur des débats autour de l'IA et du droit d’auteur.

J’achète l’article 1.5 €

Par Pauline Gabinari,
Créé le 26.01.2024 à 15h40 ,
Mis à jour le 31.01.2024 à 12h03

Un peu de contexte…

En 2019, une directive européenne est ratifiée pour harmoniser le droit de la propriété intellectuelle des Vingt-Sept. Mais, dans les exceptions du texte, on retrouve une mention appelée « exception TDM ». Cette dernière permet aux chercheurs de fouiller automatiquement un grand nombre de publications et de données scientifiques. Trois ans plus tard, c’est cette exception qui permet aux IA génératives de s'entraîner sur des contenus provenant d’internet, livres et articles de presse compris.

Et l’opt-out dans tout ça ?

L’opt-out, c’est littéralement « qui ne dit mot consent ». En d’autres termes, les fouilles de textes sont possibles sauf si l’ayant droit exprime son non-consentement par un moyen technologique. Et c’est là où le problème devient épineux dans le cadre de l’intelligence artificielle.

L’enjeu technologique

Car c’est à l’ayant droit de mettre assez de moyens en œuvre pour que ce refus puisse être pris en compte par une IA. « On impose une charge technique, administrative et financière sur les ayants droit », insiste Maïa Bensimon, vice-présidente du Conseil européen des auteurs de livres (European Writers' Council) et déléguée générale du Syndicat national des auteurs et compositeurs. S’ajoute à ça une difficulté liée au développement de l’IA : « Avec l’opt-out, on peut indiquer à un outil de fouille de texte qu’on ne veut pas que ce dernier “scrappe” notre contenu, mais on ne peut pas l’en empêcher. Si l’IA n’a pas été développée dans sa phase d’apprentissage en prenant en compte des opt-out, elle ne le fera pas », explique Laurent Le Meur, membre de W3C et CTO de l’institut de recherche et développement de l’European Digital Reading Lab. Pour aider les ayants droit, le labo de Laurent Le Meur a d’ailleurs développé un outil qu’un technicien peut intégrer gratuitement à un site web pour faire valoir son droit d’opt-out sur n’importe quel contenu.

La question de la diffusion des contenus

Autre obstacle, la pluralité des canaux de diffusion. On s’explique : dans le cadre du dernier ouvrage de Michel Bussi, Mon cœur a déménagé, par exemple, même si l'éditeur, les Presses de la Cité, exprime son droit d’opt-out, quid d’un libraire qui publie sur son site un extrait, ou d’un fan qui poste des pages du livre sur Instagram ? C’est tout à fait légal et, malgré le droit d’opt-out initial, une IA pourra tout à fait fouiller le texte grâce à ces autres canaux.

L’opt-out dans le cadre de l’AI Act

Une façon de surmonter ces obstacles réside dans la façon dont les IA seront transparentes dans leur manière de s'entraîner, si elles le font sur des supports protégés, notamment. « En sachant quels sont les robots qui ne respectent pas l’opt-out, on pourra commencer à attaquer les entreprises sur le droit d’auteur », résume Laurent Le Meur. Une problématique que l’on retrouve dans l’AI Act avec son point très controversé qui demande aux entreprises un « résumé suffisamment détaillé » des contenus utilisés pour entraîner les general-purpose AI models. Un élément soutenu par le monde de la culture, mais qui pose encore problème à une partie du gouvernement français. Réponse le 2 février prochain, date à laquelle le texte devrait être ratifié.

Les dernières
actualités