Numérique

Livre audio : les voix artificielles ne séduisent pas encore les éditeurs

Livre audio : les voix artificielles ne séduisent pas encore les éditeurs

Après ChatGPT pour l'écriture et Midjourney pour l'image, ce sont désormais les voix artificielles (ou synthèses vocales) qui s'immiscent discrètement dans l'univers de l'édition, à travers le livre audio. Mais leur usage ne séduit pas encore les éditeurs français qui, s'ils surveillent les progrès technologiques, continuent à miser sur la création humaine.

J’achète l’article 1.5 €

Par Elodie Carreira,
Créé le 25.04.2023 à 15h00 ,
Mis à jour le 25.04.2023 à 18h09

En janvier 2023, Apple Books lançait une série de livres audio de romance et de développement personnel, narrés par quatre intelligences artificielles génératives. Un service auquel s'était aussi essayé Google, six mois plus tôt, avec un système d’auto-narration destiné à compléter « les structures traditionnelles du livre audio ». Pour « transposer un maximum d’œuvres en audio et ainsi aider le marché à grossir », le recours à des voix artificielles pour lire des livres audios avait également agité les débats sur la dernière Foire du livre de Francfort. Alors qu'en France, le marché du livre audio continue de grossir, comptant d'après les dernières estimations près de 6,6 millions d'auditeurs (baromètre Sofia/SNE/SGDL), les éditeurs s'interrogent sur l'utilisation de voix artificielles pour répondre à cette demande croissante. 

Émotions vs désincarnation 

Valérie Lévy-Soussan, directrice générale d’Audiolib, le rappelle : malgré les progrès de l’outil technologique, « aucun éditeur français n’a recours, aujourd’hui, aux voix artificielles ». En dépit d'une importante hausse de la consommation, le marché français du livre audio est encore, selon elle, dans une phase de « conquête d’auditeurs ». « Comme le cinéma n’a pas remplacé le théâtre, les voix artificielles ne remplaceront pas l'art de l'interprétation, qu'il s'agisse d'œuvres de fiction ou de transmission de connaissances », ajoute-t-elle. Un constat que partage Laure Saget, présidente de la commission du livre audio du SNE et directrice de la collection « Écoutez lire » chez Gallimard : « Aucun membre éditeur du SNE n’a l’intention d’utiliser des voix artificielles. »

Pour les deux dirigeantes, la production d’un livre audio fait vivre toute une chaîne d’acteurs, capables de valeur créative. Les narrateurs d’une œuvre audio, souvent des comédiens, possèdent une pluralité d’intonations et d’émotions qui n’est pas encore rendue possible à l’intelligence artificielle. « On passe du temps à choisir les bons comédiens. Ils font un vrai travail d’interprétation et de recréation du livre », explique Laure Saget, ajoutant que « la désincarnation de la voix artificielle est antinomique avec l’expérience intimiste du livre audio. »

Un moyen de réduire les coûts

Malgré ces conclusions, les deux éditrices ne nient pas l’intérêt des voix synthétiques pour répondre à des besoins spécifiques. Pour elles, ces outils pourraient être sollicités par des éditeurs universitaires, techniques, scientifiques, mais aussi pour des titres qui n’auraient jamais émergés en raison du caractère onéreux de la production d’un objet audio.

Ce que soutient aussi Morgane Travers, responsable de Saga Storify France, qui finance la production audio de manuscrits signés par des auteurs indépendants. Accueillant favorablement la technologie, l’éditrice pense que « l’utilisation de voix artificielles pourrait permettre de produire la version audio d’une histoire à moindre coût et d’étendre l’audience des auteurs sur plusieurs formats ». Si la plateforme n’en fait pas encore usage, sa dirigeante se dit néanmoins intéressée par le « correcteur audio », un outil de repérage des coquilles ou des bruits susceptibles de parasiter une piste audio.

Créer d'autres expériences ?

Plus optimiste, Maëlle Chassard, cofondatrice de Lunii, boîte à histoires pour enfant, considère ces nouvelles technologies comme une opportunité. « On peut s’inspirer des créations immersives et proposer de nouvelles expériences », déclare-t-elle. C’est pourquoi la fondatrice du petit boîtier qui transforme les enfants en héros a contacté Samuel Delalez, chercheur en synthèse vocale, il y a cinq ans. En collaboration avec l’IRCAM (Institut de recherche et de coordination acoustique) et le LSCP (Laboratoire de sciences cognitives), ce dernier cherche à « améliorer l’expressivité de la synthèse vocale narrative ». Autrement dit : la rendre plus humaine. « Lunii n’a pas le projet de remplacer les narrateurs mais envisage, pour les aventures audio interactives, de reprendre la voix du narrateur et d’y ajouter un contenu », expose le chercheur.

Le principe du livre audio interactif suppose que l’auditeur choisisse en toute autonomie de faire évoluer le scénario au gré de son imagination. « Les combinaisons possibles seraient alors démultipliées, rendant la tâche impossible pour le narrateur », explique Samuel Delalez. C’est là qu’intervient la synthèse vocale en générant, de façon autonome et contextuelle, la pluralité des scénarios probables. Et pour remédier à la tonalité monotone des voix artificielles, principal motif d’exclusion de celles-ci dans le livre audio, Samuel Delalez explique vouloir « utiliser les dernières technologies d’analyse textuelle pour [leur] donner des informations sémantiques et contextuelles en fonction du texte, qui leur permettront de deviner la prosodie, c’est-à-dire le rythme et l’intonation à adopter ». Un projet en pleine phase d'expérimentation mais qui verra le jour, d'après lui, d'ici cinq à dix ans. 

Des obstacles concrets

Si les éditeurs de livres audio ne perçoivent pas encore les voix artificielles comme des menaces, tous confient surveiller de près leur développement. À commencer par les avancées technologiques menées dans les laboratoires de l'IRCAM et poursuivies par le phénomène « voice cloning », déjà maîtrisé par Microsoft avec VALL-E, modèle de synthèse vocale capable d’imiter une voix humaine à partir d’un enregistrement de trois secondes seulement. Mais ces outils, même s’ils étaient mobilisés, se heurteraient à un important appareil juridique, d’après Valérie Lévy-Soussan. « Les prestataires de ces voix synthétiques-là se confronteraient au même substrat légal que celui rencontré par l’illustration générée par l’intelligence artificielle en ce moment », assure-t-elle.

Pour Maëlle Chassard, qui rejette tout « discours fataliste » à l'égard de ces technologies, l'enjeu est d'avant tout travailler la créativité humaine et « sa capacité à inventer d’autres types de récits ». Car si, à l'avenir, les voix artificielles investissent massivement le milieu du livre audio, il s’agira, selon elle, d’un « choix d’entreprise »

Les dernières
actualités