L’intelligence artificielle a déjà commencé à transformer le monde des livres audio avec la capacité de créer des enregistrements à la chaîne sans utiliser à chaque fois un narrateur humain, une évolution qui inquiète les professionnels de la voix, dont l’activité se contracte.
Tanya Eby pose sa voix sur des textes depuis vingt ans, à temps plein. En six mois, son carnet de commandes a fondu de moitié et beaucoup de ses collègues ont également vu leur activité ralentir. «ça semble logique que l’intelligence artificielle soit en train de nous affecter», dit-elle. «Je pense que c’est le plan pour l’avenir: remplacer les employés afin de couper les coûts.» Il n’existe pas de label IA identifié, mais selon plusieurs professionnels du milieu, des milliers de livres audio conçus à partir d’une banque de données vocales circulent déjà sur le marché.
Parmi les plus en pointe, DeepZen propose un tarif d’entrée qui peut diviser au minimum par quatre le coût de conception d’un «audiobook» par rapport à un projet classique. Cette petite société basée à Londres puise dans une base qu’elle a créée en enregistrant les voix de plusieurs acteurs, à qui l’on a demandé d’exprimer un registre d’émotions différentes. «Nous avons signé un accord de licence avec toutes les voix que nous utilisons», indique Kamis Taylan, directeur général de DeepZen. «Nous payons pour les enregistrements, (...) et nous versons des royalties à chaque fois que nous utilisons la voix pour un projet.» «Les choses évoluent tellement vite qu’il y a beaucoup de nouveaux venus qui n’ont pas la même éthique», et se servent de voix sans rémunérer leurs auteurs, alerte Tanya Eby.
«Il y a une zone grise», exploitée par de nombreuses plateformes, abonde Kamis Taylan. «Ils prennent votre voix, la mienne et cinq autres, ils créent une nouvelle voix et ils ne payent rien, en disant que cela n’appartient à personne.» Toutes les sociétés contactées par l’AFP se défendent de telles pratiques. La start-up texane Speechki propose, outre le recours à ses propres enregistrements, de se servir de voix tirées de banques de données existantes, explique le directeur général Dima Abramov. Cette seconde option passe par la signature d’un contrat qui comprend les droits d’utilisation, précise-t-il.
«Lien émotionnel»
Sollicitées sur le sujet, les cinq grandes maisons d’édition du marché américain n’ont pas donné suite, mais, selon des professionnels interrogés par l’AFP, plusieurs noms de l’édition traditionnelle recourent déjà à l’IA, dite générative, c’est-à-dire capable de créer, sans intervention humaine, textes, images, vidéos ou voix, à partir de contenus existants.
«La narration professionnelle a toujours été essentielle à l’écoute sur Audible et le restera», a indiqué une porte-parole du géant américain des livres audio, filiale d’Amazon. «Cela dit, avec l’amélioration de la technologie, nous imaginons un avenir dans lequel l’interprétation humaine et le contenu généré (avec l’AI) pourront co-exister.» Très investis dans l’intelligence artificielle, les géants technologiques sont impliqués dans l’économie bourgeonnante des livres audios générés par logiciel.
En début d’année, Apple a lancé une offre de «narration numérique», destinée, selon la firme à la pomme, à «rendre la création de livres audio plus accessible à tous», notamment «aux auteurs et indépendants et petits éditeurs».
Google propose un service similaire, décrit comme de l’auto-narration. «Nous devons démocratiser l’industrie de l’édition, parce que, en l’état, seuls les noms les plus connus sont convertis en livres audio», décrit Kamis Taylan. «La narration synthétique ouvre la porte à tous les livres existants qui n’ont pas été enregistrés et à tous ceux à venir qui n’auraient jamais été convertis à cause des contraintes économiques», selon Dima Abramov, qui estime à 5% actuellement le nombre de livres qui deviennent des «audiobooks».
Cette croissance du marché va aussi bénéficier aux acteurs vocaux, affirme-t-il. «Ils feront plus d’enregistrements et gagneront plus d’argent. «Raconter des histoires, à la base, c’est permettre aux humains de se reconnecter avec leur humanité», estime Emily Ellet, responsable de l’Association des narrateurs professionnels de livres audio (PANA). «La narration devrait rester entièrement humaine.»
Pour Tanya Eby, en l’état, la narration IA manque de lien émotionnel. Il y a une vraie différence (avec les enregistrements classiques).
Mais avec le temps, les auditeurs vont peut-être s’y habituer. Je crois que c’est d’ailleurs en train de se passer. «J’aimerais quand même que les producteurs indiquent clairement aux utilisateurs qu’ils écoutent un produit généré par l’IA», dit-elle, qu’ils soient francs.