Ce qui se passe:
En mars 2019, la Neue Zürcher Zeitung (NZZ) a lancé un nouveau service de synthèse vocale au public, sous la forme d'une version améliorée de son lecteur audio bêta sorti en octobre dernier. L’entreprise a partagé certaines des principales leçons apprises au cours du processus.
Creuser plus profond:
Google Wavenet ne suffit pas pour la langue suisse alémanique
NZZ a utilisé Google Wavenet pour générer ses fichiers audio, et bien que la technologie soit douée pour les langues (actuellement neuf langues avec un son de qualité naturelle), elle n'était pas assez robuste pour les complexités du suisse allemand. Pour résoudre le problème, NZZ a équipé un middleware avec un lexique pour faire circuler les mots avant d'être convertis en audio.
L'architecture doit être facile à mélanger
Dans un secteur en évolution avec des outils, des besoins et des produits changeants, NZZ avait besoin de créer un service qui puisse facilement être adapté aux circonstances changeantes. En créant une architecture mix-and-match, ils ont pu déplacer le service d'Amazon Polly vers Google Wavenet dans un court délai, ce qui s'est considérablement amélioré.
L'audio n'est pas pour tout le monde
Certaines personnes aiment l’audio, mais d’autres non. NZZ a demandé aux deux types d'utilisateurs d'évaluer différents moteurs de synthèse vocale ainsi que du texte lu par un véritable humain. Sans surprise, les deux groupes ont attribué la note la plus élevée à la voix humaine naturelle. Cependant, cette idée n'était pas vraiment pertinente, mis à part le fait que les utilisateurs aimaient ou non l'audio, et que la voix humaine, ou son absence, ne semblait pas avoir une influence importante sur l'utilisation.
Techniques pour transformer un morceau écrit en un bon audio
Il est important que le contenu audio soit agréable à écouter, et la NZZ a dû utiliser une mise en page différente pour transformer ses articles au format MP3 de qualité. Cela impliquait d'examiner de près la manière dont les utilisateurs aimeraient qu'on leur lise un article, ce qui a informé leurs modèles audio.
Différentes expériences de joueur présentent un défi
NZZ souhaitait introduire son audio sur tous les produits et sur toutes les plateformes (ordinateurs de bureau, tablettes et applications). Cela signifiait concevoir et développer de nombreuses variantes de lecteurs différentes pour répondre aux considérations technologiques des différents joueurs.
Contenu de nos partenaires
L’essentiel :
De nombreuses variables entrent en jeu dans la création d'un bon service audio de synthèse vocale et doivent être pleinement prises en compte lors de la création, des tests et de la version bêta afin de lancer avec succès un produit de contenu audio de qualité.