Cosa sta succedendo:
Nel marzo 2019, la Neue Zürcher Zeitung (NZZ) ha lanciato al pubblico un nuovo servizio di sintesi vocale, una versione migliorata del suo lettore audio beta rilasciato lo scorso ottobre. L'azienda ha condiviso alcune delle principali lezioni apprese durante il processo.
Scavando più a fondo:
Per la lingua svizzero-tedesca Google Wavenet non basta
NZZ ha utilizzato Google Wavenet per generare i suoi file audio e, sebbene la tecnologia sia adatta per le lingue (attualmente ne parlano nove con un suono di qualità naturale), non era abbastanza robusta per le complessità dello svizzero tedesco. Per risolvere il problema, NZZ ha dotato un middleware di un lessico per far scorrere le parole prima di convertirle in audio.
L’architettura deve essere adatta al mix-and-match
In un settore in evoluzione con strumenti, esigenze e prodotti in continuo cambiamento, NZZ aveva bisogno di creare un servizio che potesse essere facilmente adattato alle mutevoli circostanze. Costruendo un'architettura mix-and-match, sono riusciti a spostare il servizio da Amazon Polly a Google Wavenet in breve tempo, migliorando notevolmente.
L'audio non è per tutti
Alcune persone amano l'audio, ma altre semplicemente no. NZZ ha chiesto a entrambi i tipi di utenti di valutare diversi motori di sintesi vocale insieme al testo letto da un essere umano reale. Entrambi i gruppi (non sorprende) hanno valutato la voce umana naturale come la più alta. Tuttavia, questa intuizione non era realmente rilevante a parte il fatto che agli utenti piaceva o meno l'audio, e la voce umana o la sua mancanza non sembrava avere un'influenza importante sull'utilizzo.
Tecniche per trasformare un pezzo scritto in un buon audio
È importante che i contenuti audio siano piacevoli da ascoltare e NZZ ha dovuto utilizzare un layout diverso per trasformare i suoi articoli in formato MP3 di qualità. Ciò ha comportato un'analisi approfondita del modo in cui gli utenti vorrebbero che venisse letto loro un articolo, che informasse i loro modelli audio.
Le diverse esperienze dei giocatori rappresentano una sfida
NZZ voleva presentare il proprio audio su tutti i prodotti e su tutte le piattaforme (desktop, tablet e app). Ciò significava progettare e sviluppare molte varianti di giocatori diversi per soddisfare le considerazioni tecnologiche dei diversi giocatori.
Contenuti dei nostri partner
La conclusione:
Molte variabili contribuiscono alla creazione di un buon servizio audio di sintesi vocale e devono essere attentamente prese in considerazione durante la creazione, il test e la beta per lanciare con successo un prodotto con contenuti audio di qualità.