Apa yang Berlaku:
Pada Mac 2019, Neue Zürcher Zeitung (NZZ) melancarkan perkhidmatan teks-ke-ucapan baharu kepada orang ramai, sebagai versi pemain audio beta yang dipertingkat yang dikeluarkan pada Oktober lalu. Syarikat itu berkongsi beberapa pengajaran utama yang dipelajari semasa proses tersebut.
Menggali Lebih Dalam:
Google Wavenet tidak mencukupi untuk bahasa Jerman Switzerland
NZZ menggunakan Google Wavenet untuk menjana fail audionya, dan walaupun teknologi ini berbakat dalam bahasa (kini bercakap sembilan dengan bunyi kualiti semula jadi), ia tidak cukup mantap untuk kerumitan bahasa Jerman Switzerland. Untuk menyelesaikan masalah, NZZ dilengkapi perisian tengah dengan leksikon untuk mengalirkan perkataan sebelum ditukar kepada audio.
Seni bina mestilah mesra campuran dan padan
Dalam industri yang berubah dengan alat, keperluan dan produk yang berubah, NZZ perlu membina perkhidmatan yang mudah disesuaikan dengan keadaan yang berubah-ubah. Dengan membina seni bina campuran dan padanan, mereka dapat mengalihkan perkhidmatan daripada Amazon Polly ke Google Wavenet dalam masa yang singkat, bertambah baik secara mendadak.
Audio bukan untuk semua orang
Sesetengah orang suka audio, tetapi yang lain tidak begitu. NZZ meminta kedua-dua jenis pengguna untuk menilai enjin teks-ke-pertuturan yang berbeza bersama-sama dengan teks yang dibaca oleh manusia sebenar. Kedua-dua kumpulan (tidak menghairankan) menilai suara manusia semula jadi yang tertinggi. Walau bagaimanapun, cerapan itu tidak begitu relevan selain fakta bahawa pengguna sama ada menyukai audio atau tidak, dan suara manusia atau kekurangannya nampaknya tidak mempunyai pengaruh penting pada penggunaan.
Teknik untuk membuat karya bertulis menjadi audio yang baik
Adalah penting bahawa kandungan audio menyenangkan untuk didengar, dan NZZ terpaksa menggunakan reka letak yang berbeza untuk mengubah rencananya kepada format MP3 yang berkualiti. Ini melibatkan melihat dengan teliti cara pengguna ingin artikel dibacakan kepada mereka, yang memaklumkan templat audio mereka.
Pengalaman pemain yang berbeza memberikan cabaran
NZZ mahu memperkenalkan audionya merentas semua produk dan pada semua platform (desktop, tablet dan apl). Ini bermakna mereka bentuk dan membangunkan banyak varian pemain yang berbeza untuk menampung pertimbangan teknologi dalam pemain yang berbeza.
Kandungan daripada rakan kongsi kami
Intinya:
Banyak pembolehubah digunakan untuk mencipta perkhidmatan audio teks ke pertuturan yang baik dan mesti mempertimbangkan sepenuhnya semasa pembinaan, ujian dan beta untuk berjaya melancarkan produk kandungan audio yang berkualiti.