ماذا يحدث:
في مارس 2019، صحيفة Neue Zürcher Zeitung (NZZ) خدمة جديدة لتحويل النص إلى كلام للجمهور، كنسخة محسنة من مشغل الصوت التجريبي الذي تم إصداره في أكتوبر الماضي. شاركت الشركة بعض الدروس الرئيسية المستفادة خلال هذه العملية.
حفر أعمق:
Google Wavenet لا يكفي للغة الألمانية السويسرية
استخدمت NZZ Google Wavenet لإنشاء ملفاتها الصوتية، وعلى الرغم من موهبة هذه التكنولوجيا في تعلم اللغات (تتحدث حاليًا تسع لغات بجودة صوت طبيعية)، إلا أنها لم تكن قوية بما يكفي لمواجهة تعقيدات اللغة الألمانية السويسرية. ولحل المشكلة، قامت NZZ بتجهيز برنامج وسيط بقاموس لتدفق الكلمات من خلاله قبل تحويلها إلى صوت.
يجب أن تكون الهندسة المعمارية صديقة للمزج والتطابق
في صناعة متغيرة مع تغير الأدوات والاحتياجات والمنتجات، احتاجت NZZ إلى بناء خدمة يمكن تكييفها بسهولة مع الظروف المتغيرة. ومن خلال إنشاء بنية مزيج وتطابق، تمكنوا من نقل الخدمة من Amazon Polly إلى Google Wavenet في وقت قصير، مما أدى إلى تحسن كبير.
الصوت ليس للجميع
بعض الناس يحبون الصوت، ولكن البعض الآخر ببساطة لا يفعل ذلك. طلبت NZZ من كلا النوعين من المستخدمين تقييم محركات مختلفة لتحويل النص إلى كلام بالإضافة إلى النص الذي يقرأه الإنسان الفعلي. كلا المجموعتين (بشكل غير مفاجئ) صنفتا الصوت البشري الطبيعي على أنه الأعلى. ومع ذلك، لم تكن هذه الرؤية ذات صلة حقًا إلى جانب حقيقة أن المستخدمين إما أحبوا الصوت أم لا، ولا يبدو أن الصوت البشري أو عدمه له تأثير مهم على الاستخدام.
تقنيات تحويل قطعة مكتوبة إلى صوت جيد
من المهم أن يكون المحتوى الصوتي ممتعًا عند الاستماع إليه، وكان على NZZ استخدام تخطيط مختلف لتحويل مقالاتها إلى تنسيق MP3 عالي الجودة. وشمل ذلك النظر عن كثب في الكيفية التي يرغب بها المستخدمون في قراءة مقال لهم، والذي أبلغ قوالبهم الصوتية.
تمثل تجارب اللاعبين المختلفة تحديًا
أرادت NZZ تقديم خدماتها الصوتية عبر جميع المنتجات وعلى جميع الأنظمة الأساسية (سطح المكتب والأجهزة اللوحية والتطبيقات). وهذا يعني تصميم وتطوير العديد من المتغيرات المختلفة للاعبين لاستيعاب الاعتبارات التقنية لدى اللاعبين المختلفين.
المحتوى من شركائنا
الخط السفلي:
تدخل العديد من المتغيرات في إنشاء خدمة صوتية جيدة لتحويل النص إلى كلام ويجب أخذها في الاعتبار بشكل كامل أثناء الإنشاء والاختبار والإصدار التجريبي من أجل إطلاق منتج محتوى صوتي عالي الجودة بنجاح.