«Google» muhandislari inson ovozidan farq qilmaydigan nutq sintezatori tizimini yaratdi
«Google» nutq sintezatorining rivojlangan yangi avlodini yaratdi. U «Tacotron 2» deb ataladi va neyrotarmoqqa asoslangan, deb xabar berdi «NV.ua».
Bundan oldingi nutq generatsiya tizimining bir qator kamchiliklari bor edi. Masalan, «WaveNet» keskin ovozlarni tarqatar edi. «Tacotron» nutq ohangini (intonatsiya) yaxshi eplar, biroq to‘laqonli «nutq mahsuloti»ni taqdim eta olmasdi.
«Tacotron 2» algoritmi Jonatan Shen ishtirokidagi «Google» dasturchilari jamoasi tomonidan taqdim etildi, u ikkita neytron tarmog‘i asosida ishlaydi. Nutqning matnli talqini maxsus «Tacotron-spektorgamma»ga o‘tkaziladi, u esa o‘z navbatida ritm va urg‘uni taqsimlaydi, so‘zlar «WaveNet» analogiga generatsiyalanadi. Bundan tashqari, neyrotarmoqni o‘qitadigan ma’lumotlar tizimi qo‘shilgan.
Audioyozuv haqiqatda tirik odamning nutqiga o‘xshaydi. Nutqning tezligi ancha ishonarli, asosiy uzilishlar noodatiy so‘zlarni talaffuz qilinganida sodir bo‘ladi. To‘g‘ri, tinglovchilarning ba’zilarini ta’kidlashicha, tizim ayrim so‘zlarni «sindirmoqda».
«Tacotron 2» ishining namunalari bilan «Google»ning rasmiy sahifasida tanishish mumkin. Ushbu texnologiyadan yaqin kunlarda kompaniya mahsulotlarida foydalaniladi.
Yangi algoritmning asosiy kamchiliklaridan biri nuqt ohangini sozlashning imkoniyati yo‘qligidir.
Izoh qoldirish uchun saytda ro'yxatdan o'ting
Kirish
Ijtimoiy tarmoqlar orqali kiring
FacebookTwitter