سیستم تبدیل متن به گفتار IBM در ۵ دقیقه صدای مصنوعی با کیفیت تولید می‌کند

آموزش مدل‌های پرقدرت تبدیل متن به گفتار نیازمند سخت‌افزار قدرتمند هستند. بر اساس گزارش‌هایی که منتشر شده است، قدرت مورد نیاز برای پردازش این متون، نسبت به سال ۲۰۱۲ حدود ۳۰۰ هزار برابر بیشتر شده است. شرکت IBM ‌در همین راستا توانسته سیستم ماژولار سبکی را توسعه دهد که تنها در ۵ دقیقه می‌توانند صدای مصنوعی را با همان کیفیت بازتولید کند.

سیستم تیم IBM از سه ماژول به هم پیوسته تشکیل شده است. این ۳ ماژول شامل پیش‌بینی ویژگی‌های لحن گوینده، بیش‌بینی ویژگی‌های آکوستیک و یک تولید‌کننده عصبی صدا است.

قابلیت پیش‌بینی ویژگی‌های لحن مدت، گام و انرژی صدا را یاد می‌گیرد. همچنین پیش‌بینی کننده ویژگی‌های آکوستیک، صدای گوینده را از داده‌های آموزشی بازتولید می‌کند. در نهایت یک تولید کننده صدا نیز با استفاده از داده‌های ماژول‌های قبلی، صدای نهایی را تولید می‌کند. تمام این اجزا با همکاری هم صدای مصنوعی را از بازتولید داده‌های کم آموزشی تولید می‌کنند.

تبدیل متن به گفتار

در تستی که به کمک شنوندگان داوطلب از این صدا‌های مصنوعی به عمل آمد، محققان بر اساس امتیازدهی داوطلبان دریافتند که صدای مصنوعی تولید شده در زمان ۵ دقیقه، کیفیت بالا و شباهت بسیاری با صدای اصلی گوینده دارد.

محققین IBM در این رابطه می‌گویند:

پیشرفت‌ها اخیر یادگیری عمیق بهبود‌های دراماتیکی داشته‌اند و این موضوع را مدیون توسعه سیستم‌های تبدیل متن به گفتار (TTS) هستند که در حال آموزش صدا و نحوه صحبت کردن و همچنین بازتولید صدای خروجی طبیعی هستند که به صورت بهینه و موثر صورت می‌گیرد. با این حال برای تولید صدای با کیفیت، بیشتر سیستم‌های TTS نیازمند مدل‌های شبکه‌های عصبی پیچیده هستند که آموزش آن‌‌ها هم به سادگی اتفاق نمی‌افتد. به همین دلیل تیم ما در IBM این مشکل را به کمک طراحی ماژولار حل کرده است.

نتایج و روش ماژولار این تیم، در سیستم جدید تبدیل متن به گفتار واتسون IBM استفاده شد که صدای مصنوعی با کیفیتی را تولید می‌کند. همچنین با کمک این سیستم ماژولار محققین توانستند سیستم آموزش هوش مصنوعی IBM را از یک هفته به ۱۱ ساعت کاهش بدهند.

تور کیش

مطالب مرتبط

باتری تازه IBM؛ بی نیاز از فلزات سنگین کمیاب

تلاش برای حذف سوخت های فسیلی و استفاده از باتری برای تامین انرژی وسایط حمل و نقل عمومی مرتبا بیشتر می شود و این روزها از خودروهای سواری گرفته تا کامیون ها و حتی هواپیماها در قالب نسخه های الکتریکی ساخته می شوند. به همین خاطر نیز در سال های اخیر تقاضا برای باتری مورد... ادامه مطلب

لیست سریع ترین ابرکامپیوترهای جهان؛ سریع تر از همیشه با لینوکس

در آخرین رده بندی 500 ابرکامپیوتر برتر دنیا، میانگین سرعت ابرکامپیوترهای مبتنی بر لینوکس به رقم باورنکردنی 1.14 پتافلاپس رسیده است. سریع ترین ابرکامپیوتر لیست یعنی «سامیت» (Summit)، با توان پردازشی 148.6 پتافلاپس به جایگاه نخست تکیه زده است.سامیت در لیست 500 ابرکامپیوتر برتر ماه ژوئن نیز لقب سریع ترین ابرکامپیوتر دنیا را به خود... ادامه مطلب

مک بهتر است یا پی سی؟ IBM به سوال قرن پاسخ می‌دهد

کمپانی IBM اخیرا داخل شرکت خود تحقیقاتی به عمل آورده و اطلاعاتی را در رابطه با کارمندانش منتشر کرده است. هدف این تحقیق، پاسخ دادن به سوالی است که پاسخ روشنی ندارد؛ مک بهتر است یا ویندوز؟ از نظر IBM، مک.بر اساس نتایج تحقیقاتی که این کمپانی به دست آورده است، کاربران مک ۲۲ درصد... ادامه مطلب

گزارش IBM از کاهش محبوبیت پول نقد؛ رمزارز اختصاصی بانک‌های مرکزی در راه است

بانک های دنیا از ترس کاهش سلطه خود در حوزه مالی، به دنبال توسعه و عرضه رمزارز هستند. طبق گزارشی که توسط کمپانی IBM منتشر شده، ارز دیجیتال بانک مرکزی (CBDC) برای استفاده عمومی تا 5 سال آینده آماده خواهد شد.در گزارش IBM به چالش هایی که بانک ها با ظهور بیت کوین و تکنولوژی... ادامه مطلب

محققان گوگل بو کردن را به هوش مصنوعی یاد دادند

محققان تیم Google Brain مقاله ای نوشته و منتشر کرده اند و در آن چگونگی آموزش تشخیص بوها به هوش مصنوعی را شرح داده اند.پژوهشگران گوگل یک بانک اطلاعاتی از تقریباً 5 هزار مولکول شناخته شده توسط عطرسازان را ایجاد کرده و آنها را با توضیحاتی مثل «کره ای»، «استوایی» و «علفی» برچسب گذاری کرده... ادامه مطلب

کمپانی IBM ادعای گوگل در مورد برتری کوانتومی را زیر سوال برد

کمپانی IBM که در زمینه سامانه‌های کوانتومی با گوگل رقابت دارد، ادعای این شرکت در مورد دستیابی به برتری کوانتومی را زیر سوال برده است.اواخر ماه گذشته گوگل مدعی شد با کامپیوتر کوانتومی Sycamore توانسته برای اولین بار به برتری کوانتومی دست پیدا کند. بر این اساس سامانه کوانتومی ۵۳ بیتی گوگل محاسبه‌ای را در ۳ دقیقه... ادامه مطلب

ویجیاتو

نظرات ۰

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

رمزتان را گم کرده‌اید؟