سیستم تبدیل متن به گفتار IBM در ۵ دقیقه صدای مصنوعی با کیفیت تولید می‌کند

آموزش مدل‌های پرقدرت تبدیل متن به گفتار نیازمند سخت‌افزار قدرتمند هستند. بر اساس گزارش‌هایی که منتشر شده است، قدرت مورد نیاز برای پردازش این متون، نسبت به سال ۲۰۱۲ حدود ۳۰۰ هزار برابر بیشتر شده است. شرکت IBM ‌در همین راستا توانسته سیستم ماژولار سبکی را توسعه دهد که تنها در ۵ دقیقه می‌توانند صدای مصنوعی را با همان کیفیت بازتولید کند.

سیستم تیم IBM از سه ماژول به هم پیوسته تشکیل شده است. این ۳ ماژول شامل پیش‌بینی ویژگی‌های لحن گوینده، بیش‌بینی ویژگی‌های آکوستیک و یک تولید‌کننده عصبی صدا است.

قابلیت پیش‌بینی ویژگی‌های لحن مدت، گام و انرژی صدا را یاد می‌گیرد. همچنین پیش‌بینی کننده ویژگی‌های آکوستیک، صدای گوینده را از داده‌های آموزشی بازتولید می‌کند. در نهایت یک تولید کننده صدا نیز با استفاده از داده‌های ماژول‌های قبلی، صدای نهایی را تولید می‌کند. تمام این اجزا با همکاری هم صدای مصنوعی را از بازتولید داده‌های کم آموزشی تولید می‌کنند.

تبدیل متن به گفتار

در تستی که به کمک شنوندگان داوطلب از این صدا‌های مصنوعی به عمل آمد، محققان بر اساس امتیازدهی داوطلبان دریافتند که صدای مصنوعی تولید شده در زمان ۵ دقیقه، کیفیت بالا و شباهت بسیاری با صدای اصلی گوینده دارد.

محققین IBM در این رابطه می‌گویند:

پیشرفت‌ها اخیر یادگیری عمیق بهبود‌های دراماتیکی داشته‌اند و این موضوع را مدیون توسعه سیستم‌های تبدیل متن به گفتار (TTS) هستند که در حال آموزش صدا و نحوه صحبت کردن و همچنین بازتولید صدای خروجی طبیعی هستند که به صورت بهینه و موثر صورت می‌گیرد. با این حال برای تولید صدای با کیفیت، بیشتر سیستم‌های TTS نیازمند مدل‌های شبکه‌های عصبی پیچیده هستند که آموزش آن‌‌ها هم به سادگی اتفاق نمی‌افتد. به همین دلیل تیم ما در IBM این مشکل را به کمک طراحی ماژولار حل کرده است.

نتایج و روش ماژولار این تیم، در سیستم جدید تبدیل متن به گفتار واتسون IBM استفاده شد که صدای مصنوعی با کیفیتی را تولید می‌کند. همچنین با کمک این سیستم ماژولار محققین توانستند سیستم آموزش هوش مصنوعی IBM را از یک هفته به ۱۱ ساعت کاهش بدهند.

مطالب مرتبط

IBM از توسعه فناوری‌های تشخیص چهره دست کشید؛ نگرانی از نقض حریم خصوصی

مدیرعامل IBM، «ارویند کریشنا» در نامه‌ای به کنگره اعلام کرده که این شرکت عرضه نرم افزارهای تشخیص یا تحلیل چهره را متوقف می‌کند و از تحقیق و توسعه در این بخش دست می‌کشد.در این نامه نوشته شده:««IBM قاطعانه مخالف استفاده از هر نوع فناوری از جمله تشخیص چهره برای نظارت جمعی، ایجاد پروفایل بر اساس... ادامه مطلب

ابزار جدید IBM امنیت داده‌ها را در اندروید و iOS دو چندان می‌کند

ابزار جدید IBM امکان دسترسی آسانتر توسعه دهندگان به فناوری رمزنگاری تمام هم‌ریخت را فراهم می سازد که از داده‌های حساس در برابر حملات سایبری حفاظت می‌کندرمزنگاری داده‌ها یکی از راه‌های حراست از آنها در برابر حملات سایبری و شنود پنهانی است. داده‌ها معمولا زمانی که ذخیره شده یا در حال انتقال هستند، رمزنگاری می‌شوند... ادامه مطلب

عواقب بحران کرونا؛ IBM هزاران کارمند را اخراج می‌کند

بحران ویروس کرونا تقریبا هیچ بخشی از بازار را بی نصیب نگذاشته و دومینوی اخراج کارکنان به IBM رسیده است.تا پیش از این بیشترین صدمات ناشی از شیوع کووید-۱۹ در کسب و کارهای خدماتی مثل اوبر مشاهده می شد که مستقیما با کاربران سر و کار دارند. با ضعیف شدن این شرکت ها حالا نوبت... ادامه مطلب

باتری تازه IBM؛ بی نیاز از فلزات سنگین کمیاب

تلاش برای حذف سوخت های فسیلی و استفاده از باتری برای تامین انرژی وسایط حمل و نقل عمومی مرتبا بیشتر می شود و این روزها از خودروهای سواری گرفته تا کامیون ها و حتی هواپیماها در قالب نسخه های الکتریکی ساخته می شوند. به همین خاطر نیز در سال های اخیر تقاضا برای باتری مورد... ادامه مطلب

لیست سریع ترین ابرکامپیوترهای جهان؛ سریع تر از همیشه با لینوکس

در آخرین رده بندی 500 ابرکامپیوتر برتر دنیا، میانگین سرعت ابرکامپیوترهای مبتنی بر لینوکس به رقم باورنکردنی 1.14 پتافلاپس رسیده است. سریع ترین ابرکامپیوتر لیست یعنی «سامیت» (Summit)، با توان پردازشی 148.6 پتافلاپس به جایگاه نخست تکیه زده است.سامیت در لیست 500 ابرکامپیوتر برتر ماه ژوئن نیز لقب سریع ترین ابرکامپیوتر دنیا را به خود... ادامه مطلب

مک بهتر است یا پی سی؟ IBM به سوال قرن پاسخ می‌دهد

کمپانی IBM اخیرا داخل شرکت خود تحقیقاتی به عمل آورده و اطلاعاتی را در رابطه با کارمندانش منتشر کرده است. هدف این تحقیق، پاسخ دادن به سوالی است که پاسخ روشنی ندارد؛ مک بهتر است یا ویندوز؟ از نظر IBM، مک.بر اساس نتایج تحقیقاتی که این کمپانی به دست آورده است، کاربران مک ۲۲ درصد... ادامه مطلب

نظرات ۰

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

رمزتان را گم کرده‌اید؟