شرکت OpenAI از هوش مصنوعی تقلید صدا Voice Engine رونمایی کرد
هوش مصنوعی تقلید صدا Voice Engine شرکت OpenAI میتواند متون را با صدای شما در زبانهای مختلف بخواند.
شرکت OpenAI وارد دنیای مدلهای هوش مصنوعی تقلید صدا شد. این شرکت از هوش مصنوعی تقلید صدا Voice Engine رونمایی کرده است که میتواند با کلیپهای صوتی ۱۵ ثانیهای، صدای مصنوعی بسازد. این صدای تولیدشده با هوش مصنوعی میتواند دستورات متنی را به زبانهای مختلفی بخواند؛ البته این ابزار بهطور بسیار محدود عرضه شده است.
درحالحاضر شرکتهای بسیار کمی ازجمله Age of Learning و HeyGen به ابزار جدید OpenAI دسترسی پیدا کردهاند. در نمونههای صوتی که OpenAI منتشر کرده است، زبانهای مختلفی ازجمله انگلیسی، آلمانی، فرانسوی و ژاپنی بهچشم میخورند. درحقیقت این ابزار نهتنها میتواند با زبان اصلی فایل صوتی، متنهای مختلف را بخواند، بلکه قابلیت خواندن متن به زبانهای دیگر را نیز دارد.
هوش مصنوعی تقلید صدا Voice Engine
به گفته OpenAI، این شرکت از اواخر ۲۰۲۲ شروع به توسعه Voice Engine کرده است و این فناوری هماکنون در API تبدیل متن به صدا و همچنین قابلیت Read Aloud چتبات ChatGPT وجود دارد. به گفته یکی از اعضای تیم محصول Voice Engine به نام «جف هریس»، این ابزار با ترکیبی از دادههای دارای حق کپیرایت و دادههای عمومی آموزش داده شده و تنها در اختیار حدود ۱۰ توسعهدهنده قرار گرفته است.
در ادامه، صدای تولیدشده توسط Age of Learning را میشنوید که در آن هوش مصنوعی با صدای مرجع، درباره زیستشناسی و شیمی صحبت میکند. همانطور که بالاتر گفتیم، این ابزار با استفاده از صدای شما، متن درخواستیتان را میخواند.
قابلیت تبدیل متن به صدا با هوش مصنوعی درحال تکامل است و درحالیکه بسیاری از شرکتها روی تولید صداهای طبیعی یا آلات موسیقی تمرکز کردهاند، استارتاپهای کمی بهسراغ تولید صدای افراد رفتهاند. البته در میان همین استارتاپها، نامهای مطرحی مانند ElevenLabs هم وجود دارد.
درحالی OpenAI بهسراغ ابزار تقلید صدا رفته است که نگرانیهایی درباره سوءاستفاده از این ابزارها وجود دارد. بااینحال، OpenAI میگوید با شرکا در رابطه با پیروی از سیاستهای خود به توافق رسیده است. طبق این سیاستها، نباید از هوش مصنوعی تقلید صدای OpenAI برای جعل هویت افراد و سازمانها بدون رضایت آنها استفاده کرد.
OpenAI همچنین از شرکای خود میخواهد که «رضایت صریح و آگاهانه» گوینده اصلی را داشته باشند. به صداهای تولیدشده با هوش مصنوعی، واترمارک زده میشود تا بتوان منشأ آنها را پیدا کرد و البته روی نحوه استفاده از آنها نظارت داشت.
سازنده ابزار تقلید صدا Voice Engine چندین گام را برای محدودکردن امکان سوءاستفاده از این ابزارها پیشنهاد کرده است. ازجمله این پیشنهادها میتوان به حذف تدریجی احراز هویت صوتی برای دسترسی به حسابهای بانکی، تنظیم سیاستهایی برای محافظت از صدای افراد در هوش مصنوعی، آموزشهای بهتر درباره دیپفیک و همچنین توسعه سیستمهای ردیابی محتواهای ساختهشده با هوش مصنوعی اشاره کرد.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.