ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

مایکروسافت
تکنولوژی

هوش مصنوعی VALL-E مایکروسافت می‌تواند با نمونه‌های 3‌ثانیه‌ای، هر صدایی را تقلید کند

هوش مصنوعی جدید مایکروسافت با نام VALL-E قادر است با دریافت یک نمونه صوتی 3ثانیه‌ای، صدای افراد را با حفظ حس‌وحال تقلید کند.

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۱۹ دی ۱۴۰۱ | ۲۲:۰۰

مایکروسافت اخیراً یک ابزار هوش مصنوعی جدید را منتشر کرده است که VALL-E نام دارد و می‌تواند صدای افراد را تقلید کند. برای استفاده از این ابزار کافیست 3 ثانیه از صدای یک فرد را به هوش مصنوعی بدهید و بعد با حفظ حس‌وحال گوینده اصلی، به تولید عبارت‌های جدید بپردازید.

به گزارش AITopics، هوش مصنوعی تقلید صدا مایکروسافت موسوم به VALL-E می‌تواند از روی نمونه 3ثانیه‌ای صدای افراد، دست به تقلید صدای آن‌ها بزند. این ابزار با 60 هزار ساعت داده صوتی به زبان انگلیسی آموزش داده شده است. VALL-E می‌تواند در عین حفظ احساس گوینده اصلی، دست به خلق عبارت‌هایی بزند که در برش 3 ثانیه اصلاً وجود نداشته است.

گروهی از محققان دانشگاه کورنل با این ابزار چندین صدای مصنوعی ساخته‌اند و نتایج آزمایش‌های خود را در گیت‌هاب منتشر کرده‌اند. با بررسی این صداها می‌توان دید که برخی از آن‌ها طبیعی‌تر و برخی ماشینی‌ترند. درنتیجه، انتظار می‌رود که این هوش مصنوعی در آینده بهبودهای بیشتری داشته باشد. از طرف دیگر، اگر بیشتر از 3 ثانیه داده دریافتی وجود داشته باشد، می‌توان شانس بیشتری برای تقلید صدای دقیق‌تر قائل شد.

VALL-E مایکروسافت در دسترس عموم قرار ندارد

VALL-E درحال‌حاضر به‌صورت عمومی منتشر نشده و این تصمیم احتمالاً تصمیم درستی بوده است؛ چرا که تقلید صدای افراد می‌تواند کاربردهای خطرناکی داشته باشد و خیلی راحت و سریع توسط تبهکاران برای اهداف کلاهبرداری استفاده شود.

به‌علاوه، چنین شکلی از هوش مصنوعی می‌تواند با تقلید صدای سیاستمداران مشکلات بسیار بزرگ‌تری را به‌وجود بیاورد. درنتیجه، به‌نظر می‌رسد که تا پیش از عرضه این ابزار (البته اصلاً اگر امکان عرضه آن وجود داشته باشد)، باید به سؤالات مهمی در این زمینه پاسخ دهیم و نگرانی‌های مهمی را برطرف کنیم.

بدیهی است که VALL-E هم مثل بسیاری از ابزارهای هوش مصنوعی تغییر صدا می‌تواند استفاده‌های مفید و غیرمفیدی داشته باشد. «برد اسمیت»، از مدیران مایکروسافت قبلاً گفته بود که این حوزه نیازمند مقررات است و در آینده باید ببینیم که مایکروسافت چه قواعدی را برای استفاده از ابزارهای خود در نظر خواهد گرفت.

ایمان صاحبی

علاقه من به فناوری به دوره نوجوانی برمی‌گرده اما از حدود سال ۹۴ کار جسته گریخته توی این فضا رو شروع کردم و از ۹۷ به‌طور جدی‌تر وارد این کار شدم. فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این حوزه برام محسوب می‌شه، اما به مرور فهمیدم که همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم خیلی دوست دارم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی