ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی تولید صدا
هوش مصنوعی

ElevenLabs ابزار هوش مصنوعی خیره‌کننده‌ای برای اضافه‌کردن صدا به ویدیوها منتشر کرد

این ابزار به سازندگان اجازه می‌دهد تا برای ویدیوهای خود جلوه‌های صوتی و صدا تولید کنند.

جواد تاجی
نوشته شده توسط جواد تاجی | ۳۰ خرداد ۱۴۰۳ | ۱۴:۰۰

استارتاپ هوش مصنوعی ElevenLabs چند هفته پس از راه‌اندازی مدل تبدیل متن به صدای Sound Effects، ابزاری متن‌باز را نیز در اختیار کاربران قرار داد و پتانسیل‌های آن را نمایش داد. این ابزار هوش مصنوعی تولید صدا به سازندگان اجازه می‌دهد برای ویدیوهای خودشان جلوه‌های صوتی ایجاد کنند.

هوش مصنوعی تولید صدا ElevenLabs

طبق گزارش‌های موجود، ویدیو جدیدی را که برای استفاده از این ابزار آپلود می‌کنید، چهار فریم در فواصل زمانی یک‌ثانیه‌ای ارائه می‌شود. سپس این فریم‌ها همراه پرامپت به مدل GPT-4o فرستاده می‌شوند تا پرامپت جدیدی گرفته شود. به کمک API Sound Effects از این پرامپت برای تولید افکت صوتی از متن استفاده می‌شود.

درنهایت صدای تولیدشده با ویدیوی کاربر ترکیب می‌شود تا فایل آن برای دانلود ارائه شود. همچنین باید به این موضوع اشاره کرد که درحال‌حاضر فقط یک ویدیوی 22 ثانیه‌ای می‌توان با این ابزار ساخت.

استفاده از این ابزار بسیار ساده است. فقط باید ویدیو بدون صدا را در آن آپلود کنید تا هوش مصنوعی ElevenLabs چهار گزینه با صدا به شما ارائه کند. می‌توان انتظار داشت این هوش مصنوعی در آینده به سیستم‌های بزرگ‌تری اضافه شود تا تولیدکنندگان بتوانند از مزایای سیستم تولید صدای آن بهره ببرند.

«عمار ریشی»، مدیر بخش طراحی ElevenLabs، می‌گوید:

«سازندگان ویدیوهای هوش مصنوعی اغلب به‌دنبال جلوه‌های صوتی عالی هستند و ما احساس می‌کنیم با درک فریم ویدیوهای آن‌ها و پیشنهاد بهترین خروجی می‌توانیم به روند کار آن‌ها سرعت ببخشیم.»

همچنین ویدیویی را به اشتراک گذاشته که برای ساخت آن، از فناوری‌های ElevenLabs در کنار Luma AI و Hedra کمک گرفته شده است.

توسعه‌دهندگان می‌توانند به کد این ابزار در GitHub دسترسی داشته باشند. البته ElevenLabs وب‌سایت جدیدی هم راه‌اندازی کرده تا بتوانید Sound Effects API را امتحان کنید.

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی