ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی Fugatto انویدیا
هوش مصنوعی

انویدیا مدل هوش مصنوعی Fugatto را معرفی کرد؛ تولید صدا از روی دستورات متنی [تماشا کنید]

این مدل امکان ویرایش فایل‌های صوتی از پیش ساخته شده را نیز دارد.

حمید گنجی
نوشته شده توسط حمید گنجی | ۶ آذر ۱۴۰۳ | ۱۰:۰۴

انویدیا به‌تازگی مدل هوش مصنوعی جدیدی به نام Fugatto معرفی کرده که می‌تواند دستورات متنی کاربران را به صدا تبدیل کند یا با استفاده از این دستورها، فایل‌های صوتی را ویرایش کند.

انویدیا پادشاه مطلق بازار تراشه‌های هوش مصنوعی است و در ساخت مدل‌های نرم‌افزاری هوش مصنوعی نیز از پیشگامان به حساب می‌آید. انویدیا جدیدترین مدل هوش مصنوعی خود را «چاقوی سوئیسی برای صدا» توصیف می‌کند. این مدل می‌تواند ابزاری بسیار کاربردی برای تولیدکنندگان محتواهای ویدیویی باشد.

Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار نگرفته است

به گفته انویدیا، مدل «Foundational Generative Audio Transformer Opus 1» یا به‌اختصار Fugatto می‌تواند دستوراتش را متنی از کاربران دریافت کند و منطبق با این دستورات، فایل‌های صوتی بسازد. کاربران همچنین می‌توانند از Fugatto برای ویرایش فایل‌های صوتی ازپیش‌ساخته‌شده نیز استفاده کنند.

این مدل هوش مصنوعی را تیمی از متخصصان این حوزه در سراسر جهان ساخته‌اند. همچنین انویدیا می‌گوید این موضوع قابلیت‌های چندزبانی و چندلهجه‌ای Fugatto را قوی‌تر کرده است.

«رافائل واله»، یکی از محققان این پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، دراین‌باره می‌گوید قصد آنها ساخت مدلی بوده که صدا را مانند انسان‌ها درک و تولید کند. انویدیا برخی سناریوهای احتمالی برای استفاده از این مدل در دنیای واقعی را فهرست کرده است. Fugatto می‌تواند در این سناریو کاربرد داشته باشد.

هوش مصنوعی Fugatto

برای مثال، تولیدکنندگان موسیقی می‌توانند از این مدل هوش مصنوعی برای تولید نمونه‌های اولیه آهنگ استفاده کنند و به‌راحتی آن را ویرایش کنند. مردم عادی، تولیدکنندگان محتوا و توسعه‌دهندگان بازی‌های ویدیویی نیز می‌توانند نهایت استفاده را از قابلیت‌های مدل Fugatto ببرند. البته Fugatto هنوز به‌صورت عمومی در دسترس کاربران قرار ندارد و انویدیا نیز نگفته چه زمانی دسترسی عمومی به آن فراهم می‌شود.

شرکت‌های متا و گوگل نیز پیش‌ازاین مدل‌های هوش مصنوعی مشابهی معرفی کرده بودند که می‌توانست دستورات متنی کاربران را به صدا تبدیل کند. مدل هوش مصنوعی گوگل MusicLM نام دارد و کاربران می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی