ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

تولید موسیقی توسط هوش مصنوعی
تکنولوژی

مدل هوش مصنوعی متن‌باز جدید متا می‌تواند از متن، آهنگ بسازد

متا مدل هوش مصنوعی متن‌بازی را معرفی کرده است که می‌تواند با دریافت ورودهای متنی یا تکه‌های یک ملودی، آهنگ‌های تازه بسازد.

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۲۲ خرداد ۱۴۰۲ | ۲۰:۰۰

تیم تحقیقاتی Audiocraft از شرکت متا به‌تازگی یک مدل هوش مصنوعی متن‌باز به نام MusicGen را منتشر کرده است که شبیه ChatGPT با ورودی‌های متنی کار می‌کند، اما از آن‌ها آهنگ می‌سازد. این مدل حتی قادر است نمونه‌ای از یک آهنگ را دریافت کند و آن را مطابق توصیف کاربر تغییر دهد.

به گزارش وب‌سایت Decoder، با استفاده از MusicGen می‌توانید سبک موسیقی مدنظر خود را توصیف کنید یا بخشی از یک آهنگ را به نرم‌افزار بدهید و روی دکمه Generate کلیک کنید. پس از چند ثانیه (در یک مثال پس از 160 ثانیه) به آهنگ جدیدی می‌رسید که مطابق توصیف متنی شما ساخته شده یا تغییر پیدا کرده است.

دموی این مدل یادگیری عمیق که در سایت Hugging Face فیسبوک قرار دارد، به شما اجازه می‌دهد آهنگ مدنظر خود را توصیف کنید. برای مثال، می‌توانید بگویید آهنگی شبیه به آهنگ‌های دهه 1980 میلادی می‌خواهم که درام‌های سنگینی در پس‌زمینه داشته باشد.

هوش مصنوعی متا با 20 هزار ساعت موسیقی آموزش داده شده است

متا برای توسعه این مدل هوش مصنوعی از 20 هزار ساعت موسیقی مجوزدار شامل 10 هزار قطعه آهنگ از پایگاه داده داخلی خود به‌همراه داده‌های سایت‌هایی مثل Shutterstock و Pond5 استفاده کرده است. این شرکت برای بالابردن سرعت فرایند آموزش، از توکن‌ساز صوتی 32 کیلوهرتزی EnCodec استفاده کرده تا تکه‌های کوچک‌تری از آهنگ‌ها را با قابلیت پردازش هم‌زمان بسازد.

«احسان خالق»، مهندس یادگیری ماشینی Hugging Face می‌گوید: «MusicGen برخلاف متدهای موجود نظیر MusicLM به بازنمایی معنایی با قابلیت نظارت بر خود نیاز ندارد [و] به‌ازای هر ثانیه‌ صدا فقط 50 گام پس‌رونده خودکار دارد.»

همان‌طور که گفتیم، MusicGen متن‌باز است و حتی می‌تواند برای تولید آهنگ‌های تجاری استفاده شود. این نرم‌افزار نشان می‌دهد که توسعه هوش مصنوعی با چه سرعتی درحال پیش‌رفتن است و مدل‌های یادگیری عمیق چگونه می‌توانند بازار موسیقی را تهدید کنند. گوگل هم حدود یک ماه پیش مدل MusicLM را معرفی کرد، اما به‌نظر می‌رسد که MusicGen عملکرد بهتری دارد.

ایمان صاحبی

علاقه من به فناوری به دوره نوجوانی برمی‌گرده اما از حدود سال ۹۴ کار جسته گریخته توی این فضا رو شروع کردم و از ۹۷ به‌طور جدی‌تر وارد این کار شدم. فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این حوزه برام محسوب می‌شه، اما به مرور فهمیدم که همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم خیلی دوست دارم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی