ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی Gen-3 آلفا
هوش مصنوعی

هوش مصنوعی تبدیل متن به ویدیوی Runway Gen-3 Alpha منتشر شد

مدل جدید استارتاپ Runway برخلاف مدل‌های قبلی Gen-1 و Gen-2 رایگان نیست.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۱۲ تیر ۱۴۰۳ | ۱۶:۰۰

چند روز قبل استارتاپ Runway هوش مصنوعی تبدیل متن به ویدیوی «Gen-3 Alpha» را معرفی کرد. اکنون این هوش مصنوعی در دسترس کاربران قرار گرفته، اما برخلاف مدل‌های Gen-1 و Gen-2 رایگان نیست. کاربران باید اشتراک‌های پولی این شرکت را داشته باشند تا بتوانند از این مدل استفاده کنند.

باتوجه به تعرفه‌های ماهانه و سالانه Runway، کاربران باید اشتراک‌های این شرکت را که از 12 دلار در ماه شروع می‌شود، تهیه کنند تا بتوانند به مدل جدید Gen-3 Alpha دسترسی داشته باشند. با این مدل شما می‌توانید با پرامپت‌های متنی حداکثر ویدیوهای 10 ثانیه‌ای تولید کنید؛ این مقدار بیشتر از بسیاری از مدل‌های ویدیویی هوش مصنوعی کنونی است، البته مدل OpenAI یعنی Sora می‌تواند ویدیوهای 1 دقیقه‌ای بسازد، اما هنوز برای عموم منتشر نشده است.

هوش مصنوعی تبدیل متن‌ به‌ ویدیوی Runway Gen-3 Alpha

Runway پس از عرضه مدل‌های Gen-1 و Gen-2 در عرض چند ماه در سال 2023، برای مدتی سکوت کرد و خبری از مدلی جدید نبود. در این مدت، مدل‌های تبدیل متن به ویدیوی زیادی مانند Pika و Dream Machine معرفی شدند.

پرامپت: پرتره سینمایی چهره دردکشیده و چروکیده یک پیرزن که با نور تلویزون روشن شده است.

با افزایش رقابت در زمینه مدل‌های تبدیل متن به ویدیو، استارتاپ Runway نیز تصمیم گرفت ماه گذشته با Gen-3 Alpha دوباره وارد میدان شود. این مدل که با ویدیوها و تصاویر همراه با توصیفات متنی آن صحنه‌ها آموزش دیده است، به کاربران امکان می‌دهد تا کلیپ‌های ویدیویی فوق‌العاده واقع‌گرایانه با کادربندی‌های سینمایی و شخصیت‌های انسانی باورپذیر با طیف وسیعی از کنش‌ها، حرکات و احساسات را تولید کنند.

نمونه‌هایی که Runway به نمایش گذاشته، ارتقای قابل‌توجه Gen-3 Alpha را نسبت به Gen-1 و Gen-2 نشان می‌دهد. این هوش مصنوعی نسبت به مدل‌های پیشین از نظر سرعت تولید ویدیو، وفاداری به متن کاربر و به‌تصویرکشیدن صحنه‌های مختلف پیشرفت زیادی داشته است. این شرکت می‌گوید که برای توسعه این قابلیت‌ها با یک تیم بین‌رشته‌ای متشکل از دانشمندان، مهندسان و هنرمندان همکاری کرده، اما اطلاعات زیادی درباره منبع دقیق داده‌های آموزشی منتشر نکرده است.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی