ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

مدل Veo 2 گوگل
هوش مصنوعی

رقیب قدرتمند Sora؛ گوگل از هوش مصنوعی ویدیوساز Veo 2 رونمایی کرد [تماشا کنید]

Veo 2 می‌تواند کلیپ‌های 2 دقیقه‌ای با رزولوشن 4K ایجاد کند.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۲۷ آذر ۱۴۰۳ | ۰۹:۳۳

گوگل 7 ماه قبل از هوش مصنوعی Veo پرده برداشت و حالا Veo 2 از راه رسیده است. Veo 2 می‌تواند کلیپ‌های دودقیقه‌ای با حداکثر رزولوشن 4K (4096 در 2160 پیکسل) تولید کند؛ به‌عبارتی در مقایسه با هوش مصنوعی Sora، مدل جدید گوگل ویدیوهایی با 4 برابر وضوح و حدود 6 برابر زمان بیشتر ارائه می‌دهد.

براساس اعلام گوگل، مدل Veo 2 می‌تواند ویدیوهای 2 دقیقه‌ای با کیفیت 4K تولید کند. البته درحال‌حاضر نمی‌توانید با چنین کیفیتی ویدیو بسازید و این ارقام صرفاً تئوری هستند. در ابزار آزمایشی تولید ویدیوی گوگل، VideoFX که Veo 2 اکنون انحصاری در آن در دسترس است، ویدیوها به کیفیت 720p و زمان 8 ثانیه محدود هستند. رقیب این مدل، Sora، می‌تواند کلیپ‌های 20 ثانیه‌ای 1080p تولید کند.

گوگل همچنین نسخه به‌روزشده‌ مدل تبدیل متن به عکس Imagen 3 را معرفی کرد اما تغییرات آن آن‌قدر زیاد نیستند که بتوان آن را مدل کاملاً جدیدی تلقی کرد و صرفاً نسخه‌ای بهبودیافته است.

هوش مصنوعی مولد ویدیوی Veo 2 گوگل

اگر می‌خواهید از مدل Veo 2 استفاده کنید، باید به پلتفرم VideoFX بروید و در لیست انتظار بمانید؛ البته گوگل می‌گوید تعداد کاربرانی را که می‌توانند در این هفته به هوش مصنوعی جدید دسترسی داشته باشند، افزایش می‌دهد. همچنین به گفته گوگل، Veo 2 از طریق پلتفرم توسعه‌دهنده Vertex AI نیز در دسترس خواهد بود. درکل این شرکت می‌خواهد در ماه‌های آینده، براساس بازخورد کاربران، مدل جدید را به بخش‌های مختلف اکوسیستم خود بیاورد.

مانند هر مدل مولد ویدیوی دیگری، Veo 2 نیز از طریق پرامپت‌های متنی برای شما ویدیو می‌سازد اما این مدل مزیت‌هایی دارد. مدل جدید گوگل می‌تواند کلیپ‌ها را در طیف وسیعی از سبک‌ها تولید کند، همچنین درک آن از فیزیک بهبود یافته‌ و فیلم‌های آن «واضح‌تر» شده‌اند.

واضح‌تر به این معنی است که بافت‌ها و تصاویر در کلیپ‌ها، به‌خصوص در صحنه‌هایی با حرکت زیاد، واضح‌تر هستند. همچنین کنترل دوربین بهتر شده و در Veo 2 دوربین مجازی را می‌توان بهتر در زوایای مختلف قرار داد.

گوگل ادعا می‌کند Veo 2 می‌تواند حرکت دینامیک سیالات (مانند ریختن قهوه در لیوان) و ویژگی‌های نور (مانند سایه‌ها و بازتاب‌ها) را واقعی‌تر مدل‌سازی کند. گوگل مدعی است این مدل کمتر دچار توهم می‌شود و خطاهای رایج مدل‌های دیگر مانند انگشت‌های اضافی را تولید نمی‌کند اما نمی‌توان با قطعیت این ادعا را پذیرفت.

گوگل هنوز اعلام نکرده منابع آموزشی مدل Veo 2 چه بوده‌اند اما ویدیوهای یوتوب یکی از منابع احتمالی است. گوگل مالک یوتوب است و پیش‌ازاین نیز گفته بود در توسعه مدل‌هایی مانند Veo «ممکن است» از محتوای یوتوب استفاده شود.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی