تکنولوژی

گوگل Veo 3.1 معرفی شد؛ عملکرد بهتر در تبدیل تصویر به ویدیو [تماشا کنید]

گوگل در مدل خود بیشتر روی کاربردهای حرفه‌ای و ویرایشی به‌جای محتوای سطحی شبکه‌های اجتماعی تمرکز کرده است.

نوشته شده توسط جواد تاجی تاریخ انتشار: ۲۴ مهر ۱۴۰۴ | ۰۹:۰۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

ویدئوی مرتبط

تکنولوژی دیجی‌تک؛ چرا گوشی‌های اندروید دیر آپدیت می‌شوند؟

گوگل مدل هوش مصنوعی ویدیوساز Veo 3.1 را معرفی کرده که در تبدیل تصاویر به ویدیو عملکرد بهتری دارد. این نسخه جدید، در اجرای جزئیات درخواست‌های متنی دقت بیشتری دارد و اکنون از طریق API جمینای در دسترس کاربران قرار گرفته است. علاوه‌براین، Ve‌o 3.1 حالا موتور اصلی ویرایشگر ویدیو Flow گوگل نیز محسوب می‌شود.

هوش مصنوعی تولید ویدیو Veo 3.1

Veo 3.1 برپایه قابلیت‌هایی ساخته شده که گوگل در جریان رویداد Google I/O 2025 و هم‌زمان با عرضه Veo 3 آنها را معرفی کرده بود. طبق اعلام گوگل، این مدل جدید در «پایبندی به درخواست کاربر» بهتر عمل می‌کند و می‌تواند با دقت بیشتری از تصاویر آپلودشده در کنار متن، ویدیو تولید کند. همچنین برای اولین‌بار، تبدیل تصویر به ویدیو همراه با تولید صدا به‌صورت هم‌زمان در Veo 3.1 امکان‌پذیر شده است؛ قابلیتی که در نسخه قبلی وجود نداشت.

در ابزار Flow نیز Veo 3.1 قابلیت تازه‌ای به نام Frame to Video ارائه کرده است. این ویژگی به کاربر اجازه می‌دهد فریم ابتدایی و انتهایی یک صحنه را آپلود کند تا سیستم ویدیو بین آن دو را بسازد. گوگل می‌گوید این ویژگی مشابه قابلیتی است که در Adobe Firefly وجود دارد، اما Flow می‌تواند به‌طور هم‌زمان صدا نیز تولید کند.

مهارت‌های صوتی جدید Veo همچنین در قابلیت‌های دیگر Flow، مانند افزودن صحنه به ویدیوهای موجود یا درج اشیاء در فریم‌ها هم به کار گرفته می‌شود.

براساس نمونه‌هایی که گوگل منتشر کرده، ویدیوهای تولیدشده با Veo 3.1 هنوز تا حدی حالت مصنوعی دارند و کیفیت آنها بسته به موضوع و متن ورودی متفاوت است. بااین‌حال، هرچند از واقع‌گرایی مدل Sora 2 شرکت OpenAI فاصله دارد، تصمیم گوگل برای تمرکز بر کاربردهای حرفه‌ای و ویرایشی به‌جای محتوای سطحی شبکه‌های اجتماعی، گامی مثبت در جهت درست محسوب می‌شود.

گوگل

اشتراک گذاری:

کپی لینک

جواد تاجی

دوران حرفه‌ای من در دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

مشاهده کلیه مقالات منتشر شده