گوگل مدل هوش مصنوعی ویدیوساز Veo 3.1 را معرفی کرده که در تبدیل تصاویر به ویدیو عملکرد بهتری دارد. این نسخه جدید، در اجرای جزئیات درخواستهای متنی دقت بیشتری دارد و اکنون از طریق API جمینای در دسترس کاربران قرار گرفته است. علاوهبراین، Veo 3.1 حالا موتور اصلی ویرایشگر ویدیو Flow گوگل نیز محسوب میشود.
هوش مصنوعی تولید ویدیو Veo 3.1
Veo 3.1 برپایه قابلیتهایی ساخته شده که گوگل در جریان رویداد Google I/O 2025 و همزمان با عرضه Veo 3 آنها را معرفی کرده بود. طبق اعلام گوگل، این مدل جدید در «پایبندی به درخواست کاربر» بهتر عمل میکند و میتواند با دقت بیشتری از تصاویر آپلودشده در کنار متن، ویدیو تولید کند. همچنین برای اولینبار، تبدیل تصویر به ویدیو همراه با تولید صدا بهصورت همزمان در Veo 3.1 امکانپذیر شده است؛ قابلیتی که در نسخه قبلی وجود نداشت.
در ابزار Flow نیز Veo 3.1 قابلیت تازهای به نام Frame to Video ارائه کرده است. این ویژگی به کاربر اجازه میدهد فریم ابتدایی و انتهایی یک صحنه را آپلود کند تا سیستم ویدیو بین آن دو را بسازد. گوگل میگوید این ویژگی مشابه قابلیتی است که در Adobe Firefly وجود دارد، اما Flow میتواند بهطور همزمان صدا نیز تولید کند.
مهارتهای صوتی جدید Veo همچنین در قابلیتهای دیگر Flow، مانند افزودن صحنه به ویدیوهای موجود یا درج اشیاء در فریمها هم به کار گرفته میشود.
براساس نمونههایی که گوگل منتشر کرده، ویدیوهای تولیدشده با Veo 3.1 هنوز تا حدی حالت مصنوعی دارند و کیفیت آنها بسته به موضوع و متن ورودی متفاوت است. بااینحال، هرچند از واقعگرایی مدل Sora 2 شرکت OpenAI فاصله دارد، تصمیم گوگل برای تمرکز بر کاربردهای حرفهای و ویرایشی بهجای محتوای سطحی شبکههای اجتماعی، گامی مثبت در جهت درست محسوب میشود.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.