ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی تولید ویدیو
هوش مصنوعی

گوگل از هوش مصنوعی پیشرفته Lumiere برای تولید ویدیو از متن و تصویر رونمایی کرد [تماشا کنید]

این ابزار می‌تواند براساس متن و تصاویر شما ویدیوهای کاملاً واقعی تولید کند و همچنین ویدیوها را ویرایش نماید.

جواد تاجی
نوشته شده توسط جواد تاجی | ۷ بهمن ۱۴۰۲ | ۱۴:۰۰

تیمی از محققان گوگل ریسرچ ابزار هوش مصنوعی جدیدی با نام Lumiere را توسعه داده‌اند که از آن به‌عنوان نسل بعدی ابزارهای تولید ویدیو براساس متن یاد شده است. گوگل مدعی شده که Lumiere می‌تواند ویدیوهای کاملی با حرکات منسجم، روان و واقعی ایجاد کند.

بسیاری از مدل‌های هوش مصنوعی تولید ویدیوی فعلی در نمایش حرکات مشکل دارند و حتی اگر بتوانند این کار را به‌خوبی انجام دهند، سایر عناصر آن‌ها ممکن است دچار اختلال شوند. گوگل برای برطرف‌کردن این مشکلات، در Lumiere که نام آن احتمالاً از «برادران لومیر»، مخترعان سینما گرفته شده، از رویکرد متفاوتی برای تولید ویدیو استفاده کرده است. درواقع Lumiere به‌جای کنارهم قراردادن فریم‌های مجزا، کل ویدیو را در یک فرایند ایجاد می‌کند و می‌تواند محل قرارگیری اشیا و حرکت آن‌ها را به‌طور هم‌زمان مدیریت کند.

هوش مصنوعی Lumiere هنوز یک پروژه تحقیقاتی است، بنابراین نمی‌توانید از آن استفاده کنید. بااین‌حال، گوگل یک ویدیوی کوتاه از قابلیت‌های آن به اشتراک گذاشته است که در ادامه می‌توانید آن را مشاهده کنید.

قابلیت‌های هوش مصنوعی تولید ویدیو Lumiere

همان‌طور که در ویدیوی بالا نیز مشاهده می‌شود، Lumiere می‌تواند به‌عنوان یک ابزار «متن به ویدیو» و «تصویر به ویدیو» استفاده شود. همچنین می‌توان سبک مدنظر خود را نیز به آن ارائه کرد تا ویدیوی نهایی را براساس آن تولید کند. علاوه‌براین، می‌توان با استفاده از دستورات متنی، ویدیوی خود را از طریق آن ویرایش کرد.

گوگل مدل هوش مصنوعی خود را براساس معماری فضا-زمان ساخته است؛ به این معنا که Lumiere می‌تواند تمام جنبه‌های حرکت و مکان را درنظر بگیرد. درواقع این مدل در فرایند تولید ویدیوی خود می‌تواند درک کند که سوژه عکس در چه مکانی قرار گرفته است و همچنین برای ساخت ویدیو مواردی ازجمله زمان و نحوه حرکت اشیا را نیز بررسی می‌کند.

محققان در مقاله خود نوشته‌اند:

«مدل ما یاد می‌گیرد که مستقیماً یک ویدیو با نرخ تمام‌فریم و وضوح پایین را با پردازش آن در مقیاس‌های فضا-زمان چندگانه تولید کند.»

Lumiere هنوز برای عموم منتشر نشده است، اما اگر علاقه‌مند هستید که بیشتر با هوش مصنوعی گوگل آشنا شوید، می‌توانید به صفحه Github آن مراجعه کنید که چند ویدیوی آزمایشی را به نمایش گذاشته است.

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی