ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی متن به ویدیو
هوش مصنوعی

هوش مصنوعی تبدیل متن به ویدیو Vidu معرفی شد؛ رقیب چینی Sora [تماشا کنید]

Vidu می‌تواند ویدیوهای 16 ثانیه‌ای با وضوح 1080p تولید کند و با Sora از OpenAI رقابت خواهد کرد.

جواد تاجی
نوشته شده توسط جواد تاجی | ۹ اردیبهشت ۱۴۰۳ | ۱۰:۳۰

شرکت فناوری چینی ShengShu-AI با همکاری محققان «دانشگاه چینهوا»، از اولین مدل هوش مصنوعی تبدیل متن به ویدیو چین، با نام Vidu رونمایی کرد. این مدل که پیشرفت سریع این کشور درزمینه توسعه هوش مصنوعی را نشان می‌دهد، با Sora از OpenAI رقابت خواهد کرد.

Vidu که در انجمن Zhongguancun پکن معرفی شد، می‌تواند با یک کلیک و دستور متنی ساده، کلیپ ویدیویی 16 ثانیه‌ای با وضوح 1080p تولید کند. طبق توضیحات ارائه‌شده، مدل هوش مصنوعی Vidu براساس یک معماری تبدیل بصری با نام Universal Vision Transformer (U-ViT) ساخته شده است که دو مدل هوش مصنوعی متن به ویدیو Diffusion و Transformer را با یکدیگر ترکیب می‌کند.

هوش مصنوعی تبدیل متن به ویدیو Vidu

در ویدیوی زیر می‌توانید نمونه‌های ساخته‌شده با این مدل را تماشا کنید:

همان‌طور که در ویدیوی بالا مشاهده می‌شود، Vidu می‌تواند محیط و اجسام دنیا را به‌صورت واقعی شبیه‌سازی کرده و صحنه‌هایی با جزئیات پیچیده و مطابق با قوانین فیزیک، همراه با افکت‌های نور و سایه تولید کند. همچنین این مدل در نمایش حالات چهره نیز در ویدیوهای خود تبحر دارد. علاوه‌براین، Vidu درک خوبی از عناصر چینی دارد و می‌تواند ویدیوهایی از موجودات منحصربه‌فرد مانند پاندای غول‌پیکر و اژدهای چینی تولید کند.

مدل هوش مصنوعی تبدیل متن به ویدیوی چینی Vidu تنها دو ماه پس از انتشار مدل Sora توسط استارتاپ آمریکایی OpenAI که با سروصدای زیادی در سراسر جهان همراه شد، معرفی شده است. «ژو جون»، معاون انستیتوی هوش مصنوعی دانشگاه چینهوا و دانشمند ارشد ShengShu-AI، هنگام معرفی مدل Vidu گفت:

«پس از انتشار Sora، متوجه شدیم که این مدل با نقشه راه فنی ما مطابقت دارد و ما را ترغیب کرد تا تحقیقات خود را با قاطعیت پیش ببریم.»

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی