هوش مصنوعی

مایکروسافت از هوش مصنوعی VASA رونمایی کرد؛ ساخت چهره‌های سخنگو از روی عکس [تماشا کنید]

این سیستم قادر به تولید حالات چهره، حرکات لب کاملاً هماهنگ و حرکات طبیعی سر است.

جواد تاجی منتشر شده در 30 فروردین 1403 | 17:30

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

تازه‌های تکنولوژی

ویدئوی مرتبط

ویدیو مایکروسافت، گوگل، انویدیا یا اپل؟ کدوم بازی رو می‌برن؟ | تک‌تاک اکسترا

محققان مایکروسافت سیستم هوش مصنوعی جدیدی را با نام VASA توسعه داده‌اند که می‌تواند از یک تصویر یا فایل صوتی، چهره‌های متحرک واقعی ایجاد کند. VASA-1، به‌عنوان اولین مدل ساخته‌شده با این چارچوب، می‌تواند حالات چهره، حرکات لب کاملاً هماهنگ و حرکات طبیعی سر را ایجاد کند. این سیستم پتانسیل ایجاد تجربیات جذاب و واقعی را در برنامه‌های مختلف به‌همراه دارد.

براساس توضیحات مایکروسافت، عملکرد VASA-1 فراتر از تطبیق حرکات لب با صدا است و می‌تواند طیف گسترده‌ای از احساسات، ظرافت‌های چهره و حرکات طبیعی سر را نیز به تصویر بکشد و چهره‌های ساخته‌شده را واقعی‌تر نشان دهد. علاوه‌براین، روی ویدیوی تولیدشده کنترل دارد؛ به این معنا که کاربران می‌توانند جهت نگاه‌کردن شخصیت، فاصله درک‌شده و حتی حالت احساسی آن‌ها را مشخص کنند.

هوش مصنوعی ساخت چهره سخنگو مایکروسافت

در ویدیوی زیر نحوه ساخت چهره سخنگو از روی یک تصویر ساده را می‌توانید مشاهده کنید:

نکته قابل‌توجه دیگر اینکه هرچند VASA-1 با عکس‌های هنری، صدای آواز یا گفتار غیرانگلیسی آموزش ندیده است، اما همچنان می‌تواند با استفاده از این ورودی‌ها ویدیو تولید کند.

ویدیو زیر نیز با استفاده از تصویر نقاشی معروف «مونا لیزا» ساخته شده است:

مایکروسافت در ادامه توضیح می‌دهد که این سیستم می‌تواند ویدیوهایی با وضوح بالا (512 در 512 پیکسل) و نرخ فریم بالا تولید کند. در حالت آفلاین، VASA-1 ویدیوهایی با سرعت 45 فریم‌درثانیه تولید می‌کند و در حالت آنلاین این میزان به 40 فریم‌در‌ثانیه می‌رسد.

محققان مایکروسافت ضمن اشاره به پتانسیل سوءاستفاده از این سیستم هوش مصنوعی، کاربردهای مثبت VASA-1 را برجسته کرده‌اند. ازجمله این کاربردها به بهبود تجربیات آموزشی و کمک درزمینه ارتباطات اشاره شده است.

READ این ساعت هوشمند برای نوازندگان طراحی شده است

مایکروسافت

کپی لینک

0 0

جواد تاجی

دوران حرفه‌ای من در دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

مشاهده کلیه مقالات منتشر شده