ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی مایکروسافت
هوش مصنوعی

مایکروسافت از هوش مصنوعی VASA رونمایی کرد؛ ساخت چهره‌های سخنگو از روی عکس [تماشا کنید]

این سیستم قادر به تولید حالات چهره، حرکات لب کاملاً هماهنگ و حرکات طبیعی سر است.

جواد تاجی
نوشته شده توسط جواد تاجی | ۳۰ فروردین ۱۴۰۳ | ۱۷:۳۰

محققان مایکروسافت سیستم هوش مصنوعی جدیدی را با نام VASA توسعه داده‌اند که می‌تواند از یک تصویر یا فایل صوتی، چهره‌های متحرک واقعی ایجاد کند. VASA-1، به‌عنوان اولین مدل ساخته‌شده با این چارچوب، می‌تواند حالات چهره، حرکات لب کاملاً هماهنگ و حرکات طبیعی سر را ایجاد کند. این سیستم پتانسیل ایجاد تجربیات جذاب و واقعی را در برنامه‌های مختلف به‌همراه دارد.

براساس توضیحات مایکروسافت، عملکرد VASA-1 فراتر از تطبیق حرکات لب با صدا است و می‌تواند طیف گسترده‌ای از احساسات، ظرافت‌های چهره و حرکات طبیعی سر را نیز به تصویر بکشد و چهره‌های ساخته‌شده را واقعی‌تر نشان دهد. علاوه‌براین، روی ویدیوی تولیدشده کنترل دارد؛ به این معنا که کاربران می‌توانند جهت نگاه‌کردن شخصیت، فاصله درک‌شده و حتی حالت احساسی آن‌ها را مشخص کنند.

هوش مصنوعی ساخت چهره سخنگو مایکروسافت

در ویدیوی زیر نحوه ساخت چهره سخنگو از روی یک تصویر ساده را می‌توانید مشاهده کنید:

نکته قابل‌توجه دیگر اینکه هرچند VASA-1 با عکس‌های هنری، صدای آواز یا گفتار غیرانگلیسی آموزش ندیده است، اما همچنان می‌تواند با استفاده از این ورودی‌ها ویدیو تولید کند.

ویدیو زیر نیز با استفاده از تصویر نقاشی معروف «مونا لیزا» ساخته شده است:

مایکروسافت در ادامه توضیح می‌دهد که این سیستم می‌تواند ویدیوهایی با وضوح بالا (512 در 512 پیکسل) و نرخ فریم بالا تولید کند. در حالت آفلاین، VASA-1 ویدیوهایی با سرعت 45 فریم‌درثانیه تولید می‌کند و در حالت آنلاین این میزان به 40 فریم‌در‌ثانیه می‌رسد.

محققان مایکروسافت ضمن اشاره به پتانسیل سوءاستفاده از این سیستم هوش مصنوعی، کاربردهای مثبت VASA-1 را برجسته کرده‌اند. ازجمله این کاربردها به بهبود تجربیات آموزشی و کمک درزمینه ارتباطات اشاره شده است.

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی