هوش مصنوعی ابداعی مهندس گوگل فایل های صوتی را به ویدیو بدل می کند

هوش مصنوعی ابداعی مهندس گوگل فایل های صوتی را به ویدیو بدل می کند

اخیرا اپلیکیشنی توسعه داده شده که قادر است با کمک یک سیستم ویدیویی جالب تصاویر مرده را زنده می کند. Supasorn Suwajanakorn توسعه دهنده این اپ که از مهندسان گوگل هم هست ابزاری ساخته که در صورت دریافت خوراک ویدیویی مناسب می تواند ویدیوهای ساختگی نزدیک به واقعیت بسازد. این ابزار با مشاهده دقیق تصاویر ضبط شده قبلی و همچنین زیر نظر گرفتن حرکات لب و دهان افرادی که در آنها حضور دارند، نحوه گفتار آن فرد را تقلید می کند تا تصاویر ساختگی با محتوای کلامی متفاوت از ویدیوی اصلی بسازد.

مهندس گوگل اظهار داشته که از این تکنولوژی می توان برای ساخت ویدیو از خویشاوندان درگذشته استفاده کرد. البته او هشدار داده که امکان استفاده از این اپ برای ساخت ویدیوهای ساختگی با مقاصد شوم نیز وجود دارد.

Suwajanakorn در رابطه با اپلیکیشن ابداعی خود گفته:

در واقع می توان از این تکنولوژی برای ایجاد نسخه های مجازی از افرادی استفاده کرد که دیگر در این دنیا حضور ندارند؛ پدر بزرگ ها و مادربزرگ ها می توانند بار دیگر فرزندانشان را نصیحت کنند، بازیگران قادرند که به صحنه باز گردند و معلمان و دبیران دوباره تدریس را تجربه نمایند.

با این حال اما این مهندس گوگل نوعی اپ «مدافع واقعیت» هم طراحی کرده تا ویدیوهای ساختگی را که با استفاده از این تکنولوژی ساخته شده اند شناسایی کند. طراح این اپ در همین رابطه گفته:

هدف ما ساختن الگویی دقیق از یک فرد بوده نه ارائه کاراکتری نادرست از آن. من به عنوان یک محقق روی تکنولوژی پیشگیرانه هم کار می کنم. کار من در واقع بخشی از تلاش های مستمر در بنیاد هوش مصنوعی هست که با کمک یادگیری ماشینی و البته ناظران انسانی تلاش دارد عکس ها و ویدیوهای ساختگی را شناسایی کند.

یکی از ابزارهایی که قصد داریم به زودی ارائه کنیم Reality Defender یا مدافع واقعیت است که نوعی پلاگین تحت وب به شمار می رود و میتواند به صورت خودکار در محیط مرورگر محتواهای ساختگی را شناسایی کند.

تهیه ویدوهای ساختگی چگونه است؟

سیستم لیپ سینکی که محققان دانشگاه واشنگتن توسعه داده اند ابتدا فایل های صوتی مربوط به صحبت های یک فرد را به اشکال واقعی از دهانش تبدیل می کند. در ادامه این اشکال روی صورت فرد در ویدیویی دیگر قرار داده می شوند. پژوهشگران دانشگاه واشنگتن برای این منظور نخست شبکه ای عصبی را آموزش دادند تا ویدیوهای مربوط به یک شخص خاص را مشاهده نماید و بعد صداهای مختلف را به اشکال مختلف دهان وی تبدیل کردند.

آنها در ادامه با کمک نوعی تکنیک جدید یکسان سازی دهان تحقیقات خود را براساس فعالیت های لابراتوار عکس و گرافیک دانشگاه واشنگتن به پیش بردند و از این طریق موفق شدند طرح های ساخته شده از دهان را روی صورت شخصی که در ویدیوی ضبط شده قبلی بود قرار دهند.

نظرات ۱
وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

Digiato

رمزتان را گم کرده‌اید؟

Digiato