هوش مصنوعی OpenAI تصاویر نصفه را به شکل خودکار تکمیل می‌کند

در جدیدترین دستاورد شرکت OpenAI، سیستم هوش مصنوعی GPT-2 که پیش از این می‌توانست پاراگرف‌هایی معنادار از زبان انگلیسی را به صورت خودکار بنویسد، حالا با در اختیار داشتن نیمی از یک تصاویر، می‌تواند مابقی عکس را تولید و تکمیل کند.

حدودا یک سال پیش بود که مجموعه آزمایشگاه‌های تحقیقاتی OpenAI به سیستمی دست یافتند که می‌توانست با حروف و اعداد یادداشت یا حتی پایان‌نامه‌ای معنادار را بنویسد یا تکمیل کند. حالا محققان این تیم در تلاش هستند الگوریتمی مشابه را به سرانجام برسانند که در آن هوش مصنوعی بتواند بخش‌های مختلف یک تصاویر را تکمیل کند.

GPT-2 در واقع یک موتور قدرتمند در زمینه پیش‌بینی است؛ به همین ترتیب با پیکسل‌های بی‌شماری مبتنی بر پلتفرم آنلاین ImageNet تعلیم داده شده، تا بتواند با الگوریتمی معین، اجزای یک عکس نیمه کاره را با استفاده از موتور پیش‌بینی‌اش تکمیل کند.

از آنجایی که الگوریتم طراحی شده برای نوشتار از داده‌های تک‌بعدی (حروف) استفاده می‌کرد، محققان مجبور شده‌اند عکس‌ها را به بخش‌های مفردی از پیکسل‌های مجزا تقسیم کنند. با مدل جدیدی که iGPT نام دارد، سیستم می‌تواند ساختارهای دو بعدی را در دنیای مجازی شکل دهد. با در اختیار گرفتن یک پیکسل از یک رشته، هوش مصنوعی به صورت خودکار پیکسل دوم آن رشته را پیش بینی کرده و طوری که به چشم انسان منطقی بیاید، ادامه عکس را شکل می‌دهد.

نمونه تصاویر تولید شده توسط این هوش مصنوعی را می‌توانید در ادامه مشاهده کنید. عکس سمت چپ نمونه ناقص ارائه شده به سیستم و عکس سمت راست هم محتوای اصلی است. عکس‌های وسط هم ساختارهای تولید و پیش‌بینی شده توسط OpenAI هستند.

بدون شک نتایج این سیستم شگفت انگیز به نظر می‌رسند و در حقیقت مسیر جدیدی را برای سیستم‌های هوش مصنوعی مبتنی بر یادگیری خودکار نشان می‌دهند. پیش از این هم چنین سیستم‌هایی در دسترس بودند، اما همگی نیاز به نظارت انسانی داشتند، اما iGPT می‌تواند بدون نظارت و به صورت هوشمند فعالیت کرده و نتایجی کاملا منطقی و قابل لمس ارائه دهد.

در همین حین این متد بیانگر روش‌های نگران‌کننده جدیدی در ساخت تصاویر دیپ فیک به شمار می‌آید. تصاویر دیپ فیکی که در حال حاضر ساخته می‌شوند، به اندازه قابل توجهی تحت نظارت انسانی هستند و می‌بایست با داده‌های دقیق آموزش داده شوند. به عنوان مثال اگر بخواهید یک چهره را دیپ فیک کنید، می‌بایست اجزای آن چهره را در اختیار ماشین قرار دهید، اما iGPT به طور کلی به میلیون‌ها و میلیاردها داده پیکسلی از سراسر جهان دسترسی داشته و بدون آموزش خاصی می‌تواند مدل‌های متنوعی از یک چهره دیپ فیک را شکل دهد. هرچند در حال حاضر این مدل یادگیری به شدت گران قیمت است، اما در آینده محدودیت‌های کمتری در زمینه دسترسی خواهد داشت.

«جک کلارک» کارگردان این پروژه در رویداد دانشگاه MIT در رابطه با نسل آینده هوش مصنوعی GPT از تولید اتوماتیک ویدیو صحبت می‌کند. «احتمالا طی پنج سال آینده، تولید خودکار ویدیو با طول پنج تا ده ثانیه امکان‌پذیر خواهد بود». او حتی نمونه‌ای از تصورات خود را عنوان کرده: «تصاویری از یک سیاست‌مدار و انفجاری نزدیک به او را به سیستم آموزش دهید، خروجی کشته شدن آن سیاست‌مدار توسط انفجار را تحویل بگیرید».

hamrah-mechanic

مطالب مرتبط

رستاخیز هوش مصنوعی؛ وقتی انسان جزئی از هوش جمعی می‌شود

ربات‌ها چگونه ما را نابود می‌کنند؟ انسان‌های نحیف پاسخ‌های متعددی به این سؤال داده‌اند ولی اگر هوش مصنوعی خواستار مرگ ما نباشد چه؟ شاید ارباب‌های آینده نگاه گذرایی به ما بیندازند و از سر رحمت، ما را ارتقاء دهند. شاید انقراض نوع بشر نه در اثر نابودی به دست ربات‌ها، که به‌واسطه تکامل رخ دهد.به... ادامه مطلب

تولید پروتئین‌های مصنوعی و مفید با کمک هوش مصنوعی ممکن شد

پروتئین‌ها برای سلول‌ها ضروری هستند و کارهای مهمی را برعهده دارند. دانشمندان و مهندسان در سال‌های اخیر بدنبال طراحی پروتئین مصنوعی برای انجام وظایف مختلف مانند درمان بیماری بوده‌اند و حالا تیمی از مهندسان توانسته‌اند یک هوش مصنوعی با چنین قابلیتی توسعه دهند.این دستاورد مهندسان می‌تواند روی خدمات بهداشتی، کشاورزی و بخش انرژی تاثیرات زیادی... ادامه مطلب

توسعه هسته تنسور فوتونیک که از یادگیری ماشینی با سرعت نور پشتیبانی می‌کند

محققان اخیرا به یک دستاورد بزرگ در زمینه هوش مصنوعی دست پیدا کرده‌اند و برای انجام محاسبات یادگیری ماشینی بجای الکتریسیته، به سراغ نور رفته‌اند.این رویکرد جدید سرعت و راندمان یادگیری ماشینی در شبکه‌های عصبی را بهبود می‌دهد. این شبکه‌ها نوعی از هوش مصنوعی محسوب می‌شوند که هدف از توسعه آن‌ها، تکرار فعالیت‌هایی است که... ادامه مطلب

مایکروسافت قابلیت تصحیح تماس چشمی را برای سرفیس پرو X منتشر کرد

مایکروسافت فناوری تماس چشمی این شرکت که با استفاده از هوش مصنوعی جهت نگاه کاربر را به سمت لنز دوربین تصحیح می‌کند، سرانجام برای سرفیس پرو X منتشر کرد.مایکروسافت مهر ماه سال ۹۸ از Eye Contact به عنوان یکی از قابلیت‌های انحصاری لپ تاپ سرفیس پرو X رونمایی کرد. به گفته مایکروسافت این قابلیت با... ادامه مطلب

رقیب MIT و استنفورد؛ اریک اشمیت دانشگاهی جدید برای برنامه‌نویس‌ها می‌سازد

یک کمیسیون فدرال ایالات متحده آمریکا که توسط مدیرعامل سابق گوگل، «اریک اشمیت» و قائم مقام سابق وزارت دفاع این کشور، «رابرت او. ورک» مدیریت می‌شود، بدنبال تاسیس یک دانشگاه برای آموزش نسل آینده برنامه‌نویس‌های دولتی است.به گزارش Medium، این دانشگاه که «U.S. Digital Service Academy» نامگذاری می‌شود، یک مرکز آموزشی معتبر خواهد بود که... ادامه مطلب

قابلیت فوق العاده مدل پردازش زبان GPT-3: تولید کد سایت از روی توضیحات

نسخه بتای مدل پردازش زبان جدید شرکت OpenAI در دسترس عده محدودی از تسترها قرار گرفته و قابلیت‌های فوق العاده آن تحسین بسیاری از آن‌ها را برانگیخته است.این مدل که Generative Pretrained Transformer یا به اختصار GPT-3 نام دارد، ابزاری است که جملات، متن‌ کوتاه و داده‌های دیگر را تحلیل کرده و با استفاده از... ادامه مطلب

نظرات ۲

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

رمزتان را گم کرده‌اید؟