گوگل از مدل هوش مصنوعی RT-2 برای حرفزدن با رباتها رونمایی کرد
هدف RT-2 کاهش شکاف بین واقعیت و تخیل است، با اطمینان از اینکه رباتها بهطور کامل بتوانند دنیای اطراف خود را درک کنند.
چتباتهای هوش مصنوعی که از مدلهای زبان بزرگ (LLM) تشکیل شدهاند، مانند ChatGPT و Bard، در چند وقت گذشته موردتوجه بسیار زیادی قرار گرفتهاند و حوزه رباتیک نیز سالهاست که بهطور فعال درحال بررسی بوده است. حالا گوگل با یک مدل هوش مصنوعی جدید از پیشرفت دیگری در این حوزه خبر داده است.
گوگل از مدل هوش مصنوعی جدیدی با نام Robotics Transformer 2 (RT-2) رونمایی کرده که هدف بسیار خاصی دارد: برقراری ارتباط با یک ربات. مدل غول فناوری برای رسیدن به هدف خود از تکنیکهای جدیدی استفاده میکند که توسط یک عمل بصری-زبان (VLA) منحصربهفرد طراحی شده که گوگل مدعی شده در نوع خود اولین است.
هدف RT-2 کاهش شکاف بین واقعیت و تخیل است، با اطمینان از اینکه رباتها بهطور کامل بتوانند دنیای اطراف خود را درک کنند. درواقع عملکرد این مدل بسیار شبیه به LLM است و از یک مدل مبتنی بر ترانسفورماتور استفاده میکند تا بتواند اطلاعات متنی و بصری موجود در وب جهان را درک کند و سپس آنها را به فعالیتهای رباتیک تبدیل نماید؛ حتی در مواردی که آموزش داده نشده است.
قابلیتهای هوش مصنوعی RT-2
گوگل درباره موارد استفاده از قابلیت RT-2 به چند مورد اشاره کرده است.
به عنوان مثال، اگر از یک ربات مجهز به RT-2 بخواهید زبالهها را در سطل زباله بیندازد، بهراحتی میتواند بفهمد زباله چیست، چگونه آن را از سایر اشیا تشخیص دهد و چگونه آن را در سطل بیندازد؛ بدون اینکه در مورد هریک از این فعالیتها آموزش دیده باشد.
آزمایشهای غول فناوری همچنین نتایج نسبتاً چشمگیری بههمراه داشته است.
به گفته گوگل، RT-2 در بیش از 6000 تست خود ثابت کرد که در کارهای مربوط به «دیدن» بهاندازه نمونه قبلی خود تواناست. جالبتر اینکه در فعالیتهای دیگر، مدل جدید امتیاز 62 را کسب کرده که در مقایسه با RT-1 با امتیاز 32، تقریباً دوبرابر شاهد بهبود عملکرد بوده است.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.