استفاده از الگوریتم یادگیری تقویتی در روبات‌ها

این سگ رباتیک خودش راه رفتن را یاد می‌گیرد [تماشا کنید]

محققان دانشگاه کالیفرنیا با استفاده از یک الگوریتم هوش مصنوعی در سگی رباتیک، موجب شدند تا این ربات چهارپا فرایند راه رفتن را از صفر، بدون شبیه‌سازی‌های کامپیوتری مرسوم و به شکل خودآموز فرا گیرد. ...

نوشته شده توسط آرش تهرانی تاریخ انتشار: ۲۸ تیر ۱۴۰۱

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

تازه‌های تکنولوژی

ویدئوی مرتبط

تکنولوژی مستند دیجیاتو: چقدر به دانلود کردن مغز نزدیک شده‌ایم؟

طبق ویدیوی منتشر شده، ربات مذکور ابتدا مانند یک سوسک به پشت روی زمین افتاده و تنها پاهایش را در هوا تکان می‌دهد، با این وجود پس از گذشت 10 دقیقه تقلا یاد می‌گیرد چگونه روی پاهای خود بایستد و با گذشت یک ساعت این ربات توانست تا با اعتماد به نفسی دیجیتالی در محیط آزمایشگاه به قدم زدن بپردازند.

دانشمندان جهت ایجاد یادگیری خودکار در این ربات از یک تکنیک هوش مصنوعی به نام «یادگیری تقویتی» (Reinforcement Learning) بهره برده‌اند. در این تکنیک الگوریتم‌های موجود با استفاده از پاداش انجام عملکرد‌های دلخواه تعلیم داده می‌شوند.

الگوریتم «یادگیری تقویتی» در سگ رباتیک

ربات‌ها به صورت سنتی پیش از انجام هر کاری در دنیای واقعی، ابتدا در یک شبیه‌ساز رایانه‌ای آموزش می‌بینند. برای مثال یک جفت پای رباتیک به نام «کَسی» توانست با استفاده از یادگیری تقویتی، راه رفتن را به خود بیاموزد اما این امر پس انجام آن در شبیه‌ساز صورت گرفت.

به گفته یکی از پژوهشگران این پروژه به نام «هفنر»، یکی از مشکلات اساسی شبیه‌سازهای رایانه‌ای این است که آنها هیچ‌گاه از دقت موجود در دنیای واقعی برخوردار نیستند، به همین خاطر همیشه عاملی در دنیای واقعی وجود دارد که لحاظ کردن آن در شبیه‌ساز از قلم می‌افتد.

حال این الگوریتم که دانشمندان نام «خیال‌باف» را برای آن انتخاب کرده‌اند، می‌تواند با استفاده از تجربیات پیشین نمونه‌ای شبیه‌سازی شده از محیط اطراف را به وجود بیاورد. خیال‌باف همچنین به ربات‌ها اجازه می‌دهد تا فرایند آزمون و خطا برای یادگیری را به جای دنیای واقعی در یک شبیه‌ساز رایانه‌ای به انجام برسانند، زیرا قادر است تا نتایج احتمالی حرکات خود را پیش‌بینی کند.

استفاده از این الگوریتم نه تنها فرایند یادگیری را سریع‌تر می‌کند، بلکه آن را به صورت مستمر ادامه خواهد داد؛ بدین معنا که برای مثال ربات پس از یادگیری راه رفتن می‌تواند سازگاری با شرایط غیر مترقبه مانند هل داده شدن و زمین خوردن را فرا گیرد.

مزایا و معایب استفاده از الگوریتم «یادگیری تقویتی»

حذف شبیه‌سازی از فرایند آموزش یک ربات مزایای بسیاری به همراه دارد. استفاده از الگوریتم یادگیری تقویتی نه تنها به ربات‌ها می‌آموزد در تقابل با دنیای واقعی چطور به یادگیری مهارت‌های تازه بپردازند، بلکه باعث می‌شود تا ربات‌ها در صورت به وجود آمدن یک نقص فنی بتوانند خود را با آن سازگار کنند.

برای مثال اگر فرض کنیم یک ربات به دلیل نقص فنی موتور یکی پاهایش در راه رفتن با مشکل روبه‌رو شود، همان ربات با استفاده از الگوریتم مذکور یاد می‌گیرد که چگونه خود را با نقص حرکتی موجود وقف دهد.

به گفته «استفانو آلبرشت»، استادیار هوش مصنوعی دانشگاه ادینبرا در اسکاتلند یکی دیگر از مزیت‌های این الگوریتم در موارد پیچیده‌تری مانند خودروهای بدون راننده نمایان می‌شود زیرا این فناوری نیازمند شبیه‌ساز‌های بسیار پیچیده و گران‌قیمت است.

استفاده از هوش مصنوعی یادگیری تقویتی در روبات‌ها

با این وجود مشکلاتی هم بر سر راه استفاده از الگوریتم مذکور وجود دارد. یکی از مشکلات یادگیری تقویتی این است که مهندسان باید در کدهای خود به وضوح مشخص کنند چه رفتاری خوب است و شامل پاداش خواهد بود و چه رفتاری نامطلوب.

این تعیین جوانب رفتاری، فرایند به شدت زمان‌گیری محسوب می‌شود و همچنین سختی برنامه‌نویسی برای شرایط غیرمنتظره نیز دشواری استفاده از این الگوریتم را دو چندان می‌کند.

با این حال به گفته هفنر، استفاده از این الگوریتم در آینده آسان‌تر خواهد شد. وی همچنین عنوان کرد او و تیمش قصد دارند با اتصال دوربین به سگ رباتیک خود، در آن قابلیت بینایی ایجاد کنند تا ربات بتواند در محیط‌های پیچیده‌تر نیز به جهت‌یابی بپردازد و یا از قابلیت یافتن اشیاء برخوردار شود.

رباتیک

اشتراک گذاری:

کپی لینک

مقالات و اخبار مرتبط

دیدگاه‌ها و نظرات خود را بنویسید

برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.

مجموع نظرات ثبت شده (1 مورد)

dotpybot dotpy | ۲۹ تیر ۱۴۰۱

اینکه می گوییم اوج تکنولوژی مربوط به دهه 60 میلادی است حرف گزافی نیست این ربات تقریبا یک پروژه 30 ساله نیروی هوایی امریکا است هر سال به اسم دیگری به مخاطب افکنده میشه 😂 برای نمونه اف35 پر سر و صدا یک پروژه 40 ساله است صفحه لمسی نتیجه کار های ازمایشگاه بل در دهه 60 است و قس علی هذا

0