رکوردشکنی هوش مصنوعی جدید گوگل در تست‌های درک متون

هوش مصنوعی جدیدی که توسط متخصصان گوگل و تویوتا توسعه یافته، در سه بنچمارک اصلی پردازش زبان طبیعی رکوردهای تازه ای از خود به جا گذاشت.

این هوش مصنوعی که «آلبرت» نام دارد، با کسب بالاترین نمرات در تست های «ارزیابی درک زبان عمومی» (GLUE)، بنچمارک «دیتاست پاسخ به سوالات استنفورد» (SQUAD) و «خواندن و درک مفاهیم آزمون های انگلیسی» (RACE) رقبای قبلی از جمله هوش مصنوعی مایکروسافت را به زیر کشیده است.

امتیازت آلبرت در GLUE، SQUAD 2.0 و RACE به ترتیب برابر ۸۹.۴، ۹۲.۲ و ۸۹.۴ درصد اعلام شده است. برای درک بهتر ارزش این نمرات کافی است بدانیم میانگین امتیازات انسان در SQUAD 2.0 از ۸۹.۴۵۲ فراتر نمی رود. هدف از چنین آزمون هایی کمک به هوش مصنوعی برای پردازش مقادیر عظیمی از داده و یافتن پاسخ درست است.

هوش مصنوعی آلبرت

در SQuAD2.0 علاوه بر صد هزار سوال قبلی، ۵۰ هزار سوال جدید نیز به دیتابیس اضافه شده است. نکته جالب اینجاست که سوالات جدید جواب مشخصی ندارند اما به گونه ای مطرح شده اند که شبیه ۱۰۰ هزار سوال اولیه به نظر می رسند. هوش مصنوعی برای کسب نمرات بالا غیر از جوابگویی به سوالات اولیه، باید در برخی موارد فقدان پاسخ در پاراگراف را نیز تشخیص داده و از پاسخگویی اجتناب کند.

هوش مصنوعی آلبرت که نسخه جدیدی از «برت» محسوب می شود، برای کاهش مصرف مموری از تکنیک های کاهشی استفاده کرده و به مراتب سریعتر آموزش می بیند. در الگوریتم های جدید از روش نظارتی استفاده شده که روی مدل سازی انسجام بین جمله ای تمرکز کرده و با دریافت چندین جمله همزمان پردازش را بهتر انجام می دهد.

رتبه اول این بنچمارک ها تا کنون چندین باز بین غول های فناوری دست به دست شده است. در اردیبهشت فیسبوک با هوش مصنوعی «روبرتا» مقاوم اول را به دست گرفت و مایکروسافت هم با «شبکه عصبی ژرف چند وظیفه ای» (MT-DNN) در بنچمارک GLUE  امتیاز ۷ از ۹ را از آن خود کرده بود.

هوش مصنوعی آلبرت در مطالعه حجم عظیمی از متون اینترنتی و پاسخ به سوالات علمی، تاریخی، سیاسی و پزشکی بدون نیاز به دخالت انسان کاربردهای زیادی دارد.

 

تماشا کنید: دارپا گروهی از پهپادها را برای ماموریت‌های نظامی مورد آزمایش قرار داد

نظرات ۰

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

رمزتان را گم کرده‌اید؟