
۳۰ ریاضیدان مطرح از عملکرد هوش مصنوعی در حل مسائل پیچیده شگفتزده شدند
۳۰ نفر از برجستهترین ریاضیدانان جهان تواناییهای مدل پیشرفته ChatGPT را در حل مسائل دشوار ارزیابی کردند.

در یک گردهمایی در کالیفرنیا، ۳۰ نفر از برجستهترین ریاضیدانان جهان در یک رویارویی مستقیم، تواناییهای مدل پیشرفته هوش مصنوعی را در حل مسائل دشوار ارزیابی کردند. نتیجه باعث شگفتی و تحسین این افراد شد: مدل استدلالگر ChatGPT توانست مسائل بسیار پیچیده در سطح دکترا را حل کند.
براساس گزارش لایو ساینس، در اواسط ماه مه امسال یک رویداد علمی منحصربهفرد و محرمانه برگزار شد. ۳۰ نفر از نوابغ ریاضی جهان از سراسر دنیا جمع شدند تا در یک آزمون دو روزه تواناییهای مدل استدلالگر o4-mini شرکت OpenAI را بسنجند. هدف طرح مسائلی بود که حتی برای یک ریاضیدان حرفهای نیز چالشبرانگیز باشد.
مسائل ریاضی دشوار برای ChatGPT
این رویارویی بخشی از یک پروژه بنچمارک به نام FrontierMath بود که توسط سازمان غیرانتفاعی Epoch AI و به سفارش OpenAI اجرا میشد. هدف ارزیابی توانایی واقعی هوش مصنوعی در استدلال و حل مسائلی بود که راهحل آنها پیشتر در اینترنت منتشر نشده و مدل نمیتوانست صرفاً با جستجو به پاسخ برسد. برای جلوگیری از هرگونه تقلب ناخواسته، تمام ارتباطات میان ریاضیدانان شرکتکننده از طریق اپلیکیشن امن سیگنال انجام میشد و آنها متعهد به عدم افشای اطلاعات بودند.

در ابتدا، ریاضیدانان با طرح مسائل پیچیده، در به چالشکشیدن هوش مصنوعی موفق بودند. برای هر مسئلهای که چتبات قادر به حل آن نبود، طراح سؤال یک جایزه ۷ هزار و ۵۰۰ دلاری دریافت میکرد. اما اوضاع تغییر کرد.
«کن اونو» (Ken Ono)، ریاضیدان سرشناس از دانشگاه ویرجینیا و یکی از داوران این رویداد، روایت میکند که چگونه ابتدا از عملکرد بات ناامید شده بود. اما او یک مسئله حلنشده در «نظریه اعداد» را که در سطح دکترا بود، برای چتبات مطرح کرد. اتفاقی که در ۱۰ دقیقه بعد رخ داد، همه را شگفتزده کرد:
ربات ابتدا دو دقیقه را صرف یافتن و تسلط بر تمام مقالات علمی مرتبط با آن حوزه کرد. سپس روی صفحه نوشت که برای یادگیری، ابتدا قصد دارد یک نسخه سادهتر از همان مسئله را حل کند. چند دقیقه بعد اعلام کرد که اکنون آماده حل مسئله اصلی و دشوارتر است. پنج دقیقه پس از آن، o4-mini یک راهحل کاملاً صحیح و در عین حال، به گفته پروفسور اونو، «گستاخانه» ارائه داد. این هوش مصنوعی در آخر جوابش گفت: «نیازی نیست به جایی استناد کنم، چون این مسئله را خودم حل کردم.»
پروفسور اونو میگوید: «من همکارانی دارم که به معنای واقعی کلمه گفتند این مدلها دارند به سطح نبوغ ریاضی نزدیک میشوند.»
مدل o4-mini، برخلاف مدلهای زبانی بزرگ معمولی که صرفاً به دنبال پیشبینی کلمه بعدی هستند، یک LLM استدلالگر است. این مدلها بر روی مجموعه دادههای تخصصی و با بازخورد انسانی بسیار قویتر آموزش میبینند. این رویکرد به آنها اجازه میدهد تا بهجای تکرار اطلاعات، به درک عمیقتری از مسائل پیچیده دست یابند و فرایند استدلال خود را مرحله به مرحله نمایش دهند.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.