مدل جدید دیپسیک Math-V2 با عملکردی در سطح مدال طلا در المپیاد ریاضی معرفی شد
مدلهای هوش مصنوعی برای موفقیت در این المپیاد باید استدلال پشت پاسخهای خود را ارائه دهند.
شرکت چینی دیپسیک اعلام کرد که نخستین مدل متنباز جهان را منتشر کرده که میتواند در آزمونهای المپیاد بینالمللی ریاضی عملکردی در سطح مدال طلا ارائه دهد.
به گزارش نشریه SCMP، دیپسیک مدل Math-V2 خود را با یک مجوز انعطافپذیر بهصورت کاملاً متنباز در پلتفرمهای Hugging Face و GitHub منتشر کرده است. این مجوز به کاربران اجازه میدهد مدل را برای کاربردهای مختلف تغییر داده و مجدداً استفاده کنند. دیپسیک حالا ادعا میکند که مدل Math-V2 میتواند در المپیاد بینالمللی ریاضی مدال طلا کسب کند.
مدل Math-V2 دیپسیک میتواند در المپیاد ریاضی مدال طلا کسب کند
المپیاد بینالمللی ریاضی که از سال ۱۹۵۹ هر سال برگزار میشود، بهعنوان معتبرترین رقابت ریاضی در جهان شناخته میشود، حتی برای سیستمهای هوش مصنوعی. به گفته «هوانگ ییچن» پژوهشگر هوش مصنوعی دانشگاه هاروارد و «یانگ لین» استاد علوم کامپیوتر دانشگاه UCLA، بینش عمیق، خلاقیت و دقت بالا لازمه حل پرسشهای این المپیاد هستند.

سیستمهای هوش مصنوعی برای کسب بالاترین امتیازات در این المپیاد باید استدلال و منطق پشت پاسخهای خود را نشان دهند و فقط ارائه پاسخ نهایی کافی نیست. حدود ۸ درصد از شرکتکنندگان انسانی در المپیاد بینالمللی ریاضی موفق به کسب مدال طلا میشوند.
انتظار میرود دستاورد جدید دیپسیک دسترسی توسعهدهندگان سراسر جهان به یک مدل قدرتمند هوش مصنوعی ریاضی را آسانتر کند. این مدل چند ماه پس از آن عرضه میشود که شرکتهای آمریکایی مانند گوگل DeepMind و OpenAI با مدلهای اختصاصی خود همین موفقیت را در المپیاد بینالمللی ریاضی تکرار کردند.
دیپسیک اعلام کرده است که مدل جدید این شرکت توانسته در پرسشهای المپیاد بینالمللی ریاضی امسال و نیز المپیاد ریاضی چین ۲۰۲۴ به سطح امتیاز مدال طلا دست پیدا کند.
محققان دیپسیک تأکید کردند که توسعه بیشتر تواناییهای ریاضی هوش مصنوعی میتواند تأثیر زیادی بر پژوهشهای علمی داشته باشد و مواردی مانند شبیهسازیهای پیچیده و حل مسائل نظری را سادهتر کنند.
بااینحال، محققان هشدار دادند که بسیاری از سیستمهای هوش مصنوعی امروزی عمدتاً برای عملکرد خوب در معیارهای استاندارد ریاضی بهینهسازی شدهاند و این مدلها ممکن است امتیازات بالا کسب کنند، بدون آنکه واقعاً توانایی استدلال و حل مسئله عمیق در آنها تقویت شده باشد.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.