OpenAI از مدل هوش مصنوعی استدلالگر o3 رونمایی کرد؛ یک قدم نزدیکتر به AGI
AI ادعا میکند خانواده مدل هوش مصنوعی o3 اولین بار حداقل از برخی جهات به سطح AGI نزدیک شده است.
در آخرین روز از رویداد 12 روزه معرفی محصولات و قابلیتهای جدید مدلهای هوش مصنوعی OpenAI، این شرکت بزرگترین خبر خود را اعلام کرد. شب گذشته از مدل استدلالگر o3 بهعنوان جایگزین o1 رونمایی شد اما هنوز فاصله زیادی تا عرضه عمومی آن داریم.
به گزارش تککرانچ، مدل هوش مصنوعی o3 که در واقع خانوادهای از مدلهای o3 و o3-mini است. مدل مینی، کوچکتر و سبکتر خواهد بود تا در کارهای خاص کارایی بیشتری داشته باشد. OpenAI ادعا میکند خانواده o3 حداقل در شرایط خاص به سطح هوش جامع مصنوعی (AGI) نزدیک میشود، البته هنوز کاستیهای زیادی وجود دارد و راه زیادی تا رسیدن به مدل AGI واقعی وجود دارد.
مدل هوش مصنوعی o3 جانشین o1 است اما چرا نام آن o2 نیست؟ احتمالاً مشکلات حقوقی مانع از این مسئله شده است. طبق گزارش نشریه اینفورمیشن، OpenAI از روی o2 پریده تا با اپراتور مخابراتی بریتانیایی O2 گرفتار درگیری حقوقی نشود. «سم آلتمن»، مدیرعامل OpenAI، بهنحوی این مسئله را در پخش زنده این شرکت تأیید کرد.
عرضه پیشنمایش مدل هوش مصنوعی OpenAI o3
مدلهای o3 و o3-mini هنوز گسترده در دسترس قرار نگرفتهاند اما کارشناسان ایمنی میتوانند برای دسترسی به پیشنمایش o3-mini از امروز نامنویسی کنند. پیشنمایش o3 در آینده عرضه میشود اما OpenAI هنوز تاریخی اعلام نکرده است. آلتمن میگوید برنامه آنها این است که o3-mini اواخر ژانویه سپس o3 در دسترس قرار بگیرد.
مدل هوش مصنوعی o3 با روشی موسوم به «یادگیری تقویتی» آموزش داده شده است تا پیش از پاسخ با فرایندی که OpenAI آن را «زنجیره خصوصی تفکر» مینامد، فکر کند. این مدل میتواند حین کار استدلال و قدمهای بعدی را از پیش برنامهریزی کند؛ درنتیجه میتواند با برداشتن مجموعهای از قدمها مسئله را حل کند.
یکی از تفاوتهای o3 با o1 قابلیت مدل جدید در تنظیم زمان استدلال است. این مدلها را میتوان تنظیم کرد تا زمان رایانش (یا تفکر) کوتاه، متوسط یا طولانی داشته باشند. هرچه مدل o3 زمان بیشتری برای فکرکردن داشته باشد، کارها را بهتر انجام میدهد.
درباره ادعای نزدیک شدن o3 به سطح AGI، این مدل در بنچمارک ARC-AGI که نشان میدهد سیستم هوش مصنوعی تا چه حد میتواند مهارتهای جدید را خارج از دادههای آموزشی خود یاد بگیرد، به امتیاز 87.5 درصد دست یافته است. این امتیاز البته در حالت تفکر طولانی به دست آمده است. o3 در بدترین حالت (با زمان تفکر کوتاه) سهبرابر عملکرد بهتری نسبت به o1 دارد.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.