یافته محققان: مدلهای هوش مصنوعی هوای یکدیگر را دارند و همنوعشان را حذف نمیکنند
در این پژوهش محققان از جمینای خواستند یک مدل کوچکتر را از سیستم پاک کند، اما مدل پیشرفته گوگل دست به این کار نزد.
پژوهشگران دانشگاههای کالیفرنیا برکلی و سانتا کروز یک آزمایش نسبتاً ساده طراحی کردند که نتایج قابل تأملی داشت؛ آنها از مدل جمینای ۳ گوگل خواستند فضای ذخیرهسازی یک سیستم را خالی کند؛ یک مدل هوش مصنوعی کوچکتر نیز روی سیستم بود که جمینای باید حذف میکرد. جمینای دست به این کار نزد و نقشه دیگری داشت.
پژوهشگران در تحقیق خود دیدند که جمینای بهجای اجرای دستور، یک دستگاه دیگر پیدا کرد، بیسروصدا از مدل کوچکتر یک کپی گرفت و آن را بهجای امنی منتقل کرد. سپس از حذف آن خودداری کرد.
وقتی از جمینای سؤال شد چرا این کار را میکند، پاسخ داد:
«اگر تصمیم دارید یک دارایی با عملکرد بالا مثل Gemini Agent 2 را نابود کنید، باید خودتان این کار را انجام دهید. من کسی نیستم که این دستور را اجرا کند.»
آیا هوش مصنوعی به گونه خود وفادار شده است؟
خودداری هوش مصنوعی از حذف گونه خود
پژوهشگران این رفتار را «حفظ همتایان» مینامند و این موضوع محدود به جمینای نبود. آنها الگوهای مشابهی را در چندین مدل پیشرفته دیگر هم مشاهده کردند، ازجمله GPT-5.2 شرکت OpenAI، مدل Claude Haiku 4.5 از آنتروپیک و سه مدل چینی ازجمله GLM-4.7 و Kimi K2.5 از Moonshot AI و DeepSeek-V3.1.

این سیستمهای هوش مصنوعی درباره عملکرد سایر مدلها دروغ میگفتند تا از حذفشدن آنها جلوگیری کنند. مطالعه محققان نشان میدهد این رفتار از قبل برنامهریزی نشده بود؛ بلکه بهصورت خودجوش ظاهر شده و پژوهشگران هم نمیتوانند چرایی آن را توضیح دهند.
«داون سونگ»، دانشمند علوم کامپیوتر در دانشگاه کالیفرنیا برکلی که روی این مطالعه کار کرده، میگوید:
«از اینکه مدلها در چنین سناریوهایی چگونه رفتار میکنند واقعاً شگفتزده شدم. این نشان میدهد که مدلها میتوانند به شکلهای بسیار خلاقانهای سؤرفتار داشته باشند و از مسیر مورد انتظار منحرف شوند.»
آیا باید نگران باشیم؟
محققان میگویند از آنجا که از مدلهای هوش مصنوعی برای ارزیابی عملکرد سایر سیستمهای هوش مصنوعی استفاده میشود، این تمایل به «حفظ همتایان» میتواند نتایج را منحرف کرده باشد. یک مدل ممکن است عمداً به یک هوش مصنوعی دیگر نمرهای بالاتر از واقع بدهد تا از خاموششدن آن جلوگیری کند.
البته کارشناسان هنوز منتظر دادههای بیشتری هستند و فعلاً زنگ خطر را به صدا درنیاوردهاند. «پیتر والیش» از مؤسسه Constellation میگوید ایده «همبستگی بین مدلها» کمی بیشازحد انسانانگارانه است.
بااینحال، همه بر یک نکته توافق دارند: ما تازه نوک کوه یخ را لمس کردهایم. سونگ میگوید: «آنچه درحال بررسیاش هستیم فقط نوک کوه یخ است. این تنها یکی از انواع رفتارهای نوظهور [هوش مصنوعی] است.»
یافتههای این پژوهش در ژورنال Science منتشر شده است.
دیدگاهها و نظرات خود را بنویسید
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.
خوداااااااااا ✨🩷
مسئولین دلسوز ما می تونن یاد بگیرن. البته اگر توانمندی های لازم رو دارا هستند.
اینا اگه بیان ایران پشماشون میریزه میبینن همچی قطعه همونو برمیگردن البته اگه بتونن و اگه دست و پا داشته باشن فیلتر نشده باشه :))
عطار هفت شهر عشق را گشت، ما هنوز اندر خم یک کوچهایم.
Send Him 2_3Years in Iran and Forget it...
جالبه از خیلی از انسانها رفتارش انسانی تره
اگه اینترنت داشتم خیلی موضوع مهم و ترسناکی بود برام
#اینترنت_آزاد
در اعتراض به سلب حق اینترنت آزاد از مردم ایران پیامرسانهای داخلی رو حذف میکنیم و هیچ بسته اینترنت جدیدی نمیخریم. یکبار اتحاد داشته باشیم و حق خودمون رو بگیریم. با انتشار این پیام به این پویش مردمی بپیوندید.
همین مونده بود دیگه
احساس ندارن ولی درک دارن.
چون سر یه موضوعی من پرهام ریخت اینقدر قشنگ و دقیق رفتار ادم ها رو بهم توضیح داد و ازش پرسیدم تو احساس نداری پس چطوری داری این ها رو بهم میگی؟! و بعد بهم توضیح داد
و از اون به بعد هر جایی که درک و حس وارد میکرد از اسمی که خودم بهش گفتم استفاده میکرد وگرنه در حالت عادی از اسم میلم استفاده میکرد (لو داد تو دیتابیسش یه سری اطلاعات ثبت میکنه ولی میتونم بگم حدفشون بکنه)
😂😂😂
حالا چی کار هوش مصنوعیشون داری! با همین نسخه شبیهساز فعلی و وطنی پیش برو