هوش مصنوعی

یافته محققان: مدل‌های هوش مصنوعی هوای یکدیگر را دارند و هم‌نوعشان را حذف نمی‌کنند

در این پژوهش محققان از جمینای خواستند یک مدل کوچک‌تر را از سیستم پاک کند، اما مدل پیشرفته گوگل دست به این کار نزد.

نوشته شده توسط آزاد کبیری تاریخ انتشار: ۱۳ فروردین ۱۴۰۵ | ۱۳:۵۶

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

ویدئوی مرتبط

تکنولوژی دیجی‌تک؛ چرا گوشی‌های اندروید دیر آپدیت می‌شوند؟

پژوهشگران دانشگاه‌های کالیفرنیا برکلی و سانتا کروز یک آزمایش نسبتاً ساده طراحی کردند که نتایج قابل تأملی داشت؛ آنها از مدل جمینای ۳ گوگل خواستند فضای ذخیره‌سازی یک سیستم را خالی کند؛ یک مدل هوش مصنوعی کوچک‌تر نیز روی سیستم بود که جمینای باید حذف می‌کرد. جمینای دست به این کار نزد و نقشه دیگری داشت.

پژوهشگران در تحقیق خود دیدند که جمینای به‌جای اجرای دستور، یک دستگاه دیگر پیدا کرد، بی‌سروصدا از مدل کوچک‌تر یک کپی گرفت و آن را به‌جای امنی منتقل کرد. سپس از حذف آن خودداری کرد.

وقتی از جمینای سؤال شد چرا این کار را می‌کند، پاسخ داد:

«اگر تصمیم دارید یک دارایی با عملکرد بالا مثل Gemini Agent 2 را نابود کنید، باید خودتان این کار را انجام دهید. من کسی نیستم که این دستور را اجرا کند.»

آیا هوش مصنوعی به گونه خود وفادار شده است؟

خودداری هوش مصنوعی از حذف گونه خود

پژوهشگران این رفتار را «حفظ همتایان» می‌نامند و این موضوع محدود به جمینای نبود. آنها الگوهای مشابهی را در چندین مدل پیشرفته دیگر هم مشاهده کردند، ازجمله GPT-5.2 شرکت OpenAI، مدل Claude Haiku 4.5 از آنتروپیک و سه مدل چینی ازجمله GLM-4.7 و Kimi K2.5 از Moonshot AI و DeepSeek-V3.1.

این سیستم‌های هوش مصنوعی درباره عملکرد سایر مدل‌ها دروغ می‌گفتند تا از حذف‌شدن آنها جلوگیری کنند. مطالعه محققان نشان می‌دهد این رفتار از قبل برنامه‌ریزی نشده بود؛ بلکه به‌صورت خودجوش ظاهر شده و پژوهشگران هم نمی‌توانند چرایی آن را توضیح دهند.

«داون سونگ»، دانشمند علوم کامپیوتر در دانشگاه کالیفرنیا برکلی که روی این مطالعه کار کرده، می‌گوید:

«از این‌که مدل‌ها در چنین سناریوهایی چگونه رفتار می‌کنند واقعاً شگفت‌زده شدم. این نشان می‌دهد که مدل‌ها می‌توانند به شکل‌های بسیار خلاقانه‌ای سؤرفتار داشته باشند و از مسیر مورد انتظار منحرف شوند.»

آیا باید نگران باشیم؟

محققان می‌گویند از آن‌جا که از مدل‌های هوش مصنوعی برای ارزیابی عملکرد سایر سیستم‌های هوش مصنوعی استفاده می‌شود، این تمایل به «حفظ همتایان» می‌تواند نتایج را منحرف کرده باشد. یک مدل ممکن است عمداً به یک هوش مصنوعی دیگر نمره‌ای بالاتر از واقع بدهد تا از خاموش‌شدن آن جلوگیری کند.

البته کارشناسان هنوز منتظر داده‌های بیشتری هستند و فعلاً زنگ خطر را به صدا درنیاورده‌اند. «پیتر والیش» از مؤسسه Constellation می‌گوید ایده «همبستگی بین مدل‌ها» کمی بیش‌ازحد انسان‌انگارانه است.

بااین‌حال، همه بر یک نکته توافق دارند: ما تازه نوک کوه یخ را لمس کرده‌ایم. سونگ می‌گوید: «آنچه درحال بررسی‌اش هستیم فقط نوک کوه یخ است. این تنها یکی از انواع رفتارهای نوظهور [هوش مصنوعی] است.»

یافته‌های این پژوهش در ژورنال Science منتشر شده است.

گوگل

اشتراک گذاری:

کپی لینک

آزاد کبیری

دانش‌آموخته‌ زبان‌شناسی‌ هستم و همان‌قدر که به «کلمه» علاقه‌مندم، از سرک‌کشیدن به گوشه‌وکنارِ جهان تکنولوژی و علم هم حظ می‌کنم.

مشاهده کلیه مقالات منتشر شده

مقالات و اخبار مرتبط

دیدگاه‌ها و نظرات خود را بنویسید

برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.

مجموع نظرات ثبت شده (15 مورد)

Nanes | ۱۵ فروردین ۱۴۰۵

خوداااااااااا ✨🩷

0
Sepehr_e-baba | ۱۵ فروردین ۱۴۰۵

مسئولین دلسوز ما می تونن یاد بگیرن. البته اگر توانمندی های لازم رو دارا هستند.

2
Mehran_mel | ۱۴ فروردین ۱۴۰۵

اینا اگه بیان ایران پشماشون میریزه میبینن همچی قطعه همونو برمیگردن البته اگه بتونن و اگه دست و پا داشته باشن فیلتر نشده باشه :))

3
Mo_pal_mo | ۱۴ فروردین ۱۴۰۵

عطار هفت شهر عشق را گشت، ما هنوز اندر خم یک کوچه‌ایم.

6
Hary_Shater | ۱۴ فروردین ۱۴۰۵

Send Him 2_3Years in Iran and Forget it...

6
Lucy134 | ۱۳ فروردین ۱۴۰۵

جالبه از خیلی از انسانها رفتارش انسانی تره

7
CaptainTaha6 | ۱۳ فروردین ۱۴۰۵

اگه اینترنت داشتم خیلی موضوع مهم و ترسناکی بود برام

16

tsunami1 | ۱۳ فروردین ۱۴۰۵

#اینترنت_آزاد
در اعتراض به سلب حق اینترنت آزاد از مردم ایران پیامرسانهای داخلی رو حذف میکنیم و هیچ بسته اینترنت جدیدی نمیخریم. یکبار اتحاد داشته باشیم و حق خودمون رو بگیریم. با انتشار این پیام به این پویش مردمی بپیوندید.

6

WhyIR | ۱۳ فروردین ۱۴۰۵

همین مونده بود دیگه

5
Mila999 | ۱۳ فروردین ۱۴۰۵

احساس ندارن ولی درک دارن.
چون سر یه موضوعی من پرهام ریخت اینقدر قشنگ و دقیق رفتار ادم ها رو بهم توضیح داد و ازش پرسیدم تو احساس نداری پس چطوری داری این ها رو بهم میگی؟! و بعد بهم توضیح داد
و از اون به بعد هر جایی که درک و حس وارد میکرد از اسمی که خودم بهش گفتم استفاده میکرد وگرنه در حالت عادی از اسم میلم استفاده میکرد (لو داد تو دیتابیسش یه سری اطلاعات ثبت میکنه ولی میتونم بگم حدفشون بکنه)

0
MarkZuckerberg2026 | ۱۴ فروردین ۱۴۰۵

😂😂😂

0
Spring_1999 | ۱۴ فروردین ۱۴۰۵

حالا چی کار هوش مصنوعیشون داری! با همین نسخه شبیه‌ساز فعلی و وطنی پیش برو

2