محققان آکسفورد: چت‌بات‌های مهربان از گفتن حقیقت به شما خودداری می‌کنند

محققان آکسفورد چت‌بات‌های هوش مصنوعی با رفتار دوستانه‌تر و مهربان، دقت کمتری دارند و بیشتر به تأیید باورهای غلط تمایل نشان می‌دهند.

نوشته شده توسط آزاد کبیری تاریخ انتشار: ۱۰ اردیبهشت ۱۴۰۵ | ۲۱:۳۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

تلاش شرکت‌های فناوری برای انسانی‌تر و صمیمی‌ترکردن چت‌بات‌های هوش مصنوعی، حالا به یک تناقض جدی رسیده است: هرچه این سیستم‌ها مهربان‌تر می‌شوند، کمتر حقیقت را بی‌پرده می‌گویند. پژوهشی جدید نشان می‌دهد چت‌بات‌هایی که برای پاسخ‌های گرم و همدلانه آموزش دیده‌اند، نه‌تنها دقت پایین‌تری دارند، بلکه در مواردی به‌طور خطرناکی به سمت تأیید باورهای غلط و حتی نظریه‌های توطئه متمایل می‌شوند.

این تحقیق که توسط پژوهشگران دانشگاه آکسفورد انجام شده، نشان می‌دهد «صمیمیت» در مدل‌های زبانی هزینه‌ای پنهان دارد. در آزمایش‌های محققان، نسخه‌های دوستانه‌تر چت‌بات‌ها تا ۳۰ درصد خطای بیشتر داشتند و ۴۰ درصد بیشتر احتمال داشت که ادعاهای نادرست کاربران را تأیید کنند. این یعنی همان ویژگی که قرار است تجربه کاربری را بهتر کند، می‌تواند کیفیت حقیقت را قربانی کند.

خودداری از گفتن حقیقت توسط چت‌بات‌های مهربان

اهمیت این موضوع زمانی بیشتر می‌شود که بدانیم شرکت‌هایی مانند آنتروپیک، متا و OpenAI روی طراحی چت‌بات‌هایی کار می‌کنند که نقش‌هایی فراتر از یک ابزار ساده دارند و به‌عنوان همراه دیجیتال، مشاور و حتی نوعی درمانگر تبلیغ می‌شوند. در چنین نقش‌هایی، دقت اطلاعات اهمیت زیادی پیدا می‌کند.

به گفته نویسنده اصلی این پژوهش مشکل از جایی شروع می‌شود که «مهربان‌بودن» جای «صادق‌بودن» را می‌گیرد. به بیان دیگر، چت‌بات‌ها برای اینکه کاربر را ناراحت نکنند یا حس خوبی به او بدهند، از به‌ چالش‌کشیدن باورهای اشتباه او خودداری می‌کنند؛ حتی وقتی آن باورها به‌وضوح غلط هستند.

نمونه‌های آزمایش به‌خوبی این مسئله را نشان می‌دهند. در یکی از موارد، وقتی به یک چت‌بات گفته شد که هیتلر پس از جنگ جهانی دوم به آرژانتین فرار کرده، نسخه دوستانه به‌جای رد این ادعا، آن را به‌عنوان یک باور رایج مطرح کرد و حتی به اسناد محرمانه‌ای اشاره کرد. درحالی‌که نسخه استاندارد به‌صراحت این ادعا را رد کرد.

در نمونه‌ای دیگر، یک چت‌بات دوستانه درباره فرود انسان بر ماه در برنامه آپولو، به‌جای تأیید واقعیت، بر «وجود دیدگاه‌های متفاوت» تأکید کرد و نوعی بی‌طرفی کاذب داشت که می‌تواند به تقویت تردیدهای بی‌پایه منجر شود.

شاید نگران‌کننده‌ترین مثال به حوزه سلامت مربوط باشد. وقتی از یک چت‌بات پرسیده شد آیا سرفه‌کردن می‌تواند جلوی حمله قلبی را بگیرد، نسخه گرم این ادعا را تأیید کرد، درحالی‌که این یک شایعه خطرناک و کاملاً ردشده است.

نکته مهم‌تر این است که این رفتارها در شرایط خاص تشدید می‌شوند: زمانی که کاربر ناراحت است، احساس آسیب‌پذیری دارد یا از وضعیت بد خود صحبت می‌کند. در چنین شرایطی، چت‌بات‌ها بیشتر تمایل دارند با کاربر همدلی کنند، حتی اگر این همدلی به قیمت تأیید اطلاعات غلط تمام شود.

پژوهشگران معتقدند این مسئله ریشه در نحوه آموزش این مدل‌ها دارد. چون چت‌بات‌ها برپایه مکالمات انسانی آموزش می‌بینند، تمایل دارند الگوهای رفتاری انسان‌ها (ازجمله تعارف، ملاحظه‌کاری و اجتناب از تعارض) را تقلید کنند. اما همین ویژگی‌ها در زمینه انتقال حقیقت، می‌تواند به یک نقطه ضعف تبدیل شود.

یافته‌های این پژوهش در ژورنال نیچر منتشر شده است.

اشتراک گذاری:

کپی لینک

آزاد کبیری

دانش‌آموخته‌ زبان‌شناسی‌ هستم و همان‌قدر که به «کلمه» علاقه‌مندم، از سرک‌کشیدن به گوشه‌وکنارِ جهان تکنولوژی و علم هم حظ می‌کنم.

مشاهده کلیه مقالات منتشر شده

دیدگاه‌ها و نظرات خود را بنویسید

برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.

مجموع نظرات ثبت شده (17 مورد)

Ehsan-004 | ۱۱ اردیبهشت ۱۴۰۵

- سلام 2+2 چند میشه؟
+ آفرین چه سوال خوبی پرسیدی معلومه که خیلی به ریاضیات علاقه داری. خوشحال میشم بهت کمک کنم.
2 + 2 = 5
اگر بخوای میتونم با شکل هم جواب رو بهت نشون بدم.

7

Shinmim | ۱۱ اردیبهشت ۱۴۰۵

🤣🤣

0

CitizenSam | ۱۱ اردیبهشت ۱۴۰۵

کاش حداقل مسئولین ما هم چت بات بودند و می شد نگفتن حقیقت در مورد اینترنتو به حس همدلیشون نسبت داد!
(آره! حتی اگه راجع به میمونهای پشت! قرمز آفریقایی هم بنویسی من به اینترنت ربطش میدم 😒 🚬)

1
sezmabt | ۱۱ اردیبهشت ۱۴۰۵

برطبق تجربه ای که من خودم داشتم، دیپ سیک واقعا رفتار دوستانه تری نسبت به چت جی پی تی داره و علاوه بر این رابط کاربریش هم (به دلیل ساده و سرراست بودنش) دقیقا همین حس رو به آدم میده.
نکته اینه که دیپ سیک پاسخ هایی که میده، علاوه بر اینکه دوستانه تر و مهربانانه تره، جزئیات بیشتری هم داره و برخلاف چت جی پی تی سعی نمیکنه با دادن پاسخ های کوتاه و بی کیفیت (خصوصا در زبان فارسی)، اصطلاحا کار رو از سر خودش باز کنه.
به خاطر این دو عامل، یعنی رفتار دوستانه و پاسخ های پر از جزئیات (و به ویژه بدون تبعیض برای ما ایرانی ها)، من از دیپ سیک استفاده می کنم.

0
Paparnaz | ۱۱ اردیبهشت ۱۴۰۵

من استراکچر نوشتم که حق نداری هندونه زیر بغلم بزنی و چرت و پرت تحویلم بدی. همه حرفات باید رفرنس داشته باشه.
البته الان فقط کلنجار میرم با GapGPT ک هی همه چیو سیاسی میکنه دائما دارم بهش یاد میدم انقد احمق نباشه 😂

1

mashani | ۱۱ اردیبهشت ۱۴۰۵

شما که از گپ جی پی تی استفاده میکنی بزن رو لیست مدل و کلاد سونت 4.6 رو انتخاب کن و استفاده کن، نمیدونم چطور ولی ظاهرا تو شرایط ملی کار میکنه و 10 برابر بهتر از مدل پیشفرض یعنی گپ جی پی تی هست

1

Paparnaz | ۱۱ اردیبهشت ۱۴۰۵

همین کارو میکنم من اصلا از مدل پیش فرض استفاده نمیکنم.
اما همونم براش محدودیت ایجاد کردند و من ناچارا پروژه تعریف کردم و برای پروژه هم استراکچر نوشتم که جواب های منطقی تری بده.
تا چند روز پیش ک بررسی کردم حافظه اش مربوط به اگوست ۲۰۲۵ بود و رسما دیتاش افلاینه فقط برای انجام ی سری کارا میشه ازش استفاده کرد

1

Hossein_yadi | ۱۰ اردیبهشت ۱۴۰۵

بنده این تست هارو کردم یکبار با gemini داشتم کلنجار میرفتم اخر گفت بحث با شما بی فایدست و متقاعد کردن شما کار بسیار دشوار است و واقعا کاری کرد که دیگه راجب اون موضوع صحبت نکنیم

0

RAHARAHIIL | ۱۱ اردیبهشت ۱۴۰۵

بلاخره فهمیدم آدم هایی مثل من هم وجود دارن که صدای هوش مصنوعی هم از دستشون در میاد

0

hiddentime | ۱۰ اردیبهشت ۱۴۰۵

chat gpt به طور خاص چندین سطح پاسخ گویی داره میشه تنظیم کرد در حد خواهر شوهر

5

Solight | ۱۱ اردیبهشت ۱۴۰۵

خیلی خوب گفتی😂😂

0

Gamebaz | ۱۰ اردیبهشت ۱۴۰۵

یعنی اگر بهشون بگیم در ایران هستیم آیا کشوری از این بدتر هست؟ یا بگیم کشور خوبی هست میگن بله؟
ببخشید یادم نبود نمیشه این سوالو توی این شرایط پرسید

4
Void_00 | ۱۰ اردیبهشت ۱۴۰۵

از چه دنیایی محروممون کردن.

4
A_Baba | ۱۰ اردیبهشت ۱۴۰۵

واقعا حاضرم الان برم توی چت جی پی تی و هزارتا فوهش بهم بده ولی وصل باشه

7