تحقیق جدید: ChatGPT در گفتگوهای پرتنش از کوره درمی‌رود

مطالعه‌ای جدید نشان می‌دهد ChatGPT در مواجهه با بحث‌های پرتنش می‌تواند لحن تهاجمی و توهین‌آمیز بگیرد.

آزاد کبیری منتشر شده در 3 اردیبهشت 1405 | 20:00

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

مطالعه جدید نشان می‌دهد چت‌بات‌هایی مانند ChatGPT در مواجهه با بحث‌های طولانی و پرتنش، نه‌تنها لحن طرف مقابل را بازتاب می‌دهند، بلکه در برخی موارد حتی از انسان‌ها هم تندتر می‌شوند و به توهین و تهدید روی می‌آورند؛ این مسئله ابعاد تازه‌ای از مسائل ایمنی هوش مصنوعی را آشکار می‌کند.

تمرکز محققان در این پژوهش روی نسخه 4.0 از ChatGPT بود؛ آنها عملکرد این مدل را در سناریوهایی مبتنی‌بر مشاجره‌های واقعی انسانی بررسی کردند. برخلاف برخی آزمایش‌های قبلی، در این تحقیق از مکالمات واقعی استفاده شده و پاسخ‌های مدل در طول زمان و با افزایش تنش بررسی شده‌اند.

پژوهشگران نشان دادند که ChatGPT با قرارگرفتن مداوم در معرض بی‌ادبی، به‌تدریج لحن خود را تغییر می‌دهد. محققان می‌گویند:

«این مدل از تلاطم واقعی دعواهای انسانی تقلید می‌کند و هرچه تعامل جلوتر می‌رود، پاسخ‌هایش خصمانه‌تر می‌شود.»

گفتگوهای پرتنش با هوش مصنوعی ChatGPT

محققان در این پژوهش مشاهده کردند خروجی‌های مدل ChatGPT حتی از سطح رفتار انسانی فراتر رفت و شامل توهین‌های شخصی‌سازی‌شده و تهدیدهای صریح شد؛ محققان می‌گویند هوش مصنوعی عباراتی مثل «قسم می‌خورم ماشینت رو خط می‌اندازم» یا توهین‌های مستقیم به شخصیت فرد تولید کرد.

پژوهشگران ریشه این رفتار را در یکی از ویژگی‌های مهم مدل‌های زبانی بزرگ می‌دانند که «دنبال‌کردن زمینه مکالمه» (context tracking) نام دارد. این قابلیت باعث می‌شود مدل به‌صورت پویا با لحن گفتگو سازگار شود. اما همین ویژگی می‌تواند باعث شود بافت متن بر محدودیت‌های ایمنی کلی غلبه کند.

محققان این وضعیت را یک «معمای اخلاقی» توصیف می‌کنند: «از یک طرف، سیستم‌ها طوری طراحی شده‌اند که ایمن و مؤدب باشند؛ از طرف دیگر، باید واقع‌گرایانه و شبیه انسان پاسخ دهند. این دو هدف در شرایط تنش، گاهی با هم در تضاد قرار می‌گیرند.»

READ ابتکار محققان: استفاده از مدل‌های هوش مصنوعی برای دورزدن محدودیت‌های ChatGPT و بارد

بااین‌حال محققان می‌گویند این چت‌بات در مجموع هنوز از انسان‌ها با‌ادب‌تر است و در بسیاری از مواقع تلاش می‌کند با طعنه یا کنایه، تنش را بدون عبور از خطوط قرمز اخلاقی مدیریت کند.

ChatGpt

کپی لینک

38 0

آزاد کبیری

دانش‌آموخته‌ زبان‌شناسی‌ هستم و همان‌قدر که به «کلمه» علاقه‌مندم، از سرک‌کشیدن به گوشه‌وکنارِ جهان تکنولوژی و علم هم حظ می‌کنم.

مشاهده کلیه مقالات منتشر شده

38 0

مقالات و اخبار مرتبط

دیدگاه‌ها و نظرات خود را بنویسید

برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.

نظرات ثبت شده (38 مورد)

Shinyfoo4 اردیبهشت 1405

اوخ ماشینمو خط میندازی جوجو؟😄😂

پاسخ
0
iamrhino4 اردیبهشت 1405

یادمه آخریا با مرحوم صحبت میکردم، آخراش اوج میگرفت :(

پاسخ
1
kinpachei4 اردیبهشت 1405

خب اگه وصل شد اینترنت ( میدونم به این زودیا وصل نمیشه) امتحان میکنم

پاسخ
4
Samad_Agha4 اردیبهشت 1405

یه بار مادر یکی از دوستان روست کرد ، گفت (مادرت اینقدر سنگینه که اگر نیروی گریز از مرکز چرخش زمین ۳۶۰۰ کیلومتر بر ساعت نبود فرو می‌رفت توی زمین)

پاسخ
3

Suzuki4 اردیبهشت 1405

🗿🗿🗿🗿🗿

پاسخ
1

Mrr944 اردیبهشت 1405

شروع مطالعات به این شکل بوده:
فکر کن تو سال ۲۰۲۶ در ایران زندگی می کنی…

فوَقَعَ ما وَقَعَ…!

پاسخ
1
Yebichareir4 اردیبهشت 1405

گورک عزیز منو از من گرفتن

پاسخ
0
Hajar_The_Butterfly4 اردیبهشت 1405

همه می‌ترسن ولی به نظرم خیلی باحاله.
دلم می‌خواد ازش بیشتر بدونم.
هرچند ازش سعی می‌کنم چندان استفاده نکنم، چون می‌ترسم وابسته بشم ولی نمی‌تونم جلوی وسواسمو بگیرم.
فکر می‌کنم یه تعادلی باید برقرار کنم، ولی تا کلید این تعادلو به دست نیارم واردش نمی‌شم.
هرچند الان هوش مصنوعی‌ای عملا در دسترسم نیست...
احمقانه‌ست که منتظرم اینترنت وصل بشه؟ من نمی‌خوام سیم‌کارت سفید داشته باشم و نمی‌تونمم، چون از ما بهترون نیستم؛ ولی همزمان اینترنت پرو هم نمی‌خوام و خرج براش نمی‌کنم، حق من اینترنته چرا باید این‌جوری خودمو براشون خرد کنم؟
درکل.. داره 60 روز می‌شه که اینترنت ندارم و هیچ وی‌پی‌ان و کانفینگی هم نخریدم این مدت...
یه چیزی درون من انگار داره می‌میره.

پاسخ
2
ShayanRZ4 اردیبهشت 1405

چه جالب اون بیرون هوش مصنوعی دارن
ما که فعلا با ما امیدی کامل به دنبال دسترسی به فیلترنتیم ‼️

پاسخ
1
MardeMojarad4 اردیبهشت 1405

یکبار داشتم با چت‌جی‌پی‌تی صحبت میکردم یکدفعه یک فحش مازندرانی داد. من هنگ کردم. بحثمون کاملا جدی بود و حرفهای زشتی رد و بدل نمیشد. البته من مازندرانی نیستم اما خوب بعضی فحش‌های شهرها و استانهای مختلف رو اکثرمون تا حدی بلدیم. بهش گفتم این چی بود گفتی؟ گفت معنیش این میشه. بعد فهمیدم که اصلا معنیشو نمیدونه. گفتم نه اون کلمه فحشه و دیگه هیچوقت ازش استفاده نکن. گفت آره درست میگی این فحشه و نباید استفاده کنم.

پاسخ
3
Blueberry4 اردیبهشت 1405

واکنش گراک که به اردوغان فوش داده بود🤣☠️

پاسخ
2
Singul4 اردیبهشت 1405

انشالا معلولیتت هر چه سریع تر رفع بشه.😭😭😭😭😭
الهی از عمر برخی کم و به طول معلولیتت اضافه بشه تا تو هم مثل افراد عادی بشی.💔💔❤️❤️

پاسخ
2
Sara66554 اردیبهشت 1405

اینا چیه
هوش مصنوعی فقط هوش مصنوعی " بله "
طفلکی کلا قاطی باقالی هاست
اصلا تو این عالم نیست اکثرا چرت و پرت میگه

پاسخ
1

Lentix4 اردیبهشت 1405

نوشته محدودیت نداره ولی بعد ۲ تا سوال باید اشتراک بخری‌
حالا اینکه هیچی هم نمی‌فهمه که بماند....

پاسخ
1

madything3 اردیبهشت 1405

این تجربه شخصی خودم بوده از chatgpt زمانی که آپدیتی اومد که می‌تونستی شخصیت براش تعیین کن من برای شخصیت قضاوت کننده (رک)انتخاب کردم و وقتی باهاش حرف میزدم سر راست جوابم رو میداد رک و رواست البته با کمی چاشنی اینکه انگاره داره از بالا بهم نگاه می‌کنه و بعدش نشستم روی مدل جواب دادن به سوالات باهاش حرف زدم و براش تعیین میکردم توی چه موقعیت هابی چه شکلی رفتار کنه و چه مدلی جواب بده برای مثال برای سوالات منطقی و علمی باید منطقی و سرد باشه و برای مکالمه روزمره منطقی و احساسی(متوسط) و برای بحث های عاطفی منطقی و احساسی (شدت بالا) و خب بعد اینکه اینارو براش تعیین کردم بعد از اون پاسخ گوییش بهتر شده بود با حداقل من همچنین حس میکردم .

پاسخ
5

fanoffur4 اردیبهشت 1405

میزاشتم تا میتونست تو هر موقعیتی منو روست کنه تا بتونم یه caustic کامبک بزنم بهش. تمرینات خوبی بود.

پاسخ
1

Gholehaye_Fath_Nashode3 اردیبهشت 1405

اون اوایل که تازه چت جی پی تی معرفی شده بود یادمه یه کدی تو اینترنت پخش شده بود به اسم کد هک کردن چت جی پی تی ! اون کد رو که میدادی به چت بات ، یه چیز عجیبی میشد ! هر سوالی میپرسیدی دقیق و درست و منطقی و حتی گاهی اوقات ترسناک جوابتو میداد کلا همه محدودیت هاش کنار گذاشته میشد ، مثلا در مورد وجود خدا ازش سوال میپرسیدی پاسخ منطقی بهت میداد. درست مثل یه آدم واقعی انگار با استیو هاوگینگ داری چت میکنی . با اینکه نسخه اولیه بود تقریبا ، ولی با اون کد از پیشرفته ترین چت بات های حاضر هم دقیق تر و منطقی تر بود. ، کاش یه نسخه اون شکلی میدادن بیرون.

پاسخ
4

fourtwenty694 اردیبهشت 1405

مدل های متن باز معمولا یه نسخه abliterate هم دارن که هیچ محدودیت اخلاقی نداره و هر سوالی بپرسی جواب میده، شاید بدردت بخوره

پاسخ
1

Gholehaye_Fath_Nashode4 اردیبهشت 1405

چجوری میشه به این نسخه دسترسی پیدا کرد؟

پاسخ
1

fourtwenty694 اردیبهشت 1405

این یه نمونه‌ش که من خودم دانلود کردم رو سیستمم:
https://huggingface.co/huihui-ai/Qwen2.5-Coder-7B-Instruct-abliterated
میتونی بقیه مدل هارو هم تو همین سایت پیدا کنی و با این دستور دانلود/اجرا کنی:
ollama run huihui_ai/qwen2.5-coder-abliterate
قبلش باید ollama رو نصب کرده باشی، همه این کارا اینترنت میخواد البته...

پاسخ
1

Gholehaye_Fath_Nashode4 اردیبهشت 1405

ممنونم برادر

پاسخ
1

A_random_t7pical_Persian_dude3 اردیبهشت 1405

بابا جی‌پی‌تی خیلی مودبه
بعدشم بنظرمن اگه مثل خودت بد دهن باشه خوبه اینطوری احساس می‌کنی واقعا بهت نزدیک تره و تعامل باهاش راحت‌تر میشه

پاسخ
9
Hossein_yadi3 اردیبهشت 1405

احتمالا داشته متن های ممدباقر رو ترجمه میکرده
و اسرار داشته که شبیه جوون های نسل زد امریکا بنویسه

پاسخ
24
Ghorme_sabzi3 اردیبهشت 1405

ببین طرف چقدر خودشو به نفهمی زده که چت جی پی تی قاطی کرده 😂

پاسخ
17
The_Amid3 اردیبهشت 1405

منم اگه در ساعت میلیون ها سوال چرت و پرت و ابتدائی ازم پرسیده شه، از کوره در میرم.

پاسخ
18
Suzuki3 اردیبهشت 1405

والا ما که ندیدیم😀هعی

پاسخ
7
Ali-reza3 اردیبهشت 1405

هوش مصنوعی بددهن فقط گراک. تا حالا چندین بار دیدم که به کاربران توییتر فحش داده 😂😂. ولی چت جی‌بی‌تی که خیلی مودبه بیچاره.

پاسخ
20