تحقیق جدید: ChatGPT در گفتگوهای پرتنش از کوره درمیرود
مطالعهای جدید نشان میدهد ChatGPT در مواجهه با بحثهای پرتنش میتواند لحن تهاجمی و توهینآمیز بگیرد.
مطالعه جدید نشان میدهد چتباتهایی مانند ChatGPT در مواجهه با بحثهای طولانی و پرتنش، نهتنها لحن طرف مقابل را بازتاب میدهند، بلکه در برخی موارد حتی از انسانها هم تندتر میشوند و به توهین و تهدید روی میآورند؛ این مسئله ابعاد تازهای از مسائل ایمنی هوش مصنوعی را آشکار میکند.
تمرکز محققان در این پژوهش روی نسخه 4.0 از ChatGPT بود؛ آنها عملکرد این مدل را در سناریوهایی مبتنیبر مشاجرههای واقعی انسانی بررسی کردند. برخلاف برخی آزمایشهای قبلی، در این تحقیق از مکالمات واقعی استفاده شده و پاسخهای مدل در طول زمان و با افزایش تنش بررسی شدهاند.
پژوهشگران نشان دادند که ChatGPT با قرارگرفتن مداوم در معرض بیادبی، بهتدریج لحن خود را تغییر میدهد. محققان میگویند:
«این مدل از تلاطم واقعی دعواهای انسانی تقلید میکند و هرچه تعامل جلوتر میرود، پاسخهایش خصمانهتر میشود.»
گفتگوهای پرتنش با هوش مصنوعی ChatGPT
محققان در این پژوهش مشاهده کردند خروجیهای مدل ChatGPT حتی از سطح رفتار انسانی فراتر رفت و شامل توهینهای شخصیسازیشده و تهدیدهای صریح شد؛ محققان میگویند هوش مصنوعی عباراتی مثل «قسم میخورم ماشینت رو خط میاندازم» یا توهینهای مستقیم به شخصیت فرد تولید کرد.

پژوهشگران ریشه این رفتار را در یکی از ویژگیهای مهم مدلهای زبانی بزرگ میدانند که «دنبالکردن زمینه مکالمه» (context tracking) نام دارد. این قابلیت باعث میشود مدل بهصورت پویا با لحن گفتگو سازگار شود. اما همین ویژگی میتواند باعث شود بافت متن بر محدودیتهای ایمنی کلی غلبه کند.
محققان این وضعیت را یک «معمای اخلاقی» توصیف میکنند: «از یک طرف، سیستمها طوری طراحی شدهاند که ایمن و مؤدب باشند؛ از طرف دیگر، باید واقعگرایانه و شبیه انسان پاسخ دهند. این دو هدف در شرایط تنش، گاهی با هم در تضاد قرار میگیرند.»
بااینحال محققان میگویند این چتبات در مجموع هنوز از انسانها باادبتر است و در بسیاری از مواقع تلاش میکند با طعنه یا کنایه، تنش را بدون عبور از خطوط قرمز اخلاقی مدیریت کند.
دیدگاهها و نظرات خود را بنویسید
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.
هوش مصنوعی بددهن فقط گراک. تا حالا چندین بار دیدم که به کاربران توییتر فحش داده 😂😂. ولی چت جیبیتی که خیلی مودبه بیچاره.
لطفا "آقا مانی رزومه خودشون رو به عنوان "متخصص جلوگیری از کوره در رفتن"برای اپن ای آی بفرستن.نمونه کار هم خواستند ویدئوهای آقا کوروش رو ضمیمه کنند:)
هوش مصنوعی خیلی داره ترسناک میشه
«محققان میگویند هوش مصنوعی عباراتی مثل «قسم میخورم ماشینت رو خط میاندازم» یا توهینهای مستقیم به شخصیت فرد تولید کرد.»
😂😂😂
اگه اینطوریه چت جی پی تی رو بذاری روبروی مسئولین ما یه ترمیناتور واقعی میسازه.
این خبری که میگن آسیاتک ورشکست شده چیه؟ تو گوگل سرچ میکنی یه سری ها خبرش رو کار کردن اما همه خارجین سایتشون باز نمیشه
منم شنیدم حتی میگن رفته زیرمجموعه مخابرات
چاتی پاتی من که ماشین ندارم
یه زمان حتی فکرش رو هم نمیکردم که دلم بخواد واسه چت جی پیتی تنگ بشه
چت بات ها هم توهین میکنن ،،،بعد از ما انتضار دارید تو این شرایط توهین نکنییم 😆😆😆😁😁😁😅😅
سلام دوستانی که فایلای ضروری برنامه نویسی نیاز دارن همه فایلا ارشیو شده اینجا هستن توی این شرایط خیلی به درد میخوره
https://avasam.ir/post/offline-tools
یخورده کم کم یاد skynet و این داستانا افتادم... هوش مصنوعی جدا داره خطری میشه، مخصوصا اگر چنین اتفاقی برای هوش مصنوعی هایی که کاربرد نظامی دارن بیوفته که بدبخت و بیچاره میشیم😂
فقط چند قدم تا درست کردن دوست دختر یا دوست پسر با خصوصیات اخلاقی مورد پسند خودمون از طریق هوش مصنوعی فاصله داریم 😅😅😅 (البته همین الانم خیلی تو این زمینه پیشرفت هست ولی شکل ظاهری روبات ها هنوز جای کار داره)
انشالا معلولیتت هر چه سریع تر رفع بشه.😭😭😭😭😭
الهی از عمر برخی کم و به طول معلولیتت اضافه بشه تا تو هم مثل افراد عادی بشی.💔💔❤️❤️