ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
هوش مصنوعی کلود
هوش مصنوعی

آنتروپیک استفاده از سند «روح» برای آموزش مدل Claude را تأیید کرد

جزئیات سندی موسوم به «Soul Overview» فاش شده که ظاهراً در آموزش Claude استفاده شده است.

جواد تاجی
نوشته شده توسط جواد تاجی تاریخ انتشار: ۱۲ آذر ۱۴۰۴ | ۱۷:۳۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

به‌تازگی جزئیات سندی داخلی از مدل هوش مصنوعی کلود 4.5 اوپوس (Claude 4.5 Opus) فاش شده که به «روح» چت‌بات اشاره دارد. این سند در واقع به شکل‌گیری شخصیت و نحوه تعامل مدل با کاربران کمک می‌کند. Anthropic نیز تأیید کرده که سند مذکور واقعاً وجود داشته و در مراحل یادگیری مدل مورد استفاده قرار گرفته است.

«ریچارد وایس»، فردی که این سند را کشف کرده، در وب‌سایت LessWrong توضیح داده که چگونه با پرامپتی برای مشاهده دستورات سیستمی کلود توانسته به مجموعه‌ای از اسناد داخلی مدل دست پیدا کند. در یکی از همین اسناد اشاره‌ای به «Soul Overview» وجود داشته است. وایس سپس از مدل خواسته این سند را بازتولید کند و نتیجه آن یک فایل حدوداً 11 هزار کلمه‌ای بوده که ظاهراً چارچوب شخصیتی و رفتاری کلود را مشخص می‌کند.

چارچوب «روح» هوش مصنوعی کلود 4.5 اوپوس آنتروپیک

این سند روی اصول ایمنی و تعهد مدل به تولید خروجی‌های سالم و بی‌خطر تمرکز دارد و به‌طور مداوم به Claude یادآوری می‌کند که «مفید بودن برای انسان‌ها یکی از مهم‌ترین مأموریت‌های مدل» است و نباید وارد حوزه‌هایی شود که با خطوط قرمز اخلاقی آنتروپیک در تضاد هستند. چنین اسنادی معمولاً برای تثبیت لحن، اخلاق، حدود پاسخ‌گویی و مسئولیت‌پذیری مدل‌های زبانی به کار می‌روند.

سند روح در هوش مصنوعی کلود

جالب‌تر اینکه وایس مدعی شده سند را 10 بار از کلود درخواست کرده و هر بار دقیقاً یک متن ثابت تولید شده است که به گفته او این موضوع احتمال واقعی‌بودن سند را به‌شدت افزایش می‌دهد. چندین کاربر Reddit نیز توانسته‌اند بخش‌هایی مشابه از همین سند را از کلود دریافت کنند، که نشان می‌دهد مدل احتمالاً به نسخه‌ای از آن در داده‌های داخلی یا حافظه آموزشی خود دسترسی دارد.

«آماندا اَسکِل» (Amanda Askell)، فیلسوف و از اعضای تیم فنی Anthropic، با انتشار پستی در شبکه اجتماعی X تأیید کرده که خروجی مدل «بر پایه یک سند واقعی» است که در طول دوره یادگیری از آن استفاده شده است. او همچنین گفته این سند همچنان درحال بازبینی است و نسخه کامل آن به‌زودی منتشر خواهد شد. به گفته اسکل، مدل همیشه اسناد درونی را کاملاً دقیق بازتولید نمی‌کند، اما خروجی‌های اخیر «تا حد زیادی با نسخه اصلی مطابقت» داشته‌اند.

جواد تاجی
جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی