هوش مصنوعی چطور آموزش داده میشود؟ از داده خام تا پاسخ هوشمند
قبل از اینکه تماشا کنید: این ویدیو در دی ماه ۱۴۰۴ و قبل از قطع اینترنت در استودیو دیجیاتو ضبط شده است.
هوش مصنوعی یکی از مهمترین فناوریهای تحولآفرین عصر حاضر است و درک نحوه آموزش مدلهای زبانی میتواند به ما کمک کند تا بهتر بفهمیم این سیستمها چگونه قادرند متن تولید کنند، تحلیل انجام دهند و پاسخهای پیچیده ارائه دهند. فرآیند آموزش یک مدل زبانی پیشرفته شامل مراحلی دقیق، گسترده و مبتنی بر داده است که در این ویدیو به صورت گامبهگام تشریح شده است.
این ویدیو پیش از قطعی اینترنت تولید شده است. :)
در اولین مرحله، دادهها نقش ستون اصلی را ایفا میکنند. میلیونها سند، متن، مقاله، مکالمه و منابع نوشتاری با دقت گردآوری میشوند تا مدل بتواند الگوهای زبان طبیعی را بیاموزد. سپس این دادهها پاکسازی و نرمالسازی میشوند؛ یعنی عناصر تکراری، نویزها، دادههای ناکامل و محتواهای نامعتبر حذف میشود تا مدل با اطلاعات درست و ساختارمند آموزش ببیند.
پس از آمادهسازی داده، مرحله پیشپردازش آغاز میشود. در این بخش، متنها به توکن تبدیل میشوند؛ واحدهایی کوچکتر که مدل از طریق آنها ساختار زبان را درک میکند. سپس مدل وارد مرحله یادگیری میشود که هسته اصلی فرآیند است. در این مرحله، شبکه عصبی ترنسفورمر با استفاده از میلیاردها پارامتر، تلاش میکند روابط میان کلمات، معنا، جملهسازی و منطق زبانی را بیاموزد. این یادگیری از طریق محاسبه خطا و اصلاح وزنها انجام میشود؛ به گونهای که مدل بهتدریج در پیشبینی توکن بعدی و ساخت متن دقیقتر میشود.
مرحله بعد، تنظیمهای پیشرفته و آموزش تکمیلی است. در این مرحله مدل با استفاده از دادههای تخصصیتر یا روشهایی مانند یادگیری تقویتی با بازخورد انسانی (RLHF) بهبود مییابد. این کار کمک میکند مدل نه فقط زبان را بفهمد، بلکه بتواند محتوایی سازگار با نیازها، ارزشها و دستورالعملهای انسانی تولید کند.
در پایان، مدل تحت آزمون، اعتبارسنجی و ارزیابی دقیق قرار میگیرد تا عملکرد آن در حوزههای مختلف سنجیده شود. این ارزیابیها شامل تستهای کیفیت متن، سازگاری معنایی، ایمنی و توانایی پاسخدهی است. نتیجه این مراحل، مدلی است که میتواند پاسخهای طبیعی، دقیق و سازگار ارائه دهد.
این ویدیو تمامی این مراحل را با زبانی روان اما کاملاً فنی توضیح میدهد تا مخاطب درک دقیقی از سازوکار شکلگیری یک مدل زبانی هوش مصنوعی داشته باشد.
دیدگاهها و نظرات خود را بنویسید
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.
تازه شروع به یادگیری دیپ لرنینگ کرده بودم که... هی هیچی نگم بهتره💔
خوش به حالمون
چرا ویدیوی یوتیوب دیدی کپی کردی؟
ما بی خبر هستیم از دنیا ولی تا وقتی وصل بودیم آپدیت بودیما😅
درضمن برای کسایی که واقعا میخوان بدونن این مدلا چطوری ساخته میشن باید بگم که توضیحات توی ویدیو بر میگرده به خیلی قدیم یعنی ی چیزی در حد alex net که بدبختانه برای فهم عامه کلی هم ازش کم شده و خلاصه های اشتباهی زدن از روش.
ارچیتکت یا معماری هر مدل جدید با بقیه فرق داره مثلا مدلی مثل qwen یا kimi k2 از دو معماری کاملا متفاوت استفاده میکنن که شما فقط توکنایزر ها یا انکودرهاشون رو بخوای درک کنی مخت سوت میکشه.
(این توضیح برای افرادی بود که واقعیت کار رو میخوان بدونن یا یاد بگیرن،اگر برای سرگرمی نگاه میکنید عیبی نداره لذت ببرید✌️)
ای کاش بیشتر توضیح میدادید. من تا transformers هاش رو فکر کردم همشون شبیه همن. یعنی اینطوری نیست؟ یعنی اون قسمت الگوریتم اولیه training یا همون neural network شون هم از بیخ متفاوته؟
ببین از ترنسفورمر استفاده میشه درشون ولی یکسری مدل های جدید هم اومدن که یا هیبرید هستن یا کلا روی یک ساختار دیگری مثل دیفیوژن دارن که میتونن توی ۵ ثانیه ۱۵ هزار توکن بدن بیرون و حتی کمتر خطا و توهم دارن.
الان اینترنت نداریم وگرنه چنتا لینک میدادم از هاگینگ فیس و گیتهاب و مدیوم تا بهتر متوجه بشی(اگر وصل شد میتونی توی این سایتا سرچ کنی اینا معتبر و به روز هستن).
من خودم با اینکه بیشترشون رو میفهمم ولی خب به قول رفیقم اصلا توی انتقال دانش به دیگران خوب نیستم😅.
خلاصه اش رو اینطوری بگم،همونطور که یک سیستم عامل از بخش های مختلف مثل کرنل،درایور،سرویس ها و غیره تشکیل شده و هرکدوم مثل لینوکس و ویندوز متفاوت ساخته شدن،مدل ها هم همینطور هستن.
شما نمیتونی یک تریلیون پارامترو الکی وصل کنی به هم و توقع داشته باشی وزن هاش خودشون دقیق بشن و واقعا چیز خوبی در بیاد ازش.
بیشتر هوشمندی مدل ها از سیستم های دورشون در زمان تمرین و بعد در زمان پروداکشن میاد مثل همون توکنایزر،انکودر،امبدینگ،و حتی رپر های کوچیک مثل سرچ اینترنتی که چت داشت.
بزرگ ترین بخش هر مدل درسته که پارامتر هاش هست ولی بیشترین بار رو اون سیستم های دقیق دورشون هندل میکنه.
مثل این میمونه که یک کوه روی یک سوزن سوار شده باشه.
نمونه های داخلی یه چت بات ساده ان در حد یه PIP TensorFlow
، نگید هوش مصنوعی ایرانی بهتره بگید یه اسکرین شات قدیمی
دارن فکت رو انتشار میدن عزیز!
به اینکار نمیگن کپی ^–^
مثل اینکه من بیام به شما بگم آب تو 100درجه به جوش میاد و شما بگی: چرا کتاب علوم سوم دبستان خوندی کپی کردی؟
متاسفانه فکت نیس،شاید من سخت گیرم😅.(این یک موجی بود توی شبکه های اجتماعی که راه افتاد به خاطر هوش مصنوعی و خب افرادی که ویدیو ساختن ازش همه از روی هم کپی کردن و حتی سورس های اولیه رو هم من تا جایی یادم میاد اصلا دقیق نبود توضیحاتشون و باعث ایجاد یک زنجیره اطلاعات نادرست شد).
بعدشم گفتم برای وقت پر کردن ویدیوی خوبیه. افراد عام نمیتونن مثل علاقه مندان این حوزه عمیق بشن.
اصلا حوصله نمیکنن.
دنیا داره با ریاضی چیکار میکنه حالا سرزمین ما که نخبه هاش مجبورن مهاجرت کنن
نخبه چیه الان کارگر هم داره میره از ایران.
فرار مغزا موند تو چندین سال پیش.
الان بخاطر اوضاع فلاکت بار ایران همه قشرا بفکر مهاجرت از ایرانن.
هیچ تو اینده ای تو ایران وجود نداره حتی تو بهترین رشته ها و بهترین شغلا
دقیقا حتی منم به فکر رفتن حداقل به ترکیه ام
هعی روزگار
راستی لایک رو خیلی قشنگ کردید منو یاد یوتیوب انداخت اونم همین افکت رو میداد وقتی لایک میکردیم خیلی قشنگ شد
جالبه روزیاتو برام بسته شده باز نمیشه
دیجیاتو سایتش خیلی کند میاره بالا
رسیدیم به دوران قبل از اینترنت وبعد از اینترنت مثل ساعت قدیم و جدید جالبه
کسی جو که ماهی ۳ دلار میگرفت هویجهارو جدا میکرد رو یادشه؟
مننننن
راستش اونو یادمنیست ولی دانمارکی خیار رو یادمه
من آمادگی این کارو دارم. فقط منو از ایران ببرند. من حتی همون ۳ دلار رو هم نمیگیرم
کوروش میدونی، دلم میخاد برم انیمیشن های بچگیم رو دوباره ببینم تا یکم هم که شده برگردم به اون حال خوب قدیم ولی یادم میاد من کنکوریم اگه برم انیمیشن ببینم عذاب وجدان و استرس دیگه ولم نمیکنه و هی افسرده تر از قبل میشم
مام یدونه کوروش چایچی داشتیم الان میاد میشینه اخبارارو رو خوانی میکنه قدیما توی یوتیوب...... کسی یادشه اونو؟؟؟؟
عه یادش بخیر بنده خدا خودشو خالی میکرد
اولین باره میشنوم
اومده ایران داره vpn گیگی 250 یک ماهه تک کاربره تونل استارلینک تضمینی بازگشت وجه میفروشه
گوگل میت وصل شد
هنوز موندم چرا سرچ کنسول باید قطع بمونه!؟
رو ایرانسل و همراه تست کردم قطعه
رایتل فقط رو لب تاب
دروغ نگو اصلا کار نمیکنه نه ایرانسل نه همراه اول
عامو کجا وصل شد!!!
ما مرثیه اینترنت رو گرفتیم داغ ما رو تازه نکنین
اکانت فیک هست
اکانت فیک کوروش چایچی هم بوجود آمد
قراره طراحی دایرهمون عوض شه
متاهلم شدی دیگه فشار روت زیاده.
بنظرم از ایران بری بهتره بخاطر فردا بچه ای که میخوای داشته باشی و حتی خودت.
خیلی بی ربطه:
چجوری از ۴۸ تاپس قابلیت هوش مصنوعی کوپایلت پلاس پی سیم استفاده کنم؟
تو اولاما میشه ازش استفاده کرد؟
فیک چیه! خودمم