ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

Stability AI
هوش مصنوعی

Stability AI از سری مدل‌های هوش مصنوعی StableLM رونمایی کرد؛ جایگزین متن‌باز ChatGPT

شرکت مشهور Stability AI از خانواده مدل‌های جدیدی به نام StableLM پرده برداشته است که به‌صورت متن‌باز در دسترس قرار گرفته‌اند.

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۵ اردیبهشت ۱۴۰۲ | ۱۷:۰۰

شرکت Stability AI به‌تازگی یک خانواده متن‌باز از مدل‌های زبانی هوش مصنوعی را منتشر کرده است که StableLM نام دارد. این شرکت امیدوار است که با این محصول بتواند اثری شبیه به Stable Diffusion در دنیای مدل‌های متن‌باز تصویری را تکرار کند. StableLM به‌خاطر ماهیت خود می‌تواند برای تولید جانشین‌های ChatGPT استفاده شود.

به گزارش آرس‌تکنیکا، مدل‌های StableLM در‎حال‌حاضر درحالت آلفا قرار دارند و با 3 میلیارد و 7 میلیارد پارامتر در دسترس قرار گرفته‌اند. Stability AI وعده داده است که در آینده مدل‌هایی با 15 و 65 میلیارد پارامتر را هم عرضه می‌کند. این مدل‌ها با مجوز Creative Commons BY-SA-4.0 منتشر شده‌اند، بدین معنی که استفاده از آن‌ها با اشاره به سازنده اصلی و نشر مجدد از طریق همین مجوز مجاز است.

StableLM درست مثل GPT-4، محصول شرکت OpenAI، با پیش‌بینی واژه بعدی در یک جمله دست به تولید متن می‌زند. این خانواده البته درواقع بیشتر سعی کرده است که با وجود در اختیار داشتن پارامترهای کمتر، عملکردی شبیه به GPT-3 داشته باشد. GPT-3 حدود 175 میلیارد پارامتر دارد.

ساخت StableLM با ملاحظات فراوان صورت گرفته است

این پارامترها متغیرهایی هستند که مدل‌های زبانی از آن‌ها برای آموزش داده‌ها استفاده می‌کنند. استفاده از پارامترهای کمتر می‌تواند به کوچک‌تر و بهینه‌ترشدن مدل‌ها کمک کند، اما اگر بخواهیم عملکردی مشابه با مدل‌های بزرگ‌تر داشته باشیم، باید آن‌ها را با مهارت و دقت بسیار بالا مهندسی کنیم.

Stability AI می‌گوید StableLM را روی مجموعه تازه‌ای از داده‌های آزمایشی بر پایه مجموعه متن‌بازی از داده‌ها موسوم به The Pile آموزش داده است. این شرکت ادعا می‌کند که غنای این داده‌ها عامل اصلی عملکرد شگفت‌انگیز این مدل کوچک بوده است.

وب‌سایت آرس‌تکنیکا می‌گوید در آزمایشی که با مدل 7 میلیارد پارامتری StableLM انجام داده، دریافته است که این مدل عملکردی بهتر از مدل 7 میلیارد پارامتری LLaMA شرکت متا دارد، بااین‌حال مدل GPT-3 احتمالاً توانمندتر و انعطاف‌پذیرتر است.

جزئیات فنی کامل خانواده StableLM قرار است در آینده نزدیک به اشتراک گذاشته شود.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی