Stability AI از سری مدل‌های هوش مصنوعی StableLM رونمایی کرد؛ جایگزین متن‌باز ChatGPT

شرکت مشهور Stability AI از خانواده مدل‌های جدیدی به نام StableLM پرده برداشته است که به‌صورت متن‌باز در دسترس قرار گرفته‌اند.

نوشته شده توسط ایمان صاحبی تاریخ انتشار: ۵ اردیبهشت ۱۴۰۲ | ۱۷:۰۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

شرکت Stability AI به‌تازگی یک خانواده متن‌باز از مدل‌های زبانی هوش مصنوعی را منتشر کرده است که StableLM نام دارد. این شرکت امیدوار است که با این محصول بتواند اثری شبیه به Stable Diffusion در دنیای مدل‌های متن‌باز تصویری را تکرار کند. StableLM به‌خاطر ماهیت خود می‌تواند برای تولید جانشین‌های ChatGPT استفاده شود.

به گزارش آرس‌تکنیکا، مدل‌های StableLM در‎حال‌حاضر درحالت آلفا قرار دارند و با 3 میلیارد و 7 میلیارد پارامتر در دسترس قرار گرفته‌اند. Stability AI وعده داده است که در آینده مدل‌هایی با 15 و 65 میلیارد پارامتر را هم عرضه می‌کند. این مدل‌ها با مجوز Creative Commons BY-SA-4.0 منتشر شده‌اند، بدین معنی که استفاده از آن‌ها با اشاره به سازنده اصلی و نشر مجدد از طریق همین مجوز مجاز است.

StableLM درست مثل GPT-4، محصول شرکت OpenAI، با پیش‌بینی واژه بعدی در یک جمله دست به تولید متن می‌زند. این خانواده البته درواقع بیشتر سعی کرده است که با وجود در اختیار داشتن پارامترهای کمتر، عملکردی شبیه به GPT-3 داشته باشد. GPT-3 حدود 175 میلیارد پارامتر دارد.

ساخت StableLM با ملاحظات فراوان صورت گرفته است

این پارامترها متغیرهایی هستند که مدل‌های زبانی از آن‌ها برای آموزش داده‌ها استفاده می‌کنند. استفاده از پارامترهای کمتر می‌تواند به کوچک‌تر و بهینه‌ترشدن مدل‌ها کمک کند، اما اگر بخواهیم عملکردی مشابه با مدل‌های بزرگ‌تر داشته باشیم، باید آن‌ها را با مهارت و دقت بسیار بالا مهندسی کنیم.

Stability AI می‌گوید StableLM را روی مجموعه تازه‌ای از داده‌های آزمایشی بر پایه مجموعه متن‌بازی از داده‌ها موسوم به The Pile آموزش داده است. این شرکت ادعا می‌کند که غنای این داده‌ها عامل اصلی عملکرد شگفت‌انگیز این مدل کوچک بوده است.

وب‌سایت آرس‌تکنیکا می‌گوید در آزمایشی که با مدل 7 میلیارد پارامتری StableLM انجام داده، دریافته است که این مدل عملکردی بهتر از مدل 7 میلیارد پارامتری LLaMA شرکت متا دارد، بااین‌حال مدل GPT-3 احتمالاً توانمندتر و انعطاف‌پذیرتر است.

جزئیات فنی کامل خانواده StableLM قرار است در آینده نزدیک به اشتراک گذاشته شود.

ChatGpt

اشتراک گذاری:

کپی لینک

ایمان صاحبی

دبیر بخش تکنولوژی

فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این دنیا برام محسوب می‌شه، اما همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم دوست دارم.

مشاهده کلیه مقالات منتشر شده