هوش مصنوعی

اپل چند مدل هوش مصنوعی متن‌باز جدید منتشر کرد؛ رقیبی برای مدل‌های کوچک گوگل و متا

مدل‌های جدید اپل به‌صورت متن‌باز اکنون برای محققان در دسترس هستند.

نوشته شده توسط آزاد کبیری تاریخ انتشار: ۱ مرداد ۱۴۰۳ | ۱۰:۰۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

ویدئوی مرتبط

ویدیو جعبه گشایی و نگاه نزدیک دیجیاتو: آیفون SE [تماشا کنید]

درحالی‌که توجه علاقه‌مندان هوش مصنوعی اخیراً به مدل جدید و ارزان GPT-4o mini جلب شده، اپل تصمیم گرفته خانواده مدل‌های کوچکش را گسترش دهد. به‌تازگی محققان اپل چند مدل‌ متن‌باز را تحت پروژه‌ای موسوم به DCLM منتشر کردند.

براساس گزارش AppleInsider، خانواده هوش مصنوعی جدید اپل شامل دو مدل اصلی است: یکی با 7 میلیارد پارامتر و دیگری با 1.4 میلیارد پارامتر. هر دوی آن‌ها در بنچمارک‌ها عملکرد بسیار خوبی دارند، به‌خصوص نمونه بزرگ‌تر که بهتر از مدل Mistral-7B است و می‌تواند با سایر مدل‌های متن‌باز پیشرو، مانند Llama 3 از متا و Gemma از گوگل رقابت کند.

مدل‌های هوش مصنوعی متن‌باز جدید اپل

محققان اپل این مدل‌های جدید را مدل‌های متن‌باز با بهترین عملکرد توصیف کرده‌اند. نکته‌ مهم این است که در این پروژه، با انتشار کد آموزشی و مجموعه داده‌های دیگر، مدل‌ها به‌صورت متن‌باز در Hugging Face در دسترس هستند. همچنین هر دو مدل در بنچمارک‌های MMLU امتیاز خوبی کسب کردند تا در برابر مدل‌های تجاری دیگر رقابت کنند.

مقایسه امتیاز مدل متن‌باز جدید اپل (DCLM-7B) با دیگر مدل‌ها

به گفته محققان اپل، مدل بزرگ‌تر در مقایسه با MAP-Neo (پیشرفته‌ترین مدل متن‌باز قبلی اپل)، بهبود 6.6 درصدی در بنچمارک‌ها داشته است؛ درحالی‌که تا 40 درصد از محاسبات کمتری برای آموزش آن استفاده شده است. از سوی دیگر، درست مانند مدل بزرگ‌تر DCLM-7B، نسخه کوچک‌تر 1.4B این مدل که روی 2.6 تریلیون توکن آموزش دیده است، عملکرد قابل‌توجهی در تست‌های MMLU ،Core و Extended دارد.

اردیبهشت‌ماه نیز اپل از مدل‌های متن‌باز OpenELM رونمایی کرد که در چهار مدل مختلف 270 میلیون پارامتری، 450 میلیون پارامتری، 1.1 میلیارد پارامتری و 3 میلیارد پارامتری منتشر شد. به گفته اپل، این مدل‌ها در وظایف مربوط به پردازش متن ،مانند نوشتن ایمیل، عملکرد خوبی دارند.

مدل‌هایی که محققان اپل منتشر کرده‌اند، ظاهراً در هیچ‌یک از محصولات آینده اپل به‌ کار گرفته نمی‌شوند و بیشتر باید آن‌ها را پروژه‌های تحقیقاتی متن‌باز در نظر گرفت.

اپل

اشتراک گذاری:

کپی لینک