ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

مدل هوش مصنوعی alibaba
هوش مصنوعی

بهتر از DeepSeek؛ هوش مصنوعی جدید شرکت چینی Alibaba معرفی شد [تماشا کنید]

به ادعای Alibaba مدل هوش مصنوعی Qwen2.5-Max از مدل تحسین‌شده DeepSeek-V3 بهتر است.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۱۰ بهمن ۱۴۰۳ | ۱۵:۱۵

شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد که ادعا می‌کند از مدل تحسین‌شده DeepSeek-V3 بهتر است.

براساس اعلام Alibaba، مدل جدید Qwen2.5-Max در بنچمارک‌هایی مانند Arena-Hard، LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل می‌کند. در دیگر بنچمارک‌ها نیز تقریباً هم‌سطح مدل دیپ‌سیک است. همچنین این شرکت می‌گوید که مدلش از GPT-4o و Llama-3.1-405B در بخش‌های مختلفی عملکرد بهتری دارد.

اکنون می‌توانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. همچنین این مدل قدرتمند در Qwen Chat منتشر شده است که در آن می‌توانید عکس و ویدیو نیز تولید کنید.

هوش مصنوعی جدید Alibaba

مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که بر روی بیش از 20 تریلیون توکن و با روش‌های تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE کمک می‌کند تا هوش مصنوعی بدون خوشه‌های GPU عظیم به دست آید و هزینه‌های زیرساخت را 40 تا 60 درصد نسبت به سایر رویکردهای مدل‌های زبانی بزرگ کاهش داد.

مدل جدید علی‌بابا و البته DeepSeek نشان می‌دهند که به‌جای سرمایه‌گذاری هنگفت در ایجاد مراکز داده و خوشه‌های GPU بزرگ می‌توان با بهینه‌سازی معماری هوش مصنوعی مدل‌هایی کم‌هزینه و کارآمد توسعه داد. عملکرد قوی این مدل در تولید کد (با امتیاز 38.7 درصد در بنچمارک LiveCodeBench) و استدلال (با امتیاز 89.4 درصد در Arena-Hard) نشان می‌دهد می‌توان بسیاری از کاربردهای هوش مصنوعی مولد را با توان پردازشی کمتری مدیریت کرد.

البته فقط عملکرد خوب در بنچمارک‌ها کافی نیست تا یک مدل هوش مصنوعی در بین کاربران محبوب شود. رعایت حریم خصوصی داده‌های کاربران، ارائه API قابل‌اطمینان و پشتیبانی طولانی‌مدت نیز از عوامل تأثیرگذار هستند. درکل اکنون باید دید که آیا مدل جدید علی‌بابا می‌تواند در رقابت با دیپ‌سیک و شرکت‌های آمریکایی عملکرد قابل‌قبولی داشته باشد یا خیر.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی