هوش مصنوعی

بهتر از DeepSeek؛ هوش مصنوعی جدید شرکت چینی Alibaba معرفی شد [تماشا کنید]

به ادعای Alibaba مدل هوش مصنوعی Qwen2.5-Max از مدل تحسین‌شده DeepSeek-V3 بهتر است.

آزاد کبیری منتشر شده در 10 بهمن 1403 | 15:15

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

تازه‌های تکنولوژی

شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد که ادعا می‌کند از مدل تحسین‌شده DeepSeek-V3 بهتر است.

براساس اعلام Alibaba، مدل جدید Qwen2.5-Max در بنچمارک‌هایی مانند Arena-Hard، LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل می‌کند. در دیگر بنچمارک‌ها نیز تقریباً هم‌سطح مدل دیپ‌سیک است. همچنین این شرکت می‌گوید که مدلش از GPT-4o و Llama-3.1-405B در بخش‌های مختلفی عملکرد بهتری دارد.

اکنون می‌توانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. همچنین این مدل قدرتمند در Qwen Chat منتشر شده است که در آن می‌توانید عکس و ویدیو نیز تولید کنید.

هوش مصنوعی جدید Alibaba

مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که بر روی بیش از 20 تریلیون توکن و با روش‌های تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE کمک می‌کند تا هوش مصنوعی بدون خوشه‌های GPU عظیم به دست آید و هزینه‌های زیرساخت را 40 تا 60 درصد نسبت به سایر رویکردهای مدل‌های زبانی بزرگ کاهش داد.

مدل جدید علی‌بابا و البته DeepSeek نشان می‌دهند که به‌جای سرمایه‌گذاری هنگفت در ایجاد مراکز داده و خوشه‌های GPU بزرگ می‌توان با بهینه‌سازی معماری هوش مصنوعی مدل‌هایی کم‌هزینه و کارآمد توسعه داد. عملکرد قوی این مدل در تولید کد (با امتیاز 38.7 درصد در بنچمارک LiveCodeBench) و استدلال (با امتیاز 89.4 درصد در Arena-Hard) نشان می‌دهد می‌توان بسیاری از کاربردهای هوش مصنوعی مولد را با توان پردازشی کمتری مدیریت کرد.

البته فقط عملکرد خوب در بنچمارک‌ها کافی نیست تا یک مدل هوش مصنوعی در بین کاربران محبوب شود. رعایت حریم خصوصی داده‌های کاربران، ارائه API قابل‌اطمینان و پشتیبانی طولانی‌مدت نیز از عوامل تأثیرگذار هستند. درکل اکنون باید دید که آیا مدل جدید علی‌بابا می‌تواند در رقابت با دیپ‌سیک و شرکت‌های آمریکایی عملکرد قابل‌قبولی داشته باشد یا خیر.