بهتر از DeepSeek؛ هوش مصنوعی جدید شرکت چینی Alibaba معرفی شد [تماشا کنید]
به ادعای Alibaba مدل هوش مصنوعی Qwen2.5-Max از مدل تحسینشده DeepSeek-V3 بهتر است.
شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد که ادعا میکند از مدل تحسینشده DeepSeek-V3 بهتر است.
براساس اعلام Alibaba، مدل جدید Qwen2.5-Max در بنچمارکهایی مانند Arena-Hard، LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل میکند. در دیگر بنچمارکها نیز تقریباً همسطح مدل دیپسیک است. همچنین این شرکت میگوید که مدلش از GPT-4o و Llama-3.1-405B در بخشهای مختلفی عملکرد بهتری دارد.
اکنون میتوانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. همچنین این مدل قدرتمند در Qwen Chat منتشر شده است که در آن میتوانید عکس و ویدیو نیز تولید کنید.
هوش مصنوعی جدید Alibaba
مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که بر روی بیش از 20 تریلیون توکن و با روشهای تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE کمک میکند تا هوش مصنوعی بدون خوشههای GPU عظیم به دست آید و هزینههای زیرساخت را 40 تا 60 درصد نسبت به سایر رویکردهای مدلهای زبانی بزرگ کاهش داد.
مدل جدید علیبابا و البته DeepSeek نشان میدهند که بهجای سرمایهگذاری هنگفت در ایجاد مراکز داده و خوشههای GPU بزرگ میتوان با بهینهسازی معماری هوش مصنوعی مدلهایی کمهزینه و کارآمد توسعه داد. عملکرد قوی این مدل در تولید کد (با امتیاز 38.7 درصد در بنچمارک LiveCodeBench) و استدلال (با امتیاز 89.4 درصد در Arena-Hard) نشان میدهد میتوان بسیاری از کاربردهای هوش مصنوعی مولد را با توان پردازشی کمتری مدیریت کرد.
البته فقط عملکرد خوب در بنچمارکها کافی نیست تا یک مدل هوش مصنوعی در بین کاربران محبوب شود. رعایت حریم خصوصی دادههای کاربران، ارائه API قابلاطمینان و پشتیبانی طولانیمدت نیز از عوامل تأثیرگذار هستند. درکل اکنون باید دید که آیا مدل جدید علیبابا میتواند در رقابت با دیپسیک و شرکتهای آمریکایی عملکرد قابلقبولی داشته باشد یا خیر.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.