ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

مدل Qwen3-Max علی‌بابا
هوش مصنوعی

علی‌بابا از Qwen3-Max رونمایی کرد؛ مدل هوش مصنوعی جدید چین با ۱ تریلیون پارامتر

مدل Qwen3-Max در بنچمارک‌های اولیه رقبای سرسختی مانند Claude Opus 4 را پشت سر گذاشت.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۱۵ شهریور ۱۴۰۴ | ۱۶:۰۰

شرکت چینی علی‌بابا از بزرگ‌ترین مدل زبانی بزرگ خود با نام Qwen3-Max-Preview رونمایی کرد. این مدل غول‌پیکر با بیش از ۱ تریلیون پارامتر در بنچمارک‌های اولیه رقبای سرسختی مانند Claude Opus 4 را پشت سر گذاشته و با سرعت پاسخ‌دهی خیره‌کننده‌اش توجه کارشناسان را به خود جلب کرده است.

تابستان امسال بخش هوش مصنوعی علی‌بابا بسیار پرکار بوده و چندین مدل متن‌باز قدرتمند را منتشر کرده است. اکنون نیز این شرکت چینی از مدل قدرتمند Qwen3-Max-Preview رونمایی کرد تا فاصله خود را با غول‌های آمریکایی مانند OpenAI، گوگل و آنتروپیک کمتر کند.

مدل هوش مصنوعی قدرتمند Qwen3-Max علی‌بابا

بسیاری از آزمایشگاه‌های برجسته هوش مصنوعی اخیراً بر روی توسعه مدل‌های کوچک‌تر و بهینه‌تر متمرکز شده‌اند، بااین‌حال Qwen حالا یک مدل عظیم ۱ تریلیون پارامتری توسعه داده است. پارامترها درواقع تنظیمات داخلی هستند که رفتار مدل را هدایت می‌کنند و تعداد بیشتر آن‌ها معمولاً به معنای قدرت و عملکرد بالاتر است.

مدل Qwen3-Max علی‌بابا

نتایج بنچمارک‌های منتشر شده توسط تیم Qwen نشان می‌دهد که این مدل جدید در آزمون‌های معتبری مانند SuperGPQA و AIME25 از مدل‌هایی مانند Claude Opus 4 ،Kimi K2 و Deepseek-V3.1 پیشی گرفته است.

آزمایش‌های اولیه و غیررسمی نشان می‌دهد که Qwen3-Max-Preview نه‌تنها از اشتباهات رایج مدل‌های زبانی (مانند شمارش نادرست حروف در کلمات) اجتناب می‌کند، بلکه سرعت پاسخ‌دهی آن به‌طرز شگفت‌انگیزی بالاست و در برخی موارد حتی از ChatGPT نیز سریع‌تر عمل می‌کند.

بازخوردهای اولیه جامعه فناوری نیز بسیار مثبت بوده است. برخی کاربران گزارش داده‌اند که این مدل با وجود اینکه هنوز به‌طور رسمی به عنوان یک مدل «استدلال‌گر» معرفی نشده، در حل مسائل منطقی و ریاضی عملکردی فراتر از انتظار داشته و توانسته است معماهایی را حل کند که حتی مدل‌های پیشرفته‌ای مانند GPT-5 Thinking و Gemini 2.5 Pro بدون ابزارهای کمکی از حل آن‌ها عاجز بوده‌اند.

این مدل از یک پنجره زمینه عظیم ۲۶۲ هزار و ۱۴۴ توکنی پشتیبانی می‌کند که به آن اجازه می‌دهد حجم بسیار زیادی از اطلاعات را در یک درخواست پردازش کند. این ویژگی، مدل را برای کارهای پیچیده مانند کدنویسی و تحلیل داده‌ها ایده‌آل می‌سازد.

با وجود تمام این قابلیت‌ها، تیم Qwen تأکید کرده است که این نسخه تنها یک «پیش‌نمایش» است و نسخه نهایی، عملکردی حتی قوی‌تر و شگفت‌انگیزتر خواهد داشت. برخلاف نسخه‌های قبلی، Qwen3-Max-Preview هنوز به صورت متن‌باز منتشر نشده و دسترسی به آن درحال‌حاضر از طریق API پولی علی‌بابا و وب‌سایت‌های Qwen Chat و OpenRouter امکان‌پذیر است.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی