ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
هوش مصنوعی Mistral
تکنولوژی

میسترال از مدل متن‌باز Medium 3.5 رونمایی کرد؛ عملکرد ضعیف در بنچمارک‌ها

این مدل فرانسوی از رقبای خود بزرگ‌تر است و هزینه بالاتری دارد اما عملکرد ضعیف‌تری در بنچمارک‌ها داشته است.

جواد تاجی
نوشته شده توسط جواد تاجی تاریخ انتشار: ۱۱ اردیبهشت ۱۴۰۵ | ۰۹:۳۴

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

شرکت مستقر در پاریس Mistral AI از هوش مصنوعی متن‌باز جدیدی با نام Mistral Medium 3.5 رونمایی کرد. این مدل ۱۲۸ میلیارد پارامتری همراه با مجموعه‌ای از قابلیت‌های ایجنت‌محور معرفی شده اما کاربران شبکه‌های اجتماعی به انتقاد گسترده از آن پرداخته‌اند.

Mistral Medium 3.5 در بنچمارک SWE-Bench Verified که عملکرد مدل در کدنویسی را آزمایش می‌کند، امتیاز ۷۷.۶ درصد را کسب کرده است. این مدل همچنین در بنچمارک τ³-Telecom که استفاده عامل‌محور از ابزارهای آن در محیط‌های تخصصی را بررسی می‌کند، به امتیاز ۹۱.۴ درصد رسیده است.

در مقابل، مدل Qwen 3.6 علی‌بابا با ۲۷ میلیارد پارامتر (یعنی کمتر از یک‌چهارم تعداد پارامترهای Medium 3.5) در همان بنچمارک SWE-Bench Verified امتیاز ۷۲.۴ درصد کسب کرده و تحت مجوز Apache 2.0 عرضه می‌شود؛ یعنی می‌توان آن را رایگان دانلود و اجرا کرد.

میسترال برای هر یک میلیون توکن ورودی این مدل ۱.۵۰ دلار و برای هر یک میلیون توکن خروجی ۷.۵۰ دلار دریافت می‌کند.

بررسی جداول رتبه‌بندی مدل‌های متن‌باز نیز نشان می‌دهد که جایگاه‌های بالای این جدول‌ها در اختیار Qwen از علی‌بابا، GLM از شرکت چینی Zhipu AI و MiMo-V2 از شیائومی است؛ مدل‌هایی که هم ارزان‌تر هستند و هم قدرتمند و رقابتی ظاهر شده‌اند. Medium 3.5 هنوز حتی در رتبه‌بندی‌های مستقل بزرگ جایگاهی ندارد و ارزیابی‌های شخص ثالث از آن همچنان در انتظار انتشار است.

واکنش کاربران به Mistral Medium 3.5

«پدرو دومینگوس»، استاد یادگیری ماشین در دانشگاه واشنگتن، از جمله افرادی است که واکنش تندی به این مدل نشان داده. او می‌گوید:

«شرکت‌های معمولی هوش مصنوعی به این افتخار می‌کنند که مدلشان در بنچمارک‌ها چقدر بهتر است. فقط میسترال است که افتخار می‌کند که مدلش چقدر بدتر است. نمی‌دانم چه چیزی بدتر است؛ اینکه اروپا در رقابت هوش مصنوعی حضور نداشته باشد یا نماینده آن چیزی مثل میسترال باشد که مایه تمسخر است.»

«یوسف التوخى»، بنیان‌گذار Yoyo Studios، نیز محاسبه کرده که Qwen 3.6 با ۲۷ میلیارد پارامتر، ۴.۷ برابر کوچک‌تر از Medium 3.5 است و در حوزه کدنویسی امتیازی قابل‌مقایسه کسب می‌کند. هزینه خروجی Medium 3.5 نیز آن را در کنار مدل‌های بسته‌ای قرار می‌دهد که در تمام بنچمارک‌های مهم امتیازهای بسیار بالاتری دارند.

البته همه واکنش‌ها کاملاً منفی نبود. «میکال لانگمایر»، توسعه‌دهنده هوش مصنوعی، این وضعیت دوگانه را چنین توصیف می‌کند:

«واقعاً خوشحالم که هنوز یک آزمایشگاه غیرآمریکایی و غیرچینی وجود دارد که تلاش می‌کند مدل‌های زبانی بزرگ پیشرو بسازد، اما واقعاً باید در اروپا سطح بازی را بالا ببریم. مدل پرچمدار جدید [میسترال] اساساً در هیچ بنچمارکی بهترین نیست، اما چند برابر بیشتر از اکثر رقبا هزینه دارد.»

برخی توسعه‌دهندگان نیز استدلال کرده‌اند که ارائه وزن‌های متن‌باز بیشتر یک استراتژی بلندمدت برای دوام است و هدف آن صرفاً رقابت در جدول رتبه‌بندی نیست. در واقع آنها می‌گویند مدلی که هرکسی بتواند آن را دانلود، تنظیم و روی زیرساخت خودش میزبانی کند، الزاماً نیازی ندارد امروز در رتبه‌بندی‌ها پیروز شود.

جواد تاجی
جواد تاجی

دوران حرفه‌ای من در دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مجموع نظرات ثبت شده (2 مورد)
  • Rustinic
    Rustinic | ۱۱ اردیبهشت ۱۴۰۵

    اقتصاد پویا و سازنده با «دستور» و یا «خواستن» ساخته نمیشه. باید محیطش وجود داشته باشه. حکومت‌های چپ‌گرای اروپایی تا رنگ شورت کارکنان شرکت‌ها را هم تعیین می‌کنند و ۶۰ درصد حقوق کارکنان و درآمد شرکت را مالیات می‌گیرند، میریزن تو جیب دولت بعد انتظار محیط پویا و اقتصاد پیشرو هم دارند.
    چین که ساختار سیاسیش مشخصاً کمونیستیه (چپ‌گرا) حداقل میدونه که اقتصاد را باید آزاد بزاره. فعالیت اقتصادی در چین خیلی راحته. از تاسیس شرکت و جذب نیرو و زنجیره تامین در دسترس و ...
    بنظرم اروپا آینده جالبی نداره. کشورهایی که با چند سنت افزایش قیمت بنزین خودشون را خراب می‌کنند، تاب‌آوری لازم برای نبردهای وحشتناک اقتصادی/نظامی پیش رو را ندارند.

  • Milad7764
    Milad7764 | ۱۱ اردیبهشت ۱۴۰۵

    اصولا قوانین من درآوردی و سفت و سخت اتحادیه اروپا اجازه نمیده که هوش مصنوعی درست و حسابی هم بذارن روی میز.
    برای نمونه اینها اینترنت آزاد برای عموم دارند که باعث میشه شرکت هاش عقب بیفتن از پیشرفت.
    بهترین جا برای سرمایه گذاری روی هوش مصنوعی ایران هست که هم اینترنت روی عموم بسته است، و هم به صاحبان بیزینس سیم کارت پرو میدن هر 50 گیگ 2.200 میلیون تومان ناقابل.
    صد البته با همین اینترنت گرون بیزینسی هم حتی نمیشه ویندوز رو آپدیت کرد ولی میشه یک فیلترشکن یا دی ان اس ارزون تر پیدا کرد :)

مطالب پیشنهادی