ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
هوش مصنوعی شیائومی
هوش مصنوعی

شیائومی از نسل جدید هوش مصنوعی MiMo رونمایی کرد؛ پردازش هم‌زمان متن، تصویر، ویدیو و صدا

برخلاف نسل قبلی که فقط متن و کد را پردازش می‌کرد، MiMo-V2.5 قادر به درک و پردازش همزمان تصویر، ویدیو و صدا است.

جواد تاجی
نوشته شده توسط جواد تاجی تاریخ انتشار: ۴ اردیبهشت ۱۴۰۵ | ۱۸:۳۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

شیائومی که چند هفته پیش مدل MiMo-V2-Pro را منتشر کرده بود، حالا از دو مدل جدید با نام‌های MiMo-V2.5 و MiMo-V2.5-Pro رونمایی کرده است. این مدل‌ها به‌صورت هم‌زمان دارای قابلیت پردازش تصویر، ویدیو و صدا هستند.

برخلاف نسل قبلی که فقط متن و کد را پردازش می‌کرد، MiMo-V2.5 قادر به درک و پردازش هم‌زمان تصویر، ویدیو و صدا است. برای مثال، با این قابلیت می‌توانید عکس یخچال خود و محتویات آن را آپلود کرده و دستور پخت غذا دریافت کنید یا از یک ویدیوی آموزشی خلاصه گام‌به‌گام تهیه کنید.

شیائومی ادعا می‌کند که MiMo-V2.5-Pro در قابلیت‌های عامل‌محور، مهندسی نرم‌افزار پیچیده و وظایف بلندمدت، پیشرفت بزرگی داشته و با مدل‌های پیشرفته‌ای مانند Claude Opus 4.6 و GPT-5.4 در بسیاری از بنچمارک‌های مربوط به کدنویسی و ایجنت‌ها رقابت می‌کند.

موارد استفاده از مدل‌های جدید شیائومی

مدل‌های MiMo-V2.5 و MiMo-V2.5-Pro با اهداف متفاوتی توسعه داده شده‌اند. طبق توضیحات شیائومی، مدل MiMo-V2.5-Pro می‌تواند وظایف حرفه‌ای پیچیده‌ای که ممکن است انسان‌ها چندین روز مشغول آنها باشند را انجام دهد. این مدل با سرعت ۶۰ تا ۸۰ توکن‌درثانیه کار می‌کند و هزینه آن ۱ دلار ورودی و ۳ دلار خروجی به ازای هر میلیون توکن است.

MiMo-V2.5 نیز به‌عنوان یک مدل برای وظایف روزمره معرفی شده است. این مدل سریع‌تر (۱۰۰ تا ۱۵۰ توکن در ثانیه) و ارزان‌تر (۰.۴ دلار ورودی و ۲ دلار خروجی) است و همچنان از تصویر، صدا و ویدیو پشتیبانی می‌کند.

هر دو مدل دارای پنجره زمینه ۱ میلیون توکنی هستند که به آنها امکان می‌دهد حدود ۷۵۰ هزار کلمه را در یک مکالمه واحد پردازش کنند.

عملکرد مدل‌های هوش مصنوعی شیائومی در بنچمارک

در بنچمارک کدنویسی SWE-bench Pro، مدل MiMo-V2.5-Pro موفق به حل ۵۷.۲ درصد از وظایف شده است که این رقم بسیار بالاتر از میانگین ۲۵ درصدی مدل‌های دیگر است. در معیارهایی مانند τ3-bench و ClawEval، عملکرد این مدل نزدیک به Claude Opus 4.6 و GPT-5.4 بوده است.

با‌این‌حال، در آزمون Humanity’s Last Exam که شامل مسائل چندین رشته دانشگاهی می‌شود، MiMo امتیاز ۴۸ درصد را کسب کرده، درحالی‌که GPT-5.4 به امتیاز ۵۸.۷ درصد رسیده است.

این مدل هم‌اکنون از طریق AI Studio شیائومی قابل دسترس است و از طریق Xiaomi MiMo API نیز می‌توان به آن دسترسی داشت. غول چینی که در ماه‌های اخیر تمرکز ویژه روی عرضه مدل‌های هوش مصنوعی داشته، اعلام کرده که درحال آموزش نسل بعدی مدل‌ها با «استدلال عمیق‌تر، ادغام دقیق‌تر ابزارها و پایه‌ریزی غنی‌تر در دنیای واقعی» است.

جواد تاجی
جواد تاجی

دوران حرفه‌ای من در دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مجموع نظرات ثبت شده (3 مورد)
  • D_Mohsen
    D_Mohsen | 4 هفته قبل

    که نیاز به اینترنت داره

  • Javani
    Javani | 4 هفته قبل

    بررسی شیانومی 17 اولترا نسخه گلوبال بذارین

  • Inglory
    Inglory | 4 هفته قبل

    «و اینترنت میخواد»

مطالب پیشنهادی