ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

میسترال Voxtral
هوش مصنوعی

میسترال از اولین هوش مصنوعی صوتی متن‌باز خود رونمایی کرد؛ با Voxtral آشنا شوید

مدل‌های جدید میسترال عملکردی رقابتی و قیمتی بسیار پایین‌تر ارائه می‌دهند.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۲۵ تیر ۱۴۰۴ | ۱۲:۰۰

استارتاپ فرانسوی میسترال (Mistral) از اولین خانواده مدل‌های صوتی متن‌باز خود با نام «Voxtral» رونمایی کرد. این مدل‌های جدید با عملکردی رقابتی و قیمتی بسیار پایین‌تر، به‌دنبال ارائه یک جایگزین قدرتمند و مقرون‌به‌صرفه در برابر غول‌هایی مثل OpenAI و گوگل هستند.

قابلیت‌های گفتاری هوش مصنوعی یکی از جنبه‌های مهم این فناوری است؛ اما تا به امروز، کسب‌وکارها با یک انتخاب دشوار روبه‌رو بودند: یا از سیستم‌های متن‌باز رایگان با دقت پایین و درک معنایی محدود استفاده کنند، یا به سراغ APIهای بسته و اختصاصی شرکت‌های بزرگ بروند که با وجود عملکرد بهتر، هزینه بسیار بالاتری دارند و کنترل کمتری را در اختیار توسعه‌دهنده قرار می‌دهند. Voxtral دقیقاً برای پر کردن این شکاف طراحی شده است. این پلتفرم، دقت و درک معنایی پیشرفته را در یک مدل متن‌باز و با قیمتی که به گفته میسترال «کمتر از نصف» رقبای اصلی است، ارائه می‌دهد.

هوش مصنوعی صوتی Voxtral میسترال

Voxtral با تکیه بر مدل زبانی بزرگ Mistral Small 3.1 توسعه یافته و قابلیت‌هایی فراتر از تبدیل گفتار به متن ارائه می‌دهد؛ این مدل صوتی قادر به رونویسی فایل‌های صوتی تا ۳۰ دقیقه و درک محتوای آنها تا ۴۰ دقیقه است. همچنین کاربران می‌توانند مستقیماً از محتوای فایل صوتی سؤال بپرسند یا خلاصه‌های ساختاریافته از آن دریافت کنند، بدون نیاز به استفاده از چند مدل مجزا. البته این مدل در زبان‌های پرکاربردی مانند انگلیسی، اسپانیایی، فرانسوی، آلمانی، هندی و ایتالیایی عملکردی پیشرفته دارد.

میسترال این فناوری را در دو اندازه مختلف ارائه کرده است:

  1. Voxtral Small: یک مدل قدرتمند ۲۴ میلیارد پارامتری که برای کارهای بزرگ طراحی شده و عملکردی رقابتی با مدل‌هایی مثل جمینای ۲.۵ فلش، GPT-4o-mini و ElevenLabs Scribe دارد.
  2. Voxtral Mini: یک مدل سبک ۳ میلیارد پارامتری که برای کاربردهای کوچک‌تر مناسب است.

علاوه‌براین، یک نسخه فوق‌العاده ارزان و بهینه‌سازی‌شده فقط برای رونویسی با نام Voxtral Mini Transcribe نیز ارائه شده که به گفته میسترال، عملکردی بهتر از OpenAI Whisper با کمتر از نصف قیمت دارد.

میسترال، به عنوان یکی از بزرگ‌ترین حامیان اکوسیستم متن‌باز، مدل‌های Voxtral را برای دانلود رایگان در Hugging Face قرار داده است. همچنین، استفاده از API آن با قیمت ۰.۰۰۱ دلار در دقیقه آغاز می‌شود و کاربران می‌توانند تا چند هفته دیگر آن را در چت‌بات میسترال، Le Chat، نیز آزمایش کنند.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی