ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
مدل جدید ERNIE 5.0 بایدو
هوش مصنوعی

بایدو مدل ERNIE 5 را معرفی کرد؛ رقیب قدرتمند GPT-5 و جمینای

این مدل در بنچمارک‌های درک اسناد و نمودارها، GPT-5 و Gemini 2.5 را شکست داد.

آزاد کبیری
نوشته شده توسط آزاد کبیری تاریخ انتشار: ۲۳ آبان ۱۴۰۴ | ۱۴:۳۰

تنها یک روز پس از آنکه OpenAI مدل GPT-5.1 را منتشر کرد، شرکت چینی بایدو از مدل هوش مصنوعی جدیدش با نام ERNIE 5.0 رونمایی کرد.

ERNIE 5.0 یک مدل همه‌وجهی و انحصاری است؛ یعنی این مدل برای پردازش و تولید همزمان محتوا در چهار وجه متن، تصویر، صدا و ویدیو طراحی شده است. همچنین برخلاف مدل اخیر این شرکت یعنی ERNIE-4.5-VL که به‌صورت متن‌باز عرضه شد، ERNIE 5.0 انحصاری است و فقط از طریق وب‌سایت ERNIE Bot و پلتفرم ابری Qianfan (از طریق API) در دسترس خواهد بود. بایدو همچنین نسخه دیگری به نام ERNIE 5.0 Preview 1022 را معرفی کرده که به‌طور خاص برای کارهای سنگین متنی بهینه‌سازی شده است.

رقابت مدل جدید ERNIE 5.0 با GPT-5

براساس بنچمارک‌های بایدو، ERNIE 5.0 در طیف وسیعی از کارها عملکردی برابر یا حتی بهتر از GPT-5-High (مدل رده‌بالای OpenAI) و Gemini 2.5 Pro داشته است. برگ برنده اصلی بایدو، در حوزه‌هایی است که برای کسب‌وکارها اهمیت اساسی دارند: این مدل در بنچمارک‌های OCRBench (تشخیص نوری کاراکترها) و DocVQA (پاسخ به سؤال از روی اسناد) توانسته است رقبای آمریکایی خود را شکست دهد.

مدل جدید ERNIE 5.0 بایدو

همچنین در بنچمارک ChartQA، مدل بایدو در استدلال و درک داده‌های ساختاریافته از نمودارها، برتری نشان داده است. بایدو ادعا می‌کند این توانایی‌ها ERNIE 5.0 را به گزینه‌ای ایده‌آل برای پردازش خودکار اسناد و تحلیل‌های مالی تبدیل می‌کند.

مدل جدید ERNIE 5.0 بایدو

در بخش تولید تصویر این مدل با Veo3 گوگل برابری کرده یا از آن پیشی گرفته است. در کارهای صوتی و زبانی نیز نتایج رقابتی اعلام شده‌اند، هرچند تمرکز اصلی روی درک بصری و اسناد بوده است.

بایدو ERNIE 5.0 را به‌عنوان یک مدل پریمیوم قیمت‌گذاری کرده که به‌طور قابل‌توجهی گران‌تر از نسخه‌های قبلی مانند ERNIE 4.5 Turbo است. بااین‌حال، هزینه آن در مقایسه با رقبای اصلی آمریکایی، همچنان بسیار رقابتی و ارزان‌تر به نظر می‌رسد.

در جدول زیر، هزینه استفاده (به‌ازای هر ۱ میلیون توکن) مقایسه شده است:

مدلهزینه ورودی (۱ میلیون توکن)هزینه خروجی (۱ میلیون توکن)
ERNIE 5.0 (Baidu)$0.85$3.40
GPT-5.1 (OpenAI)$1.25$10.00
Gemini 2.5 Pro (Google)$1.25 (تا 200k)$10.00 (تا 200k)
Claude Opus 4.1 (Anthropic)$15.00$75.00
ERNIE 4.5 Turbo (Baidu)$0.11$0.45

رونمایی از این مدل، بخشی از یک استراتژی بزرگ‌تر بایدو بود. این غول چینی هم‌زمان محصولات دیگری مانند MeDo (پلتفرم ساخت اپلیکیشن بدون کد) و Oreate را در سطح جهانی عرضه کرده و سرویس تاکسی خودران Apollo Go نیز را به ۲۲ شهر گسترش داده است.

آزاد کبیری
آزاد کبیری

دانش‌آموخته‌ زبان‌شناسی‌ هستم و همان‌قدر که به کلمات علاقه‌مندم، از سرک‌کشیدن به گوشه‌وکنارِ تکنولوژی و علم هم لذت می‌برم. حدود ۱۵ سال از نگارش نخستین متن رسمی‌ام می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی