ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

OpenAI
هوش مصنوعی

OpenAI از «پردازش فلکس» رونمایی کرد؛ کاهش 50 درصدی هزینه استفاده از o3 و o4-mini

پردازش فلکس گزینه‌ای جدید از OpenAI برای کاهش 50 درصدی هزینه مدل‌ها است که البته سرعت پاسخ‌دهی پایینی دارد.

جواد تاجی
نوشته شده توسط جواد تاجی | ۲۹ فروردین ۱۴۰۴ | ۱۱:۰۰

OpenAI به منظور رقابت جدی‌تر با شرکت‌هایی مانند گوگل، گزینه جدیدی به نام «پردازش فلکس» (Flex Processing) را برای API مدل‌های هوش مصنوعی خود معرفی کرده است. این گزینه که فعلاً در قالب نسخه بتا ارائه شده، امکان استفاده از مدل‌ها با هزینه‌ای کمتر را فراهم می‌کند، هرچند در مقابل، سرعت پاسخ‌دهی آن پایین‌تر خواهد بود و گاهی نیز ممکن است منابع به‌طور موقت در دسترس نباشند.

پردازش فلکس فعلاً برای مدل‌های استدلالی جدید OpenAI یعنی o3 و o4-mini در دسترس است. همچنین استفاده از این گزینه بیشتر برای کارهای کم‌اولویت یا غیرتولیدی مانند ارزیابی مدل‌ها، غنی‌سازی داده‌ها و پردازش‌های ناهم‌زمان پیشنهاد شده است.

کاهش هزینه استفاده از مدل‌های OpenAI

هزینه استفاده از API با این گزینه دقیقاً به نصف کاهش می‌یابد. برای مدل o3، قیمت پردازش فلکس 5 دلار به‌ازای هر میلیون توکن ورودی و 20 دلار برای هر میلیون توکن خروجی است؛ درحالی‌که قیمت عادی به ترتیب 10 دلار و 40 دلار است. برای مدل o4-mini نیز قیمت از 1.10 دلار برای هر میلیون توکن ورودی و 4.40 دلار برای توکن‌های خروجی، به ترتیب به 0.55 دلار و 2.20 دلار کاهش می‌یابد.

این گزینه جدید درحالی از سوی OpenAI معرفی شده که هزینه استفاده از مدل‌های پیشرفته هوش مصنوعی روزبه‌روز بیشتر می‌شود و رقبایی مانند گوگل نیز مدل‌های کم‌هزینه‌تر و بهینه‌تری معرفی می‌کنند. به‌عنوان مثال، گوگل اخیراً مدل Gemini 2.5 Flash را معرفی کرده که با هزینه‌ای کمتر، عملکردی برابر یا بهتر از مدل R1 شرکت DeepSeek دارد.

OpenAI با ارسال یک ایمیل به مشتریان خود برای معرفی گزینه پردازش فلکس توضیح داده که کاربران سطوح 1 تا 3 مصرف آن (براساس میزان هزینه مصرفی) برای دسترسی به مدل o3، باید فرآیند احراز هویت جدید این شرکت را تکمیل کنند. پشتیبانی از خلاصه‌سازی استدلالی و API استریم نیز منوط به این احراز هویت است.

پیش‌تر این شرکت اعلام کرده بود که هدف از این احراز هویت، جلوگیری از سوءاستفاده و نقض سیاست‌های استفاده از خدمات این شرکت است.

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی