ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
هوش صوتی OpenAI
هوش مصنوعی

هوش صوتی برای تعاملات بهتر؛ OpenAI از مدل جدید خود برای توسعه‌دهندگان رونمایی کرد

اپلیکیشن‌ها می‌توانند برای پاسخگویی بهتر به کاربر، از این سرویس هوش مصنوعی OpenAI استفاده کنند.

نیما جلالی
نوشته شده توسط نیما جلالی تاریخ انتشار: ۱۸ اردیبهشت ۱۴۰۵ | ۱۰:۳۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

شرکت OpenAI به‌تازگی اعلام کرده با رونمایی از نسخه جدید هوش مصنوعی صوتی خود در API، حالا می‌تواند نقش پررنگ‌تری را در توسعه اپلیکیشن‌های مکالمه‌محور ایفا کند. این API برای ساخت اپ‌هایی طراحی شده که روی صحبت، مکالمه و ترجمه جملات کاربران متمرکز هستند. در واقع با چندین مدل هوش صوتی مواجهیم که ترکیب آن‌ها، تجربه‌ای تازه را به‌ارمغان می‌آورد.

هوش مصنوعی GPT-Realtime-2 از راه رسید؛ چه تغییرات جدیدی را شاهدیم؟

مدل صوتی جدید OpenAI برای شبیه‌سازی صوتی واقع‌گرایانه ساخته شده و می‌تواند تجربه مکالمه خوبی را برای کاربران فراهم کند. هوش صوتی GPT-Realtime-2 برخلاف نسل پیشین خود از قابلیت استدلال با هوش مصنوعی GPT-5 برخوردار شده که می‌تواند آن را برای پاسخگویی به درخواست‌های پیچیده کاربران آماده کند.

سرویس GPT-Realtime-Translate نیز از راه رسیده و همان‌طور که از نامش پیداست، از امکان ترجمه زنده متون و جملات بهره‌مند شده است. این هوش مصنوعی مترجم از بیش‌از ۷۰ زبان ورودی و ۱۳ زبان خروجی (برای ترجمه نهایی) پشتیبانی می‌کند. درنهایت GPT-Realtime-Whisper نیز توسط OpenAI ارائه شده تا با تبدیل سریع صحبت‌های کاربر به متن، شما را عملاً از یادداشت‌نویسی و تایپ بی‌نیاز کند.

تمام این مدل‌های هوش صوتی با برچسب «Realtime API» در اختیار توسعه‌دهندگان قرار خواهند گرفت. بنابراین توسعه‌دهندگان می‌توانند با دردسر و مشقت کم‌تری قابلیت‌های مرتبط با مکالمه را به اپلیکیشن‌های خود اضافه کنند. هزینه استفاده از سرویس‌های Translate و Whisper به‌صورت دقیقه‌ای خواهد بود؛ اما هزینه استفاده از سرویس GPT-Realtime-2 براساس میزان توکن مصرفی کاربر محاسبه خواهد شد.

OpenAI برای تأمین هرچه بیشتر امنیت، حفاظ‌های امنیتی خاصی را برای مدل‌های جدیدش طراحی کرده تا از سوءاستفاده برخی کاربران برای اسپم، کلاهبرداری و سایر جرایم اینترنتی جلوگیری کند. بنابراین اگر گفتگوها با این مدل‌های صوتی به‌سمت محتوای مضر سوق پیدا کنند، به‌طور خودکار متوقف می‌شوند.

نیما جلالی
نیما جلالی
نویسنده و مجری بخش سخت‌افزار و بررسی

نیما از همون اول می‌دونست چی می‌خواد و مستقیم وارد حوزه مورد علاقش، یعنی تولید محتوای حوزه فناوری شد. عشقش بررسی و به‌چالش کشیدنه و دوست داره با گجتای روز سروکار داشته باشه. الانم مشغول تحصیل توی رشته مهندسی کامپیوتره.

دیدگاه‌ها و نظرات خود را بنویسید
مجموع نظرات ثبت شده (1 مورد)
  • Ali100
    Ali100 | ۱۸ اردیبهشت ۱۴۰۵

    بدون اینترنت هم می شه استقاده کرد؟ لطفا کنار هر مطلب بنویسید یا برچسب بزرگ بزنبد برای استقاده ار این سرویس یا اپلیکیشن و نرم اقزار اینترنت لازم هست یا اینترنت لازم نیست یا نت ملی کافیه

مطالب پیشنهادی