ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

Gemini Live
هوش مصنوعی

گوگل از Gemini Live پرده برداشت؛ رقیبی برای حالت صوتی GPT-4o

با کمک این قابلیت می‌توانید ارتباط طبیعی‌تری با مدل هوش مصنوعی قدرتمند گوگل داشته باشید.

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۲۵ اردیبهشت ۱۴۰۳ | ۲۱:۴۴

یکی از ویژگی‌های جذابی که گوگل امشب برای اپلیکیشن جمینای معرفی کرد، قابلیت Live یا «زنده» است. در کنفرانس توسعه‌دهندگان گوگل اعلام شد که Gemini Live می‌تواند قابلیت گفت‌وگوی طبیعی با این مدل هوش مصنوعی را فراهم کند تا تعامل صوتی بهتری با این فناوری داشته باشید.

هنگام استفاده از جمینی گوگل، قابلیت جمینای لایو به شما اجازه می‌دهد به‌صورت طبیعی با هوش مصنوعی صحبت کنید و مانعی میان ارتباط خود با این فناوری نداشته باشید. این قابلیت به‌طور خودکار لحن حرف‌زدن شما را تشخیص می‌دهد و با آن وفق پیدا می‌کند. گوگل می‌گوید ویژگی Gemini Live در تابستان امسال برای مشترکان نسخه Advanced در اپ موبایل این هوش مصنوعی عرضه خواهد شد.

قابلیت Gemini Live چیست؟

قابلیت جمینای لایو از طریق آیکون صدا در اپلیکیشن Gemini در اندروید و iOS در دسترس خواهد بود. زمانی که روی این آیکون بزنید، با یک پنجره تمام‌صفحه روبه‌رو می‌شوید که یک افکت شکل موج جذاب را هم به شما نشان می‌دهد. در این حالت می‌توانید با هوش مصنوعی دیالوگ دوطرفه داشته باشید و پاسخ سؤالات خود را در کمترین زمان بگیرید.

گوگل می‌گوید فرض کنید می‌خواهید در یک مصاحبه شغلی شرکت کنید یا قصد دارید برای یک سخنرانی مهم آماده شوید. در این شرایط، کافی است از قابلیت Live استفاده کنید و از جمینای بخواهید کمک‌تان کند. جمینای مهارت‌هایی را به شما توصیه خواهد کرد که در تعامل با مصاحبه‌کننده به کار شما می‌آید، یا نکاتی را به شما می‌گوید که در هنگام سخنرانی به شما کمک خواهد کرد تا آرامش خود را حفظ کنید و از استرس‌تان بکاهید.

در ماه‌های آینده می‌توانید در حین استفاده از قابلیت Live از دوربین گوشی هم استفاده کنید و درباره چیزهایی که می‌بینید حرف بزنید یا سؤال بپرسید. این قابلیت بخشی از پروژه استرا است که به جمینای اضافه می‌شود.

به‌نظر می‌رسد که این قابلیت پاسخی به حالت جدید صوتی در مدل هوش مصنوعی GPT-4o از OpenAI باشد که دیشب در مراسم ویژه این شرکت معرفی شد و بسیاری از مخاطبان را شگفت‌زده کرد.

ایمان صاحبی

علاقه من به فناوری به دوره نوجوانی برمی‌گرده اما از حدود سال ۹۴ کار جسته گریخته توی این فضا رو شروع کردم و از ۹۷ به‌طور جدی‌تر وارد این کار شدم. فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این حوزه برام محسوب می‌شه، اما به مرور فهمیدم که همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم خیلی دوست دارم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی