هوش مصنوعی

مدل هوش مصنوعی جمینای 1.5 پرو اکنون می‌تواند صداها را درک کند

مدل جمینای 1.5 پرو حالا می‌تواند به فایل‌های صوتی آپلودشده، تماس‌های صوتی و صدای ویدیوها گوش دهد و آن‌ها را درک کند.

نوشته شده توسط آزاد کبیری تاریخ انتشار: ۲۱ فروردین ۱۴۰۳ | ۱۷:۰۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

ویدئوی مرتبط

تکنولوژی دیجی‌تک؛ چرا گوشی‌های اندروید دیر آپدیت می‌شوند؟

گوگل در کنفرانس Cloud Next اعلام کرد که مدل جمینای 1.5 پرو اکنون از پردازش صدا پشتیبانی می‌کند. این مدل هوش مصنوعی حالا می‌تواند به فایل‌های صوتی آپلودشده، تماس‌های صوتی و همچنین به صدای ویدیوها گوش دهد و بدون نیاز به زیرنویس متنی آن‌ها را درک کند. گوگل همچنین گفت که جمینای 1.5 پرو را برای اولین‌بار از طریق پلتفرم Vertex AI در دسترس عموم قرار می‌دهد.

براساس گزارش ورج، نسخه جدید جمینای پرو که قرار بوده است عضو میانه خانواده جمینای باشد، درحال‌حاضر از نظر عملکرد از بزرگ‌ترین و قدرتمندترین عضو این خانواده یعنی جمینای اولترا جلو زده است. گوگل ادعا می‌کند که جمینای 1.5 پرو می‌تواند دستورالعمل‌های پیچیده را درک کند و سریع‌تر از جمینای اولترا است.

مقایسه جمینای 1.5 پرو با جمینای 1.0 پرو و جمینای 1.0 اولترا

مدل هوش مصنوعی جمینای 1.5 پرو گوگل

گوگل پیش‌تر ادعا کرده بود که جمینای 1.5 پرو در 87 درصد از بنچمارک‌ها، جمینای 1.0 پرو را شکست می‌دهد و حتی در برخی ویژگی‌ها از جمینای 1.0 اولترا بهتر عمل می‌کند. همچنین قبلاً اعلام شده بود که کاربران با این مدل می‌توانند یک ساعت ویدیو، 11 ساعت صدا، کدهایی با بیش از 30,000 خط، یا بیش از 700 هزار کلمه را همزمان پردازش کنند.

جمینای 1.5 پرو تنها مدل هوش مصنوعی گوگل نیست که ارتقا یافته است. نسخه جدید مدل متن به تصویر Imagen 2 نیز معرفی شده است که به کاربران اجازه می‌دهد عناصر مختلف را از تصاویر حذف یا به آن اضافه کنند. همچنین حالا قابلیت تبدیل متن به تصاویر متحرک به این مدل اضافه شده است. گوگل همچنین قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده از طریق مدل‌های Imagen در دسترس قرار داد.

جمینای 1.5 پرو فعلاً فقط برای افرادی که به پلتفرم Vertex AI دسترسی دارند، قابل استفاده است.

گوگل

اشتراک گذاری:

کپی لینک