ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جمینای 1.5 پرو
هوش مصنوعی

مدل هوش مصنوعی جمینای 1.5 پرو اکنون می‌تواند صداها را درک کند

مدل جمینای 1.5 پرو حالا می‌تواند به فایل‌های صوتی آپلودشده، تماس‌های صوتی و صدای ویدیوها گوش دهد و آن‌ها را درک کند.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۲۱ فروردین ۱۴۰۳ | ۱۷:۰۰

گوگل در کنفرانس Cloud Next اعلام کرد که مدل جمینای 1.5 پرو اکنون از پردازش صدا پشتیبانی می‌کند. این مدل هوش مصنوعی حالا می‌تواند به فایل‌های صوتی آپلودشده، تماس‌های صوتی و همچنین به صدای ویدیوها گوش دهد و بدون نیاز به زیرنویس متنی آن‌ها را درک کند. گوگل همچنین گفت که جمینای 1.5 پرو را برای اولین‌بار از طریق پلتفرم Vertex AI در دسترس عموم قرار می‌دهد.

براساس گزارش ورج، نسخه جدید جمینای پرو که قرار بوده است عضو میانه خانواده جمینای باشد، درحال‌حاضر از نظر عملکرد از بزرگ‌ترین و قدرتمندترین عضو این خانواده یعنی جمینای اولترا جلو زده است. گوگل ادعا می‌کند که جمینای 1.5 پرو می‌تواند دستورالعمل‌های پیچیده را درک کند و سریع‌تر از جمینای اولترا است.

مقایسه جمینای 1.5 پرو با جمینای 1.0 پرو و جمینای 1.0 اولترا

مدل هوش مصنوعی جمینای 1.5 پرو گوگل

گوگل پیش‌تر ادعا کرده بود که جمینای 1.5 پرو در 87 درصد از بنچمارک‌ها، جمینای 1.0 پرو را شکست می‌دهد و حتی در برخی ویژگی‌ها از جمینای 1.0 اولترا بهتر عمل می‌کند. همچنین قبلاً اعلام شده بود که کاربران با این مدل می‌توانند یک ساعت ویدیو، 11 ساعت صدا، کدهایی با بیش از 30,000 خط، یا بیش از 700 هزار کلمه را همزمان پردازش کنند.

جمینای 1.5 پرو تنها مدل هوش مصنوعی گوگل نیست که ارتقا یافته است. نسخه جدید مدل متن به تصویر Imagen 2 نیز معرفی شده است که به کاربران اجازه می‌دهد عناصر مختلف را از تصاویر حذف یا به آن اضافه کنند. همچنین حالا قابلیت تبدیل متن به تصاویر متحرک به این مدل اضافه شده است. گوگل همچنین قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده از طریق مدل‌های Imagen در دسترس قرار داد.

جمینای 1.5 پرو فعلاً فقط برای افرادی که به پلتفرم Vertex AI دسترسی دارند، قابل استفاده است.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی