ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

گوگل Gemini
هوش مصنوعی

گوگل از Gemini رونمایی کرد؛ انقلابی در دنیای هوش مصنوعی

گوگل بالاخره رسماً مدل هوش مصنوعی Gemini را معرفی کرد و از راه‌اندازی آن به‌عنوان رقیب مدل مورد استفاده در ChatGPT خبر داد.

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۱۵ آذر ۱۴۰۲ | ۱۹:۱۰

عرضه مدل هوش مصنوعی جدید جمینای (Gemini) به گفته مدیرعامل گوگل آغازگر عصر جدیدی برای این شرکت خواهد بود که از آن به‌عنوان «عصر جمینای» نام برده شده است. این مدل در نسخه‌های مختلفی عرضه خواهد شد و می‌خواهد به‌طور مستقیم به رقابت با GPT-4 از شرکت OpenAI برود.

گوگل اولین‌بار در رویداد توسعه‌دهندگان 2023 خود به مدل هوش مصنوعی جمینای اشاره کرده بود و حالا رسماً از عرضه آن خبر داده است. این مدل یک نسخه سبک به‌نام Gemini Nano دارد که می‌تواند به‌صورت آفلاین روی دستگاه‌های اندرویدی اجرا شود.

مدل دوم قدرت بیشتری دارد و با نام Gemini Pro به‌زودی در سرویس‌های هوش مصنوعی گوگل پیاده‌سازی خواهد شد و از امروز در چت‌بات بارد فعال است. نسخه سوم جمینای با نام Gemini Ultra، قدرتمندترین مدل زبانی بزرگی است که گوگل تابه‌حال خلق کرده و ظاهراً بیشتر برای دیتاسنترها و کاربردهای سازمانی طراحی شده است.

مدل هوش مصنوعی جمینای پرو در حال حاضر در بارد پیاده‌سازی می‌شود، و کاربران پیکسل 8 پرو هم می‌توانند با جمینای نانو از ویژگی‌های جدیدی برخوردار شوند. جمینای اولترا قرار است از سال آینده میلادی عرضه شود. توسعه‌دهندگان و مصرف‌کنندگان سازمانی می‌توانند از 13 دسامبر از طریق Generative AI Studio یا Vertex AI در گوگل کلود به جمینای پرو دسترسی پیدا کنند.

مدل هوش مصنوعی Gemini گوگل در حال حاضر فقط به زبان انگلیسی در دسترس است و سایر زبان‌ها در آینده برای آن فعال می‌شود. «ساندار پیچای»، مدیرعامل گوگل می‌گوید این مدل در نهایت در موتور جستجو، سرویس تبلیغات، مرورگر کروم و دیگر محصولات این شرکت پیاده‌سازی خواهد شد. این مدل آینده گوگل را رقم خواهد زد.

مقایسه مدل هوش مصنوعی Gemini گوگل با GPT-4

«دمیس هاسابیس»، مدیرعامل دیپ‌مایند که در توسعه Gemini نقش اساسی داشته است، می‌گوید آن‌ها بنچمارک‌های زیادی را روی این مدل انجام داده‌اند. در واقع از بین 32 بنچمارک مهمی که روی جمینای انجام شده است، این مدل در 30 مورد جلوتر از رقبا بوده است.

آشکارترین برتری جمینای در بنچمارک‌ها به توانایی درک و تعامل با صوت و ویدیو برمی‌گردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدل‌های گوناگونی مثل DALL-E یا Whisper بسازد. در نتیجه انتظار می‌رود تجربه کاربری حین استفاده از جمینی گوگل بهبود یابد.

جمینای نانو در حال حاضر فقط می‌تواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس می‌گوید در آینده قابلیت‌های بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.

گوگل در زمینه کدنویسی ظاهراً تمرکز ویژه‌ای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده می‌کند که این شرکت می‌گوید می‌تواند 85 درصد بهتر از رقبا و 50 درصد بهتر از نسل قبلی خود کدنویسی کند.

مدل هوش مصنوعی Gemini از نظر مصرف انرژی هم ظاهراً بسیار بهینه است. گوگل این مدل را روی واحد پردازش تنسور (TPU) خودش آموزش داده تا نسبت به مدل‌های قبلی ازجمله PaLM سریع‌تر و ارزان‌تر باشد. این شرکت در کنار این مدل از نسخه جدید سیستم TPU موسوم به TPU v5p هم پرده برداشته که یک سیستم رایانش مخصوص دیتاسنترهاست و در زمینه آموزش و اجرای مدل‌های زبانی بزرگ می‌تواند مورد استفاده قرار گیرد.

گوگل می‌گوید تلاش زیادی کرده است تا از ایمنی و مسئولیت‌پذیری Gemini مطمئن شود و آزمایش‌های زیادی را در این زمینه انجام داده است. بااین‌حال، باید منتظر بمانیم تا ببینیم این مدل در جهان واقعی چه عملکردی از خود نشان خواهد داد.

ساندار پیچای و دمیس هاسابیس ظاهراً اعتقاد دارند که راه‌اندازی هوش مصنوعی Gemini آغازگر پروژه‌ای بزرگ‌تر و گامی در مسیر تغییر است. این همان مدلی است که گوگل سال‌ها در حال توسعه آن بوده و حالا برای تغییر صحنه رقابت با OpenAI به آن نیاز دارد.

ایمان صاحبی

علاقه من به فناوری به دوره نوجوانی برمی‌گرده اما از حدود سال ۹۴ کار جسته گریخته توی این فضا رو شروع کردم و از ۹۷ به‌طور جدی‌تر وارد این کار شدم. فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این حوزه برام محسوب می‌شه، اما به مرور فهمیدم که همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم خیلی دوست دارم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی