ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی جدید ویرایش تصویر جمینای گوگل
هوش مصنوعی

رقیبی برای فتوشاپ؛ گوگل مدل ویرایش تصویر Nano Banana را به جمینای اضافه کرد

مدل جدید گوگل همان هوش مصنوعی مرموز Nano-Banana است که عملکردش در ویرایش تصویر، کاربران و کارشناسان را شگفت‌زده کرده بود.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۵ شهریور ۱۴۰۴ | ۰۹:۳۰

گوگل از یک ارتقا بزرگ و بسیار قدرتمند برای قابلیت ویرایش تصویر جمینای رونمایی کرد. این به‌روزرسانی که مدل پشت پرده آن Nano banana نام دارد، به کاربران کنترل بسیار دقیق‌تری در زمینه ویرایش تصاویر می‌دهد و به‌طور خاص مشکل بزرگ حفظ ثبات چهره و جزئیات سوژه را در ویرایش‌های متوالی حل می‌کند.

براساس گزارش تک‌کرانچ، مدل جدید گوگل که نام رسمی آن Gemini 2.5 Flash Image است، پیش از معرفی رسمی، به صورت ناشناس با نام Nano-Banana در پلتفرم ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد خیره‌کننده‌اش، کاربران و کارشناسان را شگفت‌زده کرد. اکنون گوگل تأیید کرده است که این مدل تحسین‌شده، همان فناوری جدیدی است که درحال اضافه‌شدن به جمینای است.

هوش مصنوعی ویرایش تصویر Nano Banana در جمینای گوگل

تمرکز اصلی این ارتقا روی حل یکی از بزرگ‌ترین مشکلات هوش مصنوعی مولد تصویر است: حفظ ثبات شخصیت. از این پس، می‌توانید یک عکس از دوستان، خانواده یا حتی حیوانات خانگی خود را ویرایش کنید و مطمئن باشید که چهره و ظاهر آن‌ها در ویرایش‌های مختلف (مانند تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی می‌ماند.

علاوه‌براین، قابلیت‌های پیشرفته دیگری نیز اضافه شده است؛ کاربران می‌توانند چندین عکس را بارگذاری کنند و از هوش مصنوعی بخواهند تا آن‌ها را در یک صحنه جدید و منسجم ترکیب کند. همچنین می‌توانید سبک بصری یک تصویر (مانند الگوی یک گل) را بر روی یک شیء در تصویر دیگر اعمال کنید (مثلاً آن را به طرح یک لباس تبدیل کنید). همچنین  کاربران می‌توانند به صورت متوالی و مرحله به مرحله، اجزای مختلف یک تصویر را تغییر دهند، بدون اینکه ویرایش‌های قبلی از بین برود.

این به‌روزرسانی در بحبوحه رقابتی شدید در بازار هوش مصنوعی صورت می‌گیرد. پس از آنکه OpenAI با ابزارهای تصویرسازی خود در ChatGPT توانست کاربران زیادی را جذب کند، گوگل نیز در تلاش است با ارائه ابزارهای قدرتمندتر، این فاصله را جبران کند. درحال‌حاضر، ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، درحالی‌که جمینای ۴۵۰ میلیون کاربر ماهانه را ثبت کرده است.

گوگل همچنین با درس‌گرفتن از مشکلات گذشته (مانند تولید تصاویر تاریخی نادرست) تدابیر ایمنی جدیدی را نیز در نظر گرفته است. تمام تصاویر تولید یا ویرایش شده با این ابزار جدید، دارای یک واترمارک قابل مشاهده و یک واترمارک نامرئی (SynthID) خواهند بود تا به راحتی از تصاویر واقعی قابل تشخیص باشند. علاوه‌براین، قوانین سخت‌گیرانه‌ای برای جلوگیری از تولید محتوای مضر، مانند تصاویر خصوصی، اعمال شده است.

این قابلیت‌های جدید به تدریج برای تمام کاربران در اپلیکیشن جمینای و همچنین برای توسعه‌دهندگان از طریق پلتفرم‌های API گوگل در دسترس قرار می‌گیرد.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی