هوش مصنوعی

ChatGPT حالا می‌تواند با مدل GPT-4o تصاویر بهتری تولید کند

این ویژگی توانایی ChatGPT در حفظ انسجام و یکپارچگی تصاویر را ارتقا می‌کند و عناصر بیشتری را در عکس جای می‌دهد.

نوشته شده توسط امیررضا فروزان تاریخ انتشار: ۶ فروردین ۱۴۰۴ | ۱۰:۳۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

ویدئوی مرتبط

ویدیو آیا هوش مصنوعی جایگزین انسان خواهد شد؟

OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چت‌بات خود اضافه کرده و از GPT-4o برای تولید تصویر در این چت‌بات استفاده می‌کند. این قابلیت دقت رنگ‌های تصاویر و رندر متن در تصاویر را تا حد قابل‌‌توجهی بهبود می‌دهد.

به‌ گفته «تارا کریستینسن»، سخنگوی OpenAI ویژگی جدید از امروز در دسترس همه کاربران قرار می‌گیرد. او افزود کاربران نسخه عادی ChatGPT باوجود بعضی محدودیت‌ها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. البته ممکن است این محدودیت‌ها نیز به‌مرور براساس تقاضا یا استقبال کاربران تغییر کند.

قابلیت جدید ChatGPT تصاویر را یکپارچه‌تر می‌کند

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و توسعه این قابلیت استفاده شده است؛ مدلی که توانایی پردازش انواع مختلف داده‌‌ها را دارد.

او همچنین از بهبود قابل‌توجه ویژگی «Binding» در ساخت تصاویر گفت: «مدل‌های قدیمی اغلب در حفظ انسجام تصاویر مشکل داشتند، مخصوصاً زمانی که عناصر بیشتری را به عکس‌ها اضافه می‌کردیم.» مثلاً ممکن بود مدل هوش مصنوعی به‌جای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.

این مشکل در ChatGPT رفع شده و مدل جدید می‌تواند بین ۱۵ تا ۲۰ عنصر را به‌درستی در عکس قرار دهد اما مدل‌های قدیمی فقط می‌توانستند 5 تا 8 عنصر را بدون اشتباه تولید کنند.

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» استفاده می‌کند؛ یعنی ChatGPT مثل نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست می‌سازد. درحالی‌که مدل‌های قبلی مثل DALL·E براساس روش Diffusion model کل تصویر را هم‌زمان پردازش و طراحی می‌کردند. همین موضوع احتمالاً باعث شده تا یکپارچگی تصاویر بهبود یابد.

مدیر تیم تحقیقاتی OpenAI قابلیت جدید ChatGPT را نتیجه تست‌های متعدد و بعضاً تکراری تیمش در ماه‌های اخیر می‌داند. البته او گفت این ویژگی هنوز در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را هم‌زمان حفظ می‌کند.

ChatGpt OpenAI

اشتراک گذاری:

کپی لینک

امیررضا فروزان

امیررضا فروزان جوان‌ترین عضو دیجیاتوئه که علاقه‌زیادی به دنیای هوش مصنوعی و استارت‌آپ‌ها داره، شیمی رشته دانشگاهیشه و گوش‌دادن به راک‌ومتال، دیدن بازی‌های بارسا و فیلم‌دیدن از سرگرمی‌های رایجشه

مشاهده کلیه مقالات منتشر شده