ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

ChatGPT
هوش مصنوعی

ChatGPT حالا می‌تواند با مدل GPT-4o تصاویر بهتری تولید کند

این ویژگی توانایی ChatGPT در حفظ انسجام و یکپارچگی تصاویر را ارتقا می‌کند و عناصر بیشتری را در عکس جای می‌دهد.

امیررضا فروزان
نوشته شده توسط امیررضا فروزان | ۶ فروردین ۱۴۰۴ | ۱۰:۳۰

OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چت‌بات خود اضافه کرده و از GPT-4o برای تولید تصویر در این چت‌بات استفاده می‌کند. این قابلیت دقت رنگ‌های تصاویر و رندر متن در تصاویر را تا حد قابل‌‌توجهی بهبود می‌دهد.

به‌ گفته «تارا کریستینسن»، سخنگوی OpenAI ویژگی جدید از امروز در دسترس همه کاربران قرار می‌گیرد. او افزود کاربران نسخه عادی ChatGPT باوجود بعضی محدودیت‌ها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. البته ممکن است این محدودیت‌ها نیز به‌مرور براساس تقاضا یا استقبال کاربران تغییر کند.

قابلیت جدید ChatGPT تصاویر را یکپارچه‌تر می‌کند

«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و توسعه این قابلیت استفاده شده است؛ مدلی که توانایی پردازش انواع مختلف داده‌‌ها را دارد.

او همچنین از بهبود قابل‌توجه ویژگی «Binding» در ساخت تصاویر گفت: «مدل‌های قدیمی اغلب در حفظ انسجام تصاویر مشکل داشتند، مخصوصاً زمانی که عناصر بیشتری را به عکس‌ها اضافه می‌کردیم.» مثلاً ممکن بود مدل هوش مصنوعی به‌جای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.

این مشکل در ChatGPT رفع شده و مدل جدید می‌تواند بین ۱۵ تا ۲۰ عنصر را به‌درستی در عکس قرار دهد اما مدل‌های قدیمی فقط می‌توانستند 5 تا 8 عنصر را بدون اشتباه تولید کنند.

عکس ساخته‌شده با Images in ChatGPT

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» استفاده می‌کند؛ یعنی ChatGPT مثل نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست می‌سازد. درحالی‌که مدل‌های قبلی مثل DALL·E براساس روش Diffusion model کل تصویر را هم‌زمان پردازش و طراحی می‌کردند. همین موضوع احتمالاً باعث شده تا یکپارچگی تصاویر بهبود یابد.

مدیر تیم تحقیقاتی OpenAI قابلیت جدید ChatGPT را نتیجه تست‌های متعدد و بعضاً تکراری تیمش در ماه‌های اخیر می‌داند. البته او گفت این ویژگی هنوز در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را هم‌زمان حفظ می‌کند.

امیررضا فروزان

امیررضا فروزان جوان‌ترین عضو دیجیاتوئه که علاقه‌زیادی به دنیای فناوری و استارت‌آپ‌ها داره، در دانشگاه شیمی می‌خونه و با مطالعه کتاب و موسیقی، مخصوصاً راک و کلاسیک تایم خالی خودشو پر می‌کنه

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی