
ChatGPT حالا میتواند با مدل GPT-4o تصاویر بهتری تولید کند
این ویژگی توانایی ChatGPT در حفظ انسجام و یکپارچگی تصاویر را ارتقا میکند و عناصر بیشتری را در عکس جای میدهد.

OpenAI ویژگی جدیدی با نام «Images in ChatGPT» به چتبات خود اضافه کرده و از GPT-4o برای تولید تصویر در این چتبات استفاده میکند. این قابلیت دقت رنگهای تصاویر و رندر متن در تصاویر را تا حد قابلتوجهی بهبود میدهد.
به گفته «تارا کریستینسن»، سخنگوی OpenAI ویژگی جدید از امروز در دسترس همه کاربران قرار میگیرد. او افزود کاربران نسخه عادی ChatGPT باوجود بعضی محدودیتها، از لحاظ تعداد تصاویر درخواستی محدودیتی ندارند. البته ممکن است این محدودیتها نیز بهمرور براساس تقاضا یا استقبال کاربران تغییر کند.
قابلیت جدید ChatGPT تصاویر را یکپارچهتر میکند
«گابریل گو»، مدیر تیم تحقیقاتی OpenAI، در گفتگو با Verge از نتایج مثبت این ویژگی گفت. او اشاره کرد از مدل «GPT-4o omnimodal» برای پردازش و توسعه این قابلیت استفاده شده است؛ مدلی که توانایی پردازش انواع مختلف دادهها را دارد.
او همچنین از بهبود قابلتوجه ویژگی «Binding» در ساخت تصاویر گفت: «مدلهای قدیمی اغلب در حفظ انسجام تصاویر مشکل داشتند، مخصوصاً زمانی که عناصر بیشتری را به عکسها اضافه میکردیم.» مثلاً ممکن بود مدل هوش مصنوعی بهجای ساخت یک ستاره آبی و یک مثلث قرمز، یک ستاره قرمز و یک مثلث آبی بسازد.
این مشکل در ChatGPT رفع شده و مدل جدید میتواند بین ۱۵ تا ۲۰ عنصر را بهدرستی در عکس قرار دهد اما مدلهای قدیمی فقط میتوانستند 5 تا 8 عنصر را بدون اشتباه تولید کنند.

گابریل گو افزود ویژگی بالا از رویکرد «Autoregressive» استفاده میکند؛ یعنی ChatGPT مثل نوشتن متون تصاویر را تدریجی از بالا به پایین و از چپ به راست میسازد. درحالیکه مدلهای قبلی مثل DALL·E براساس روش Diffusion model کل تصویر را همزمان پردازش و طراحی میکردند. همین موضوع احتمالاً باعث شده تا یکپارچگی تصاویر بهبود یابد.
مدیر تیم تحقیقاتی OpenAI قابلیت جدید ChatGPT را نتیجه تستهای متعدد و بعضاً تکراری تیمش در ماههای اخیر میداند. البته او گفت این ویژگی هنوز در پردازش متون ریز و کوچک در تصاویر مشکل دارد اما درمجموع کیفیت متن و تصاویر را همزمان حفظ میکند.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.