ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
عکس‌های ساخته شده با Qwen-Image-2512
هوش مصنوعی

رقیب جدید Nano Banana Pro معرفی شد؛ Qwen-Image-2512 رایگان تصاویر باکیفیت می‌سازد

عملکرد این مدل در تولید چهره و جزئیات مختلف و تولید متن و چیدمان ساختاریافته بهبود یافته است.

جواد تاجی
نوشته شده توسط جواد تاجی تاریخ انتشار: ۱۱ دی ۱۴۰۴ | ۰۹:۴۵

مدل هوش مصنوعی Nano Banana Pro گوگل چند ماه قبل معرفی شد و در زمینه تولید تصویر بسیاری از خواسته‌های کاربران را برآورده می‌کند. اما این مدل عمیقاً به زیرساخت ابری گوگل متصل شده و برای موارد حرفه‌ای، استفاده از آن هزینه‌ زیادی برای مشتریان دارد. حالا تیم Qwen از علی‌بابا، با معرفی Qwen-Image-2512 تلاش کرده تا چنین سرویسی را به‌صورت رایگان در اختیار کاربران قرار دهد.

Qwen-Image-2512 مدل هوش مصنوعی برای توسعه‌دهندگان و حتی شرکت‌های بزرگ است که به‌صورت رایگان و تجاری تحت لایسنس آزاد Apache 2.0 ساخته شده. این مدل هم‌اکنون از طریق رابط Qwen Chat در دسترس قرار گرفته و نسخه‌های متفاوت آن در Hugging Face و ModelScope منتشر شده است.

برای آزمایش بدون نیاز به نصب این مدل، یک دموی رایگان در Hugging Face و نسخه مرورگری ModelScope نیز قابل دسترس است و کسب‌وکارهایی که ترجیح می‌دهند از سرویس مدیریت‌شده استفاده کنند، می‌توانند از طریق Model Studio در علی‌بابا کلاد به آن دسترسی پیدا کنند.

Qwen-Image-2512 در چه زمینه‌هایی بهبود پیدا کرده است؟

مدل Qwen-Image-2512 بر سه محور اصلی تمرکز دارد که برای سازمان‌ها می‌توانند مهم باشند.

  • واقع‌گرایی چهره و انسجام محیطی: مدل، جلوه «ظاهر مصنوعی» که در اکثر مدل‌ها دیده می‌شود را کاهش می‌دهد. جزئیات سن، بافت پوست و حالات چهره با این مدل طبیعی‌تر نمایش داده می‌شوند و محیط‌های پس‌زمینه با معنا و ارتباط بصری روشن‌تری رندر می‌شوند. Qwen می‌گوید که برای شبیه‌سازی، آموزش داخلی و ارتباطات سازمانی، این سطح از تولید طبیعی بسیار مهم است.
بهبود ساخت چهره در Qwen-Image-2512
  • وفاداری بافت‌ها و مواد: مناظر، آب، مو و سطوح مواد با جزئیات بیشتری نمایش داده می‌شوند. این موضوع نه‌تنها از نظر زیباشناسی اهمیت دارد، بلکه هزینه‌های مربوط به مدل را کاهش می‌دهد.
  • متن و چیدمان ساختاریافته: درست مانند نانو بنانا پرو، دقت این مدل در تولید متن داخل تصویر و انسجام چیدمان بهبود یافته و حالا اسلایدها، پوسترها و اینفوگرافیک‌ها خواناتر و دقیق‌تر از قبل هستند.

در تست‌های انجام شده روی AI Arena علی‌بابا، Qwen-Image-2512 به‌عنوان قدرتمندترین مدل متن‌باز تصویر رتبه‌بندی شده و در رقابت با سیستم‌های بسته نیز عملکرد نزدیکی داشته است.

رتبه‌بندی مدل‌ها در Alibaba AI Arena

حوزه‌ای که Qwen-Image-2512 بیش از هر چیز دیگری خود را در آن متمایز می‌داند، در «مجوز و شیوه انتشار» است. این مدل تحت لایسنس Apache 2.0 عرضه شده؛ یعنی سازمان‌ها و توسعه‌دهندگان می‌توانند آزادانه از آن استفاده کنند، کد و وزن‌ها را تغییر دهند، آن را برای موارد خاص خود تنظیم کنند و حتی بدون محدودیت حقوقی، به‌صورت تجاری آن را مستقر کنند.

جواد تاجی
جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی