ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

هوش مصنوعی تولید تصویر
هوش مصنوعی

هوش مصنوعی تولید تصویر Ideogram معرفی شد؛ رقیب میدجرنی و Dall-E 3 [تماشا کنید]

این مدل توسط استارتاپی معرفی شده که مدیرعامل آن یک مهندس ایرانی به‌نام «محمد نوروزی» است.

جواد تاجی
نوشته شده توسط جواد تاجی | ۱۳ اسفند ۱۴۰۲ | ۱۰:۳۰

استارتاپ حوزه هوش مصنوعی Ideogram AI که توسط مهندسان سابق گوگل تأسیس شده است و مدیرعامل آن یک مهندس ایرانی به‌نام «محمد نوروزی» است، اولین نسخه کامل از مدل تولید تصویر خود با نام Ideogram را معرفی کرد. از Ideogram به‌عنوان پیشرفته‌ترین مدل هوش مصنوعی تبدیل متن به عکس یاد شده است که از نظر عملکرد، به‌خصوص در بخش نمایش نوشته‌ها، ظاهراً برخی از بزرگ‌ترین رقبای خود مانند میدجرنی (MidJourney) و Dall-E 3 را شکست می‌دهد.

Ideogram AI در پست رسمی وبلاگ خود نوشت:

«ما از انتشار Ideogram 1.0، پیشرفته‌ترین مدل تبدیل متن به تصویر تا به امروز، بسیار هیجان‌زده هستیم. Ideogram 1.0 که مانند تمام مدل‌های Ideogram از پایه آموزش داده شده است، پیشرفته‌ترین رندر متن، فوتورئالیسم بی‌سابقه و پایبندی سریع را ارائه می‌دهد و با ویژگی جدیدی که Magic Prompt نام دارد، به شما کمک می‌کند تا دستورات متنی دقیقی برای تصاویر زیبا و خلاقانه خود بنویسید.»

همچنین در این پست از جمع‌آوری کمک مالی 80 میلیون دلاری به‌رهبری شرکت Andreessen Horowitz خبر داده شده است.

مقایسه هوش مصنوعی تولید تصویر Ideogram با میدجرنی و DALL-E 3

نشریه Decrypt موفق‌شده این مدل را آزمایش می‌کند و در گزارش خود می‌گوید که ادعاهای این استارتاپ درباره مدل هوش مصنوعی تولید تصویر Ideogram اغراق‌آمیز نیستند. در واقع طبق این گزارش، نسخه یک مدل Ideogram نسبت به نسخه‌های قبلی آن پیشرفت واضحی در زمینه‌های تولید سریع تصویر و کیفیت داشته است.

در تصویر زیر خروجی‌های این مدل و دو مدل تولید تصویر محبوب آمده است. تصویر تولیدشده توسط Ideogram در سمت چپ، تصویر تولیدشده توسط MidJourney در وسط و نتیجه ارائه‌شده توسط Dall-E 3 در سمت راست آمده است.

البته مدل Ideogram منبع باز نیست و هیچ مقاله تحقیقاتی برای ارزیابی آن وجود ندارد. اما براساس نتایج به‌دست آمده از آن، Decrypt ادعا کرده که احتمالا با بهترین مدل موجود درحال‌حاضر برای تولید تصویر روبه‌رو هستیم (حداقل تا زمانی که Stable Diffusion 3 به‌صورت عمومی منتشر شود).

یکی از مهم‌ترین نکات مربوط به این مدل جدید، قابلیت‌های متنی پیشرفته است که در آن می‌توان از متن‌های طولانی‌تری استفاده کرد که حتی با این وجود، ضریب خطای آن نسبت به DALL-E 3 و میدجرنی کمتر است. سطح رایگان فعلی آن نیز باعث برتری مدل نسبت به رقبای خود می‌شود. ویژگی Prompt Magic که به آن اشاره کردیم نیز درخواست متنی کاربران را تجزیه‌وتحلیل می‌کند تا بتواند تصاویر با کیفیت بهتر و دقیق‌تری تولید کند.

Ideogram همچنین دو طرح اشتراکی ماهانه 7 دلار و 15 دلار را به کاربران ارائه می‌کند که مزایایی ازجمله ویرایشگر تصویر، دانلود با کیفیت بهتر و امکان تولید 400 تصویر در روز را فراهم می‌کند.

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و نزدیک به سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی