ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

مدل تبدیل متن به تصویر گوگل
تکنولوژی

گوگل از هوش مصنوعی Imagen رونمایی کرد؛ تبدیل متن به عکس با بالاترین دقت

گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که می‌تواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه می‌دهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل ...

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۴ خرداد ۱۴۰۱ | ۱۰:۳۰

گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که می‌تواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه می‌دهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل تصویری آن را ببیند. این شرکت مدعی است که مدل Imagen دارای سطح بی‌بدیلی از واقع‌گرایی و درک عمیقی از زبان‌هاست.

مدل هوش مصنوعی گوگل به راحتی توسط همه کاربران قابل استفاده است. برای مثال اگر بنویسید «تصویر یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار می‌زند» تصویر زیر به دست می‌آید. گوگل می‌گوید در مقایسه‌ای که بین مدل خود و سایر مدل‌های مشابه داشته، فهمیده که کاربران دقت و صحت تصاویر را در این مدل بیشتر می‌پسندند.

مدل تبدیل متن به تصویر گوگل

اهالی ماونتین ویو شماری از خروجی‌های مدل Imagen را در وب‌سایت این پروژه منتشر کرده‌اند. با این حال، این نمونه‌ها دستچین شده‌اند و ممکن است از بین هزاران خروجی دیگر انتخاب شده باشند که به این خوبی نیستند. مدل Imagen به‌صورت عمومی در دسترس نیست، چون گوگل معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.

هوش مصنوعی گوگل هنوز مشکلاتی دارد

مدل‌های هوش مصنوعی تبدیل متن به عکس معمولا با مجموعه بزرگی از اطلاعات تعلیم داده می‌شوند که از سطح اینترنت به دست می‌آیند و دستچین نشده‌اند. در نتیجه، مشکلات متنوعی به وجود می‌آید. محققان گوگل می‌گویند: «هرچند این رویکرد موجب پیشرفت‌های الگوریتمی سریع در سال‌های اخیر شده، داده‌هایی که از این طریق به دست می‌آیند حاوی کلیشه‌های اجتماعی، نظرات افراطی و توهین‌آمیز یا اشکالات دیگری هستند که به ضرر اقلیت‌ها تمام می‌شود.»

در ادامه گفته شده: «اگرچه زیرمجموعه‌ای از این داده‌ها از صافی عبور کرده بود تا نویزها و محتواهای ناخواسته را حذف کند، ولی ما از مجموعه داده LAION-400M هم استفاده کردیم که به داشتن گستره وسیعی از محتواهای نامناسب از جمله تصاویر هرزه‌نگاری، نژادپرستی و کلیشه‌های آسیب‌زننده اجتماعی معروف است.»

در نتیجه، Imagen سوگیری‌های اجتماعی و محدودیت‌های مدل‌های زبانی بزرگ را به ارث برده است. با این حال، در آینده احتمالا بخشی از این مشکلات برطرف خواهند شد.

ایمان صاحبی

علاقه من به فناوری به دوره نوجوانی برمی‌گرده اما از حدود سال ۹۴ کار جسته گریخته توی این فضا رو شروع کردم و از ۹۷ به‌طور جدی‌تر وارد این کار شدم. فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این حوزه برام محسوب می‌شه، اما به مرور فهمیدم که همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم خیلی دوست دارم.

دیدگاه‌ها و نظرات خود را بنویسید
مجموع نظرات ثبت شده (1 مورد)
  • مهرداد مهرداد
    مهرداد مهرداد | ۵ خرداد ۱۴۰۱

    هوش مصنوعی DALL.E قبل تر از این ساخته شده بود آیا این همون هست یا اختصاصی خود گوگل؟

مطالب پیشنهادی