ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

مولد تصویر ایلان ماسک
هوش مصنوعی

معرفی یک استارتاپ ناشناخته؛ پشت پرده هوش مصنوعی مولد تصویر ایلان ماسک چه می‌گذرد؟

شبکه اجتماعی ایلان ماسک اکنون پذیرای قابلیت تبدیل متن به تصویر است که به‌آسانی می‌تواند اسلحه و مواد مخدر را به تصویر بکشد.

امیرحسین امام‌جمعه
نوشته شده توسط امیرحسین امام‌جمعه | ۲۵ مرداد ۱۴۰۳ | ۱۹:۰۰

هوش مصنوعی گروک که در پلتفرم ایکس در دسترس کاربران قرار دارد، اخیراً به قابلیت ساخت تصویر با استفاده از دستورات متنی مجهز شده‌است. البته ایلان ماسک برای افزودن این قابلیت به شبکه اجتماعی خود، از یک استارتاپ کمتر شناخته‌شده کمک گرفته است که در ادامه به معرفی آن خواهیم پرداخت.

چرا ایلان ماسک به‌سراغ استارتاپ Black Forest Labs رفته است؟

چت‌بات Grok یکی از موارد استثنائی در نوع خود به‌شمار می‌رود؛ زیرا زبان طعنه‌آمیزی دارد و سانسور کمتری را در مقایسه با رقبای خود روی محتوا انجام می‌دهد. این سرویس مبتنی‌بر هوش مصنوعی به‌تازگی پذیرای ویژگی تولید خودکار عکس بوده است که آزادی عمل بیشتری را در اختیار کاربران قرار می‌دهد. برای مثال می‌توانید عکس دونالد ترامپ هنگام مصرف مواد مخدر را روی آن ایجاد کنید؛ بدون آنکه با محدودیت خاصی مواجه شوید. پس از ساخت تصاویر، امکان آپلود مستقیم آنها روی پلتفرم ایکس نیز وجود دارد.

البته ایلان ماسک برای بهره‌مندی از ویژگی تبدیل متن به تصویر در چت‌بات هوش مصنوعی خود، از استارتاپ Black Forest Labs کمک گرفته و به سراغ توسعه بومی این قابلتی نرفته است. مجموعه xAI چندی قبل آغاز همکاری خود را با این استارتاپ اعلام کرده بود و اکنون چت‌بات گروک می‌تواند با استفاده از مدل FLUX.1 اقدام به تولید تصویر نماید. استارتاپ مذکور در زمینه ساخت خودکار تصویر و ویدئو تمرکز دارد و به نظر می‌رسد که اهداف مشترکی را با ایلان ماسک دنبال می‌کند. برای مثال هردوی آنها به‌دنبال مقابله با جنبش ووک (Woke) هستند و به همین دلیل می‌توانند رقیب بالقوه برای سرویس‌های دارای محدودیت‌های اخلاقی یا سیاسی مثل Dall-E و Imagen گوگل محسوب شوند.

هوش مصنوعی مولد تصویر ایکس

استارتاپ Black Forest Labs در کشور آلمان تأسیس شده و اخیراً موفق به کسب ۳۱ میلیون سرمایه شده‌است. از سرمایه‌گذاران مطرح آن می‌توان به مدیرعامل فعلی شرکت Y Combinator و مدیرعامل اسبق Oculus اشاره کرد. همچنین در میان هم‌بنیان‌گذاران، اسامی پژوهشگران دخیل در توسعه نسخه ابتدایی Stable Diffusion نیز به چشم می‌خورد.

طبق بررسی‌های صورت گرفته از سوی مؤسسه Artificial Analysis، مدل مولد تصویر FLUX.1 از لحاظ کیفی می‌تواند سرویس‌های Midjourney و Dall-E را پشت‌سر بگذارد. استارتاپ مورد اشاره، ادعا دارد که می‌خواهد مدل خود را در دسترس طیف وسیعی از کاربران قرار دهد و به همین منظور، کد منبع آن را به‌صورت متن‌باز در گیت‌هاب و پلتفرم Hugging Face در اختیار علاقه‌مندان قرار داده است. همچنین گفته‌شده که به‌زودی مدل تبدیل متن به ویدئوی آن هم توسعه خواهد یافت.

سازنده مدل FLUX.1 هنگام انتشار اولیه آن، عنوان کرده بود که قصد دارد میزان ایمنی این ابزار در ارائه خروجی را افزایش دهد. البته به نظر می‌رسد که این هدف چندان محقق نشده است؛ زیرا اکنون شبکه اجتماعی ایکس با حجم زیادی از تصاویر مربوط به سیاستمداران و افراد مشهور اشباع شده که توسط کاربران و با استفاده از همین هوش مصنوعی ساخته‌شده‌اند. برای مثال در برخی تصاویر اسلحه و سایر موارد حساس به چشم می‌خورد؛ درحالی‌که سرویس‌های رقیب مثل Imagen و Dall-E امکان دریافت چنین خروجی را به کاربران خود نمی‌دهند. همچنین به نظر می‌رسد که تصاویر تحت حمایت قانون کپی‌رایت برای تمرین دادن مدل استارتاپ آلمانی مورد استفاده قرار گرفته‌اند؛ مسئله‌ای که احتمال دارد در آینده برای این شرکت و پلتفرم ایکس مشکلاتی را ایجاد کند.

هوش مصنوعی مولد تصویر گروک

می‌توان گفت که سطح پایین ایمنی یا به‌تعبیری دیگر، سانسور و فیلتر اندک روی خروجی‌ها، باعث شده‌است تا ایلان ماسک، مدل توسعه‌یافته توسط استارتاپ Black Forest Labs را برای چت‌بات خود انتخاب کند. او در گذشته عنوان کرده بود که افزایش ایمنی مدل‌های هوش مصنوعی می‌تواند در نهایت به کاهش امنیت آنها منتهی شود و از خطر تبدیل هوش مصنوعی به ابزاری برای ترویج ایده‌های جنبش ووک، هشدار داده‌بود. اکنون باید دید که آیا استفاده از مدل مذکور موجب وارد شدن انتقادهای بیشتر به چت‌بات گروک خواهد شد یا می‌تواند مشکلات جدی‌تری را برای پلتفرم ایکس و ایلان ماسک به‌دنبال داشته‌باشد.

امیرحسین امام‌جمعه

امیر علاقه بسیاری به زمینه‌های مشترک زیست‌شناسی و فناوری دارد و در حوزه نگارش محتوای آموزشی و بررسی سرویس‌ها و اپلیکیشن‌ها فعال است.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی