هوش مصنوعی جدید گوگل، کلمات را به مدلهای سه بعدی تبدیل میکند
این مدل DreamFusion نام دارد و مشخص نیست چه زمانی در دسترس کاربران قرار خواهد گرفت.
گوگل قبلا از هوش مصنوعی Imagen رونمایی کرده بود که به عنوان رقیبی برای DALL-E 2 میتواند متن را با دقت زیادی به عکس تبدیل کند. اکنون غول فناوری از هوش مصنوعی جدیدی با نام DreamFusion رونمایی کرده که میتواند کلمات کاربران را به مدلهای سه بعدی تبدیل کند.
«بن پول»، محقق تیم تحقیقاتی Google Brain، اخبار مربوط به این مدل هوش مصنوعی را در توییتر به اشتراک گذاشت. او میگوید که همراه با محققان دیگری از جمله «بن میلدنهال» و «جان بارون» روی ایجاد این هوش مصنوعی کار کرده که عمیقا به تولیدکننده تصویر Imagen گوگل متکی است.
تبدیل متن به مدل سه بعدی با هوش مصنوعی
پول در توییت خود توضیح میدهد که اکنون، محققان میتوانند مدلهای سه بعدی خود را به سادگی و با استفاده از یک مدل از پیش آموزش داده شده انتشار متن به تصویر ایجاد کنند. این کار نیاز به هر گونه داده سه بعدی را از بین میبرد.
طبق مقالهای که محققان روی سرورهای arXiv به اشتراک گذاشتهاند، این برنامه در حال حاضر یک اثبات مفهوم است. از هوش مصنوعی متن به مدل سهبعدی گوگل در حال حاضر به عنوان DreamFusion یاد میشود که نسخه تکامل یافته Dream Fields است، یک مولد متن به مدل سه بعدی که گوگل سال 2021 آن را معرفی کرده بود.
بزرگترین تفاوت بین دو مدل هوش مصنوعی DreamFusion و Dream Fields این است که Dream Fields به فناوری CLIP شرکت OpenAI متکی است.
در نهایت، هنوز مشخص نیست که هوش مصنوعی DreamFusion چه زمانی در دسترس کاربران قرار خواهد گرفت اما کاربردهای مختلف این فناوری کاملا قابل تشخیص هستند. به عنوان مثال، توسعهدهندگان بازیهای مستقل میتوانند در پروژههای خود از این فناوری کمک زیادی بگیرند.
اخیرا شرکت متا نیز از هوش مصنوعی جدیدی برای تبدیل متن به ویدیو رونمایی کرده بود. مارک زاکربرگ با انتشار ویدیوی از یک خرس عروسکی که در حال کشیدن پرتره خودش است، این برنامه که ظاهرا Make-A-Video نام دارد را معرفی کرده بود.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.