ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
مدل‌های هوش مصنوعی Nemotron 3 انویدیا
هوش مصنوعی

انویدیا از مدل‌های Nemotron 3 برای ساخت ایجنت‌های هوش مصنوعی رونمایی کرد

انویدیا از سه مدل هوش مصنوعی Nemotron 3 با معماری ترکیبی رونمایی کرد که برای ساخت ایجنت‌های هوش مصنوعی کاربرد دارند.

آزاد کبیری
نوشته شده توسط آزاد کبیری تاریخ انتشار: ۲۵ آذر ۱۴۰۴ | ۱۲:۲۶

انویدیا از نسخه جدید مدل‌های هوش مصنوعی خود به نام Nemotron 3 رونمایی کرد. این خانواده جدید با هدف افزایش دقت در ساخت ایجنت‌های هوش مصنوعی طراحی شده است. در ادامه مشخصات این مدل‌ها را می‌خوانید.

انویدیا برای پوشش‌دادن نیازهای مختلف این مدل‌ها را در سه سایز متفاوت منتشر کرده است:

  1. Nemotron 3 Nano (۳۰ میلیارد پارامتر): مدلی کارآمد برای انجام کارهای خاص و هدفمند با سرعت بالا.
  2. Nemotron 3 Super (۱۰۰ میلیارد پارامتر): مدل میانی که برای برنامه‌های چند-ایجنتی طراحی شده و قدرت استدلال بالایی دارد.
  3. Nemotron 3 Ultra (۵۰۰ میلیارد پارامتر): این مدل با موتور استدلال قدرتمند خود برای حل پیچیده‌ترین مسائل سازمانی ساخته شده است.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

کارایی بالای این مدل‌ها به‌خاطر معماری ترکیبی آنهاست. انویدیا به‌جای استفاده صرف از معماری ترنسفورمر (که در مدل‌هایی مثل GPT استفاده می‌شود) آن را با معماری Mamba ترکیب کرده است. این ترکیب باعث می‌شود برخلاف مدل‌های قدیمی که برای هر کلمه نیاز به حافظه زیادی داشتند، این مدل‌ها بسیار سبک‌تر اجرا شوند. همچنین طبق ادعای انویدیا، مدل نانو جدید تا ۴ برابر خروجی توکن سریع‌تری نسبت به نسل قبل دارد و هزینه‌های استنتاج را تا ۶۰ درصد کاهش می‌دهد.

مدل‌های هوش مصنوعی Nemotron 3 انویدیا

برای مدل‌های بزرگ‌تر سوپر و اولترا، انویدیا از یک ترفند به نام «MoE هیبریدی» استفاده کرده است. «کاری بریسکی» (Kari Briski)، معاون نرم‌افزار انویدیا، این مفهوم را اینگونه تشبیه می‌کند: «تصور کنید چندین آشپز ماهر در یک آشپزخانه بزرگ کار می‌کنند. آنها همگی از یک هسته مشترک (مواد اولیه و اجاق‌ها) استفاده می‌کنند، اما هرکدام قفسه ادویه مخصوص خود را دارند.» این روش باعث می‌شود مدل‌ها مقیاس‌پذیرتر باشند و بدون افت دقت روی زیرساخت‌های فعلی اجرا شوند.

انویدیا می‌داند که مدل خام به‌تنهایی کافی نیست. به همین دلیل محیطی شبیه‌سازی‌شده به نام NeMo Gym را راه‌اندازی کرده است. این فضا شبیه یک باشگاه بدنسازی برای هوش مصنوعی است. توسعه‌دهندگان می‌توانند ایجنت‌های خود را در این محیط‌های شبیه‌سازی‌شده رها کنند تا با آزمون و خطا ورزیده شوند و عملکردشان را قبل از ورود به دنیای واقعی محک بزنند.

مدل Nemotron 3 Nano از امروز روی Hugging Face و همچنین از طریق پلتفرم‌های مختلف مانند FriendliAI و OpenRouter در دسترس است.

آزاد کبیری
آزاد کبیری

دانش‌آموخته‌ زبان‌شناسی‌ هستم و همان‌قدر که به کلمات علاقه‌مندم، از سرک‌کشیدن به گوشه‌وکنارِ تکنولوژی و علم هم لذت می‌برم. حدود ۱۵ سال از نگارش نخستین متن رسمی‌ام می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی