ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

متا Llama 3.2
هوش مصنوعی

مدل هوش مصنوعی Llama 3.2 معرفی شد؛ اولین مدل متن‌باز متا با قابلیت پردازش تصویر

این مدل قادر به پردازش متون و تصاویر است.

ایمان صاحبی
نوشته شده توسط ایمان صاحبی | ۴ مهر ۱۴۰۳ | ۲۱:۱۵

تنها دو ماه پس از عرضه جدیدترین مدل هوش مصنوعی بزرگ متا، این شرکت با یک آپدیت بزرگ دیگر برگشته است. Llama 3.2 نخستین مدل متن‌باز متا است که می‌تواند علاوه‌بر متون، تصاویر، جداول، نمودارها و کپشن عکس‌ها را هم پردازش کند.

مدل هوش مصنوعی متا Llama 3.2 به توسعه‌دهندگان اجازه می‌دهد اپلیکیشن‌های هوش مصنوعی پیشرفته ازجمله اپ‌های واقعیت مجازی که می‌توانند در لحظه ویدیوها را درک کنند، موتورهای جستجوی بصری که قادر به مرتب‌سازی تصاویر براساس محتوا هستند، یا ابزارهایی برای تحلیل اسناد بسازند که می‌توانند متون طولانی را برای شما خلاصه کنند.

معرفی مدل هوش مصنوعی چندوجهی Llama 3.2 متا

متا می‌گوید راه‌اندازی مدل هوش مصنوعی لاما 3.2 راحت است. توسعه‌دهندگان تنها کافی است حالت جدید چندوجهی را به مدل خود اضافه کنند تا بتوانند تصویر به‌نمایش بگذارند و امکان تعامل با این فایل‌ها را فراهم کنند.

با توجه به اینکه OpenAI و گوگل پیش‌تر مدل‌های چندوجهی خود را معرفی کرده بودند، متا با Llama 3.2 سعی دارد عقب‌ماندگی خود را جبران کند. افزودن قابلیت بینایی - یعنی امکان پردازش تصویر - نقش مهمی برای آینده برنامه‌های این شرکت دارد، چراکه آن‌ها مشغول توسعه توانمندی‌های هوش مصنوعی برای سخت‌افزارهایی مثل عینک‌های متا ری‌بن هستند.

لاما 3.2 دارای دو مدل بینایی (با 11 و 90 میلیارد پارامتر) و دو مدل سبک متنی (با 1 و 3 میلیارد پارامتر) است. مدل‌های کوچک‌تر طراحی شده‌اند تا با سخت‌افزارهای کوالکام، مدیاتک و دیگر سخت‌افزارهای مبتنی بر آرم کار کنند. این شرکت احتمالاً امید دارد که این مدل‌ها به گوشی‌های همراه نیز وارد شوند.

متا می‌گوید Llama 3.2 در زمینه تشخیص تصویر و فهم دیگر عناصر بصری رقیب Claude 3 Haiku از شرکت انتروپیک و GPT4o-mini از شرکت OpenAI است. اما در زمینه‌هایی همچون دنبال‌کردن دستورات، خلاصه‌سازی محتوا و بازنویسی پرامپت بهتر از Gemma و Phi 3.5-mini عمل می‌کند.

مدل‌های Llama 3.2 همین حالا از طریق وب‌سایت Llama.com و Hugging Face و دیگر پلتفرم‌های همکار متا در دسترس قرار گرفته‌اند.

ایمان صاحبی

علاقه من به فناوری به دوره نوجوانی برمی‌گرده اما از حدود سال ۹۴ کار جسته گریخته توی این فضا رو شروع کردم و از ۹۷ به‌طور جدی‌تر وارد این کار شدم. فناوری مخصوصاً بخشی که روی لبه حرکت می‌کنه، جذاب‌ترین قسمت این حوزه برام محسوب می‌شه، اما به مرور فهمیدم که همه حوزه‌ها حتی نقاط تلاقی علم و فناوری می‌تونن خیلی جذاب باشن. در کنار این‌ها دنیای فیلم، سریال و بازی‌های ویدیویی رو هم خیلی دوست دارم.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی