ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

سخت‌افزار DeepSeek
هوش مصنوعی

هزینه سخت‌افزارهای DeepSeek می‌تواند بیش از 500 میلیون دلار بوده باشد

شرکت تحقیقاتی SemiAnalysis در گزارش جدیدی ادعاهای جالبی درباره هزینه‌های DeepSeek داشته است.

آزاد کبیری
نوشته شده توسط آزاد کبیری | ۱۳ بهمن ۱۴۰۳ | ۱۴:۰۰

طبق گزارشی جدید، به نظر می‌رسد هزینه‌ سخت‌افزارهای DeepSeek بالاتر از 500 میلیون دلار بوده است. اما آنچه اخیراً بیشتر به آن توجه شده هزینه‌ 5 میلیون و 600 هزار دلاری آموزش مدل جدید این شرکت چینی بوده که بسیار کمتر از مبلغ مصرفی رقبای آمریکایی است.

براساس گزارش SemiAnalysis که شرکتی تحقیقاتی در زمینه نیمه‌رساناهاست، با احتساب هرینه‌های تحقیق و توسعه و دیگر بخش‌ها، تخمین زده می‌شود هزینه سخت‌افزارهای DeepSeek بسیار بیش از 500 میلیون دلار باشد.

البته دیپ‌‎سیک در مقاله معرفی مدل DeepSeek-V3 گفته بود کل هزینه‌های آموزشی آن نزدیک به 5 میلیون و 570 هزار دلار است. همچنین این شرکت گفته این رقم فقط شامل «آموزش رسمی» مدل می‌شود و هزینه‌های «تحقیقات قبلی و آزمایش‌های فرسایشی انجام‌شده روی معماری‌ها، الگوریتم‌ها یا داده‌ها» لحاظ نشده است. این شرکت همچنین هزینه کل تولید این مدل را اعلام نکرده است.

برای مثال شرکت آنتروپیک برای آموزش مدل Claude 3.5 Sonnet حدود 10 میلیون دلار هزینه کرده است اما اگر هزینه توسعه مدل فقط به همین رقم محدود می‌شد، این شرکت میلیاردها دلار از گوگل و آمازون جذب سرمایه نمی‌کرد.

هزینه سخت‌افزارهای DeepSeek

سخت‌افزار DeepSeek

به ادعای SemiAnalysis، شرکت DeepSeek به حدود 10 هزار تراشه H800 و حدود 10 هزار H100 انویدیا دسترسی دارد. علاوه‌براین، تعداد زیادی از تراشه‌های H20 را که انویدیا آنها را برای بازار چین تولید کرده، در اختیار دارند. البته این پردازشگرهای گرافیکی ظاهراً بین شرکت High-Flyer و DeepSeek مشترک‌اند. این 2 شرکت را «لیانگ ون‌فنگ» تأسیس کرده و حامی مالی دیپ‌سیک نیز High-Flyer است.

محققان SemiAnalysis مدعی‌اند اگرچه V3 بدون شک یک مدل قدرتمند است، باید دقت بیشتری داشته باشیم که آن را با کدام مدل مقایسه می‌کنیم. بسیاری از افراد V3 را با GPT-4o مقایسه کرده‌اند اما باید بدانیم که GPT-4o مه 2024 منتشر شد و مسلماً سرعت پیشرفت هوش مصنوعی در این مدت بیشتر شده است.

البته نمی‌توان از مدل R1 دیپ‌سیک نیز غافل شد که توانست در برخی بنچمارک‌ها از مدل o1 شرکت OpenAI جلو بزند.

آزاد کبیری

دانش‌آموخته‌ی ساکتِ زبان‌شناسی هستم و همان‌قدر که به کلمات علاقه‌مندم، سرک‌کشیدن به هر گوشه‌ از تکنولوژی و علم را هم دوست دارم. حدود 15 سال نیز از نگارش اولین متن رسمی من می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی