مدل متنباز DeepSeek R1 منتشر شد؛ رقیب OpenAI o1 اما 95 درصد کمهزینهتر
هزینه مدل متنباز دیپسیک تا 95 درصد کمتر از مدل o1 است.
استارتاپ هوش مصنوعی چینی DeepSeek بهتازگی DeepSeek-R1 را منتشر کرده است که مدلی متنباز و استدلالگر محسوب میشود. به ادعای این استارتاپ، این مدل در برخی بنچمارکها مدل o1 از شرکت OpenAI را شکست میدهد. نکته قابلتوجه این است که هزینههای مدل چینی تا 95 درصد کمتر از مدل آمریکایی است.
دیپسیک ضمن انتشار مدل DeepSeek-R1 در Hugging Face، در گزارشی عملکرد این مدل استدلالگر را در بنچمارکهای مختلف نشان داده است. مدل R1 توانسته در بنچمارکهای AIME ،MATH-500 و SWE-bench Verified مدل o1 را شکست دهد. این مدل در تستهای ریاضی AIME امتیاز 79.8 درصد و در MATH-500 امتیاز 97.3 درصد را کسب کرد. همچنین امتیاز 2 هزار و 29 را در تست Codeforces به دست آورد؛ بهتر از 96.3 درصد برنامهنویسان انسانی عمل کرده است. در مقابل، مدل o1 بهترتیب امتیازهای 79.2 درصد، 96.4 درصد و 96.6 درصد را در این بنچمارکها به دست آورده بود.
البته این مدل در بنچمارک MMLU که مربوط به دانش عمومی است، امتیاز 90.8 درصد را کسب کرد که کمی کمتر از امتیاز 91.8 درصد o1 است. درکل، امتیازهای این 2 مدل خیلی به یکدیگر نزدیک است، با این تفاوت که مدل استارتاپ چینی با هزینهای 90 تا 95 درصد کمتر از مدل o1 این محاسبات را انجام میدهد.
مقایسه مدل متنباز DeepSeek-R1 با مدل o1
مدلهای استدلالگر در مقایسه با مدلهای عادی کُندتر هستند و معمولاً چند ثانیه تا چند دقیقه طول میکشد تا پاسخ بدهند اما مزیتشان این است که در حوزههایی مانند فیزیک، علوم و ریاضیات قابلاعتمادترند. DeepSeek در گزارش اخیرش گفته R1 حاوی 671 میلیارد پارامتر است و بر پایه مدل DeepSeek V3 توسعه یافته؛ مدلهایی با پارامترهای بیشتر معمولاً بهتر از مدلهایی با پارامترهای کمتر عمل میکنند.
البته DeepSeek نسخههای کوچکتر R1 را در اندازههای یکمیلیارد پارامتر تا 70 میلیارد پارامتر نیز منتشر کرده که کوچکترین مدل میتواند روی لپتاپها اجرا شود اما برای اجرای نسخه کامل R1 به سیستم قویتری نیاز دارید؛ البته اگر بین استفاده از این مدل و مدل OpenAI مردد هستید، بهتر است نگاهی به هزینههای این 2 بیندازید.
مدل o1 تقریباً 15 دلار بهازای هر میلیون توکن ورودی و 60 دلار بهازای هر میلیون توکن خروجی هزینه دارد اما هزینه مدل R1 فقط 0.55 دلار بهازای هر میلیون توکن ورودی و 2.19 دلار بهازای هر میلیون توکن خروجی است.
البته میتوانید از قابلیتهای مدلهای استدلالگر این شرکت در اپلیکیشن و نسخه وب دیپسیک رایگان استفاده کنید. برای استفاده از مدل استدلالگر آن کافی است گزینه DeepThink را فعال و درخواست خود را بیان کنید.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.