ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

تکنولوژی

تسلا از D1 Dojo رونمایی کرد: تراشه ۵۰ میلیارد ترانزیستوری برای آموزش هوش مصنوعی

هوش مصنوعی در سال‌های اخیر مورد توجه زیادی قرار گرفته و البته کاربردهایش هم افزایش چشمگیری پیدا کرده. حالا تسلا برای افزایش سرعت فعالیت‌هایش در این زمینه، تراشه D1 Dojo را معرفی کرده که در ...

محمد قریشی
نوشته شده توسط محمد قریشی | ۱ شهریور ۱۴۰۰ | ۱۷:۳۰

هوش مصنوعی در سال‌های اخیر مورد توجه زیادی قرار گرفته و البته کاربردهایش هم افزایش چشمگیری پیدا کرده. حالا تسلا برای افزایش سرعت فعالیت‌هایش در این زمینه، تراشه D1 Dojo را معرفی کرده که در حقیقت یک ASIC اختصاصی برای تعلیم هوش مصنوعی است.

در حال حاضر شرکت‌های زیادی برای محاسبات هوش مصنوعی ASIC می‌سازند، از استارتاپ‌های کوچک گرفته تا کمپانی‌های غول‌پیکری مانند آمازون، بایدو، اینتل و انویدیا. با این حال تمام آن‌ها عملکرد مناسبی ندارند و همین موضوع باعث شده تسلا دست به کار شود و ASIC خودش را برای آموزش هوش مصنوعی توسعه دهد.

این تراشه که D1 نام دارد، بخشی از ابرکامپیوتر Dojo در مقر تسلا برای آموزش مدل‌های هوش مصنوعی به حساب می‌آید که در آینده برای کارهای زیادی مورد استفاده قرار می‌گیرد. تراشه D1 تسلا با لیتوگرافی ۷ نانومتری TSMC به تولید می‌رسد و بیش از ۵۰ میلیارد ترانزیستور دارد. ابعاد این چیپ برابر ۶۴۵ میلی‌متر مربع است.

اگر ادعای تسلا درست باشد، با عملکرد بالایی روبه‌رو هستیم. به گفته این شرکت، خروجی D1 می‌تواند به ۳۶۲ ترافلاپس در دقت FP16/CFP8 برسد. کاملا مشخص است که تسلا تراشه‌اش را برای داده‌های نوع FP16 بهینه‌سازی کرده تا از قدرتمندترین GPU انویدیا یعنی A100 هم عملکرد بهتری داشته باشد. محصول انویدیا در کارهای FP16 قدرتی برابر ۳۱۲ ترافلاپس دارد.

در سطح سیلیکون، تسلا یک شبکه از واحدهای عملکردی (FU) ایجاد کرده که با یکدیگر ارتباط دارند تا یک تراشه بزرگ تشکیل شود. هر FU شامل پردازنده ۶۴ بیتی با ISA اختصاصی می‌شود که برای انتقال، جمع‌آوری و پخش و ارتباط پیمایش‌ها طراحی شده است.

هر FU می‌تواند در محاسبات BF16 یا CFP8 قدرتی برابر ۱ ترافلاپس و برای محاسبات FP32 قدرتی برابر ۶۴ گیگافلاپس داشته باشد. پهنای باند آن هم در هر جهت به ۵۱۲ گیگابایت بر ثانیه می‌رسد. در حالت کلی طراحی آن به گونه‌ای است که تاخیر را کاهش و عملکرد را افزایش می‌دهد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی