شرکت Moore Threads به تازگی کارت گرافیک جدید خود را با نام MTT S4000 معرفی کرده است. این کارت گرافیک با عملکرد ۲۰۰ ترا عملیات در ثانیه (TOP) و حافظه ۴۸ گیگابایتی برای LLMها، از معماری هسته سوم نسل MUSA بهره میبرد.
طراحی این کارت گرافیک به منظور تقویت بارهای کاری هوش مصنوعی صورت گرفته است و ویژگیهای بسیار بالای حافظه را برای مدلهای زبان بزرگ فراهم میکند.
مشخصات کارت گرافیک MTT S4000 از شرکت Moore Threads
کارت گرافیک MTT S4000 از شرکت Moore Threads، با ویژگیهای بینظیری ارائه میشود. این کارت دارای ۴۸ گیگابایت حافظه GDDR6 با سرعت ۱۶ گیگابیت بر ثانیه است که برای ارائه پهنای باند ۷۶۸ گیگابایت بر ثانیه به کاربران ارائه میدهد. جدیدترین فناوری رابط MTLink 1.0 به کاربران این امکان را میدهد تا چندین کارت گرافیک را به طور همزمان اجرا کنند، این امر بسیار شبیه به فناوری NVLINK که در کارتهای گرافیک شرکت انویدیا است، میباشد. ارتقاء به پروتکل PCIe Gen5 نیز باعث ساختار قدرتمند این کارت گرافیک شده است و Moore Threads تنها تولیدکنندهای است که سختافزار کلاس کاربری را با پشتیبانی از Gen5 ارائه میدهد.
به گفته شرکت، برخی از ارقام محاسباتی نشان میدهد که این کارت گرافیک دارای عملکردی به شرح زیر است:
۲۵ TFLOP در FP32 و ۵۰ TFLOP در TF32، همچنین ۱۰۰ TFLOP در FP16/BF16 به علاوه ۲۰۰ TOPS در عملکرد INT8. این عملکرد بیشتر از ۵ برابر سریعترین ترکیب NPU+CPU+GPU موجود در PC های هوش مصنوعی مانند سری Ryzen 8040 شرکت AMD و سری Core Ultra کمپانی اینتل است. متأسفانه، تعداد هسته و سایر جزئیات فنی این کارت گرافیک توسط شرکت اعلام نشده است.
یک نکته جالب این است که علاوه بر اینکه MTT S4000 یک کارت شتاب دهنده هوش مصنوعی است، دارای چهار خروجی نمایشگر است و میتواند تا صفحه نمایش 8K را پشتیبانی کند. این کارت گرافیک همچنین قابلیت پشتیبانی از ۹۶ پخش همزمان با کیفیت 1080p را دارد و مجهز به آخرین ابزارهای توسعه USIFY است که میتواند از نرمافزار مبتنی بر CUDA شرکت انویدیا به طور کامل استفاده کند.
خلاصه مشخصات:
- معماری گرافیکی نسل سوم MUSA
- ۴۸ گیگابایت حافظه GDDR6
- پهنای باند ۷۶۸ گیگابایت بر ثانیه (سرعت پین ۱۶ گیگابایت در ثانیه)
- سازگار با PCIe Gen5
- ۲۵ TFLOP FP32
- ۵۰ TFLOP TF32
- ۱۰۰ TFLOP FP16/BF16
- ۲۰۰ تاپ INT8
- چهار خروجی نمایشگر
- ۹۶ 1080p جریان
- ساخته شده برای برنامههای کاربردی هوش مصنوعی
کارت گرافیک جدید، با یک سیستم خنک کننده غیرفعال دو اسلاته به بازار عرضه شده است، و از یک کانکتور برق با ولتاژ 12VHPWR برای اتصال به نیرو استفاده میکند. برخلاف نسل قبلی، کارت گرافیک MTT S3000، این نسخه جدید دارای ۳۲ گیگابایت حافظه و توان محاسباتی FP32 حداکثر با ۱۵.۲ TFLOP میباشد. بنابراین، این موضوع نشانگر افزایش ۵۰ درصدی در ظرفیت حافظه و بهبود ۶۴ درصدی در عملکرد قابلیتهای محاسباتی FP32 میباشد.
ادغام کارت گرافیک MTT S4000 با سیستمهای محاسباتی KUAE
محصولات محاسباتی KUAE، با استفاده از کارت گرافیک MTT S4000 از Moore Threads، ادغام شدهاند. سیستم Kuae MCCX D800 با استفاده از ۸ کارت گرافیک MTT S4000 عمل میکند و قابلیت گسترش بیوقفه از یک دستگاه به کارتهای متعدد و چندین سیستم هوش مصنوعی را فراهم میکند. هر دو کارت گرافیک MTT S4000 و سیستمهای Kuae از جدیدترین LLMها مانند LLaMA، GLM، Aquila، Baichuan، GPT، Bloom، Yuyan پشتیبانی میکنند و تا ۱۳۰ میلیارد پارامتر را به راحتی مدیریت میکنند. ابتدا ۱۰۰۰ عدد از کارتهای گرافیک MTT S4000 در نخستین خوشه محاسباتی در چین به کار گرفته خواهند شد تا بار کاری هوش مصنوعی را بر عهده بگیرند.
آیا این مدل توانایی ارائه عملکرد قابل قبول را دارد؟
مدل جدید کارت گرافیک MTT S4000 از شرکت Moore Threads، همانند دو مدل قبلی یعنی MTT S80 و MTT S70، با یک قیمت بسیار رقابتی به بازار عرضه خواهد شد. با این حال، برای ارزیابی عملکرد واقعی این کارت گرافیک، نیاز به مشاهده نتایج و عملکرد واقعی داریم. در گذشته، کارتهای گرافیک قبلی این شرکت، به رغم ادعای قابلیتهای گیمینگ بالقوه، عملکرد آنها مورد انتظار نبوده و این موضوع باعث نگرانی برای ماست.