تحولی بزرگ در حوزه هوش مصنوعی در راه است! GH200 Grace Hopper انویدیا، سوپرچیپ پیشرفتهای است که آمده تا دنیای هوش مصنوعی (AI) و HPC را متحول کند! در این مقاله قصد داریم تا با این ابر چیپ قدرتمند آشنا شویم، با ما همراه باشید.
سوپرچیپ GH200 Grace Hopper، پیشرفتهترین پلتفرم محاسباتی جهان!
NVIDIA Grace Hopper در واقع ترکیبی از گرافیک NVIDIA Hopper و پردازنده قدرتمند NVIDIA Grace تحت عنوان سوپرچیپ GH200 Grace Hopper است. در واقع، در این معماری GPU و CPU از طریق گذرگاه (NVIDIA NVLink Chip-2-Chip (C2C به یکدیگر متصل شدهاند و پهنای باند بالا، تاخیر کم و memory-coherent را برای شما به ارمغان میآورد. GH200، تا 900 گیگابایت بر ثانیه پهنای باند کلی ارائه میدهد که 7 برابر بیشتر از خطوط PCIe Gen5 ای است که عموما در سیستمهای شتابدهنده استفاده میشود. به لطف این گذرگاه میتوانید از حداکثر ظرفیت GPU استفاده کنید و از پهنای باند بالای حافظه CPU Grace لذت ببرید.
با حداکثر 480GB حافظه پردازنده LPDDR5X به ازای هر سوپرچیپ GH200 و همینطور بسته به پیکربندی حافظه آن، گرافیک مستقیما به 7 برابر سرعت بیشتر از HBM3 و 8 برابر بیشتر از HBM3e، دست پیدا خواهد کرد.
این سوپرچیپ را میتوان به راحتی در سرورهای مختلف برای اجرای طیف وسیعی از بارهای کاری استنتاجی، تحلیل و آنالیز داده و سایر workloadهای محاسباتی و حافظهمحور به کار گرفت.
بهینگی انرژی با پردازنده Grace
پردازنده NVIDIA Grace دو برابر عملکرد به ازای هر وات نسبت به پلتفرمهای معمولی x86-64 ارائه میدهد و از این رو، لقب سریعترین پردازنده مرکز داده Arm در جهان را به خود اختصاص داده است.
این پردازنده به گونهای طراحی شده که پاسخگوی نیازهای عملکردی تک رشتهای (single-threaded) با پهنای باند حافظه بالا و همینطور قابلیتهای بینظیر data-movement باشد.
این پردازنده 72 هسته Neoverse V2 Armv9 را با حداکثر 480GB حافظه سروری LPDDR5X مجهز به کد تصحیح خطا (ECC) ادغام میکند.
در مقایسه با یک طراحی هشت کاناله DDR5، حافظه این پردازنده، LPDDR5X، تا 53 درصد پهنای باند بیشتری را با یک هشتم مصرف انرژی به ازای هر گیگابایت در ثانیه ارائه میدهد.
عملکرد و سرعت بالا را با گرافیک Hopper H100 تجربه کنید!
NVIDIA H100 Tensor Core نهمین نسل از GPUهای مرکز داده NVIDIA است و جهش بزرگی در عملکرد برای حوزه AI و HPC نسبت به نسل قبلی خود یعنی، ،NVIDIA A100 Tensor Core ارائه میدهد. H100 مبتنی بر معماری جدید GPU Hopper است و نوآوریهای زیر را دارد:
- هستههای Tensor نسل چهارم جدید، محاسبات ماتریسی را سریعتر از همیشه بر روی طیف وسیعتری از تسکهای AI و HPC انجام میدهند.
- موتور جدید ترانسفورمر به H100 امکان میدهد تا 9 برابر آموزش سریعتر هوش مصنوعی و تا 30 برابر استنتاج سریعتر هوش مصنوعی در مقایسه با نسل قبلی GPU را ارائه دهد.
- فناوری MIG کارت گرافیک را به بخشهای کوچکتر و مجزا تقسیم میکند تا کارهای کوچکتر با سرعت و کیفیت بهتری انجام شوند و بتوان از کارت گرافیک به طور کارآمد و موثرتر استفاده کرد.
قدرت یکپارچگی حافظه (Memory Coherency)!
تکنولوژی NVLink-C2C باعث میشود که هم CPU و هم GPU بتوانند به طور همزمان و بدون نیاز به مدیریت دستی حافظه، به حافظههای یکدیگر دسترسی داشته باشند. این یعنی توسعهدهندگان دیگر نیازی نیست نگران مدیریت حافظه باشند و میتوانند تمرکز خود را بر روی بهبود الگوریتم هایشان بگذارند.
با این قابلیت، امکان انتقال دادههای مدنظر فراهم شده و نیازی به انتقال تمامی اطلاعات نخواهد بود که همین امر افزایش عملکرد و کاهش تأخیر را به همراه دارد.
نکته قابل توجه دیگر در این خصوص، افزایش حافظه قابل دسترسی توسط GPU است. با افزایش عملکرد NVLink، مقدار حافظهای که GPU میتواند به آن دسترسی داشته باشد، افزایش مییابد. این قابلیت به برنامههای شتابیافته اجازه میدهد تا مسائل بزرگتر و پیچیدهتری را نسبت به گذشته حل کنند.
به عنوان نکته پایانی در این خصوص باید گفت، این تکنولوژی با ارائه ابزارهای lightweight synchronization و atomic operations از هر دو سمت CPU و GPU، دسترسی همزمان و هماهنگ به منابع مشترک را بدون ایجاد تداخل فراهم میکند.
به طور کلی، تکنولوژی NVLink-C2C با بهبود هماهنگی و کارایی بین CPU و GPU، کار توسعهدهندگان را در مدیریت حافظه سادهتر میکند و باعث میشود که برنامههای شتابیافته بتوانند عملکرد بهتری داشته باشند و به شکل مؤثرتری مسائل بزرگ و پیچیده را حل کنند.
عملکرد پیشرو سوپرچیپ GH200 Grace Hopper در زمینه AI و HPC
در کل باید گفت، GH200 Grace Hopper Superchip تراشه بسیار قدرتمندی است که برای اجرای برنامههای پیچیده در حوزههای HPC و هوش مصنوعی ایده آل میباشد. این تراشه از چندین نوع پردازنده و شتابدهنده استفاده میکند تا بهترین عملکرد ممکن را ارائه دهد.
این پلتفرم باعث میشود که برنامهها بسیار سریعتر اجرا شوند، زیرا از بهترین ویژگیهای GPU و CPU استفاده میکند. همچنین، این پلتفرم یک روش بسیار ساده و کارآمد برای برنامهنویسی ارائه میدهد، که به دانشمندان و مهندسان کمک میکند تا بر روی حل مشکلات پیچیده تمرکز کنند.
این تراشهها به همراه فناوریهای شبکه NVIDIA، بهترین قیمت و عملکرد را برای سیستمهای هوش مصنوعی ارائه میدهند. این سیستمها میتوانند با دادههای بزرگتر و پیچیدهتر و بارهای کاری جدید با استفاده از حداکثر 624GB از حافظه fast-access کار کنند.
این تراشه همچنین در یک نسخه دوگانه ارائه میشود که دو تراشه GH200 به هم متصل شدهاند. این پیکربندی به این تراشهها اجازه میدهد تا از 288 گیگابایت حافظه HBM3e و 1.2 ترابایت fast memory استفاده کنند، که برای اجرای برنامههای پیچیده و سنگین محاسباتی و حافظه محور بسیار مفید است.
در نمودارهای زیر تفاوت پارامترهای مختلف را در 3 نوع تکنولوژی بررسی میکنیم: 1.یک سرور با پردازنده +8480 که در نمودار زیر با x86 مشخص شده است. 2.یک سرور ترکیبی از پردازنده +8480 و گرافیک H100 Tensor که در نمودار با x86+ H100 مشخص شده و 3.سرور با سوپرچیپ GH200 144GB
نکته: برتری سروری که از این سوپرچیپ استفاده کرده است به خوبی مشهود است.
پشتیبانی کامل از تمامی پلتفرمهای انویدیا
سوپرچیپ GH200، میتواند از مجموعه گسترده و متنوعی از پردازندههای 64 بیتی Arm که در حال حاضر وجود دارد، استفاده کنند تا عملکرد بی نظیری را شاهد باشید. تمامی کانتینرها، برنامهها و سیستم عاملهایی که روی سایر محصولات Arm اجرا میشوند، بدون هیچ تغییری روی این سوپرچیپ با سرعت بیشتر اجرا میشوند. این سوپرچیپ از تمامی پلتفرمهای نرم افزاری انویدیا نظیر NVIDIA HPC ،NVIDIA AI و NVIDIA Omniverse پشتیبانی میکند.
جدول مشخصات فنی سوپرچیپ GH200 Grace Hopper
ویژگی | GH200 | GH200 NVL2 |
تعداد هسته پردازنده | 72 Arm Neoverse V2 cores | 144 Arm Neoverse V2 cores |
کش L1 | 64KB i-cache + 64KB d-cache | 64KB i-cache + 64KB d-cache |
کش L2 | 1MB per core | 1MB per core |
کش L3 | 114MB | 228MB |
فرکانس پایه| فرکانس SIMD | 3.0GHz | 3.1GHz | 3.0GHz | 3.1GHz |
سایز LPDDR5X | 480GB120GB, 240GB | 960GB240GB, 480GB |
پهنای باند حافظه | Up to 384GB/sUp to 512GB/s | Up to 768GB/sUp to 1024GB/s |
لینکهای PCIe | Up to 4x PCIe x16 (Gen5) | Up to 8x PCIe x16 (Gen5) |
ویژگی | GH200 | GH200 NVL2 |
FP64 | 34teraFLOPS | 68teraFLOPS |
هسته FP64 Tensor | 67teraFLOPS | 134teraFLOPS |
FP32 | 67teraFLOPS | 134teraFLOPS |
هسته TF32 Tensor | 989teraFLOPS* | 494 teraFLOPS | 1979teraFLOPS* | 990 teraFLOPS |
هسته BFLOAT16 Tensor | 1979teraFLOPS* | 990 teraFLOPS | 3958teraFLOPS* | 1979 teraFLOPS |
هسته TP16 Tensor | 1979teraFLOPS* | 990 teraFLOPS | 3958teraFLOPS* | 1979 teraFLOPS |
هسته FP8 Tensor | 3958teraFLOPS* | 1979 teraFLOPS | 7916teraFLOPS* | 3958 teraFLOPS |
هسته INT8 Tensor | 3958teraFLOPS* | 1979 teraFLOPS | 7916teraFLOPS* | 3958 teraFLOPS |
میزان HBM | 96GB HBM3 | 144GB HBM3e | Up to 288GB HBM3e |
پهنای باند حافظه | Up to 4TB/s | Up to 4.9TB/s | Up to 9.8TB/s |
پهنای باند NVIDIA NVLink-C2C | 900GB/s | 900GB/s |
توان | Configurable 450 to 1000W(Memory + CPU + GPU) | Configurable 900W to 2000W(Memory + CPU + GPU) |
روش خنکسازی | فن و خنک کننده مایع | فن و خنک کننده مایع |
معجزه سوپرچیپ GH200 Grace Hopper در سرورهای نسل 12 HPE!
گفتنی است که با این معماری دیگر RAM و CPUای با آن معنی که ما میشناسیم در کار نخواهند بود و به سرعت از طریق ارتباط بین گرافیک و پردازنده، بارهای کاری شما پاسخ داده خواهند شد. حذف شدن اسلاتهای رم و ترکیب ماژولهای CPU و GPU در سرور تازه وارد HPE DL384 Gen12 به خوبی قابل مشاهده است. در این سرور 2 سوپرچیپ قرار داده شده که یا نامهای Primary Superchip و Secondary Superchip نام گذاری شدهاند و در تصویر با شمارههای 2 و 6 به ترتیب دیده میشوند.
آداک فناوری مانیا با عرضه سرور و استوریج با قیمت و کیفیت مناسب در کنار شماست تا بهترین انتخاب را داشته باشید. با مشاورین فنی ما در تماس باشید تا بهترین پیشنهاد را به شما داشته باشند. به زودی با عرضه سرورهای نسل 12ام از برند HPE با شما همراه خواهیم بود.