معجزه سوپرچیپ GH200 Grace Hopper در سرورهای نسل 12 HPE!

تحولی بزرگ در حوزه هوش مصنوعی در راه است! GH200 Grace Hopper انویدیا، سوپرچیپ پیشرفته‌ای است که آمده تا دنیای هوش مصنوعی (AI) و HPC را متحول کند! در این مقاله قصد داریم تا با این ابر چیپ قدرتمند آشنا شویم، با ما همراه باشید.

سوپرچیپ GH200 Grace Hopper، پیشرفته‌ترین پلتفرم محاسباتی جهان!

NVIDIA Grace Hopper در واقع ترکیبی از گرافیک NVIDIA Hopper و پردازنده قدرتمند NVIDIA Grace تحت عنوان سوپرچیپ GH200 Grace Hopper است. در واقع، در این معماری GPU و CPU از طریق گذرگاه (NVIDIA NVLink Chip-2-Chip (C2C به یکدیگر متصل شده‌اند و پهنای باند بالا، تاخیر کم و memory-coherent را برای شما به ارمغان می‌آورد. GH200، تا 900 گیگابایت بر ثانیه پهنای باند کلی ارائه می‌دهد که 7 برابر بیشتر از خطوط PCIe Gen5 ای است که عموما در سیستم‌های شتاب‌دهنده استفاده می‌شود. به لطف این گذرگاه می‌توانید از حداکثر ظرفیت GPU استفاده کنید و از پهنای باند بالای حافظه CPU Grace لذت ببرید.

با حداکثر 480GB حافظه پردازنده LPDDR5X به ازای هر سوپرچیپ GH200 و همینطور بسته به پیکربندی حافظه آن، گرافیک مستقیما به 7 برابر سرعت بیشتر از HBM3 و 8 برابر بیشتر از HBM3e، دست پیدا خواهد کرد.

این سوپرچیپ را می‌توان به راحتی در سرورهای مختلف برای اجرای طیف وسیعی از بارهای کاری استنتاجی، تحلیل و آنالیز داده‌ و سایر workloadهای محاسباتی و حافظه‌محور به کار گرفت.

بهینگی انرژی با پردازنده Grace

پردازنده NVIDIA Grace دو برابر عملکرد به ازای هر وات نسبت به پلتفرم‌های معمولی x86-64 ارائه می‌دهد و از این رو، لقب سریع‌ترین پردازنده مرکز داده Arm در جهان را به خود اختصاص داده است.

این پردازنده به گونه‌ای طراحی شده که پاسخگوی نیازهای عملکردی تک رشته‌ای (single-threaded) با پهنای باند حافظه بالا و همینطور قابلیت‌های بی‌نظیر data-movement باشد.

این پردازنده 72 هسته Neoverse V2 Armv9 را با حداکثر 480GB حافظه سروری LPDDR5X مجهز به کد تصحیح خطا (ECC) ادغام می‌کند.

در مقایسه با یک طراحی هشت کاناله DDR5، حافظه این پردازنده، LPDDR5X، تا 53 درصد پهنای باند بیشتری را با یک‌ هشتم مصرف انرژی به ازای هر گیگابایت در ثانیه ارائه می‌دهد.

عملکرد و سرعت بالا را با گرافیک Hopper H100 تجربه کنید!

NVIDIA H100 Tensor Core نهمین نسل از GPUهای مرکز داده NVIDIA است و جهش بزرگی در عملکرد برای حوزه AI و HPC نسبت به نسل قبلی خود یعنی، ،NVIDIA A100 Tensor Core ارائه می‌دهد. H100 مبتنی بر معماری جدید GPU Hopper است و نوآوری‌های زیر را دارد:

هسته‌های Tensor نسل چهارم جدید، محاسبات ماتریسی را سریع‌تر از همیشه بر روی طیف وسیع‌تری از تسک‌های AI و HPC انجام می‌دهند.
موتور جدید ترانسفورمر به H100 امکان می‌دهد تا 9 برابر آموزش سریع‌تر هوش مصنوعی و تا 30 برابر استنتاج سریع‌تر هوش مصنوعی در مقایسه با نسل قبلی GPU را ارائه دهد.
فناوری MIG کارت گرافیک را به بخش‌های کوچکتر و مجزا تقسیم می‌کند تا کارهای کوچکتر با سرعت و کیفیت بهتری انجام شوند و بتوان از کارت گرافیک به طور کارآمد و موثرتر استفاده کرد.

قدرت یکپارچگی حافظه (Memory Coherency)!

تکنولوژی NVLink-C2C باعث می‌شود که هم CPU و هم GPU بتوانند به طور همزمان و بدون نیاز به مدیریت دستی حافظه، به حافظه‌های یکدیگر دسترسی داشته باشند. این یعنی توسعه‌دهندگان دیگر نیازی نیست نگران مدیریت حافظه باشند و می‌توانند تمرکز خود را بر روی بهبود الگوریتم هایشان بگذارند.

با این قابلیت، امکان انتقال داده‌های مدنظر فراهم شده و نیازی به انتقال تمامی اطلاعات نخواهد بود که همین امر افزایش عملکرد و کاهش تأخیر را به همراه دارد.

نکته قابل توجه دیگر در این خصوص، افزایش حافظه قابل دسترسی توسط GPU است. با افزایش عملکرد NVLink، مقدار حافظه‌ای که GPU می‌تواند به آن دسترسی داشته باشد، افزایش می‌یابد. این قابلیت به برنامه‌های شتاب‌یافته اجازه می‌دهد تا مسائل بزرگ‌تر و پیچیده‌تری را نسبت به گذشته حل کنند.

به عنوان نکته پایانی در این خصوص باید گفت، این تکنولوژی با ارائه ابزارهای lightweight synchronization و atomic operations از هر دو سمت CPU و GPU، دسترسی همزمان و هماهنگ به منابع مشترک را بدون ایجاد تداخل فراهم می‌کند.

به طور کلی، تکنولوژی NVLink-C2C با بهبود هماهنگی و کارایی بین CPU و GPU، کار توسعه‌دهندگان را در مدیریت حافظه ساده‌تر می‌کند و باعث می‌شود که برنامه‌های شتاب‌یافته بتوانند عملکرد بهتری داشته باشند و به شکل مؤثرتری مسائل بزرگ و پیچیده را حل کنند.

عملکرد پیشرو سوپرچیپ GH200 Grace Hopper در زمینه AI و HPC

در کل باید گفت، GH200 Grace Hopper Superchip تراشه بسیار قدرتمندی است که برای اجرای برنامه‌های پیچیده در حوزه‌های HPC و هوش مصنوعی ایده آل می‌باشد. این تراشه از چندین نوع پردازنده و شتاب‌دهنده استفاده می‌کند تا بهترین عملکرد ممکن را ارائه دهد.

این پلتفرم باعث می‌شود که برنامه‌ها بسیار سریع‌تر اجرا شوند، زیرا از بهترین ویژگی‌های GPU و CPU استفاده می‌کند. همچنین، این پلتفرم یک روش بسیار ساده و کارآمد برای برنامه‌نویسی ارائه می‌دهد، که به دانشمندان و مهندسان کمک می‌کند تا بر روی حل مشکلات پیچیده تمرکز کنند.

این تراشه‌ها به همراه فناوری‌های شبکه NVIDIA، بهترین قیمت و عملکرد را برای سیستم‌های هوش مصنوعی ارائه می‌دهند. این سیستم‌ها می‌توانند با داده‌های بزرگ‌تر و پیچیده‌تر و بارهای کاری جدید با استفاده از حداکثر 624GB از حافظه fast-access کار کنند.

این تراشه همچنین در یک نسخه دوگانه ارائه می‌شود که دو تراشه GH200 به هم متصل شده‌اند. این پیکربندی به این تراشه‌ها اجازه می‌دهد تا از 288 گیگابایت حافظه HBM3e و 1.2 ترابایت fast memory استفاده کنند، که برای اجرای برنامه‌های پیچیده و سنگین محاسباتی و حافظه محور بسیار مفید است.

در نمودارهای زیر تفاوت پارامترهای مختلف را در 3 نوع تکنولوژی بررسی میکنیم: 1.یک سرور با پردازنده +8480 که در نمودار زیر با x86 مشخص شده است. 2.یک سرور ترکیبی از پردازنده +8480 و گرافیک H100 Tensor که در نمودار با x86+ H100 مشخص شده و 3.سرور با سوپرچیپ GH200 144GB

نکته: برتری سروری که از این سوپرچیپ استفاده کرده است به خوبی مشهود است.

پشتیبانی کامل از تمامی پلتفرم‌های انویدیا

سوپرچیپ GH200، می‌تواند از مجموعه گسترده و متنوعی از پردازنده‌های 64 بیتی Arm که در حال حاضر وجود دارد، استفاده کنند تا عملکرد بی نظیری را شاهد باشید. تمامی کانتینرها، برنامه‌ها و سیستم‌ عامل‌هایی که روی سایر محصولات Arm اجرا می‌شوند، بدون هیچ تغییری روی این سوپرچیپ با سرعت بیشتر اجرا می‌شوند. این سوپرچیپ از تمامی پلتفرم‌های نرم افزاری انویدیا نظیر NVIDIA HPC ،NVIDIA AI و NVIDIA Omniverse پشتیبانی می‌کند.

جدول مشخصات فنی سوپرچیپ GH200 Grace Hopper

ویژگی	GH200	GH200 NVL2
تعداد هسته پردازنده	72 Arm Neoverse V2 cores	144 Arm Neoverse V2 cores
کش L1	64KB i-cache + 64KB d-cache	64KB i-cache + 64KB d-cache
کش L2	1MB per core	1MB per core
کش L3	114MB	228MB
فرکانس پایه\| فرکانس SIMD	3.0GHz \| 3.1GHz	3.0GHz \| 3.1GHz
سایز LPDDR5X	480GB120GB, 240GB	960GB240GB, 480GB
پهنای باند حافظه	Up to 384GB/sUp to 512GB/s	Up to 768GB/sUp to 1024GB/s
لینک‌های PCIe	Up to 4x PCIe x16 (Gen5)	Up to 8x PCIe x16 (Gen5)

ویژگی	GH200	GH200 NVL2
FP64	34teraFLOPS	68teraFLOPS
هسته FP64 Tensor	67teraFLOPS	134teraFLOPS
FP32	67teraFLOPS	134teraFLOPS
هسته TF32 Tensor	989teraFLOPS* \| 494 teraFLOPS	1979teraFLOPS* \| 990 teraFLOPS
هسته BFLOAT16 Tensor	1979teraFLOPS* \| 990 teraFLOPS	3958teraFLOPS* \| 1979 teraFLOPS
هسته TP16 Tensor	1979teraFLOPS* \| 990 teraFLOPS	3958teraFLOPS* \| 1979 teraFLOPS
هسته FP8 Tensor	3958teraFLOPS* \| 1979 teraFLOPS	7916teraFLOPS* \| 3958 teraFLOPS
هسته INT8 Tensor	3958teraFLOPS* \| 1979 teraFLOPS	7916teraFLOPS* \| 3958 teraFLOPS
میزان HBM	96GB HBM3 \| 144GB HBM3e	Up to 288GB HBM3e
پهنای باند حافظه	Up to 4TB/s \| Up to 4.9TB/s	Up to 9.8TB/s
پهنای باند NVIDIA NVLink-C2C	900GB/s	900GB/s
توان	Configurable 450 to 1000W(Memory + CPU + GPU)	Configurable 900W to 2000W(Memory + CPU + GPU)
روش خنکسازی	فن و خنک کننده مایع	فن و خنک کننده مایع

معجزه سوپرچیپ GH200 Grace Hopper در سرورهای نسل 12 HPE!

گفتنی است که با این معماری دیگر RAM و CPUای با آن معنی که ما می‌شناسیم در کار نخواهند بود و به سرعت از طریق ارتباط بین گرافیک و پردازنده، بارهای کاری شما پاسخ داده خواهند شد. حذف شدن اسلات‌های رم و ترکیب ماژول‌های CPU و GPU در سرور تازه وارد HPE DL384 Gen12 به خوبی قابل مشاهده است. در این سرور 2 سوپرچیپ قرار داده شده که یا نام‌های Primary Superchip و Secondary Superchip نام گذاری شده‌اند و در تصویر با شماره‌های 2 و 6 به ترتیب دیده می‌شوند.

آداک فناوری مانیا با عرضه سرور و استوریج با قیمت و کیفیت مناسب در کنار شماست تا بهترین انتخاب را داشته باشید. با مشاورین فنی ما در تماس باشید تا بهترین پیشنهاد را به شما داشته باشند. به زودی با عرضه سرورهای نسل 12ام از برند HPE با شما همراه خواهیم بود.