برنامه نویسی
Infiniband در مقابل سال 비교 – نه جامعه

در شبکه های HPC & AI با عملکرد بالا ، Infiniband و Roce Nvidia (RDMA بیش از اترنت همگرا) معمولاً در هر دو رشته کوه استفاده می شود.
هر دو فن آوری در فن آوری های اتصال شبکه ای بالا ، به ویژه در HPC ، AI ، یادگیری ماشین و مراکز داده استفاده می شود.
1. Infiniband در مقابل Roce
قسمت | Infiniband (IB) | ROCE (RDMA بیش از اترنت همگرا) |
---|---|---|
شبکه اصلی | شبکه infiniband | اترنت همگرا |
پشتیبانی RDMA | پشتیبانی RDMA بومی | RDMA (RDMA بیش از اترنت) در اترنت |
سرعت شبکه | حداکثر 1200 گیگابیت در ثانیه (HDR ، NDR ، XDR) | حداکثر 800 گیگ بر ثانیه (اترنت 800 گرم) |
تاخیر | کمتر از 1 میکرومتر (1.0 μ 0.6) | حدود 1 ~ 2 میکرومتر |
ضمانت کیفیت (QoS) | کنترل جریان مبتنی بر اعتبار (انتقال بدون ضرر) | PFC (کنترل جریان مبتنی بر اولویت) |
مقیاس پذیری | مناسب برای خوشه های بزرگ HPC | مقیاس پذیری عالی در محیط مرکز داده عمومی |
استفاده اصلی | HPC ، AI ، ابر رایانه ، ابر | مرکز داده ، یادگیری/استدلال هوش مصنوعی ، امور مالی ، ذخیره سازی |
2. تجزیه و تحلیل مقایسه اصلی
① مبتنی بر شبکه
- Infiniband: یک پروتکل اختصاصی شبکه به رهبری Mellanox (NVIDIA) ، با اطمینان از عملکرد بالا و زمان تاخیر کم.
- ROCE: RDMA ویژگی های موجود در اترنت موجود است و می تواند از زیرساخت ها و زیرساخت های موجود استفاده شود.
② توان و تأخیر
- Infiniband: به طور کلی ، زمان تأخیر کمتری و عملکرد بالاتر از ROCE را فراهم می کند.
- آخرین سوئیچ NVIDIA QUANTUM-2 IB تا 400 گیگابیت در ثانیه از سرعت پشتیبانی می کند و زمان تأخیر کمتر از 1 میکرومتر است.
- ROCE V2 یک زمان تاخیر 1 μs است ، اما با ظهور اترنت بالا (400GBE ، 800GBE) ، شکاف عملکرد کاهش می یابد.
③ QoS و قابلیت اطمینان
- Infiniband: انتقال ضرر تضمین شده با استفاده از کنترل جریان مبتنی بر اعتبار.
- ROCE: اترنت مبتنی بر PFC (کنترل جریان اولویت) و ECN (ECN) برای اجرای محیط بدون ضرر است.
- اگر شبکه به درستی تنظیم نشده باشد ، ممکن است از دست دادن بسته رخ دهد.
④ مقیاس پذیری و هزینه
- Infiniband: تجهیزات جداگانه شبکه (سوئیچ ، NIC و غیره) مورد نیاز است و هزینه ساخت آن زیاد است.
- ROCE: از آنجا که می تواند در زیرساخت های موجود اترنت مورد استفاده قرار گیرد ، هزینه کم و برای مراکز ابر و داده بهینه شده است.
⑤ نرم افزار و سازگاری
- Infiniband: محیط HPC بهینه شده از طریق Nvidia HPC-X ، OpenMPI ، Slurm ، MLNX_OFED.
- ROCE: NVME-OF (ذخیره سازی) ، خوشه AI ، ابر (اتصال مستقیم NIC) ، و غیره
4. تجزیه و تحلیل محیط زیست
مورد استفاده | راه حل توصیه شده |
---|---|
HPC ، ابر رایانه ، آموزش AI (LLM ، GPT-4 و غیره) | بی نهایت |
مرکز داده ، ابر ، عمومی AI/ML | سال |
ذخیره سازی (NVME-OF ، GPUDIRECT ذخیره سازی) | سال v2 |
برنامه مالی با عملکرد بالا (تجارت الگوریتم ، HFT و غیره) | بی نهایت |
زیرساخت اترنت موجود | سال |
با توجه به چندتایی و مقیاس پذیری در مرکز داده | سال |
4. نتیجه گیری
- Infiniband: مناسب برای AI ، HPC ، امور مالی ، ابر رایانه ها و غیره که به بهترین عملکرد و حداقل زمان تأخیر نیاز دارند.
- ROCE: مرکز داده مبتنی بر اترنت موجود ، ابر ، AI/ML ، محیط ذخیره سازی با هزینه و مقیاس پذیر است.
در پایان ، اگر تأخیر HPC و Ultra -Low مهم باشد ، ROCE برای ادغام با Infiniband و زیرساخت های اترنت موجود مناسب است.