Przełącznik Mellanox (NVIDIA) MQM9790-NS2F InfiniBand w akcji | Optymalizacja połączeń wzajemnych o niskim opóźnieniu dla RDMA/HPC/AI
May 28, 2026
W miarę jak wielkoskalowe klastry szkoleniowe AI i centra obliczeń o wysokiej wydajności (HPC) zwiększają wymagania dotyczące przepustowości sieci i opóźnień do niespotykanego dotąd poziomu, tradycyjne rozwiązania Ethernet coraz częściej borykają się z kontrolą zatorów i nieprzewidywalnymi opóźnieniami końcowymi w przypadku obciążeń RDMA. Wiodące krajowe centrum superkomputerowe stanęło niedawno przed dokładnie tym wyzwaniem podczas modernizacji klastra GPU nowej generacji. Po ocenie wielu opcji połączeń wzajemnych zespół wybrałMellanox (NVIDIA) MQM9790-NS2Fjako przełącznik sieci szkieletowej — decyzja, która zasadniczo zmieniła profil wydajności klastra.
Tło i wyzwanie: Ściana skalowalności
Istniejąca struktura HDR InfiniBand w centrum superkomputerowym działała na poziomie bliskim nasycenia. Przy ponad 2000 procesorów graficznych wykonujących równoległe zadania szkoleniowe AI, w operacjach komunikacji zbiorowej, takich jak all-reduce i all-to-all, występowały znaczne skoki opóźnień. Sieć stała się głównym wąskim gardłem, powodując przestoje procesora graficznego, marnujące zarówno zasoby obliczeniowe, jak i energię. Inżynierowie oszacowali, że podczas rozproszonych szkoleń na dużą skalę prawie 30% cykli obliczeniowych zostało utraconych z powodu narzutu komunikacyjnego.
Zespołowi potrzebny był przełącznik, który będzie w stanie to zapewnić400 Gb/s na port, natywna obsługa RDMA i przyspieszenie obliczeń w sieci — a wszystko to przy zachowaniu kompatybilności wstecznej z istniejącą infrastrukturą HDR. Po zapoznaniu się zArkusz danych MQM9790-NS2FISpecyfikacje MQM9790-NS2Fustalili, żePrzełącznik InfiniBand MQM9790-NS2Foferował idealną równowagę gęstości, wydajności i zestawu funkcji.
Rozwiązanie i wdrożenie: aktualizacja 64-portowej sieci szkieletowej NDR
Centrum rozmieściło czteryMQM9790-NS2F 64-portowy OSFP 400 Gb/s NDRprzełączniki w topologii typu „spine-leaf”, łączące 2048 procesorów graficznych w 64 węzłach obliczeniowych. Każdy węzeł łączy się za pomocą pojedynczego kabla rozdzielającego OSFP na 4x100 Gb/s, zapewniając łączną przepustowość 400 Gb/s na serwer przy jednoczesnej optymalizacji gęstości zarządzania kablami.
| Parametr wdrożenia | Konfiguracja |
|---|---|
| Zmień model | NVIDIA Mellanox MQM9790-NS2F(4 jednostki) |
| Konfiguracja portu | 64x OSFP, 400 Gb/s NDR na port |
| Całkowita liczba procesorów graficznych | 2048 (NVIDIA H100) |
| Funkcje sieciowe | SHARPv3, routing adaptacyjny, kontrola zatorów |
Kluczem do wdrożenia było zapewnienie pełnegoKompatybilny z MQM9790-NS2Fwspółpraca z istniejącymi adapterami punktów końcowych HDR. Automatyczna negocjacja prędkości i translacja warstwy łącza w przełączniku umożliwiły zastosowanie strategii migracji etapowej — starsze węzły działają z szybkościami HDR, podczas gdy nowe serwery obsługujące technologię NDR wykorzystują pełną przepustowość 400 Gb/s. Centrum wykorzystało także agregację wewnątrz sieci SHARPv3, redukując ruch typu „all-reduce” o ponad 65% w przypadku dużych wiadomości powszechnie spotykanych w szkoleniach LLM.
Dla osób oceniających podobne ulepszenia,Cena MQM9790-NS2Fzapytania iDo sprzedania MQM9790-NS2Fdostępność znacznie wzrosła wśród klientów korporacyjnych i badawczych. Konkurencyjny całkowity koszt posiadania przełącznika — biorąc pod uwagę mniejszą liczbę przełączników ze względu na gęstość 64 portów — czyni go atrakcyjną opcją zarówno w przypadku nowych konstrukcji, jak i projektów odświeżania.
Wyniki i korzyści: Wymierny wzrost wydajności
- Całkowicie zmniejsz opóźnienia (wiadomość 1 GB):Zmniejszono z 48 µs do 19 µs (poprawa o 60%)
- Efektywne wykorzystanie procesora graficznego:Zwiększono z 71% do 93% podczas treningu na dużą skalę
- Czas realizacji zadania (odpowiednik GPT-3 175B):Skrócone o 41%
- Opóźnienie ogona wywołane siecią (99. percentyl):Cięcie od 210 µs do poniżej 35 µs
jakoRozwiązanie przełącznika InfiniBand MQM9790-NS2Fwdrożenie pokazało, że struktury NDR 400 Gb/s mogą spełnić pokładane w nich teoretyczne nadzieje. Połączenie algorytmów kontroli przeciążenia i routingu adaptacyjnego wyeliminowało wzorce zapadania się „wbudowywanego”, które nękały poprzednią strukturę HDR podczas faz komunikacji typu „wszyscy do wszystkich”.
Podsumowanie i perspektywy: podstawa eksaskalowej sztucznej inteligencji
Sukces centrum superkomputerowego dziękiMQM9790-NS2Fprzyspieszyła realizację planu działania w kierunku eksaskalowych możliwości sztucznej inteligencji. Planują teraz drugą fazę, która podwoi liczbę GPU do 4096 przy użyciu dodatkowychMQM9790-NS2F 64-portowy OSFP 400 Gb/s NDRprzełączniki w trójwarstwowej topologii grubego drzewa. Funkcje telemetrii i zarządzania pozapasmowego przełącznika umożliwiły również zapobieganie przeciążeniom, zmniejszając obciążenie operacyjne zespołu sieciowego.
Dla architektów sieci i menedżerów IT oceniających struktury nowej generacjiNVIDIA Mellanox MQM9790-NS2Fstanowi dojrzałe, sprawdzone w produkcji rozwiązanie. Niezależnie od tego, czy budujesz nowy klaster badawczy AI, czy modernizujesz istniejący obiekt HPC, ten przełącznik zapewnia podstawę o niskim opóźnieniu i dużej przepustowości wymaganą w nowoczesnych, równoległych obciążeniach.

