Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 w akcji: Optymalizacja połączeń o niskim opóźnieniu dla klastrów RDMA/HPC/AI

April 14, 2026

najnowsze wiadomości o firmie Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0 w akcji: Optymalizacja połączeń o niskim opóźnieniu dla klastrów RDMA/HPC/AI

W erze szkolenia modeli sztucznej inteligencji na dużą skalę i HPC na ekzaskalach opóźnienie sieci stało się najważniejszym wąskim gardłem ograniczającym skalowalność klastrów liniowych.,/Mellanox (NVIDIA Mellanox) 920-9B110-00FH-0D0InfiniBand Switch przekształca sposób projektowania przez instytucje badawcze i przedsiębiorstwa laboratoria AI swoich wysokiej wydajności tkanin.920-9B110-00FH-0D0zapewnia deterministyczną, ultra-niską opóźnienie dla obciążeń roboczych intensywnie wykorzystujących RDMA.

Temat i wyzwanie: Ściana komunikacji klastrów AI

Średnie ośrodki badawcze AI miały problemy z nieaktywnym działaniem GPU podczas rozproszonego szkolenia w 64 węzłach.W związku z powyższym należy zwrócić uwagę na fakt, żeArchitekci sieci potrzebowali rozwiązania bez strat, o wysokiej przepustowości, zdolnego do skalowania do 200Gb/s na port przy zachowaniu opóźnienia poniżej mikrosekundy.Po przeanalizowaniu dostępnych opcji zespół wybrał920-9B110-00FH-0D0 MQM8790-HS2Fjako podstawowy blok budowlany dla ich nowej topologii kręgosłupa.

Rozwiązanie i wdrożenie: Wdrożenie tkaniny InfiniBand

Rozmieszczenie koncentrowało się wokółNVIDIA Mellanox 920-9B110-00FH-0D0Każdy węzeł obliczeniowy był wyposażony w adaptery HDR ConnectX-6, łączące się z przełącznikami liścianymi za pomocą pasywnych kabli miedzianych.Kluczowe etapy wdrażania:

  • Alternatywa RDMA przez konwergencyjny Ethernet (RoCE):Native InfiniBand z sterowaniem zatłoczeniem opartym na sprzęcie całkowicie wyeliminował upadki pakietów.
  • Adaptacyjna trasa:W sprawie920-9B110-00FH-0D0 Rozwiązanie InfiniBand Switch OPNumożliwiono dynamiczne zrównoważenie obciążeń na wielu ścieżkach, zapobiegając tworzeniu się punktów gorących.
  • Zarządzanie tkaninami:Korzystanie z Subnet Manager (OpenSM) zSpecyfikacje 920-9B110-00FH-0D0Potwierdzenie wsparcia do 2000 węzłów w jednej tkaninie.

Przed udzieleniem zamówienia inżynierowie przeanalizowaliArtykuł 920-9B110-00FH-0D0W celu sprawdzenia zgodności z istniejącą optyką.920-9B110-00FH-0D0 zgodnyW tym celu wprowadzono nowe rozwiązania, które umożliwiłyby wdrożenie nowych technologii w dziedzinie rozwoju.920-9B110-00FH-0D0 cenaW tym samym czasie, w wyniku przeprowadzonych badań, można było stwierdzić, że urządzenia HDR są konkurencyjne w stosunku do alternatywnych przełączników HDR, a urządzenia te były łatwo dostępne (920-9B110-00FH-0D0 do sprzedaży) za pośrednictwem partnerów NVIDIA.

Wyniki i korzyści: mierzalne zyski z wyników

Telemetria po wdrożeniu wykazała znaczącą poprawę w trzech kluczowych wskaźnikach:

Metryczny Przed (100GbE) Po (920-9B110-00FH-0D0 HDR) Poprawa
Średnia opóźnienia All-Reduce (64 węzły) 340 μs 78 μs 77% redukcji
Czas bezczynności procesora graficznego (koszty komunikacyjne) 38% 11% 27% zysku bezwzględnego
Skuteczne wykorzystanie przepustowości tkanin 62% 94% +32%

Poza liczbami surowymi,920-9B110-00FH-0D0 InfiniBand Switch OPNUmożliwiło zespołowi skalowanie z 64 do 256 węzłów bez przeprojektowania tkaniny.Deterministyczne opóźnienie zapewnione przez kontrolę przepływu opartą na kredytach InfiniBand okazało się niezbędne do utrzymania spójności treningu w setkach procesorów graficznychInżynierowie wykorzystywali również920-9B110-00FH-0D0W celu wykrycia i usunięcia mikrowybuchów w czasie rzeczywistym.

Podsumowanie i perspektywy: Przyszłość połączeń międzyinteligentnych

Wdrożenie potwierdza, żeNVIDIA Mellanox 920-9B110-00FH-0D0Służy jako podstawowy element dla klastrów sztucznej inteligencji i HPC nowej generacji.organizacje mogą odzyskać do 30% obliczeń GPU wcześniej marnowanych na stoiskach komunikacyjnychW przypadku architektów planujących nową infrastrukturę sztucznej inteligencjiArtykuł 920-9B110-00FH-0D0zawiera szczegółowe wytyczne dotyczące topologii od małych klastrów DGX po wdrożenia na skalę superkomputerów.

W miarę ewolucji obciążeń roboczych w kierunku większego równoległości modelu i wyższej gęstości GPU,920-9B110-00FH-0D0 MQM8790-HS2FOferuje wyraźną ścieżkę modernizacji do przyszłych tkanin o prędkości 400 Gb/s poprzez swoją wsteczną kompatybilność.920-9B110-00FH-0D0 cenaw celu zwiększenia efektywności operacyjnej lub weryfikacji920-9B110-00FH-0D0 zgodnyOpcje okablowania, ten przełącznik InfiniBand zapewnia mierzalny ROI dla organizacji opartych na danych.