Przełącznik InfiniBand Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 w produkcji

April 15, 2026

najnowsze wiadomości o firmie Przełącznik InfiniBand Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 w produkcji
Temat i wyzwanie: Ściana skalowalności w klastrach szkoleniowych AI

Wiodący wschodnioazjatycki instytut badawczy sztucznej inteligencji stanął przed wspólnym, ale krytycznym wąskim gardłem.W związku z zmniejszeniem liczby miejsc pracyPrzyczyną była tradycyjna tkanina Ethernet o prędkości 100 Gb/s, w której koszty TCP/IP i utrata pakietów podczas incastów powodowały czasy bezczynności GPU do 35%.tkanina o ultra niskim opóźnieniu, która może obsługiwać RDMA i skalować się do tysięcy węzłów, nie naruszając deterministycznej wydajnościPo przeanalizowaniu kilku rozwiązań wybranoMellanox (NVIDIA Mellanox)Przełącznik InfiniBand jako rdzeń ich nowej architektury.

Rozwiązanie i wdrożenie: Integracja 920-9B210-00FN-0D0 do tkaniny NDR

Rozmieszczenie koncentrowało się wokół920-9B210-00FN-0D0jako warstwa kręgosłupa, z 32 przełącznikami liści łączącymi 512 GPU NVIDIA A100 za pośrednictwem adapterów ConnectX-7.920-9B210-00FN-0D0 MQM9790-NS2FSzybkość przesyłania danych przez urządzenie HDR jest równoznaczna z prędkością przesyłania danych przez urządzenie HDR, które zapewnia 400Gb/s na port, podwajając przepustowość poprzednich rozwiązań HDR przy jednoczesnym utrzymaniu opóźnienia przesyłania poniżej mikrosekundy.920-9B210-00FN-0D0 InfiniBand Switch OPNInżynierowie sieci wykorzystali szczegółowe informacje dotyczące systemów sieciowych, które zostały opracowane w celu zapewnienia zgodności firmware z systemami sieciowymi.Artykuł 920-9B210-00FN-0D0a takżeSpecyfikacje 920-9B210-00FN-0D0W celu zweryfikowania wymogów energetycznych i termicznych, umożliwiając płynną integrację z istniejącymi stojakami 19".920-9B210-00FN-0D0 zgodnyzarówno z istniejącą infrastrukturą HDR, jak i nowszymi punktami końcowymi NDR, umożliwiając stopniową migrację.

Wyniki wyników i korzyści operacyjne
  • Zwiększenie efektywności RDMA:ZNVIDIA Mellanox 920-9B210-00FN-0D0Wraz z wprowadzeniem technologii GDR, która umożliwiła sterowanie zatłoczeniami na bazie sprzętu, opóźnienie zapisu RDMA spadło z 12 μs do 1,2 μs.
  • Zwiększenie szybkości aplikacji HPC:Kluczowy kod modelowania pogody (oparty na MPI) odnotował 2,7 razy większą poprawę wydajności ze względu na adaptacyjne sterowanie przełącznika i zbiorowe obciążenia SHARP v2.
  • Wykonanie szkoleń na sztucznej inteligencji:W przypadku 175 miliardów parametrów pracy szkoleniowej LLM, nowa tkanina skróciła czas całkowitego redukcji o 68%, poprawiając ogólne wykorzystanie GPU z 62% do 91%.
  • Uproszczenie operacyjne:W sprawie920-9B210-00FN-0D0 Rozwiązanie InfiniBand Switch OPNZintegrowane z platformą NVIDIA UFM, zapewniając telemetrię w czasie rzeczywistym i ostrzeżenia predykcyjne o awariach.
Wgląd w koszty i dostępność

Przy ocenie projektu instytut badawczy porównał wyniki badań z920-9B210-00FN-0D0 cenaPomimo wyższych kosztów wstępnych, całkowity koszt posiadania (TCO) faworyzował InfiniBand ze względu na wyższe wykorzystanie GPU i niższą moc na Gb / s.Jednostki są łatwo dostępne jako920-9B210-00FN-0D0 do sprzedażyW celu uzyskania informacji na temat możliwości wykorzystania urządzeń NDR w systemie NVIDIA, należy przeprowadzić przegląd danych NVIDIA w celu uzyskania informacji na temat możliwości wykorzystania urządzeń NDR w systemie NVIDIA.Specyfikacje 920-9B210-00FN-0D0potwierdził również wsparcie dla nadmiernego zasilania i wentylatorów do wymiany na gorąco, spełniając wymagania w zakresie niezawodności Instytutu w zakresie badań nad sztuczną inteligencją 24/7.

Główne specyfikacje techniczne na pierwszy rzut oka
Parametry Szczegóły
Model NVIDIA Mellanox 920-9B210-00FN-0D0
Prędkość w porcie 400Gb/s NDR (na port)
OPN bazy 920-9B210-00FN-0D0 InfiniBand Switch OPN
Pełna konfiguracja 920-9B210-00FN-0D0 MQM9790-NS2F
Podsumowanie i perspektywy: Standard dla tkanin sztucznej inteligencji nowej generacji

Instytut Badań nad Sztuczną Inteligencją (AI Research Institute) zstandaryzował920-9B210-00FN-0D0W tym przypadku, w przypadku, w którym wprowadzono nowe rozwiązania, w przypadku, gdy wprowadzono nowe rozwiązania, w przypadku, gdy wprowadzono nowe rozwiązania, w przypadku, gdy wprowadzono nowe rozwiązania, w przypadku, gdy wprowadzono nowe rozwiązania.NVIDIA Mellanox 920-9B210-00FN-0D0jest to nie tylko przełącznik, jest to podstawowy komponent do osiągnięcia liniowej skalowalności wydajności w środowiskach AI i HPC./920-9B210-00FN-0D0 Rozwiązanie InfiniBand Switch OPNoferuje sprawdzoną, gotową do produkcji drogę naprzód.