Rozwiązanie techniczne: Osiągnięcie niskich opóźnień i optymalizacji przepustowości RDMA/RoCE dzięki Mellanox

March 13, 2026

Rozwiązanie techniczne: Osiągnięcie niskich opóźnień i optymalizacji przepustowości RDMA/RoCE dzięki Mellanox
1Analiza tła i potrzeb projektu

Nowoczesne centra danych są pod ciągłą presją, aby zapewnić wyższą wydajność dla aplikacji wrażliwych na opóźnienie, takich jak rozproszone bazy danych, obliczenia wysokiej wydajności (HPC),i klastry szkoleniowe w zakresie sztucznej inteligencjiTradycyjne sieci TCP/IP nakładają znaczne koszty na procesor, tworząc wąskie gardła, które ograniczają skalowalność aplikacji i zwiększają czas reakcji.Dla organizacji chcących zmodernizować swoją infrastrukturę, podstawowy wymóg jest jasny: zmniejszenie opóźnienia i zwiększenie przepustowości serwera bez kosztownych remontów architektonicznych.

Rozwiązanie polega na przyjęciu RDMA (Remote Direct Memory Access) przez Converged Ethernet (RoCE).omijanie jądra systemu operacyjnego, aby uwolnić zasoby procesora i zminimalizować opóźnienieW centrum tej transformacji znajduje się karta interfejsu sieciowego (NIC).MCX631432AN-ADABOd Mellanox (NVIDIA) jest specjalnie zaprojektowany, aby sprostać tym wymaganiom, zapewniając solidną podstawę dla tkanin umożliwiających RoCE.

2Ogólne projektowanie architektury sieci i systemu

Zaproponowana architektura jest strukturą leaf-spine zaprojektowaną do bezstratnego środowiska Ethernet, co jest warunkiem wstępnym optymalnej wydajności RoCEv2.Konstrukcja integruje ruch obliczeniowy i pamięci masowej, wysokiej prędkości tkaniny w celu zmniejszenia złożoności i kosztów.

  • Warstwa kręgosłupaWysokiej wydajności przełączniki 100GbE zapewniają łączność bez blokowania między wszystkimi przełącznikami liści, zapewniając każdą ścieżkę o niskim opóźnieniu.
  • Warstwa liści:Przełączniki "Top-of-Rack" (ToR) z 25GbE łączy się z serwerami i węzłami pamięci masowej.Przełączniki te są skonfigurowane z Priority Flow Control (PFC) i Explicit Congestion Notification (ECN) w celu utrzymania tkanki bez strat.
  • Poziom serwera:Każdy serwer jest wyposażony wNVIDIA Mellanox MCX631432AN-ADAB, dwu-port 25GbE SFP28 adapter. Umożliwia to połączenie sieciowe lub oddzielne ścieżki dla przechowywania i ruchu obliczeniowego.

Takie zaprojektowanie zapewnia, żeKarta adaptera Ethernet MCX631432AN-ADABdziała w środowisku, w którym ruch RoCE może przepływać bez utraty pakietów, co jest kluczowe dla utrzymania wysokiej przepustowości i niskiego opóźnienia.

3. Rola MCX631432AN-ADAB w rozwiązaniu

W sprawieMCX631432AN-ADABJest to kluczowy punkt końcowy umożliwiający rozwiązanie. Jako członek rodziny ConnectX-6 Lx, przynosi funkcje klasy korporacyjnej do 25GbE.Rozwiązanie karty adaptera Ethernet MCX631432AN-ADABzarówno w przypadku ruchu obliczeniowego, jak i przechowywania danych, obniżenie obciążenia zadań sieciowych z procesora serwera.

Kluczowe wkłady techniczne adaptera obejmują:

  • Wyładowanie sprzętu:Karta obsługuje wszystkie aspekty protokołu RoCE w sprzęcie, w tym transport, enkapsulację i kontrolę zatłoczenia.
  • Elastyczność podwójnego portu:Podwójne porty 25GbE mogą być skonfigurowane do aktywnego / gotowego failu lub wykorzystywane do oddzielenia typów ruchu.jeden port może obsługiwać ruch Ethernet z przodu, podczas gdy drugi jest przeznaczony do ruchu pamięci masowej z tyłu przy użyciu RoCE, maksymalnie zwiększając przepustowość i bezpieczeństwo.
  • PCIe 3.0 x16 Host Interface:Z wystarczającą szerokością pasma do uruchomienia obu portów 25GbE jednocześnie,MCX631432AN-ADAB ConnectX-6 Lx podwójny port 25GbE SFP28zapewnia, aby wewnętrzne wąskie gardła nie ograniczały wydajności aplikacji.
4Zalecenia dotyczące wdrożenia i skalowania

WdrażanieMCX631432AN-ADABNastępujące kroki przedstawiają typowe wdrożenie klastra o wysokiej wydajności:

  • Przygotowanie tkaniny:Przed wdrożeniem należy skonfigurować przełączniki sieciowe w celu obsługi RoCE.To tworzy środowisko bez strat wymagane dla adaptera do optymalnego działania.
  • Instalacja sterownika i oprogramowania:W celu zapewnienia pełnego wsparcia funkcji należy zainstalować najnowsze sterowniki NVIDIA WinOF-2 (dla systemu Windows) lub MLNX_OFED (dla systemu Linux).MCX631432AN-ADABjest aktualny w celu zapewnienia optymalnej wydajności RoCE i zgodności.
  • Skalowanie klastra:Architektura skaluje się poziomo poprzez dodanie większej liczby węzłów serwerowych, z których każdy ma własny MCX631432AN-ADAB.Niezablokowanie tkaniny liści-kręgosłupa zapewnia, że dodane węzły nie pogarszają wydajności dla istniejącychW przypadku większych wdrożeń można używać grup agregacji linków (LAG) między przełącznikami liści i kręgosłupa.

Typowa topologia klastra bazy danych polega na podłączeniu serwerów podstawowych i replikacji do tego samego przełącznika, aby zminimalizować opóźnienie między rackami.Każdy serwer korzysta z adaptera podwójnego portu do podłączenia do dwóch oddzielnych przełączników liści do redundancji.

5. Monitoring operacyjny, rozwiązywanie problemów i optymalizacja

Po wdrożeniu utrzymanie wydajności wymaga proaktywnego monitorowania i dostosowywania.MCX631432AN-ADABzapewnia w tym celu kompleksową telemetrię.

  • Podstawowe wskaźniki monitorowania:Wykorzystanie narzędzi takich jak `mlxstat` i `ethtool` w celu monitorowania liczników portów, błędów łącza i statystyk ruchu RDMA.wysoka liczba wskazuje na tkaninę z stratami, która obniży wydajność RoCE.
  • Aktualizacje oprogramowania i sterowników:Regularnie sprawdzaj aktualizacje. Nowe oprogramowanie stałe często zawiera optymalizacje wydajności i poprawki błędów, które mogą jeszcze bardziej zmniejszyć opóźnienie i poprawić kompatybilność ze przełącznikami górnymi.
  • Dostrajanie wydajności:W środowiskach o najbardziej wymagających wymaganiach dotyczących opóźnienia, precyzyjne dostosowanie moderacji przerwy i rozmiarów buforów może przynosić stopniowe zyski.Elastyczność adaptera umożliwia architektom ustawianie ustawień na podstawie ich konkretnego obciążenia pracą (np.HPC vs. wirtualizacja).

W celu rozwiązywania problemów związanych z łącznością należy sprawdzić, czy moduły SFP28 sąKompatybilny z MCX631432AN-ADABWykorzystanie optyki zgodnej z normami NVIDIA zapewnia niezawodne ustanowienie i wydajność połączenia.

6Podsumowanie i ocena wartości

W sprawieMCX631432AN-ADABOd Mellanox (NVIDIA) zapewnia jasną i skuteczną ścieżkę do wdrożenia wysokiej wydajności, niskiego opóźnienia tkanki sieciowej.organizacje mogą osiągnąć podwójne korzyści z drastycznie zmniejszonego kosztów CPU i znacznie zwiększonego przepustowości serwera. SzczegółoweSpecyfikacje MCX631432AN-ADABa takżeArkusz danych MCX631432AN-ADABpotwierdzenie zdolności do obsługi najbardziej wymagających obciążeń pracą.

Dla menedżerów IT i architektów sieci oceniających aktualizację sprzętu, zyski wydajności oferowane przez to rozwiązanie przekładają się bezpośrednio na wartość biznesową: szybsze przetwarzanie transakcji,skuteczniejszy dostęp do magazynówW związku z dalszym wzrostem zapotrzebowania na dane, wdrażanieMCX631432AN-ADABW celu uzyskania szczegółowych informacji dotyczących cen lub w celu sprawdzenia, czy infrastruktura sieci jest zgodna z wymogami określonymi wCena MCX631432AN-ADABi dostępności, prosimy o konsultację z przedstawicielem NVIDIA.