NVIDIA Mellanox MCX653106A-HDAT w akcji: Transformacja niskolatencyjnej transmisji RDMA/RoCE i przepustowości serwera

March 17, 2026

najnowsze wiadomości o firmie NVIDIA Mellanox MCX653106A-HDAT w akcji: Transformacja niskolatencyjnej transmisji RDMA/RoCE i przepustowości serwera

W dobie analiz w czasie rzeczywistym i obciążeń opartych na sztucznej inteligencji centra danych znajdują się pod ciągłą presją, aby dostarczać więcej danych przy mniejszych opóźnieniach. Wiodący dostawca usług w chmurze stanął niedawno przed krytycznym wyzwaniem: jego rozproszony klaster pamięci masowej borykał się z obciążeniem procesora i wahaniami opóźnień powodowanymi przez tradycyjne protokoły TCP/IP. Aby efektywnie skalować swoją infrastrukturę, potrzebowali rozwiązania, które mogłoby odciążyć przetwarzanie sieciowe i umożliwić prawdziwe obejście jądra. Oto historia tego, jakMCX653106A-HDATstał się kamieniem węgielnym modernizacji ich infrastruktury.

Tło i wyzwanie: wąskie gardło protokołu TCP/IP

Obciążenia szkoleniowe firmy w zakresie obliczeń o wysokiej wydajności (HPC) i sztucznej inteligencji wymagały ogromnego przepływu danych między setkami węzłów. Jednakże istniejące karty sieciowe 25GbE zużywały do ​​30% rdzeni procesora wyłącznie na potrzeby zarządzania ruchem sieciowym. To nie tylko zwiększyło koszty operacyjne, ale także spowodowało nieprzewidywalne skoki opóźnień podczas szczytowych obciążeń. Zespół inżynierów zdał sobie sprawę, że aby osiągnąć pożądaną wydajność równoległego systemu plików, musi zastosować RDMA (Remote Direct Memory Access) przez konwergentną sieć Ethernet (RoCE). Poszukiwanie niezawodnego, wydajnego urządzeniaNVIDIA Mellanox MCX653106A-HDATrozpoczęło się rozwiązanie.

Rozwiązanie i wdrożenie: Integracja adaptera ConnectX-6

Po dokładnej ocenie dostępnego sprzętu zespół wybrałMCX653106A-HDAT Adapter ConnectX Karta sieciowa PCIe. Wdrożenie było ukierunkowane na węzły magazynowania i obliczeniowe w ich środowisku chmury prywatnej. Wykorzystując natywną obsługę RoCE karty, zespół skonfigurował bezstratną strukturę Ethernet przy użyciu kontroli przepływu priorytetów (PFC) i ulepszonego wyboru transmisji (ETS). Proces instalacji został usprawniony dzięki kompatybilności karty z PCIe 3.0/4.0, co umożliwiło bezproblemową integrację zarówno z nowymi, jak i istniejącymi serwerami.

TheKarta adaptera Ethernet MCX653106A-HDATzostał skonfigurowany do obsługi łączy 100 Gb/s, zapewniając natychmiastową poprawę przepustowości. Wykorzystując możliwości odciążania sprzętu architektury ConnectX-6, zespołowi udało się przenieść przetwarzanie sieciowe z procesora do samego adaptera. Aby zapewnić optymalną wydajność, inżynierowie szeroko odnieśli się doSpecyfikacje MCX653106A-HDAToraz przewodniki dostrajania umożliwiające dostrojenie rozmiarów buforów i ustawień moderacji przerwań, tworząc solidną podstawę dla ruchu RDMA.

Wyniki i korzyści: Odblokowanie prawdziwego potencjału wydajności

Wpływ wdrożeniaMCX653106A-HDATbyło natychmiastowe i przemieniające. Poniższa tabela ilustruje wzrost wydajności zaobserwowany w środowisku produkcyjnym po migracji do RDMA/RoCE:

Metryczny Przed wdrożeniem (TCP/IP) Po wdrożeniu (RoCE v2)
Średnie opóźnienie (IPC) 12 µs 2,1 µs
Wykorzystanie procesora (sieć) 28% 5%
Przepustowość na węzeł 18 Gb/s (efektywne) 98 Gb/s (szybkość łącza)

ZNVIDIA Mellanox MCX653106A-HDATwdrożone rozwiązanie rozproszonej pamięci masowej firmy spowodowało 6-krotne zmniejszenie opóźnień. Przełożyło się to bezpośrednio na szybsze punkty kontrolne modeli AI i płynniejszą analizę w czasie rzeczywistym. Zwolnione rdzenie procesora zostały ponownie przydzielone do obciążeń aplikacji, zwiększając ogólną wydajność klastra o ponad 20%. Dla menedżerów IT widoczność zapewniana przez zaawansowaną telemetrię adaptera znacznie zwiększyła dokładność planowania wydajności i analizy wąskich gardeł.

Patrząc w przyszłość: skalowalność i zabezpieczenie na przyszłość

Zachęcony sukcesem zespół inżynierów planuje obecnie rozszerzenie wdrożenia na swoje środowiska zwirtualizowane. TheKompatybilny z MCX653106A-HDATnatura z głównymi hypervisorami i obsługa SR-IOV czynią go idealnym kandydatem do architektur chmurowych z wieloma dzierżawcami. Gdy oceniają zakup dodatkowych jednostek,Cena MCX653106A-HDATnie jest postrzegane jako koszt, ale jako strategiczna inwestycja w wydajność. Zespół bada takżeRozwiązanie w postaci karty adaptera Ethernet MCX653106A-HDATdla wdrożeń NVMe-oF, mających na celu zbudowanie całkowicie zdezagregowanej struktury pamięci masowej.

To studium przypadku pokazuje, że w przypadku organizacji, które poważnie myślą o zmniejszeniu opóźnień i maksymalizacji przepustowości serwera,MCX653106A-HDATto coś więcej niż tylko karta sieciowa; jest to kluczowy czynnik umożliwiający infrastrukturę nowej generacji. Aby uzyskać szczegółowe diagramy architektury i zweryfikować własne wymagania systemowe, skontaktuj się z urzędnikiemArkusz danych MCX653106A-HDATzapewnia całą niezbędną głębię techniczną.