NVIDIA ConnectX-8 — это сверхсетевой адаптер SuperNIC

NVIDIA подробно описала свою сетевую карту ConnectX-8 следующего поколения для систем Blackwell, которая, по ее словам, настолько продвинута, что ее можно называть SuperNIC.

Сетевая карта NVIDIA ConnectX-8 SuperNIC разработана для новейших систем Blackwell и обеспечивает скорость до 800 гигабит/сек

По данным NVIDIA, обучение ИИ и вывод ИИ — это две разные рабочие нагрузки, требующие взаимозаменяемой сквозной сетевой политики. Вывод — это дезагрегированная, разрозненная рабочая нагрузка, чувствительная к задержкам и требующая значительного взаимодействия с внешним миром, тогда как обучение — это синхронизированная, длительная рабочая нагрузка, где задержка в конце влияет на эффективность, и интерфейс с внешним миром минимален.

Сетевая карта ConnectX-8, как упоминалось выше, называется SuperNIC и поддерживается как в Spectrum-X Ethernet, так и в Quantum-X Infiniband.

Ниже приведены некоторые основные моменты этого NIC:

  • Технология RDMA развернута на миллионах графических процессоров
  • Аппаратный конвейер 800G RDMA, разработанный для обеспечения пропускной способности, задержки и масштабируемости ИИ
  • Интегрированная балансировка нагрузки, контроль перегрузки и надежность
  • Глубокое программирование каналов передачи данных для рабочих нагрузок ИИ и универсальности центра обработки данных
  • Тесная интеграция с архитектурой системы
  • Безопасность корпоративного класса

Что касается технических характеристик, ConnectX-8 800G SuperNIC совместим с API Verbs, NCCL, NIXL, DOCA и оснащён интегрированным интерфейсом Ethernet Spectrum-X Ethernet 800 Гбит/с Infiniband XDR или 2x400G Ethernet с поддержкой до 8 портов. В качестве интерфейса ввода-вывода используется PCIe Gen6 с 48 линиями, доступными через встроенный коммутатор PCIe.

NVIDIA заявляет, что ConnectX-8 RDMA обеспечивает неограниченное масштабирование на скорости 800G при различных размерах сообщений (от 64 КБ до 1 МБ). SuperNIC — это не просто сетевая карта, а микросхема ASIC, которая соединяет графический процессор с другими кластерами.

Сетевая карта впервые внедряется в новейших системах NVIDIA Blackwell GB300 NVL72. Они основаны на графическом процессоре Blackwell Ultra, о котором было подробно рассказано вчера. Коммутатор CX8 PCIe обеспечивает более высокую экономию полосы пропускания NVLINK C2C и QoS между сетевыми подключениями.

Каждый коммутатор CX8 PCIe (два на плате NVL72) имеет линии Gen5 x16 для центрального процессора Grace и линии Gen6 x16 для графического процессора Blackwell Ultra; твердотельный накопитель также оснащен линией PCIe Gen5 x4.

NVIDIA также демонстрирует, как ConnectX-8 масштабируется на 64 графических процессорах:

Поскольку сегодня искусственный интеллект (ИИ) — это прежде всего масштабируемость, NVIDIA разработала интегрированный Ethernet-коммутатор Spectrum-X ConnectX-8, который является расширением инфраструктуры Ethernet-коммутаторов Spectrum-X и обеспечивает балансировку нагрузки и контроль перегрузок с помощью функций коммутатора. ConnectX-8 RDMA позволяет масштабировать традиционные службы ОС для сетей ИИ, а пакетный процессор ConnectX-8 обеспечивает защиту и маршрутизацию фабрик ИИ.

Для обеспечения эффективной работы сети ConnectX-8 включает в себя ускоритель передачи данных (Data Path Accelerator) — 16-транзакционный процессор событий RISC-V. Благодаря всем этим технологиям и интеграции на аппаратном уровне, Spectrum-X Ethernet обеспечивает на 60% меньшее время этапа обучения и практически нулевую задержку на концевом участке под нагрузкой по сравнению с сетевым адаптером/коммутатором OTS RDMA.

Рассмотрев некоторые показатели производительности Spectrum-X, предоставленные NVIDIA, мы получаем:

  • Эффективная пропускная способность в 1,6 раза выше (балансировка нагрузки)
  • В 1,3 раза выше общая пропускная способность (хвостовая задержка)
  • В 2,2 раза выше пропускная способность всех шумоподавляющих каналов (шумоизоляция)
  • В 1,3 раза выше общая пропускная способность (устойчивая производительность)
  • Сбор телеметрических данных в 1000 раз быстрее (высокочастотная телеметрия)

Spectrum-X и ConnectX-8 SuperNIC обеспечивают поддержку 800G и PCIe Gen6. Компания уже внедряет решения с этими технологиями в системы Blackwell, поэтому в ближайшие месяцы ожидается появление дополнительных подробностей.

Оставьте комментарий