Сетевое. серверное и телекоммуникационное оборудование

8 800 600-81-40

Заказать звонок

Задать вопрос

server@tkasiatorg.ru почта для заявок

Екатеринбург, ул. Основинская, д. 10, офис 318 (БЦ "Основа")

Москва, Алтуфьевское шоссе, 48к2, офис 314 (БЦ "А-48")

China, Guangzhou, Room 1310, 13th Floor, Minggaocheng Office Building, No. 123 Yingbin Avenue, Huadu District

пн-пт: с 09:00 до 19:00
сб-вс: выходной день

8 800 600-81-40

Заказать звонок

Сравнение0

Сравнение0 Корзина 0

Контактная информация

server@tkasiatorg.ru почта для заявок

Сетевые коммутаторы для ИИ — практическое руководство по выбору

15 сентября 2025 14:44

Для устойчивой работы систем искусственного интеллекта решающим фактором становится сеть. Даже самые производительные GPU и CPU окажутся бесполезными, если передача данных даёт сбои или задержки. Задача не в том, чтобы взять самые быстрые порты, а в том, чтобы выстроить надёжную и масштабируемую инфраструктуру без потерь, подходящую под конкретный тип нагрузки — обучение, дообучение или инференс.

С чего начинать?

Прежде чем выбирать модели и скорости, ответьте на три базовых вопроса:

Профиль трафика. Обучение и дообучение — это преобладающий East-West (узел ↔ узел). Инференс — больше North-South (клиент ↔ узел). От этого зависит и скорость, и оверсабскрипция.
Горизонт роста. Что произойдёт за 12–18 месяцев: удвоение числа GPU, переход к распределённому обучению, появление параллельной ФС? Сеть должна масштабироваться без переделки архитектуры.
Площадка. Тепло и питание, глубина шасси, направление воздушного потока (F2B/B2F), кабель-менеджмент — эти «мелочи» быстро превращаются в стоп-факторы на высоких скоростях.

Скорости и топология

Компактные стойки (до 8–16 GPU).
Реалистичный выбор — 100–200 GbE на ToR. Можно стартовать без spine (прямая перемычка между двумя ToR), если заранее предусмотрен маршрут роста.

Средние кластеры (32–64 GPU).
Оптимальный уровень — 400 GbE на ToR и spine в двухуровневой схеме spine-leaf с ECMP. Это даёт предсказуемую полосу и простой масштаб.

Крупные проекты (128+ GPU).
Нужны 400/800 GbE на всех уровнях, иногда — трёхуровневый spine. Для обучения оверсабскрипция держится около 1:1…1:1.3; для инференса допускается выше, но считается по профилю запросов.

Что в свитче влияет на результат?

RoCE v2 как основа без потерь. Работает корректно только в связке ECN + DCQCN + PFC:
— ECN помечает перегрузку;
— DCQCN регулирует источники (отправителей);
— PFC даёт точечные паузы ровно на одном приоритете (и с watchdog, чтобы очереди не «залипали»).
Буферы и очереди. Нужен общий пул и VOQ (виртуальные выходные очереди), чтобы всплески не «раскачивали» задержку.
Латентность на хоп. Режим cut-through с детерминированной задержкой — то, что держит обучение «ровным».
PTP (IEEE 1588). Boundary/transparent clock дают единую шкалу времени для диагностики; без точного времени разбор инцидентов превращается в гадание.

Наблюдаемость и автоматизация. INT/IOAM, sFlow/ERSPAN, счётчики очередей и потерь, экспорт в систему мониторинга; OpenConfig/gNMI, ZTP.

Порты, оптика, кабели: единообразие — половина успеха

Внутри стойки используйте DAC/AOC, между стойками — оптику по дистанции (SR/DR/LR). Форм-факторы без сюрпризов: QSFP28 — 100G, QSFP56 — 200G, QSFP-DD/OSFP — 400G, OSFP — 800G. Чем меньше «зоопарка» модулей и ревизий, тем меньше «призрачных» потерь и флапов. Проверьте направление воздушного потока и запас по PSU: 400/800G-порты горячие.

Наша компания поставляет любое оборудование под ваши задачи напрямую из Китая. Организуем быструю доставку, поможем с подбором решений под конкретные требования и проконсультируем по всем вопросам.

Заполните форму ниже и мы свяжемся с вами, чтобы обсудить детали.

Три рабочих сценария: как это выглядит в реальности

1. Edge-инференс в филиалах

Локальные запросы рядом с источником данных, критична задержка, умеренный трафик.
Архитектура: ToR 100–200 GbE с RoCE; «без потерь» включён ровно для одного приоритета; два аплинка 25/100 GbE в ядро.
Что получаем: предсказуемый отклик, простое обслуживание, линейное масштабирование без переплаты за магистраль.

2. Дообучение средних моделей / распределённые пайплайны

Много East-West, синхронизация, регулярные чекпойнты.
Архитектура: ToR и spine на 400 GbE, ECMP; ECN+PFC настроены; сервисный трафик (управление, мониторинг, снапшоты) вынесен в отдельный QoS-класс/VRF.
Что получаем: ровный обмен между узлами, чекпойнты пишутся без «икоты», графики обучения не пляшут.

3. Смешанный HPC/AI (одна-две стойки)

GPU-обучение + параллельные вычисления + общая ФС.
Архитектура: spine-leaf 400/800 GbE; параллельная ФС (BeeGFS/DAOS) по выделенной линии 100/200 GbE на узел; управление — в собственном классе QoS.
Что получаем: нагрузочные профили не мешают друг другу, добавление узлов даёт предсказуемый прирост.

Частые ошибки — и как их не допускать

Включили PFC, забыли ECN/DCQCN → очереди «залипают».
Как правильно: сначала ECN/DCQCN, затем PFC на один класс + watchdog.
Поставили «кампусный» кремний с мелкими буферами → дрожит задержка.
Как правильно: свитчи с общим пулом буферов и VOQ, подтверждённой low-latency.
Намешали оптику/кабели/ревизии «что было» → флап-интерфейсы, фантомные потери.
Как правильно: единый список одобренных модулей и обязательные тест-линии до ввода.
Нет телеметрии → «всё хорошо, пока не упало».
Как правильно: включайте INT/IOAM, sFlow/ERSPAN, PTP, настраивайте алерты по очередям/потерям.

Как выбирать класс устройств: ориентиры без привязки к брендам

ToR 100/200G: 32–48 портов, глубокие буферы, PFC/ECN/DCBX, PTP-BC, предсказуемая латентность.
ToR 400G: 32×400G с возможностью разветвления (4×100G или 2×200G на порт), low-latency-кремний.
Spine 400/800G: неблокирующая матрица, высокая плотность портов, быстрый control-plane, ECMP.
NIC/SmartNIC: единый стек RoCE, при высоких шифровых/overlay-нагрузках DPU/SmartNIC разгружает CPU.

Основы

Целевые задержки для коллективных операций и для API-ответа (милисекунды, не «быстро/медленно»).
Допустимая оверсабскрипция на уровне leaf↔spine для вашего профиля (обучение/инференс).
Список классов трафика и политика QoS (какой поток действительно «lossless»).
Перечень оптики/кабелей по длинам и типам, с ревизиями и сертификацией.
Набор метрик для наблюдаемости: очереди/потери/ECN-метки/INT-телеметрия/синхронизация времени.
План обновлений (golden-image, staged-upgrade, резерв конфигов) и отката.

Итог

При проектировании сети для ИИ важно начинать с понимания задачи. Сначала определяется тип трафика (обучение или инференс), перспектива роста и ограничения площадки. От этого зависит выбор топологии и скоростей — от 100 до 800 GbE. Главное — предсказуемая работа без потерь. Для этого нужны правильные настройки RoCEv2 (ECN, DCQCN, PFC), свитчи с достаточными буферами и низкой задержкой, синхронизация времени и телеметрия. Единообразие в оптике и кабелях, чёткая политика QoS и план обновлений позволяют собрать сеть, которая будет масштабироваться без сюрпризов.

Азияторг поможет выстроить такую инфраструктуру: подберём коммутаторы, оптику, SmartNIC или DPU под конкретный профиль нагрузки и планы развития, а также обеспечим поставку с полным комплектом документов в согласованные сроки. Для консультации пишите на server@tkasiatorg.ru.

Назад к списку