Почему ИИ-серверы на NVIDIA GB300 и Vera Rubin в 2026 году резко подорожают — как к этому готовиться?
HBM4 и рост стоимости подсистемы памяти
Ключевым фактором подорожания серверов на базе графических процессоров R100 (Vera Rubin) стал переход на стандарт HBM4. В отличие от HBM3e, используемой в Blackwell, новая память требует 12- и 16-ярусных стеков с принципиально иной топологией соединений.
Сложность производства на заводах TSMC и ограниченные квоты SK Hynix и Samsung привели к тому, что в 2026 году стоимость модулей памяти в структуре сервера занимает почти половину себестоимости. При этом объем памяти в решениях класса GB300 вырос до 288 Гбайт и выше, что критично для моделей, ориентированных на «рассуждения» и работу с огромными контекстными окнами.
Суперчип и отказ от x86
В архитектуре Vera Rubin компания окончательно закрепляет доминирование собственных CPU. Связка из графического процессора Rubin (R100) и Arm-процессора Vera (преемник Grace) образует суперчип, где обмен данными идет через шину NVLink 6-го поколения.
Для покупателя это означает:
- Отсутствие альтернатив: Вы больше не можете сэкономить, выбрав классические x86-процессоры для высокопроизводительных узлов.
- Закрытая экосистема: Покупка системы подразумевает оплату всего проприетарного стека NVIDIA, включая интерконнект и специализированное ПО.
- Производительность: Скорость в вычислениях FP4 выросла в 1,5–2 раза относительно Blackwell, но цена за каждый терафлопс для конечного покупателя увеличилась из-за сложности упаковки чипов (CoWoS-L).
Тепловой барьер и стоимость стойки
Системы GB300 NVL72 и перспективные кластеры Rubin потребляют от 120 до 140 кВт на одну стойку. Это делает воздушное охлаждение бесполезным. В 2026 году жидкостное охлаждение (DLC) из опции превратилось в обязательное требование.
Rack Power: 120-140 kW (Minimum)
Cooling: Direct Liquid Cooling (DLC) with CDU
Manifold Type: In-rack manifold for 72 GPU nodes
Power Feed: 415V / 480V AC to Busway
Floor Loading: 1500+ kg/sq.m (due to liquid-filled racks)
Инвестиции в системы распределения хладагента (CDU), вторичные контуры и подготовку машзала теперь составляют до 25% от общей сметы проекта. Без этой подготовки запуск оборудования нового поколения невозможен: чипы R100 уходят в троттлинг за секунды при отказе помпы.
Сетевая фабрика 1.6T
Синхронизация работы сотен GPU в кластерах Vera Rubin DGX SuperPOD требует перехода на 1.6-терабитные сети. Использование адаптеров ConnectX-8 и коммутаторов Quantum-X1600 InfiniBand увеличило стоимость сетевой обвязки. В 2026 году цена одного порта с учетом трансиверов и активных оптических кабелей выросла на 40% по сравнению с эпохой H100/H200.
Как минимизировать риски при закупке
Сроки поставки на платформы GB300 и Rubin в начале 2026 года составляют 40–50 недель. Чтобы не попасть в ситуацию «пустых бюджетов», мы рекомендуем:
-
Резервировать квоты на уровне спецификаций за 9–10 месяцев до планируемого ввода в эксплуатацию.
-
Провести аудит энергоснабжения уже сейчас: подведение дополнительных 200–500 кВт к машзалу может занять больше времени, чем производство серверов.
-
Рассматривать гибридные схемы: Использование Blackwell Ultra для задач вывода (inference) и резервирование Vera Rubin только для обучения наиболее тяжелых моделей.

