Серверы на платформе CXL 3.0 - как меняется работа с памятью
Серверная архитектура десятилетиями строилась по одному принципу: у каждого сервера своя память, жёстко привязанная к его процессорам. Нужно больше памяти - добавляй слоты DIMM в конкретный узел. Нет слотов - покупай новый сервер.
Простая логика, но с ней связаны три хронические проблемы: память простаивает на одних узлах, пока другим её катастрофически не хватает; масштабирование дорогое и негибкое; большие ИИ-модели не помещаются в память одного узла.
CXL 3.0 - стандарт Compute Express Link третьего поколения - меняет эту логику фундаментально.
Что такое CXL и зачем он появился
CXL - это высокоскоростной интерфейс для связи процессора с памятью, ускорителями и другими устройствами. Строится поверх физического уровня PCIe, но использует собственные протоколы с поддержкой когерентности кэша - то есть несколько процессоров могут работать с одной областью памяти без конфликтов и без специального программного обеспечения для синхронизации.
Первые версии стандарта (CXL 1.0 и 2.0) появились в 2019-2020 годах и решали более простые задачи: подключение внешних модулей памяти к одному хосту, базовое разделение ресурсов. CXL 2.0 впервые ввёл понятие memory pooling - общего пула памяти, из которого несколько серверов могут динамически выделять себе ресурсы.
CXL 3.0 пошёл дальше. Скорость выросла до 64 GT/s, что обеспечивает полосу пропускания порядка 256 ГБ/с на линк. Главное - появилась поддержка fabric-топологий, где не два-три узла делят память, а целые стойки серверов работают как единая вычислительная среда с общей памятью.
Как работает memory pooling на практике
Представьте стойку серверов, к которой подключены отдельные модули памяти через CXL-коммутатор. Каждый сервер в этой стойке может запросить у коммутатора нужный объём памяти из общего пула и получить его с задержкой, сопоставимой с локальной DRAM.
Ресурсы перераспределяются динамически. Сервер под высокой нагрузкой получает больше памяти, простаивающий узел освобождает свою аллокацию обратно в пул. Это происходит без остановки сервисов, без перезагрузки, без ручного вмешательства администратора.
Для ИИ-нагрузок это особенно значимо. Большие языковые модели при инференсе с длинным контекстом генерируют огромный KV-кэш - данные, которые нужно удерживать в памяти на протяжении всего сеанса. Модель с 70 млрд параметров при контексте 128К требует 150+ ГБ только для KV-кэша. Это не помещается в GPU даже топового класса. CXL позволяет вынести KV-кэш в пул оперативной памяти, сохранив активные веса модели в быстрой GPU-памяти.
Что изменилось в CXL 3.0 по сравнению с предыдущими версиями
Три ключевых отличия третьего поколения.
Fabric-топология вместо точка-точка. CXL 1.x и 2.0 предполагали прямое соединение между хостом и устройством. CXL 3.0 вводит многоуровневую коммутацию: несколько CXL-коммутаторов можно объединить в сеть, через которую любой хост получает доступ к любому пулу памяти в стойке или даже в нескольких стойках.
Когерентность памяти между несколькими хостами. В CXL 2.0 когерентность поддерживалась только между одним хостом и подключёнными к нему устройствами. CXL 3.0 расширяет это до нескольких хостов: два разных сервера могут работать с одной областью памяти, и стандарт гарантирует согласованность данных на уровне кэша. Это открывает возможности для новых классов распределённых приложений без дополнительных программных уровней синхронизации.
Масштабируемость до стойкового уровня. CXL 3.0 позволяет строить общую память на уровне всей стойки - десятков узлов с доступом к единому пространству памяти. Именно это описывается как unified AI fabric: стойка серверов работает как одна большая машина с общей памятью.
Кто уже производит оборудование для CXL 3.0
Экосистема оборудования активно формируется.
Astera Labs выпускает CXL Smart Memory Controllers серии Leo - контроллеры, управляющие пулами памяти и оптимизируют доступ для ИИ-нагрузок. По данным демонстраций на OCP Global Summit 2025, решение позволяет запускать в три раза больше одновременных экземпляров LLM с более низкой задержкой.
Samsung и SK Hynix поставляют CXL DRAM-модули, специально разработанные для подключения через CXL-интерфейс. SK Hynix демонстрировала систему, где несколько серверов и GPU объединены через CXL-память без традиционных сетевых средств.
Microsoft в ноябре 2025 года запустила первые облачные инстансы с поддержкой CXL-памяти в промышленной эксплуатации - первый случай коммерческого использования технологии в крупном публичном облаке.
Gigabyte активно разрабатывает серверные платформы с нативной поддержкой CXL 3.0 и позиционирует их для ИИ-инфраструктуры.
Китайские производители в целом движутся в ту же сторону: серверные платформы с поддержкой PCIe 5.0 и CXL 2.0/3.0 постепенно становятся стандартом для оборудования нового поколения.
Что это означает для закупки серверов в 2026 году
Несколько практических выводов для тех, кто сейчас проектирует инфраструктуру или планирует закупку.
CXL 3.0 - это не то, что нужно срочно внедрять везде. Технология реальная и рабочая, но в 2026 году она находится на ранней стадии коммерческого распространения. Для стандартных рабочих нагрузок традиционная архитектура с локальной памятью работает хорошо.
Имеет смысл смотреть туда при ИИ-нагрузках с большими моделями. Инференс больших LLM, рекомендательные системы с огромными объёмами данных, базы данных в памяти - сценарии, где CXL даёт измеримый выигрыш уже сейчас.
При закупке серверов стоит проверять поддержку CXL. Платформы на Intel Xeon 6 и AMD EPYC 9005 поддерживают CXL 2.0 нативно, часть моделей - CXL 3.0. Если инфраструктура будет расширяться в сторону ИИ, закупка платформы с поддержкой CXL сейчас избавит от необходимости замены оборудования через два года.
Память и вычисления начинают разделяться. CXL меняет экономику закупки: не обязательно покупать сервер с максимальным объёмом памяти - достаточно взять базовую конфигурацию с возможностью подключения к пулу. Это снижает стоимость входа и даёт гибкость при масштабировании.
Если сейчас проектируете серверную инфраструктуру или выбираете платформы с поддержкой CXL - специалисты Азияторг помогут подобрать актуальное оборудование с нужными характеристиками и организуют поставку. Пишите на server@tkasiatorg.ru.

