Сетевое. серверное и телекоммуникационное оборудование

8 800 600-81-40

Заказать звонок

Задать вопрос

server@tkasiatorg.ru почта для заявок

Екатеринбург, ул. Основинская, д. 10, офис 318 (БЦ "Основа")

Москва, Алтуфьевское шоссе, 48к2, офис 314 (БЦ "А-48")

China, Guangzhou, Room 1310, 13th Floor, Minggaocheng Office Building, No. 123 Yingbin Avenue, Huadu District

пн-пт: с 09:00 до 19:00
сб-вс: выходной день

8 800 600-81-40

Заказать звонок

Сравнение0

Сравнение0 Корзина 0

Контактная информация

server@tkasiatorg.ru почта для заявок

Как запустить ИИ-модели на серверах с процессорами Loongson

24 апреля 2026 13:24

Российский рынок серверных процессоров оказался в нестандартной ситуации. Intel и AMD закрыли официальные поставки. Параллельный импорт работает, но создаёт юридические и операционные риски для государственных структур и крупных компаний. В этих условиях китайская архитектура Loongson и построенные на ней серверы превращаются из экзотики в реальный вариант для рассмотрения.

Разберём, что это за платформа, на что способна и как на ней запускать ИИ-нагрузки.

Что такое Loongson и LoongArch

Loongson Technology - китайская компания, которая разрабатывает процессоры с начала 2000-х годов. Изначально архитектура базировалась на MIPS, но в 2021 году компания представила полностью собственную архитектуру LoongArch.

Независимые эксперты, изучившие архитектуру, подтвердили, что LoongArch не является копией или производной от ARM, x86, MIPS, RISC-V или POWER. Собственный формат инструкций, уникальные режимы адресации, своя система кодирования. Для Китая это вопрос технологического суверенитета - создать процессорную архитектуру, которая не зависит от американских лицензий.

Актуальное поколение ядер LA664, которое используется в серверных процессорах Loongson 3C6000. Поддерживает многопоточность, 128-битные векторные инструкции LSX и 256-битные инструкции LASX - последние важны для ускорения матричных операций, которые лежат в основе ИИ-нагрузок.

Связь с российским рынком

В декабре 2025 года компания «Трамплин Электроникс» представила серверный процессор «Иртыш» на основе ядер Loongson LA664. Линейка включает модели с 16, 32 и 64 ядрами - старшая версия C664 работает на частоте до 2,1 ГГц с кэшем L3 объёмом 64 МБ.

Процессор лицензирован с правом внесения изменений в архитектуру - разработчики воспользовались этим и добавили поддержку российских криптографических алгоритмов. Целевой объём производства в первый год - 30 000 единиц, первые серверные системы на базе «Иртыша» от нескольких производителей появились в начале 2026 года.

Архитектуру LoongArch уже поддерживают «Базальт СПО», «Норси-Транс» и «Аскон» - это означает, что базовый стек корпоративного ПО для работы есть.

Где платформа сильна, а где есть ограничения

Сильные стороны платформы: полная независимость от американских лицензий, отсутствие рисков удалённой блокировки, поддержка стандартных интерфейсов PCIe Gen 4 и DDR4, совместимость с Linux-экосистемой. Для задач инференса (запуска уже обученных ИИ-моделей) платформа вполне пригодна.

Ограничения тоже реальны. Программная база значительно уже, чем у x86. Большинство ИИ-фреймворков оптимизированы под x86 с AVX-512 или под GPU с CUDA. На LoongArch они работают, но без аппаратной оптимизации под конкретные инструкции производительность ниже. Обучение больших моделей на CPU-кластере из Loongson практически нецелесообразно - это задача для GPU.

Как запустить ИИ-модели на Loongson: практический подход

Ключевой инструмент для запуска ИИ-моделей на CPU - llama.cpp. Это открытый движок на C/C++, который изначально создавался именно для работы на CPU без GPU. Он поддерживает формат GGUF с квантизацией, имеет встроенный сервер с OpenAI-совместимым API и автоматически определяет доступные инструкции процессора для оптимизации.

Для LoongArch ключевые векторные расширения - LSX (128-бит) и LASX (256-бит). Поддержка LoongArch в llama.cpp появилась, и при сборке проекта из исходников под эту архитектуру движок использует доступные векторные инструкции для ускорения матричных операций. Это не уровень AVX-512 на современном Xeon, но заметно быстрее базового скалярного исполнения.

Практический порядок запуска:

Шаг 1. Установить Linux-дистрибутив с поддержкой LoongArch. «Базальт СПО» поставляет сертифицированные дистрибутивы с поддержкой этой архитектуры.

Шаг 2. Собрать llama.cpp из исходников с флагами оптимизации под LoongArch. При сборке движок автоматически определяет доступные расширения LSX/LASX и включает соответствующие пути исполнения.

Шаг 3. Выбрать модель подходящего размера. На сервере с 64 ядрами и 128-256 ГБ ОЗУ реально работают модели 7-13 млрд параметров в формате Q4_K_M. Скорость инференса будет ниже, чем на GPU, но достаточна для корпоративных задач: документооборот, классификация, суммаризация, ответы на вопросы по базе знаний.

Шаг 4. Запустить встроенный сервер llama.cpp с OpenAI-совместимым API. Это позволяет подключать к модели любые приложения, написанные под стандартный OpenAI API, без изменения кода.

Альтернативные подходы

Помимо llama.cpp есть несколько вариантов.

ONNX Runtime поддерживает работу на CPU с различными архитектурами через общий интерфейс. Модели, конвертированные в формат ONNX, запускаются без переработки кода под конкретную платформу.

PyTorch с CPU-бэкендом работает на LoongArch через стандартную сборку под Linux. Производительность ниже, чем на x86 с оптимизированными библиотеками MKL, но для инференса небольших моделей приемлема.

Добавление GPU к системе. Ничто не мешает установить в сервер на Loongson дискретную видеокарту - через слот PCIe. Китайские GPU Biren или Moore Threads, а также NVIDIA через параллельный импорт, разгружают CPU и переносят тяжёлые вычисления на ускоритель. В этом сценарии Loongson выступает host-процессором, а GPU берёт на себя ИИ-нагрузку.

Для каких задач это имеет смысл

Loongson в связке с llama.cpp или ONNX Runtime закрывает конкретные корпоративные сценарии:

Локальный ИИ-ассистент для работы с внутренними документами без выхода данных в облако
Классификация и маршрутизация входящих запросов
Суммаризация технической документации
OCR и извлечение структурированных данных из неструктурированного текста
Встроенная аналитика в изолированных системах с требованиями к информационной безопасности

Последний пункт особенно актуален: сервер на российско-китайской архитектуре без американских компонентов в сертифицированном контуре - это конкретное конкурентное преимущество при работе с госсектором.

Если рассматриваете серверы на базе Loongson или ищете китайское серверное оборудование для задач локального ИИ, то специалисты Азияторг помогут. Мы подберем конфигурацию и организуем поставку. Для заявки пишите нам на server@tkasiatorg.ru или оставьте запрос на сайте.

Назад к списку