Китайский интеллект Atlas 950

Китайский телекоммуникационный гигант Huawei анонсировал создание компьютерного суперкластера Atlas 950 для искусственного интеллекта.

Новый кластер более чем на 520 тысяч чипов Huawei Ascend будет выведен на рынок в четвертом квартале 2026 года, заявил зампредседателя совета директоров компании Эрик Сюй на ежегодной конференции Huawei Connect в Шанхае.

Каждая система, из которых будет состоять кластер, будет в 6,7 раза мощнее системы Nvidia NVL144, запуск которой также запланирован на следующий год.

После запуска поточного производства чипов Ascend 910C в первом квартале вице-председатель Эрик Сюй заявил, что компания планирует выпустить в следующем году две версии Ascend 950, а затем Ascend 960 в 2027 году и Ascend 970 в 2028 году.

По его словам, чип Ascend 950 будет работать на базе собственной фирменной памяти компании с высокой пропускной способностью, что позволило преодолеть ключевое узкое место, с которым сталкивался Китай в этой технологии, поскольку на протяжении многих лет поставки ограничивались поставщиками из Южной Кореи и США.

Huawei также планирует развернуть новые вычислительные суперузлы под названием Atlas 950 и Atlas 960, которые Сюй назвал самыми мощными в мире, поддерживающими 8 192 и 15 488 процессоров Ascend соответственно.

По данным исследовательской группы SemiAnalysis, по некоторым показателям продукт Huawei превосходит модель GB200 NVL72 от Nvidia, в которой используется 72 процессора Nvidia B200.

Компания Huawei утверждает, что система использует архитектуру «суперузлов», которая позволяет чипам взаимодействовать на сверхвысоких скоростях.

В апреле 2025 года акции NVIDIA упали на 7% после запрета экспорта чипов H20 в Китай — эксперты оценили квартальные убытки в 5,5 миллиарда долларов. А после новостей о готовящемся к выпуску Huawei Ascend 910D стоимость акций NVIDIA ушла вниз еще на 5,6%.

Huawei, несмотря на жесткие санкции и ограниченный доступ к передовым технологиям, продолжает наращивать присутствие на рынке AI-ускорителей. Однако NVIDIA не хочет отдавать противнику весь Китай и модифицирует свои чипы, чтобы обойти запрет. Битва выходит далеко за рамки обычной корпоративной конкуренции — это геополитическое противостояние за контроль над технологиями, которые определяют будущее искусственного интеллекта.

В октябре 2022 года США ввели новые жесткие ограничения, запретив экспорт в Китай высокопроизводительных чипов NVIDIA A100 и H100 — основу для обучения крупных языковых моделей и других систем искусственного интеллекта. NVIDIA, не желая терять огромный китайский рынок, разработала специальные версии своих чипов (A800 и H800) с пониженными характеристиками, которые соответствовали экспортным требованиям США. Когда и эти модели попали под запрет, компания представила еще более урезанную версию (H20) специально для китайского рынка.

NVIDIA H20 выглядит вот так:

В апреле 2025 года администрация Трампа запретила экспорт даже этих ограниченных чипов H20. Компания была вынуждена списать 5,5 миллиарда долларов убытков за квартал и потенциально потеряла до 16 миллиардов годового дохода. А сейчас опять пытается искусственно ухудшить уже H20, чтобы обойти новые ограничения.

Но китайцы уже всё поняли — и это гогно им уже просто не нужно.

Huawei Ascend 910C представляет собой чиплетную архитектуру с 53 миллиардами транзисторов, которая произведена по 7-нм техпроцессу SMIC. Чип развивает производительность до 320 TFLOPS (некоторые источники утверждают — до 800 TFLOPS в FP16 в зависимости от конфигурации и до 1600 TOPS в INT8) для операций с 16-битной точностью (FP16) и 64 TFLOPS для FP64 при энергопотреблении около 310 ватт. В качестве памяти используются старые типы HBM2 или HBM2E.

Для сравнения: NVIDIA H100 построен на архитектуре Hopper, производится по 4-нм техпроцессу TSMC и содержит 80 миллиардов транзисторов. Он включает 640 тензорных ядер 4-го поколения и обеспечивает до 3958 TFLOPS в FP8 и 67 TFLOPS в FP64. H100 использует память HBM3 с объемом до 80–96 ГБ и пропускной способностью до 3,35 ТБ/с при TDP до 700 ватт.

Согласно тестам DeepSeek, Ascend 910C достигает примерно 60% производительности NVIDIA H100 в задачах инференса. Этот результат впечатляет, учитывая ограниченный доступ Huawei к передовым технологиям из-за санкций.

Несмотря на технологический разрыв, Ascend 910C добился значительного коммерческого успеха в Китае. Huawei планирует произвести более 100 000 единиц к концу 2025 года, а китайские технологические гиганты: ByteDance, Baidu, Alibaba, Tencent — активно внедряют эти чипы.

По данным TrendForce, интегрированная машина на базе чипов Ascend может сократить расходы на 60–70% по сравнению с решением на базе NVIDIA H100, что делает продукты Huawei привлекательными с точки зрения соотношения цены и производительности. Однако говорить о полном паритете пока рано: чип отстает по энергоэффективности (хотя уже и незначительно), имеет менее развитую программную экосистему и испытывает трудности с обучением крупных моделей. Тем не менее прогресс Huawei очевиден, а с учетом готовящихся к выпуску Ascend 910D и прочих Ascend конкуренция на рынке AI-чипов будет только усиливаться.

Компания Huawei понимает, что отстает от конкурента, и поэтому разработала уникальную стратегию конкуренции с NVIDIA — масштабирование через объединение большого количества процессоров в единую систему. Эта стратегия нашла воплощение в системе CloudMatrix 384, которая представляет собой ответ Китая на высокопроизводительные серверы NVIDIA.

CloudMatrix 384 (CM384) объединяет 384 чипа Ascend 910C в конфигурации «каждый с каждым» (all-to-all topology). Система размещается в 16 стойках, где 12 вычислительных стоек содержат по 32 процессора Ascend 910C каждая, а 4 сетевые стойки используются для высокоскоростного соединения с помощью оптических интерконнекторов 800G LPO. Совокупная пропускная способность оптической сети — более 5,5 петабита в секунду.

Такой подход позволил Huawei компенсировать технологическое отставание отдельных чипов за счет их количества. CloudMatrix 384 выдает 300 петафлопс вычислительной мощности BF16, что почти вдвое больше, чем у сервера NVIDIA GB200 NVL72. Более того, система содержит 49,2 ТБ памяти HBM, что в 3,6 раза больше, чем у GB200 NVL72 (13,8 ТБ), и обеспечивает пропускную способность памяти 1229 ТБ/с по сравнению с 576 ТБ/с у решения NVIDIA.

Решение от Хуавей, соотнесенное к единице вычислительной мощности в задачах ИИ, пока что получается примерно в 1.5 раза дороже, чем сервера от Нвидия. Это показывает, что основная цель Huawei — не ценовая выгодность решения, а создание независимого продукта, полностью разработанного за счет собственных ресурсов и способного конкурировать с западными альтернативами.

А теперь вспоминаем, что экспорт в Китай систем на NVIDIA A100 и H100 запрещен. Решение же на чипах NVIDIA H20 уже уступает решениям Huawei по всем параметрам, включая и цену. Но и NVIDIA H20 тоже запрещены. Так что конструкторы Хуавея пьют шампанское и смотрят в будущее с огромным оптимизмом — американцы сами, своими руками, отдали им рынок.

Уже есть примеры успешного преодоления программного барьера. Пресловутый DeepSeek поддерживает репозиторий PyTorch, который обеспечивает плавный переход от CUDA (програмной системы NVIDIA) к CANN (програмной системы Huawei), что упрощает использование оборудования Huawei. Кроме того, Huawei утверждает, что разработала инструмент для one-click conversion кода CUDA в код CANN с интеграцией PyTorch, эффективность которого составляет более 95%.

NVIDIA строила экосистему CUDA почти два десятилетия, но Huawei проходит аналогичный путь явно гораздо быстрее.

Текущая модель Ascend 910C обеспечивает около 60–70% производительности NVIDIA H100 при выполнении задач инференса, при этом сама по себе имеет преимущество в энергоэффективности: 310 Вт против 700 Вт у H100. Следующее поколение — Ascend 910D, образцы которого вышли в конце мая 2025 года, разрабатывается, чтобы достичь полной производительности H100 или даже превзойти ее.

Однако компания сталкивается с серьезными производственными проблемами: количество исправных чипов составляет лишь 40% от общего объема производства, хотя это на 20% лучше, чем годом ранее.

Еще более амбициозная разработка — Ascend 920, анонсированный в апреле 2025 года. Этот чип производится по 6-нм технологии и оптимизирован для моделей Mixture of Experts. Он запланирован к массовому производству в конце 2025 года.

Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Proper на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@newru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

Читайте также:

1 Комментарий
старые
новые
Isgirin
Isgirin
8 месяцев назад

Скоро школьникам чипы вшивать начнут, чтобы всё знали.

Чтобы добавить комментарий, надо залогиниться.