Консорциум UALink официально представил альтернативу NVLink для ИИ-ускорителей
2025-05-20
Технологический консорциум UALink представил первую спецификацию открытого стандарта высокоскоростных соединения между AI-ускорителями UALink 200G 1.0. Решение предлагается в качестве альтернативы закрытой архитектуре Nvidia NVLink, которая доминирует сегодня в данном сегменте.
Группа ведущих технологических компаний, включая таких гигантов как AMD, Intel, Google и Microsoft, Apple, Astera Labs, AWS, Cisco, Hewlett Packard Enterprise, Meta, Microsoft и другие объединились в консорциум UALink для разработки открытого стандарта высокоскоростных соединений для AI-кластеров. Произошло это еще в прошлом году, но лишь весной 2025 была представлена первая спецификация новой технологии, которая получила название UALink 200G 1.0. Технология подразумевает соединения до 1024 ускорителей в одном AI-кластере (против 576 у NVLink 5/6), обеспечивая пропускную способность до 800 Гбит/с на GPU/TPU.

Разработка позиционируется как более доступная и открытая альтернатива решению NVIDIA NVLink, и основана на архитектурных принципах AMD Infinity Fabric с дополнениями от других участников консорциума. UALink предназначен для создания масштабируемых ИИ- и HPC-кластеров без привязки к поставщику. Стандарт предполагает возможность объединения различных ускорителей и GPU в единую сеть с совместным доступом к памяти. Основное внимание в версии 1.0 уделено низкой задержке, высокой скорости обмена и поддержке операций, необходимых для распределенных вычислений.
Сетевая архитектура построена по коммутируемому принципу: базовая пропускная способность составляет 200 Гбит/с на линию, при возможности увеличения до 800 Гбит/с при использовании четырёх линий на одно устройство. При этом заявлены задержки на уровне менее 100 нс от порта к порту и 100–150 нс на уровне коммутатора, что соответствует скорости PCIe-коммутации, но с более низким энергопотреблением — на уровне 30–50% от аналогичных Ethernet-решений. Стандарт предусматривает совместимость с Ethernet-средой (включая Ultra Ethernet) для связи между хостами, в то время как ускорители могут взаимодействовать напрямую через UALink или через коммутируемую топологию.

На физическом уровне используется стандарт IEEE 802.3dj с поддержкой 200GBASE-KR1/CR1, 400GBASE-KR2/CR2 и 800GBASE-KR4/CR4. Поддерживаются существующие Ethernet-ретаймеры. Передача данных осуществляется словами по 680 байт, включающими полезную нагрузку (640 байт) и служебную информацию (40 байт) для коррекции ошибок (FEC) и кодирования 256B/257B. Хотя поддерживается доступ к удалённой памяти, когерентность между устройствами реализована лишь на уровне программного стека. Проект уже движется к следующему этапу — разработке спецификации на базе технологий 400G.

По словам главы альянса, Кёртиса Боумена, первые аппаратные решения на основе UALink 200G могут появиться примерно через полтора года. Правда, вряд ли NVIDIA все это время будет стоять на месте и, очевидно, компания представит новые, более производительные и энергоэффективные варианты NVLink, особенно учитывая тот факт, что данный бизнес является очень прибыльным для компании — в прошлом году сетевое подразделение NVIDIA заработало $13 млрд. Так что продвинуть альтернативу здесь будет очень непросто.