Меню
Головна Блог компанії De Novo Світові ІТ-гіганти розробляють альтернативу NVLink
Світові ІТ-гіганти розробляють альтернативу NVLink

Світові ІТ-гіганти розробляють альтернативу NVLink

2024-06-27

Нещодавно низка найбільших світових ІТ-компаній, серед яких AMD, Broadcom, Cisco, Google, HPE, Intel, Meta, Microsoft повідомили про створення альянсу Ultra Accelerator Link, метою якого є розробка рішення для конкуренції з інтерконектом NVIDIA NVLink. Чи вдасться створити гідну альтернативу? 

ля ефективного тренування та експлуатації моделей машинного навчання, складних розрахунків та багатьох інших сучасних задач, пов'язаних з AI/ML, вкрай важливим компонентом є інтерконект — технологія зв'язку між обчислювальними вузлами. Якщо він не зможе забезпечувати достатню швидкість обміну даними, то продуктивність навіть найкращих GPU/TPU буде зведено нанівець.  

Тому, свого часу, компанія NVIDIA, у якості піонера на ринку GPU, подбала й про відповідний інтерконект, розробивши близько десяти років тому технологію NVLink для зв'язку окремих прискорювачів у загальну систему. Донедавна за допомогою цього інтерконекту можна було безпосередньо об'єднати GPU високошвидкісними каналами лише всередині одного сервера. Але у 2022 році компанія вивела на ринок, у складі комплексної архітектури Hopper, нову версію інтерфейсу — NVLink v 4.0, яка забезпечила низку суттєвих переваг. Головна з яких у тому, що тепер інтерконект не обмежений рамками сервера та може об'єднувати в загальну систему (домен) до 256 акселераторів, у тому числі із зовнішніх обчислювальних вузлів, на швидкості до 900 Гбайт/с (в обох напрямках). Це забезпечило не лише суттєвий приріст продуктивності на задачах AI/ML, але й призвело до різкого зростання попиту на рішення компанії, бо, скажімо, найсучасніша версія шини PCIe 6.0 на таке не здатна та й працює вона у рази повільніше (максимальна швидкість обміну даними — до 128 Гбайт/с). 

Зазначимо, доречі, що топові моделі прискорювачів NVIDIA H100 на базі архітектури Hopper доступні з хмари (GPU Cloud) De Novo — у складі сервісів Tensor Cloud, HTI та ML Cloud

Хай живе конкуренція? 

Звичайно, інші ІТ-гіганти не могли довго дивитися на успіх конкурента, проте відповідної технології, яка могла б стати гідною та, головне, масовою заміною NVLink зараз ні в кого немає. Наприклад у AMD є Infinity Fabric — фірмовий інтерконект на базі PCIe з піковою пропускною здатністю, майже як у NVLink v 4.0, але без можливості підключення зовнішніх вузлів. Поява перших комутаторів з перспективним інтерфейсом PCIe 7.0 та технологією Accelerated Fabric Link, які зможуть забезпечити одночасну роботу GPU з різних серверів, очікується не раніше 2025 року (зараз ще навіть не затверджено специфікацію). Водночас  сама NVIDIA вже випускає обладнання на базі NVLink v 5.0 з пропускною здатністю до 1,8 Тбайт/с і можливістю об'єднання до 576 прискорювачів. 

Тому низка найбільших ІТ-компаній вирішила об'єднати зусилля і розробити альтернативу NVLink, для чого, у травні цього року було створено тематичний альянс — Ultra Accelerator Link, до складу якого сьогодні входять AMD, Broadcom, Cisco, Google, HPE, Intel, Meta, Microsoft та інші. За заявами партнерів, перша версія нового інтерфейсу UALink, який зможе об'єднувати до 1024 GPU в одному домені (з можливістю прямого звернення до їхньої пам'яті), має з'явитися до кінця поточного року. 

Глибоких технічних подробиць майбутньої розробки допоки не наводять, але партнери наголошують на тому, що це буде «відкритий» стандарт, який зможуть використовувати різні виробники.  

Нагадаємо, що це вже не перша спроба найбільших ІТ-гравців сформувати технологічний альянс проти тих чи інших рішень NVIDIA — близько року тому AMD, Arista, Broadcom, Cisco, Atos, HPE, Intel, Meta та Microsoft створили консорціум Ultra Ethernet (сьогодні туди вже входить більш ніж півсотні компаній) для розробки альтернативи високошвидкісної мережевої технології InfiniBand, яку NVIDIA отримала в одноосібне розпорядження після поглинання Mellanox у 2019 році. Але, поки що, серійних продуктів на базі UEC також немає. 

Що ж, конкуренція — це майже завжди добре, особливо в технологічних галузях, але обладнання UALink та UEC ще треба дочекатися, тоді як рішення NVIDIA продовжують завойовувати нові ринкові сегменти. 

© 2008—2024 De Novo (Де Ново)