Intel представила ускорители вычислений Data Center GPU Max — они до 2,4 раза быстрее NVIDIA A100

Компания Intel анонсировала ускорители вычислений на графических процессорах Data Center GPU Max. Ранее они были известны под кодовым именем Ponte Vecchio, однако теперь стали официальной частью продуктов серии Intel Max, в которую помимо них также вошли под именем Xeon Max серверные процессоры Xeon Sapphire Rapids с набортной памятью HBM2e, о которых говорилось ранее.

Источник изображений: Intel

В рамках презентации на мероприятии SC22, посвящённой серверным технологиям и ИИ, Intel поделилась данными о производительности своих новинок. В состав ускорителя Intel Data Center GPU Max входят 128 ядер Xe и 128 RT-ядер, что делает их единственными серверными ускорителями с нативной поддержкой аппаратного ускорения трассировки лучей. Компания также заявляет для них до 64 Мбайт кеш-памяти L1 и до 408 Мбайт кеш-памяти L2.

Графические процессоры Intel Data Center GPU Max объединяют на одной подложке 100 млн транзисторов в составе 47 чиплетов, построенных с использованием разных технологических процессов (Intel 7, TSMC N5 и TSMC N7), которые соединяются между собой интерфейсами EMIB и технологией упаковки Foveros.

Серверные ускорители вычислений Intel Data Center GPU Max будут доступны в различных форм-факторах, предназначенных под разные задачи. Решения в виде карт-расширения PCI Express выйдут в рамках серии Max 1100 и предложат TDP 300 Вт, 56 ядер Xe и 48 Гбайт памяти HBM2e. Посредством специальных мостов Intel Xe Link в кластер можно будет объединить до четырёх таких ускорителей.

Ускорители Max 1350 будут выпускаться в виде OAM-модулей с TDP 450 Вт. Они получат 112 ядер Xe и 96 Гбайт памяти HBM2e. Самые мощные решения в виде OAM-модулей Max 1550 будут обладать TDP 600 Вт и получат 128 ядер Xe, а также 128 Гбайт памяти HBM2e.

Компания отмечает, что архитектура Xe-HPC новых ускорителей вычислений позволяет объединить до восьми модулей OAM. Intel предоставила данные о следующих конфигурациях:

  • Один OAM-модуль: 128 Гбайт HBM2e, 128 ядер Xe, TDP 600 Вт, производительность 52 Тфлопс, пропускная способность памяти 3,2 Тбайт/с;
  • Два OAM-модуля: 256 Гбайт HBM2e, 256 ядер Xe, TDP 1200 Вт, производительность 104 Тфлопс, пропускная способность памяти 6,4 Тбайт/с;
  • Четыре OAM-модуля: 512 Гбайт HBM2e, 512 ядер Xe, TDP 2400 Вт, производительность 208 Тфлопс, пропускная способность памяти 12,8 Тбайт/с.

Производитель заявляет, что каждый OAM-модуль до двух раз быстрее одного ускорителя вычислений NVIDIA A100 в задачах ExaSMR OpenMC и miniBUDE. Производительность в задачах ExaSMR NekRS у Data Center GPU Max в 1,5 раза выше конкурента.


В Riskfuel ускорители Intel Data Center GPU Max обеспечивают в 2,4 раза более высокую производительность на фоне конкурентного решения.

Intel также напомнила, что наследником Ponte Vecchio станут ускорители вычислений Rialto Bridge. Они получил до 160 ядер Xe и новый форм-фактор OAM 2.0, который допускает энергопотребление на уровне 800 Вт.