В Китае представили ускоритель вычислений Biren BR100, который превосходит NVIDIA Ampere A100
Китайская компания Biren Technology представила графический процессор BR100, обеспечивающий производительность до 1024 Тфлопс в 16-битных операциях с плавающей точкой и до 2048 Тфлопс в 8-битных целочисленных операциях. Решение предназначено для использования в составе специализированных высокопроизводительных вычислительных систем (HPC).
Графический процессор BR100 — это флагманское решение компании, использующее 7-нм техпроцесс производства и технологию 2,5D-упаковки CoWoS компании TSMC. Чип использует архитектуру BiLiren и имеет на борту 77 млрд транзисторов.
Решения на его основе могут предложить до 64 Гбайт высокоскоростной памяти HBM2e с максимальной пропускной способностью на уровне 2,3 Тбайт/с, а также 300 Мбайт выделенной кеш-памяти. Для GPGPU заявляется поддержка интерфейсов PCIe 5.0 и CXL.
Производительность BR100 выше, чем у NVIDIA Ampere A100, но примерно в 2,0–2,5 раз ниже, чем у решений на базе архитектуры NVIDIA Hopper. Максимальное превосходство над NVIDIA Ampere заявляется при работе с 32-битными числами с плавающей точкой — в этом случае BR100 может предложить производительность на уровне 256 Тфлопс против 19,5 Тфлопс у решения NVIDIA.
Помимо BR100 китайская компания представила также графический чип BR104. Он предлагает урезанные вдвое характеристики и примерно вдвое меньшую по сравнению с BR100 производительность, и может использоваться в составе карт расширения формата PCIe с показателем энергопотребления до 300 Вт.
Для своих продуктов Biren Technology также представила программную платформу BIRENSUPA. Она поддерживает различные популярные фреймворки для машинного обучения, например, PaddlePaddle от Baidu.