
Список графических процессоров AMD для искусственного интеллекта
OLEKSANDR SYZOVДелиться
Список графических процессоров AMD для искусственного интеллекта
Серия графических ускорителей AMD Instinct специально разработана для высокопроизводительных вычислений (HPC) и рабочих нагрузок искусственного интеллекта (ИИ), от крупномасштабного обучения моделей до эффективного вывода. Они используют архитектуру CDNA AMD, которая оптимизирована для вычислений, а не для традиционного графического рендеринга.
Вот список известных ускорителей AMD Instinct для ИИ с их основными техническими характеристиками:
1. Серия AMD Instinct MI300 (архитектура CDNA 3)
Серия MI300 представляет собой новейшее поколение ускорителей AMD, отличающееся дизайном чиплета и объединением возможностей CPU и GPU в некоторых моделях. Они созданы для самых требовательных задач ИИ и HPC.
- AMD Instinct MI325X (ГП)
- Архитектура: CDNA 3
- Вычислительные блоки GPU: 304 CU
- Потоковые процессоры: 19 456
- Объем памяти: 256 ГБ HBM3E
- Пропускная способность памяти: 6 ТБ/с
- Пиковая производительность матрицы FP64/FP32: 163,4 TFLOPS
- Пиковая производительность FP16/BF16: 1307,4 терафлопс
- Пиковая производительность FP8: 2614,9 TFLOPS
- Интерфейс шины: PCIe Gen5 x16
- Ссылки Infinity Fabric™: 8
- Максимальный TDP/TBP: 1000 Вт
- Предназначено для: генеративного ИИ (особенно больших языковых моделей), крупномасштабных высокопроизводительных вычислений, вывода ИИ, требующего огромного объема памяти и пропускной способности.
- AMD Instinct MI300X (ГП)
- Архитектура: CDNA 3
- Вычислительные блоки GPU: 304 CU
- Потоковые процессоры: 19 456
- Объем памяти: 192 ГБ HBM3
- Пропускная способность памяти: 5,3 ТБ/с
- Пиковая производительность матрицы FP64/FP32: 122,6 TFLOPS
- Пиковая производительность FP16/BF16: 980,6 TFLOPS
- Пиковая производительность FP8: 1961,2 терафлопс
- Интерфейс шины: PCIe Gen5 x16 (обычно через модуль OAM)
- Ссылки Infinity Fabric™: 8
- Максимальный TDP/TBP: 750 Вт
- Назначение: генеративный ИИ, масштабное обучение и вывод ИИ, высокопроизводительные вычисления.
- AMD Instinct MI300A (APU — ускоренный процессор)
- Архитектура: CDNA 3 (GPU) + Zen 4 (CPU)
- Ядра ЦП: 24 ядра ЦП "Zen 4" x86
- Вычислительные блоки GPU: 228 CU
- Потоковые процессоры: 14 592
- Объем памяти: 128 ГБ Unified HBM3
- Пропускная способность памяти: 5,3 ТБ/с
- Пиковая производительность матрицы FP64/FP32: 122,6 TFLOPS
- Пиковая производительность FP16/BF16: 980,6 TFLOPS
- Пиковая производительность FP8: 1961,2 терафлопс
- Интерфейс шины: PCIe Gen5 x16 (разъем APU SH5)
- Ссылки Infinity Fabric™: 8
- Максимальный TDP/TBP: 550 Вт/760 Вт (пиковый)
- Предназначено для: рабочих нагрузок HPC, которые выигрывают от тесной интеграции ЦП и ГП, унифицированной памяти и высокой пропускной способности; также подходит для некоторых задач ИИ, где взаимодействие ЦП имеет решающее значение.
2. Серия AMD Instinct MI200 (архитектура CDNA 2)
Ускорители серии MI200 обеспечили значительный скачок производительности для высокопроизводительных вычислений и искусственного интеллекта, особенно для рабочих нагрузок с двойной точностью.
- AMD Instinct MI250X (ГП)
- Архитектура: CDNA 2
- Вычислительные единицы: 220 CU
- Потоковые процессоры: 14 080
- Объем памяти: 128 ГБ HBM2e
- Пропускная способность памяти: до 3,2 ТБ/с
- Пиковая производительность матрицы FP64: 95,7 TFLOPS
- Пиковая производительность FP16/BF16: 383 TFLOPS
- Пиковая производительность INT8: 383 TOPS
- Интерфейс шины: PCIe 4.0 x16
- Ссылки Infinity Fabric™: до 8
- Назначение: высокопроизводительные вычисления сверхвысокой производительности, масштабное обучение искусственного интеллекта, научное моделирование.
- AMD Instinct MI210 (ГП)
- Архитектура: CDNA 2
- Вычислительные единицы: 104 CU
- Потоковые процессоры: 6656
- Объем памяти: 64 ГБ HBM2e
- Пропускная способность памяти: до 1,6 ТБ/с
- Пиковая производительность матрицы FP64: 45,3 TFLOPS
- Пиковая производительность FP16/BF16: 181 TFLOPS
- Пиковая производительность INT8: 181 TOPS
- Интерфейс шины: PCIe 4.0 x16
- Ссылки Infinity Fabric™: 3
- Назначение: массовые высокопроизводительные вычисления, обучение и вывод ИИ в форм-факторах PCIe, исследования и научные открытия.
3. AMD Instinct MI100 (архитектура CDNA 1)
MI100 стал первым ускорителем AMD на базе архитектуры CDNA, в котором реализованы новые матричные ядра для повышения производительности ИИ.
- AMD Instinct MI100 (ГП)
- Архитектура: CDNA 1
- Вычислительные единицы: 120 CU
- Потоковые процессоры: 7680
- Объем памяти: 32 ГБ HBM2
- Пропускная способность памяти: до 1,2 ТБ/с
- Пиковая производительность FP64: 11,5 TFLOPS
- Пиковая производительность матрицы FP32: 46,1 TFLOPS
- Пиковая производительность FP16: 184,6 терафлопс
- Пиковая производительность BF16: 92,3 терафлопс
- Интерфейс шины: PCIe 4.0 x16
- Ссылки Infinity Fabric™: 3
- Предназначено для: рабочих нагрузок HPC, обучения ИИ, глубокого обучения и научных приложений.
4. Старые ускорители Instinct (архитектура GCN)
Хотя эти старые модели и не так распространены для новых развертываний ИИ, они заложили основу для серии AMD Instinct.
- AMD Radeon Instinct MI60 (ГП)
- Архитектура: Vega 20 (GCN 5.1)
- Потоковые процессоры: 4608
- Объем памяти: 32 ГБ HBM2
- Пропускная способность памяти: до 1 ТБ/с
- Пиковая производительность FP64: до 7,4 TFLOPS
- Пиковая производительность FP32: до 14,8 TFLOPS
- Интерфейс шины: PCIe 4.0 x16
- Предназначено для: ранних рабочих нагрузок HPC и ИИ, облачных вычислений и рендеринга.
- AMD Radeon Instinct MI25 (ГП)
- Архитектура: Vega 10 (GCN 5.0)
- Потоковые процессоры: 4096
- Объем памяти: 16 ГБ HBM2
- Пропускная способность памяти: 436,2 ГБ/с
- Пиковая производительность FP32: 12,29 TFLOPS
- Пиковая производительность FP16: 24,58 TFLOPS
- Интерфейс шины: PCIe 3.0 x16
- Предназначено для: ранних приложений ИИ и HPC в центрах обработки данных.
Ключевые технологии AMD для ИИ:
- Архитектура CDNA: оптимизированная для вычислений архитектура AMD для графических процессоров центров обработки данных, разработанная специально для рабочих нагрузок HPC и ИИ.
- ROCm (Radeon Open Compute platform): программная платформа с открытым исходным кодом, которая предоставляет полный программный стек для программирования GPU, позволяя разработчикам использовать ускорители AMD Instinct для ИИ и HPC. Она разработана как гибкая альтернатива CUDA.
- Infinity Fabric™: технология межсоединений AMD с высокой пропускной способностью и малой задержкой, которая обеспечивает прямую связь между графическими процессорами и центральными процессорами, что имеет решающее значение для масштабирования производительности в системах с несколькими ускорителями.
- HBM (память с высокой пропускной способностью): интегрированная непосредственно в корпус графического процессора, HBM обеспечивает значительно более высокую пропускную способность памяти по сравнению с традиционной памятью GDDR, что имеет решающее значение для рабочих нагрузок ИИ, связанных с памятью.
AMD постоянно совершенствует свою линейку продуктов Instinct, чтобы конкурировать на быстро меняющемся рынке аппаратного обеспечения для ИИ, уделяя особое внимание объему памяти, пропускной способности и открытым программным решениям.
Получите доступ к официальным серверам DELL PowerEdge R760 в Украине.
Безкоштовная консультация по телефону +38 (067) 819 38 38
Доступные модели серверов на складе в Киеве:
Сервер Dell PowerEdge R760 - Intel Xeon Silver 4510 2.4-4.1Ghz 12 ядер
Сервер Dell PowerEdge R760 - Intel Xeon Silver 4514Y 2.0-3.4Ghz 16 Cores
Сервер Dell PowerEdge R760 — Intel Xeon Gold 6526Y 2,8–3,9 ГГц, 16 ядер
Сервер Dell PowerEdge R760 — Intel Xeon Gold 5420+ 2,0–4,1 ГГц, 28 ядер