List of GPUs AMD for Artificial Intelligence

Список графических процессоров AMD для искусственного интеллекта

OLEKSANDR SYZOV

Список графических процессоров AMD для искусственного интеллекта

Серия графических ускорителей AMD Instinct специально разработана для высокопроизводительных вычислений (HPC) и рабочих нагрузок искусственного интеллекта (ИИ), от крупномасштабного обучения моделей до эффективного вывода. Они используют архитектуру CDNA AMD, которая оптимизирована для вычислений, а не для традиционного графического рендеринга.

Вот список известных ускорителей AMD Instinct для ИИ с их основными техническими характеристиками:

1. Серия AMD Instinct MI300 (архитектура CDNA 3)

Серия MI300 представляет собой новейшее поколение ускорителей AMD, отличающееся дизайном чиплета и объединением возможностей CPU и GPU в некоторых моделях. Они созданы для самых требовательных задач ИИ и HPC.

  • AMD Instinct MI325X (ГП)
    • Архитектура: CDNA 3
    • Вычислительные блоки GPU: 304 CU
    • Потоковые процессоры: 19 456
    • Объем памяти: 256 ГБ HBM3E
    • Пропускная способность памяти: 6 ТБ/с
    • Пиковая производительность матрицы FP64/FP32: 163,4 TFLOPS
    • Пиковая производительность FP16/BF16: 1307,4 терафлопс
    • Пиковая производительность FP8: 2614,9 TFLOPS
    • Интерфейс шины: PCIe Gen5 x16
    • Ссылки Infinity Fabric™: 8
    • Максимальный TDP/TBP: 1000 Вт
    • Предназначено для: генеративного ИИ (особенно больших языковых моделей), крупномасштабных высокопроизводительных вычислений, вывода ИИ, требующего огромного объема памяти и пропускной способности.
  • AMD Instinct MI300X (ГП)
    • Архитектура: CDNA 3
    • Вычислительные блоки GPU: 304 CU
    • Потоковые процессоры: 19 456
    • Объем памяти: 192 ГБ HBM3
    • Пропускная способность памяти: 5,3 ТБ/с
    • Пиковая производительность матрицы FP64/FP32: 122,6 TFLOPS
    • Пиковая производительность FP16/BF16: 980,6 TFLOPS
    • Пиковая производительность FP8: 1961,2 терафлопс
    • Интерфейс шины: PCIe Gen5 x16 (обычно через модуль OAM)
    • Ссылки Infinity Fabric™: 8
    • Максимальный TDP/TBP: 750 Вт
    • Назначение: генеративный ИИ, масштабное обучение и вывод ИИ, высокопроизводительные вычисления.
  • AMD Instinct MI300A (APU — ускоренный процессор)
    • Архитектура: CDNA 3 (GPU) + Zen 4 (CPU)
    • Ядра ЦП: 24 ядра ЦП "Zen 4" x86
    • Вычислительные блоки GPU: 228 CU
    • Потоковые процессоры: 14 592
    • Объем памяти: 128 ГБ Unified HBM3
    • Пропускная способность памяти: 5,3 ТБ/с
    • Пиковая производительность матрицы FP64/FP32: 122,6 TFLOPS
    • Пиковая производительность FP16/BF16: 980,6 TFLOPS
    • Пиковая производительность FP8: 1961,2 терафлопс
    • Интерфейс шины: PCIe Gen5 x16 (разъем APU SH5)
    • Ссылки Infinity Fabric™: 8
    • Максимальный TDP/TBP: 550 Вт/760 Вт (пиковый)
    • Предназначено для: рабочих нагрузок HPC, которые выигрывают от тесной интеграции ЦП и ГП, унифицированной памяти и высокой пропускной способности; также подходит для некоторых задач ИИ, где взаимодействие ЦП имеет решающее значение.

2. Серия AMD Instinct MI200 (архитектура CDNA 2)

Ускорители серии MI200 обеспечили значительный скачок производительности для высокопроизводительных вычислений и искусственного интеллекта, особенно для рабочих нагрузок с двойной точностью.

  • AMD Instinct MI250X (ГП)
    • Архитектура: CDNA 2
    • Вычислительные единицы: 220 CU
    • Потоковые процессоры: 14 080
    • Объем памяти: 128 ГБ HBM2e
    • Пропускная способность памяти: до 3,2 ТБ/с
    • Пиковая производительность матрицы FP64: 95,7 TFLOPS
    • Пиковая производительность FP16/BF16: 383 TFLOPS
    • Пиковая производительность INT8: 383 TOPS
    • Интерфейс шины: PCIe 4.0 x16
    • Ссылки Infinity Fabric™: до 8
    • Назначение: высокопроизводительные вычисления сверхвысокой производительности, масштабное обучение искусственного интеллекта, научное моделирование.
  • AMD Instinct MI210 (ГП)
    • Архитектура: CDNA 2
    • Вычислительные единицы: 104 CU
    • Потоковые процессоры: 6656
    • Объем памяти: 64 ГБ HBM2e
    • Пропускная способность памяти: до 1,6 ТБ/с
    • Пиковая производительность матрицы FP64: 45,3 TFLOPS
    • Пиковая производительность FP16/BF16: 181 TFLOPS
    • Пиковая производительность INT8: 181 TOPS
    • Интерфейс шины: PCIe 4.0 x16
    • Ссылки Infinity Fabric™: 3
    • Назначение: массовые высокопроизводительные вычисления, обучение и вывод ИИ в форм-факторах PCIe, исследования и научные открытия.

3. AMD Instinct MI100 (архитектура CDNA 1)

MI100 стал первым ускорителем AMD на базе архитектуры CDNA, в котором реализованы новые матричные ядра для повышения производительности ИИ.

  • AMD Instinct MI100 (ГП)
    • Архитектура: CDNA 1
    • Вычислительные единицы: 120 CU
    • Потоковые процессоры: 7680
    • Объем памяти: 32 ГБ HBM2
    • Пропускная способность памяти: до 1,2 ТБ/с
    • Пиковая производительность FP64: 11,5 TFLOPS
    • Пиковая производительность матрицы FP32: 46,1 TFLOPS
    • Пиковая производительность FP16: 184,6 терафлопс
    • Пиковая производительность BF16: 92,3 терафлопс
    • Интерфейс шины: PCIe 4.0 x16
    • Ссылки Infinity Fabric™: 3
    • Предназначено для: рабочих нагрузок HPC, обучения ИИ, глубокого обучения и научных приложений.

4. Старые ускорители Instinct (архитектура GCN)

Хотя эти старые модели и не так распространены для новых развертываний ИИ, они заложили основу для серии AMD Instinct.

  • AMD Radeon Instinct MI60 (ГП)
    • Архитектура: Vega 20 (GCN 5.1)
    • Потоковые процессоры: 4608
    • Объем памяти: 32 ГБ HBM2
    • Пропускная способность памяти: до 1 ТБ/с
    • Пиковая производительность FP64: до 7,4 TFLOPS
    • Пиковая производительность FP32: до 14,8 TFLOPS
    • Интерфейс шины: PCIe 4.0 x16
    • Предназначено для: ранних рабочих нагрузок HPC и ИИ, облачных вычислений и рендеринга.
  • AMD Radeon Instinct MI25 (ГП)
    • Архитектура: Vega 10 (GCN 5.0)
    • Потоковые процессоры: 4096
    • Объем памяти: 16 ГБ HBM2
    • Пропускная способность памяти: 436,2 ГБ/с
    • Пиковая производительность FP32: 12,29 TFLOPS
    • Пиковая производительность FP16: 24,58 TFLOPS
    • Интерфейс шины: PCIe 3.0 x16
    • Предназначено для: ранних приложений ИИ и HPC в центрах обработки данных.

Ключевые технологии AMD для ИИ:

  • Архитектура CDNA: оптимизированная для вычислений архитектура AMD для графических процессоров центров обработки данных, разработанная специально для рабочих нагрузок HPC и ИИ.
  • ROCm (Radeon Open Compute platform): программная платформа с открытым исходным кодом, которая предоставляет полный программный стек для программирования GPU, позволяя разработчикам использовать ускорители AMD Instinct для ИИ и HPC. Она разработана как гибкая альтернатива CUDA.
  • Infinity Fabric™: технология межсоединений AMD с высокой пропускной способностью и малой задержкой, которая обеспечивает прямую связь между графическими процессорами и центральными процессорами, что имеет решающее значение для масштабирования производительности в системах с несколькими ускорителями.
  • HBM (память с высокой пропускной способностью): интегрированная непосредственно в корпус графического процессора, HBM обеспечивает значительно более высокую пропускную способность памяти по сравнению с традиционной памятью GDDR, что имеет решающее значение для рабочих нагрузок ИИ, связанных с памятью.

AMD постоянно совершенствует свою линейку продуктов Instinct, чтобы конкурировать на быстро меняющемся рынке аппаратного обеспечения для ИИ, уделяя особое внимание объему памяти, пропускной способности и открытым программным решениям.

Получите доступ к официальным серверам DELL PowerEdge R760 в Украине.

Безкоштовная консультация по телефону +38 (067) 819 38 38

Доступные модели серверов на складе в Киеве:

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4510 2.4-4.1Ghz 12 ядер

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4514Y 2.0-3.4Ghz 16 Cores

Сервер Dell PowerEdge R760 — Intel Xeon Gold 6526Y 2,8–3,9 ГГц, 16 ядер

Сервер Dell PowerEdge R760 — Intel Xeon Gold 5420+ 2,0–4,1 ГГц, 28 ядер

Вернуться к блогу