List of GPUs AMD for Artificial Intelligence

Список графических процессоров AMD для искусственного интеллекта

OLEKSANDR SYZOV

Список графических процессоров AMD для искусственного интеллекта

Безкоштовная Профессиональная консультация по серверному обладанию.

Тел: +38 (067) 819-38-38 / E-mail: server@systemsolutions.com.ua

Конфигуратор Сервера DELL PowerEdge R760

Серия графических ускорителей AMD Instinct специально разработана для высокопроизводительных вычислений (HPC) и задач искусственного интеллекта (ИИ), от обучения крупномасштабных моделей до эффективного вывода. Они используют архитектуру AMD CDNA, оптимизированную для вычислений, а не для традиционного рендеринга графики.

Вот список известных ускорителей AMD Instinct для ИИ с их основными техническими характеристиками:

1. AMD Instinct серии MI300 (архитектура CDNA 3)

Серия MI300 представляет собой новейшее поколение ускорителей AMD, построенных на чиплетной архитектуре и сочетающих в некоторых моделях возможности центрального и графического процессоров. Они созданы для самых требовательных задач искусственного интеллекта и высокопроизводительных вычислений.

  • AMD Instinct MI325X (графический процессор)
    • Архитектура: CDNA 3
    • Вычислительные блоки GPU: 304 CU
    • Потоковые процессоры: 19 456
    • Объем памяти: 256 ГБ HBM3E
    • Пропускная способность памяти: 6 ТБ/с
    • Пиковая производительность матрицы FP64/FP32: 163,4 терафлопс
    • Пиковая производительность FP16/BF16: 1307,4 терафлопс
    • Пиковая производительность FP8: 2614,9 терафлопс
    • Интерфейс шины: PCIe Gen5 x16
    • Ссылки Infinity Fabric™: 8
    • Максимальный TDP/TBP: 1000 Вт
    • Предназначено для: генеративного ИИ (особенно больших языковых моделей), крупномасштабных высокопроизводительных вычислений, вывода ИИ, требующего большого объема памяти и пропускной способности.
  • AMD Instinct MI300X (графический процессор)
    • Архитектура: CDNA 3
    • Вычислительные блоки GPU: 304 CU
    • Потоковые процессоры: 19 456
    • Объем памяти: 192 ГБ HBM3
    • Пропускная способность памяти: 5,3 ТБ/с
    • Пиковая производительность матрицы FP64/FP32: 122,6 терафлопс
    • Пиковая производительность FP16/BF16: 980,6 терафлопс
    • Пиковая производительность FP8: 1961,2 терафлопс
    • Интерфейс шины: PCIe Gen5 x16 (обычно через модуль OAM)
    • Ссылки Infinity Fabric™: 8
    • Максимальный TDP/TBP: 750 Вт
    • Назначение: генеративный ИИ, масштабное обучение и вывод ИИ, высокопроизводительные вычисления.
  • AMD Instinct MI300A (APU — ускоренный процессор)
    • Архитектура: CDNA 3 (графический процессор) + Zen 4 (процессор)
    • Ядра ЦП: 24 ядра ЦП «Zen 4» x86
    • Вычислительные блоки GPU: 228 CU
    • Потоковые процессоры: 14 592
    • Объем памяти: 128 ГБ Unified HBM3
    • Пропускная способность памяти: 5,3 ТБ/с
    • Пиковая производительность матрицы FP64/FP32: 122,6 терафлопс
    • Пиковая производительность FP16/BF16: 980,6 терафлопс
    • Пиковая производительность FP8: 1961,2 терафлопс
    • Интерфейс шины: PCIe Gen5 x16 (разъем APU SH5)
    • Ссылки Infinity Fabric™: 8
    • Максимальный TDP/TBP: 550 Вт/760 Вт (пиковая)
    • Назначение: рабочие нагрузки HPC, которые выигрывают от тесной интеграции CPU-GPU, унифицированной памяти и высокой пропускной способности; также подходит для некоторых задач искусственного интеллекта, где взаимодействие с CPU имеет решающее значение.

2. Серия AMD Instinct MI200 (архитектура CDNA 2)

Ускорители серии MI200 обеспечили значительный скачок производительности для высокопроизводительных вычислений и искусственного интеллекта, особенно для рабочих нагрузок с двойной точностью.

  • AMD Instinct MI250X (графический процессор)
    • Архитектура: CDNA 2
    • Вычислительные единицы: 220 CU
    • Потоковые процессоры: 14 080
    • Объем памяти: 128 ГБ HBM2e
    • Пропускная способность памяти: до 3,2 ТБ/с
    • Пиковая производительность матрицы FP64: 95,7 терафлопс
    • Пиковая производительность FP16/BF16: 383 терафлопс
    • Пиковая производительность INT8: 383 TOPS
    • Интерфейс шины: PCIe 4.0 x16
    • Связи Infinity Fabric™: до 8
    • Назначение: высокопроизводительные вычисления в масштабе Exascale, масштабное обучение искусственного интеллекта, научное моделирование.
  • AMD Instinct MI210 (графический процессор)
    • Архитектура: CDNA 2
    • Вычислительные единицы: 104 CU
    • Потоковые процессоры: 6656
    • Объем памяти: 64 ГБ HBM2e
    • Пропускная способность памяти: до 1,6 ТБ/с
    • Пиковая производительность матрицы FP64: 45,3 терафлопс
    • Пиковая производительность FP16/BF16: 181 терафлопс
    • Пиковая производительность INT8: 181 TOPS
    • Интерфейс шины: PCIe 4.0 x16
    • Ссылки Infinity Fabric™: 3
    • Назначение: для массовых высокопроизводительных вычислений, обучения и вывода ИИ в форм-факторах PCIe, исследований и научных открытий.

3. AMD Instinct MI100 (архитектура CDNA 1)

MI100 стал первым ускорителем AMD на базе архитектуры CDNA, в котором реализованы новые матричные ядра для повышения производительности ИИ.

  • AMD Instinct MI100 (графический процессор)
    • Архитектура: CDNA 1
    • Вычислительные единицы: 120 CU
    • Потоковые процессоры: 7680
    • Объем памяти: 32 ГБ HBM2
    • Пропускная способность памяти: до 1,2 ТБ/с
    • Пиковая производительность FP64: 11,5 терафлопс
    • Пиковая производительность матрицы FP32: 46,1 терафлопс
    • Пиковая производительность FP16: 184,6 терафлопс
    • Пиковая производительность BF16: 92,3 терафлопс
    • Интерфейс шины: PCIe 4.0 x16
    • Ссылки Infinity Fabric™: 3
    • Назначение: рабочие нагрузки HPC, обучение ИИ, глубокое обучение и научные приложения.

4. Старые ускорители Instinct (архитектура GCN)

Хотя эти старые модели и не так широко использовались для новых развертываний ИИ, они заложили основу для серии AMD Instinct.

  • AMD Radeon Instinct MI60 (графический процессор)
    • Архитектура: Vega 20 (GCN 5.1)
    • Потоковые процессоры: 4608
    • Объем памяти: 32 ГБ HBM2
    • Пропускная способность памяти: до 1 ТБ/с
    • Пиковая производительность FP64: до 7,4 терафлопс
    • Пиковая производительность FP32: до 14,8 терафлопс
    • Интерфейс шины: PCIe 4.0 x16
    • Предназначено для: ранних рабочих нагрузок HPC и ИИ, облачных вычислений и рендеринга.
  • AMD Radeon Instinct MI25 (графический процессор)
    • Архитектура: Vega 10 (GCN 5.0)
    • Потоковые процессоры: 4096
    • Объем памяти: 16 ГБ HBM2
    • Пропускная способность памяти: 436,2 ГБ/с
    • Пиковая производительность FP32: 12,29 терафлопс
    • Пиковая производительность FP16: 24,58 терафлопс
    • Интерфейс шины: PCIe 3.0 x16
    • Предназначение: для ранних приложений ИИ и высокопроизводительных вычислений в центрах обработки данных.

Ключевые технологии AMD для ИИ:

  • Архитектура CDNA: оптимизированная для вычислений архитектура AMD для графических процессоров центров обработки данных, разработанная специально для рабочих нагрузок HPC и ИИ.
  • ROCm (платформа Radeon Open Compute): программная платформа с открытым исходным кодом, предоставляющая полный программный стек для программирования графических процессоров, позволяя разработчикам использовать ускорители AMD Instinct для ИИ и высокопроизводительных вычислений. Она разработана как гибкая альтернатива CUDA.
  • Infinity Fabric™: технология межсоединений AMD с высокой пропускной способностью и малой задержкой, которая обеспечивает прямую связь между графическими и центральными процессорами, что имеет решающее значение для масштабирования производительности в системах с несколькими ускорителями.
  • HBM (память с высокой пропускной способностью): интегрированная непосредственно в корпус графического процессора, HBM обеспечивает значительно более высокую пропускную способность памяти по сравнению с традиционной памятью GDDR, что критически важно для рабочих нагрузок ИИ, связанных с памятью.

AMD постоянно совершенствует свою линейку продуктов Instinct, чтобы конкурировать на быстро меняющемся рынке аппаратного обеспечения для ИИ, уделяя особое внимание объему памяти, пропускной способности и открытым программным решениям.

Получите доступ к официальным серверам DELL PowerEdge R760 в Украине.

Безкоштовная консультация по телефону +38 (067) 819 38 38

Доступные модели серверов на складе в Киеве:

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4510 2.4-4.1Ghz 12 Cores

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4514Y 2.0-3.4Ghz 16 Cores

Сервер Dell PowerEdge R760 — Intel Xeon Gold 6526Y 2,8–3,9 ГГц, 16 ядер

Сервер Dell PowerEdge R760 — Intel Xeon Gold 5420+ 2,0–4,1 ГГц, 28 ядер

Вернуться к блогу