List of GPUs AMD for Artificial Intelligence

Список графічних процесорів AMD для штучного інтелекту

OLEKSANDR SYZOV

Список графічних процесорів AMD для штучного інтелекту

Серія графічних прискорювачів AMD Instinct спеціально розроблена для високопродуктивних обчислень (HPC) та штучного інтелекту (ШІ), починаючи від навчання великомасштабних моделей і закінчуючи ефективним логічним висновком. Вони використовують архітектуру CDNA від AMD, оптимізовану для обчислень, а не для традиційного рендерингу графіки.

Ось список помітних прискорювачів AMD Instinct для штучного інтелекту з їхніми ключовими технічними характеристиками:

1. Серія AMD Instinct MI300 (архітектура CDNA 3)

Серія MI300 представляє останнє покоління прискорювачів AMD, що відрізняються чіплет-дизайном та поєднують у деяких моделях можливості центрального та графічного процесорів. Вони створені для найвимогливіших завдань штучного інтелекту та високопродуктивних обчислень.

  • AMD Instinct MI325X (графічний процесор)
    • Архітектура: CDNA 3
    • Обчислювальні блоки GPU: 304 CU
    • Потокові процесори: 19 456
    • Об'єм пам'яті: 256 ГБ HBM3E
    • Пропускна здатність пам'яті: 6 ТБ/с
    • Пікова продуктивність матриці FP64/FP32: 163,4 TFLOPS
    • Пікова продуктивність FP16/BF16: 1307,4 TFLOPS
    • Пікова продуктивність FP8: 2614,9 TFLOPS
    • Інтерфейс шини: PCIe Gen5 x16
    • Ланки Infinity Fabric™: 8
    • Максимальна TDP/TBP: 1000 Вт
    • Призначено для: генеративного штучного інтелекту (особливо моделей великих мов), масштабних високопродуктивних обчислень (HPC), штучного виводу, що вимагає величезного обсягу пам'яті та пропускної здатності.
  • AMD Instinct MI300X (графічний процесор)
    • Архітектура: CDNA 3
    • Обчислювальні блоки GPU: 304 CU
    • Потокові процесори: 19 456
    • Об'єм пам'яті: 192 ГБ HBM3
    • Пропускна здатність пам'яті: 5,3 ТБ/с
    • Пікова продуктивність матриці FP64/FP32: 122,6 TFLOPS
    • Пікова продуктивність FP16/BF16: 980,6 TFLOPS
    • Пікова продуктивність FP8: 1961,2 TFLOPS
    • Інтерфейс шини: PCIe Gen5 x16 (зазвичай через модуль OAM)
    • Ланки Infinity Fabric™: 8
    • Максимальна TDP/TBP: 750 Вт
    • Призначено для: генеративного штучного інтелекту, навчання та логічного висновку ШІ великого масштабу, високопродуктивних обчислень.
  • AMD Instinct MI300A (APU - Прискорений процесор)
    • Архітектура: CDNA 3 (графічний процесор) + Zen 4 (процесор)
    • Ядра процесора: 24 ядра процесора "Zen 4" x86
    • Обчислювальні блоки GPU: 228 CU
    • Потокові процесори: 14 592
    • Об'єм пам'яті: 128 ГБ уніфікованого HBM3
    • Пропускна здатність пам'яті: 5,3 ТБ/с
    • Пікова продуктивність матриці FP64/FP32: 122,6 TFLOPS
    • Пікова продуктивність FP16/BF16: 980,6 TFLOPS
    • Пікова продуктивність FP8: 1961,2 TFLOPS
    • Інтерфейс шини: PCIe Gen5 x16 (роз'єм APU SH5)
    • Ланки Infinity Fabric™: 8
    • Максимальна TDP/TBP: 550 Вт / 760 Вт (пік)
    • Призначено для: високопродуктивних обчислювальних навантажень, які вимагають тісної інтеграції процесора та графічного процесора, уніфікованої пам'яті та високої пропускної здатності; також підходить для деяких завдань штучного інтелекту, де взаємодія процесора є критично важливою.

2. Серія AMD Instinct MI200 (архітектура CDNA 2)

Прискорювачі серії MI200 запропонували значний стрибок у продуктивності для високопродуктивних обчислень (HPC) та штучного інтелекту, особливо для робочих навантажень подвійної точності.

  • AMD Instinct MI250X (графічний процесор)
    • Архітектура: CDNA 2
    • Обчислювальні одиниці: 220 CU
    • Потокові процесори: 14 080
    • Об'єм пам'яті: 128 ГБ HBM2e
    • Пропускна здатність пам'яті: до 3,2 ТБ/с
    • Пікова продуктивність матриці FP64: 95,7 TFLOPS
    • Пікова продуктивність FP16/BF16: 383 TFLOPS
    • Пікова продуктивність INT8: 383 TOPS
    • Інтерфейс шини: PCIe 4.0 x16
    • Ланки Infinity Fabric™: до 8
    • Призначено для: екзафлопсних високопродуктивних обчислень (HPC), навчання ШІ великого масштабу, наукових симуляцій.
  • AMD Instinct MI210 (графічний процесор)
    • Архітектура: CDNA 2
    • Обчислювальні одиниці: 104 CU
    • Потокові процесори: 6656
    • Об'єм пам'яті: 64 ГБ HBM2e
    • Пропускна здатність пам'яті: до 1,6 ТБ/с
    • Пікова продуктивність матриці FP64: 45,3 TFLOPS
    • Пікова продуктивність FP16/BF16: 181 TFLOPS
    • Пікова продуктивність INT8: 181 TOPS
    • Інтерфейс шини: PCIe 4.0 x16
    • Ланки Infinity Fabric™: 3
    • Призначено для: базових високопродуктивних обчислень (HPC), навчання та логічного висновку штучного інтелекту у форм-факторах PCIe, досліджень та наукових відкриттів.

3. AMD Instinct MI100 (архітектура CDNA 1)

MI100 був першим прискорювачем AMD на базі архітектури CDNA, що представив нові матричні ядра для покращеної продуктивності штучного інтелекту.

  • AMD Instinct MI100 (графічний процесор)
    • Архітектура: CDNA 1
    • Обчислювальні одиниці: 120 CU
    • Потокові процесори: 7680
    • Об'єм пам'яті: 32 ГБ HBM2
    • Пропускна здатність пам'яті: до 1,2 ТБ/с
    • Пікова продуктивність FP64: 11,5 TFLOPS
    • Пікова продуктивність матриці FP32: 46,1 TFLOPS
    • Пікова продуктивність FP16: 184,6 TFLOPS
    • Пікова продуктивність BF16: 92,3 TFLOPS
    • Інтерфейс шини: PCIe 4.0 x16
    • Ланки Infinity Fabric™: 3
    • Призначено для: високопродуктивних обчислювальних навантажень, навчання штучного інтелекту, глибокого навчання та наукових застосувань.

4. Старіші прискорювачі Instinct (архітектура GCN)

Хоча ці старіші моделі менш поширені для нових розгортань штучного інтелекту, вони заклали основу для серії Instinct від AMD.

  • AMD Radeon Instinct MI60 (графічний процесор)
    • Архітектура: Vega 20 (GCN 5.1)
    • Потокові процесори: 4608
    • Об'єм пам'яті: 32 ГБ HBM2
    • Пропускна здатність пам'яті: до 1 ТБ/с
    • Пікова продуктивність FP64: до 7,4 TFLOPS
    • Пікова продуктивність FP32: до 14,8 TFLOPS
    • Інтерфейс шини: PCIe 4.0 x16
    • Призначено для: попередніх робочих навантажень високопродуктивних обчислень (HPC) та штучного інтелекту, хмарних обчислень та рендерингу.
  • AMD Radeon Instinct MI25 (графічний процесор)
    • Архітектура: Vega 10 (GCN 5.0)
    • Потокові процесори: 4096
    • Об'єм пам'яті: 16 ГБ HBM2
    • Пропускна здатність пам'яті: 436,2 ГБ/с
    • Пікова продуктивність FP32: 12,29 TFLOPS
    • Пікова продуктивність FP16: 24,58 TFLOPS
    • Інтерфейс шини: PCIe 3.0 x16
    • Призначено для: ранніх застосувань штучного інтелекту та високопродуктивних обчислень у центрах обробки даних.

Ключові технології AMD для штучного інтелекту:

  • Архітектура CDNA: оптимізована для обчислень архітектура AMD для графічних процесорів центрів обробки даних, розроблена спеціально для робочих навантажень високопродуктивних обчислень (HPC) та штучного інтелекту.
  • ROCm (платформа Radeon Open Compute): програмна платформа з відкритим вихідним кодом, яка надає повний програмний стек для програмування графічних процесорів, дозволяючи розробникам використовувати прискорювачі AMD Instinct для штучного інтелекту та високопродуктивних обчислень. Вона розроблена як гнучка альтернатива CUDA.
  • Infinity Fabric™: технологія з’єднання AMD з високою пропускною здатністю та низькою затримкою, яка забезпечує прямий зв’язок між графічними та центральними процесорами, що є вирішальним фактором для масштабування продуктивності в системах з кількома прискорювачами.
  • HBM (пам'ять високої пропускної здатності): інтегрована безпосередньо в корпус графічного процесора, HBM забезпечує значно вищу пропускну здатність пам'яті порівняно з традиційною пам'яттю GDDR, що є критично важливим для робочих навантажень штучного інтелекту, обмежених пам'яттю.

AMD постійно вдосконалює свою лінійку продуктів Instinct, щоб конкурувати на ринку швидкозмінного обладнання для штучного інтелекту, зосереджуючись на обсягу пам'яті, пропускній здатності та відкритих програмних рішеннях.

Найкращі ціни на офіційні сервери DELL PowerEdge R760 в Україні.

Безкоштовна консультація за телефоном +38 (067) 819 38 38

Доступні моделі серверів відповідно до Києва:

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4510 2.4-4.1Ghz 12 ядер

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4514Y 2.0-3.4Ghz 16 ядер

Сервер Dell PowerEdge R760 - Intel Xeon Gold 6526Y 2.8-3.9Ghz 16 ядер

Сервер Dell PowerEdge R760 - Intel Xeon Gold 5420+ 2.0-4.1Ghz 28 ядер

Назад до блогу