GPUs Intel Gaudi 3 for Artificial Intelligence

GPU Intel Gaudi 3 for Artificial Intelligence

OLEKSANDR SYZOV

GPU Intel Gaudi 3 for Artificial Intelligence

Бесплатная Профессиональная Консультация по серверному оборудованию.

Тел: +38 (067) 819-38-38 / E-mail: server@systemsolutions.com.ua

Конфигуратор сервера DELL PowerEdge R760

Intel Gaudi 3 является последней generation of Intel AI accelerators, specifically designed handle demanding workloads generative AI and large language models (LLMs) for both training and inference. Intel стремится к competitive alternative to NVIDIA's dominant GPU в AI market, emphasizing open standards and cost-effectiveness.

Intel Gaudi 3 имеется в двух главных формах:

  1. HL-325L (OCP Accelerator Module - OAM Mezzanine Card): Это высокая эффективность, высокая версия версии разработанной для внешних параметров сервера.
  2. HL-338 (PCIe Add-In Card): Это более standard PCIe form factor для broader server compatibility.

Здесь являются key technical characteristics of Intel Gaudi 3, комбинирующие specifications для both form factors where applicable:

General Architecture and Core Features:

  • Manufacturing Process: Построение на TSMC's 5nm process node.
  • Compute Engines:
    • Matrix Multiplication Engines (MMEs): 8 units. У них есть специальные коры для эффективных matrix operations, crucial for deep learning.
    • Tensor Processor Cores (TPCs): 64 units. Эти являются программируемые векторные процессоры, разработанные для глубоких образовательных тренировок и разрыва роботов.
  • On-die SRAM: 96 MB с 12.8 TB/s лайм, обеспечивая максимальную местную память для корей.
  • Media Engines: 14 Decoders, 4 Rotator Engines, идентифицирующие возможности для обработки различных форматов мультимедиа для AI приложений.
  • Host Interface: PCIe Gen 5.0 x16, обеспечивающий высокий уровень (128 GB/s bidirectional) для коммуникации с host CPU.

Memory Subsystem:

  • HBM (High Bandwidth Memory): 128 ГБ из памяти HBM2e.
  • HBM Bandwidth: 3.7 TB/s, обеспечивающие чрезвычайно высокие данные посредством обмена AI-моделями. Приборчик HBM является оптимизированным для путешествия и linear access patterns.

Networking and Scalability:

  • On-chip Ethernet: 24 integrated 200 Gbps RoCE (RDMA over Converged Ethernet) ports. Это значимый дифференциатор, производящий открывающийся и электричный Ethernet-based фабрика для шнура (с помощью сервера) и штанга (над multiple servers) connectivity.
  • Total Bidirectional Network Bandwidth: 1200 ГБ/с. Эти способы для массивной коммуникации между accelerators within a cross nodes, строгое для множества распределения AI training.
  • Open Standard: Intel привлекает к использованию промышленного стандарта Ethernet, который требует отмены линзы подключения и стабильной integration compared to proprietary interconnects.

Разновидность мощностей (Compared to Gaudi 2 and often H100):

  • AI Compute (FP8): 1835 TFLOPS (TeraFLOPS).
  • AI Compute (BF16): 1835 TFLOPS (TeraFLOPS).
  • BF16 Vector TFLOPs: 28.7.
  • Generational Improvement: Intel claims 2x AI compute (FP8), 4x AI compute (BF16), 2x network bandwidth, и 1.5x memory bandwidth compared to Gaudi 2.
  • Time-to-Train: Intel states that Gaudi 3 может быть 1.5x пространство в time-to-train не NVIDIA H100 на среднем размере для certain models.

Power and Form Factor Specifics:

  • HL-325L (OAM):
    • TDP: 900W.
    • Form Factor: OCP Accelerator Module V2.0 Compliant. Эти были созданы для того, чтобы быть встроены в специфические baseboards, размещены в группах восьми до сервера номера (eg, в 7.6 KW integrated subsystem).
  • HL-338 (PCIe Card):
    • TDP: 600W.
    • Form Factor: Full-height, Double-wide, 10.5” length PCIe Card.

Intended Applications:

Intel Gaudi 3 is designed for the most demanding AI workloads, including:

  • Великое Language Model (LLM) Трейнинг и информация: Это высокий уровень умения, основы, и компьютерной мощности может быть идеально для множественных компьютерных и маркетинговых требований of LLMs.
  • Generative AI: Powering multi-modal generative AI applications, including text-to-image, text-to-video, и другие content creation tasks.
  • High-Performance Computing (HPC) .
  • Enterprise AI: Предоставляет регулярные и эффективные решения для различных технических средств использования AI.

Intel's strategy with Gaudi 3 is to provide compelling alternative in AI hardware market, focusing on performance, Open software development, and cost-effectiveness through its use of Ethernet for scaling.

 

Лучшие цены на официальные серверы DELL PowerEdge R760 в Украине.

Бесплатная консультация по телефону +38 (067) 819 38 38

Доступные модели серверов со склада в Киеве:

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4510 2.4-4.1Ghz 12 Cores

Сервер Dell PowerEdge R760 - Intel Xeon Silver 4514Y 2.0-3.4Ghz 16 Cores

Сервер Dell PowerEdge R760 - Intel Xeon Gold 6526Y 2.8-3.9Ghz 16 Cores

Сервер Dell PowerEdge R760 - Intel Xeon Gold 5420+ 2.0-4.1Ghz 28 Cores

Вернуться к блогу