NVIDIA rakibinden yüzde 60 hızlı! İşte AMD MI300X

AMD, MI300X ile birinci sefer NVIDIA’ya karşı yapay zeka alanında önemli bir rekabet ortamı oluşturdu. Üstelik H100’den yüzde 60 daha süratli.

NVIDIA rakibinden yüzde 60 hızlı! İşte AMD MI300X
  • 0
  • 0
  • 8 Aralık 2023
  • 1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
    Loading...
  • +
  • -


AMD, bir müddettir merakla beklenen MI300X’in resmi tanıtımını yaptı. TSMC’nin gelişmiş üretim sınırından çıkan AMD MI300X GPU, NVIDIA’nın H100’ünden yüzde 60 daha yüksek performans sunmayı başarıyor. İşte detaylar…

AMD MI300X neler sunuyor?

AMD, eğitim performansında MI300X’in H100 ile benzeri düzeyde olduğunu ve inferans iş yüklerinde üstün performans sergilediğini belirtiyor. Şirketin açıklamalarına nazaran MI300X, genel özelliklerde şu avantajları sağlıyor:

  • 2.4 kat daha yüksek bellek kapasitesi
  • 1.6 kat daha yüksek bellek bant genişliği
  • 1.3 kat FP8 TFLOPS
  • 1.3 kat FP16 TFLOPS
  • Llama 2 70B, birebir kıyaslamada yüzde 20’ye kadar daha hızlı
  • FlashAttention 2, birebir kıyaslamada yüzde 20’ye kadar daha hızlı
  • Llama 2 70B, 8v8 sunucuda yüzde 40’a kadar daha hızlı
  • FlashAttention 2, 8v8 sunucuda yüzde 60’a kadar daha hızlı

MI300X’in gerisindeki yazılım, ROCm 6.0, çeşitli yapay zeka iş yüklerini destekleyen yeni özellikler içeriyor. Çünkü bu yazılım, en yeni hesaplama formatlarını destekleyerek performansı artırıyor. MI300X, NVIDIA’nın Hopper ve Intel’in Gaudi yapay zeka hızlandırıcılarına karşı rekabeti artıracak. CDNA 3 mimarisine dayanan MI300X, toplamda 153 milyar transistöre sahip. Ayrıyeten MI300X’in bellek kapasitesi 192 GB (HBM3). Yani selefi MI250X’e nazaran yüzde 50 daha fazla.

AMD MI300X, güç tüketimi tarafında 750W TDP ile karşımıza çıkıyor. Ek olarak AMD, bu çipi destekleyen sistemleri sergilerken, 8 MI300X GPU hızlandırıcısı ve iki AMD EPYC 9004 CPU içeren bir konfigürasyonu paylaştı.

Son olarak, AMD’nin Instinct MI300 AI çiplerini destekleyeceğini açıklayan şirketler ortasında Oracle, Dell, META ve OpenAI üzere büyük isimler bulunuyor. Şirketin yapay zeka alanında yalnızca bir alternatif olmak değil, önder olma gayesi olduğu için NVIDIA ve Intel üzere rakipleri için de önemli bir rekabet ortamı yaratıyor.

GPU AMD INSTINCT MI400 AMD INSTINCT MI300X AMD INSTINCT MI300A AMD INSTINCT MI250X AMD INSTINCT MI250 AMD INSTINCT MI210 AMD INSTINCT MI100 AMD RADEON INSTINCT MI60 AMD RADEON INSTINCT MI50 AMD RADEON INSTINCT MI25 AMD RADEON INSTINCT MI8 AMD RADEON INSTINCT MI6
CPU Mimarisi Zen 5 (Exascale APU) Yok Zen 4 (Exascale APU) Yok Yok Yok Yok Yok Yok Yok Yok Yok
GPU Mimarisi CDNA 4 Su Vanjaramı (CDNA 3) Su Vanjaramı (CDNA 3) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Arkturus (CDNA 1) Vega 20 Vega 20 Vega 10 Fiji XT Polaris10
GPU Süreç Düğümü 4nm 5nm+6nm 5nm+6nm 6nm 6nm 6nm 7 nm FinFET 7 nm FinFET 7 nm FinFET 14 nm FinFET 28nm 14 nm FinFET
GPU Yongaları henüz bilinmiyor 8 (MCM) 8 (MCM) 2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik)
GPU Çekirdekleri henüz bilinmiyor 19.456 14.592 14.080 13.312 6656 7680 4096 3840 4096 4096 2304
GPU Saat Hızı henüz bilinmiyor 2100 MHz 2100 MHz 1700 MHz 1700 MHz 1700 MHz 1500 MHz 1800 MHz 1725MHz 1500 MHz 1000 MHz 1237 MHz
INT8 Hesaplama henüz bilinmiyor 2614 ÜST 1961 ÜSTLERİ 383 ÜST 362 ÜST 181 ÜST 92.3 ÜSTLER Yok Yok Yok Yok Yok
FP16 Hesaplama henüz bilinmiyor 1.3 PFLOP’lar 980,6 TFLOP 383 TFLOP 362 TFLOP 181 TFLOP 185 TFLOP 29,5 TFLOP 26,5 TFLOP 24.6 TFLOP 8.2 TFLOP’lar 5.7 TFLOP’lar
FP32 Hesaplama henüz bilinmiyor 163,4 TFLOP 122,6 TFLOP 95,7 TFLOP 90,5 TFLOP 45.3 TFLOP 23.1 TFLOP’lar 14.7 TFLOP’lar 13.3 TFLOP’lar 12.3 TFLOP’lar 8.2 TFLOP’lar 5.7 TFLOP’lar
FP64 Hesaplama henüz bilinmiyor 81.7 TFLOP 61.3 TFLOP 47,9 TFLOP 45.3 TFLOP 22.6 TFLOP 11.5 TFLOP 7.4 TFLOP’lar 6.6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP
VRAM henüz bilinmiyor 192 GB HBM3 128 GB HBM3 128 GB HBM2e 128 GB HBM2e 64 GB HBM2e 32 GB HBM2 32 GB HBM2 16 GB HBM2 16 GB HBM2 4 GB HBM1 16 GB GDDR5
Infinity Önbelleği henüz bilinmiyor 256 MB 256 MB Yok Yok Yok Yok Yok Yok Yok Yok Yok
Memory Clock henüz bilinmiyor 5,2 Gb/sn 5,2 Gb/sn 3,2 Gb/sn 3,2 Gb/sn 3,2 Gb/sn 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz
Bellek Data Yolu henüz bilinmiyor 8192-bit 8192-bit 8192-bit 8192-bit 4096 bit 4096 bit data yolu 4096 bit data yolu 4096 bit bilgi yolu 2048 bit data yolu 4096 bit data yolu 256 bit data yolu
Bellek Bant Genişliği henüz bilinmiyor 5,3 TB/sn 5,3 TB/sn 3,2 TB/sn 3,2 TB/sn 1,6 TB/sn 1,23 TB/sn 1 TB/sn 1 TB/sn 484 GB/sn 512 GB/sn 224 GB/sn
Soğutma henüz bilinmiyor Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma
TDP (Maks.) henüz bilinmiyor 750W 760W 560W 500W 300W 300W 300W 300W 300W 175W 150W

Shiftdelete

https://shiftdelete.net/amd-mi300x-tanitildi-ozellikleri

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir