Společnost Intel uvedla nové výpočetní karty ARC Pro B65 a B70. Obě se mohou chlubit velkou 32GB pamětí VRAM.
Odměníme každého! Vyplňte komunitní průzkum a získejte luxusní ceny
Kdo jste, na čem a co hrajete, jaký obsah konzumujete a jaký vztah máte k AI? Věnujte nám pár minut a jako dárek za vyplnění získáte slevu na nákup a šanci získat také další luxusní ceny.
Už dlouho se spekulovalo nad příchodem nových výpočetních karet Intelu spadajících do řady ARC Pro. Konkrétně mělo jít o modely B65 a B70. Obě tyto novinky se skutečně představily a jsou postaveny na GPU BMG-G31 architektury Battlemage. Určeny jsou pro různá nasazení, ať už jde o práci s grafikou, vývojem softwaru nebo dnes tak módní AI úlohy. V tomto případě jde zejména o inferenci, tedy běh již natrénovaných AI algoritmů.
Jako první tu máme Arc Pro B65. Ten má stejných 20 Xe2 jader jako ARC Pro B60. Máme tu 20 RT jednotek, 160 vektorových jednotek Xe i 160 enginů XMX. Tato karta běží s frekvencí 2400 MHz, díky čemuž dosahuje stejného výkonu 197 TOPS (v INT8) jako B60. V FP32 je pak výkon 12, 28 TFLOPS. Zde připomeňme, že starší B60 má i LP variantu s 2000 MHz a výkonem 164 TOPS, resp. 10.23 TFLOPS.
Zásadní změnou proti modelu B60 je ale širší 256bitová sběrnice, což znamená více paměťových čipů, tedy větší kapacita 32 GB místo 24 GB, a také větší paměťová propustnost 608 GB/s místo 456 GB/s. Pokud jde o spotřebu, ta zůstává na hodnotě 200 W (B60 LP měla 120 W).
Vrcholem je ARC Pro B70. To už tu máme 32 Xe2 jader i 32 RT jednotek, dále je tu 256 vektorových jednotek Xe i XMX. Základní takt 2280 MHz může dosahovat Boostu až 2800 MHz. To posouvá výkon v AI úlohách na 367 TOPS v INT8 a 22,94 TFLOPS. Standardní varianta Intelu má 230W TDP, nicméně LP varianta začíná na 160 W a možné je dosáhnout až 290 W. Co se týče pamětí, ty jsou shodné s ARC Pro B65.
Oba dva čipy jsou vyráběny 5nm technologií u společnosti TSMC. Pokud jde o ARC Pro B70, tato výpočetní karta bude stát od 949 USD. Možná se to nezdá málo, ale výpočetní karty bývají dražší než běžné herní, a pokud byste chtěli takto velkou paměť u Nvidie, museli byste i v herní oblasti pro RTX 5090 za dvojnásobnou cenu (pokud by zázrakem byla za MSRP).
Intel to srovnal např. s výpočetní kartou Nvidia RTX Pro 4000 s 24GB VRAM (má stejný počet CUDA jader jako RTX 5070 Ti) a podle něj nabídne 1,6 až 2,0krát více AI tokenů na dolar. Proti této kartě má být až 6,2krát rychlejší v čase do prvního tokenu (v průměru v 6 testech 4,4 krát). Díky větší paměti by mělo toto GPU nabídnout také více než 2násobně větší kontextové okno, v Llama 3.1 8B např. 93 tisíc tokenů ve srovnání s 42 tisíc u Nvidie.