Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

IBM NorthPole: čip pro AI navzdory 12nm procesu v efektivitě překoná i Nvidii

24.10.2023, Milan Šurkala, aktualita
IBM NorthPole: čip pro AI navzdory 12nm procesu v efektivitě překoná i Nvidii
IBM představilo nový čip NorthPole určený pro běh algoritmů umělé inteligence. Ten díky revoluční architektuře pamětí v efektivitě doslova zadupává do země vše ostatní, a to i přesto, že je vyráběn 12nm procesem.
Umělá inteligence je v poslední době velkým tématem. Pro její trénování se v drtivé většině případů používají grafické a výpočetní karty Nvidie, nicméně pro běh se používají různá další NPU (příp. NIPU - Neural Inference Processing Unit), asi nejčastěji se s nimi setkáváme v telefonech. A právě do oblasti běhu AI algoritmů míří nová karta společnosti IBM se jménem NorthPole. Tato karta tedy není určena pro trénování algoritmů AI, ale jen k jejich běhu (tedy inferenci). V trénování tak prozatím neochvějnou pozici Nvidie neohrozí, ale pro běh natrénovaných algoritmů by už mohla. Vtip je totiž v paměťovém systému karty. Zatímco většina počítačů běží na von Neumannově modelu s odděleným procesorem a pamětí, NorthPole má paměť přímo v čipu, což výrazně snižuje latence.
 
IBM NorthPole
 
Procesor je vyráběn 12nm procesem, což je proti dnešním nejlepším akcelerátorům už nemalý výlet do minulosti. Najdeme tu 22 mld. tranzistorů, přičemž Nvidia H100 jich má 80 mld. Je zde 256 jader schopných zpracovat 2048 operací na jádro v 8bitové přesnosti, počet se může zdvojnásobit ve 4 bitech nebo zečtyřnásobit ve 2 bitech. IBM pak hovoří o schopnosti dosáhnout až 839 TOPS. Zajímavé je také to, že zatímco H100 běží v Boostu na frekvenci okolo 1,8 GHz, NorthPole má takt jen 400-425 MHz. Přesto dokázal při běhu modelu ResNet50 dosáhnout zpracování 42,5 tisíc obrázků za sekundu, čímž překonal Nvidii A100 (30,8 tisíc) a byl zhruba na polovině Nvidie H100 (81,3 tisíc).
 
Potíž pro Nvidii je ale v tom, že zatímco H100 na toto potřebuje 700 W, NorthPole si vystačil s pouhými 74 W a dokáže fungovat i s napájením jen přes PCIe sběrnici (podporuje ale přídavné 150W napájení). Ve výsledku to znamená 5krát lepší efektivitu a proti 12nm GPU nebo 14nm CPU je efektivita řádově vyšší (až 25krát). Využití se plánuje především pro AI systémy pracující s obrazem, tedy detekci objektů, segmentaci obrazu, klasifikaci videa, akcelerátor by měl být ale schopen i rozeznávat řeč nebo zpracovávat přirozený jazyk. GPT-4 na tom ale nepoběží.
 


Autor: Milan Šurkala
Vystudoval doktorský program v oboru informatiky a programování se zaměřením na počítačovou grafiku. Nepřehlédněte jeho seriál Fotíme s Koalou o základech fotografování.