Google Cloud podigao je ulog u utrci za dominaciju nad infrastrukturom umjetne inteligencije predstavljajući Ironwood, sedmu generaciju svojih Tensor Processing Unit (TPU) čipova. Tvrtka ističe da je riječ o njezinoj dosad najjačoj AI platformi, dizajniranoj za novo razdoblje koje unutar Googlea nazivaju „dobom inferencije” – trenutkom kada se naglasak prebacuje s treniranja modela na njihovo posluživanje milijunima korisnika u stvarnom vremenu.
Ključne značajke Ironwooda • Performanse: više od četiri puta brže treniranje i inferencija u odnosu na prošlu, šestu generaciju TPU-a. • Skala: jedan „pod” povezuje do 9 216 čipova preko interne mreže koja dostiže 9,6 terabita u sekundi. • Memorija: zajednički pristup 1,77 petabajta High Bandwidth Memory omogućuje trenutnu razmjenu golemih količina podataka. • Pouzdanost: optički prekidači preusmjeravaju promet u milisekundama, a Google tvrdi da TPU sustavi od 2020. postižu 99,999 % dostupnosti – manje od šest minuta prekida godišnje.
Ugovor kakav tržište još nije vidjelo Najbolju potvrdu snage nove arhitekture pruža dogovor s tvrtkom Anthropic, kreatorom modela Claude. AI sigurnosna kompanija planira koristiti do milijun Ironwood čipova, što analitičari procjenjuju na višegodišnju obvezu vrijednu desetke milijardi dolara i „kilovatski” kapacitet veći od jednog gigavata.
„Anthropic i Google imaju dugogodišnje partnerstvo, a ovo proširenje pomaže nam zadovoljiti eksponencijalni rast potražnje”, izjavio je financijski direktor Krishna Rao. Tvrtka navodi povoljan omjer cijene i performansi te prethodno iskustvo s TPU-ovima kao ključne razloge za širenje suradnje.
Zašto je inferencija u fokusu Vice-predsjednik Google Clouda zadužen za AI i infrastrukturu Amin Vahdat ističe da trenutačni modeli – uključujući Gemini, Veo i Imagen te Anthropicov Claude – već treniraju i rade na TPU-ovima. Ali kad AI sustavi moraju odgovarati u djeliću sekunde ili autonomno obavljati zadatke kroz tzv. agentske tijekove, potrebna je neprekinuta brzina i stabilnost.
Ironwoodovo poboljšanje, naglašava James Bradbury iz Anthropica, „pomoći će nam skalirati uz zadržavanje brzine i pouzdanosti koje korisnici očekuju”. U svijetu gdje i klasteri od 10 000 akceleratora izgledaju golemo, skup od milijun čipova najavljuje novu razinu moći – i utrke ulaganja – u razvoju umjetne inteligencije.