Rast potražnje za umjetnom inteligencijom u podatkovnim centrima pretvara slojeve pohrane u kritično usko grlo. Podaci koji su se nekada čuvali u hladnim arhivama sada prelaze u kategoriju „toplih“ i sve se češće dohvaćaju za treniranje i inferenciju modela. Za takav rad potreban je nisko-latencijski, visokoprotočni sustav pohrane sposoban pratiti paralelne izračune.
Jeff Janukowicz iz analitičke kuće IDC upozorava da se kapacitet mehaničkih diskova (HDD) povećava, ali „često na račun sporije izvedbe“. Zbog toga se u industriji sve češće spominju „nearline SSD-ovi“ – flash diskovi koji kapacitetom konkuriraju tvrdom disku, ali nude znatno veće IOPS-ove.
Roger Corell, viši direktor marketinga za AI u tvrtki Solidigm, opisuje promjenu kao „tektonski pomak u vrijednosti podataka za AI“. Prema njegovim riječima, visokokapacitetni SSD-ovi omogućuju egzabajtne podatkovne tokove uz manju potrošnju energije i prostora, što ostavlja više mjesta za skupe GPU-ove.
Energetski rezovi od 77 %
Analiza koju su proveli Solidigm i VAST Data na egzabajtnom scenariju pokazuje koliki je jaz između dviju tehnologija:
- za kapacitet jednog SSD-a od 122 TB potrebna su četiri HDD-a od 30 TB;
- cijelo rješenje uključuje 3 738 SSD-ova nasuprot više od 40 000 HDD-ova;
- SSD varijanta troši 77 % manje energije i zauzima devet puta manju fizičku površinu.
Manji broj pogona pojednostavljuje održavanje, a smanjeni betonsko-čelični otisak rackova dodatno reže emisije povezane s gradnjom objekata – za više od 80 %. Na kraju životnog ciklusa potrebno je zbrinuti 90 % manje diskova.
Mehanička ograničenja HDD-a – okretni pladnjevi, mehaničke glave i vrijeme traženja podataka – postaju neodrživa za radna opterećenja koja traže istovremenu nisku latenciju i visoku propusnost. Hyperskaleri zato nerijetko „prenapucavaju“ HDD-ove do 90 % popunjenosti kako bi iscijedili još koji IOPS, no Corell smatra da je to kratkoročno rješenje koje poskupljuje rashladne i energetske proračune.
Nova generacija QLC flasha
Solidigm je dosad isporučio više od 122 egzabajta QLC flasha, a najnoviji adut je pogon D7-PS1010 E1.S – prvi eSSD s jednostranim direktnim tekućinskim hlađenjem razvijen u suradnji s Nvidijom. Dizajn cilja gustu, ventilatorski neovisnu pohranu za sljedeće GPU servere i ilustrira trend prema izravnom hlađenju svih ključnih komponenti.
„Idemo prema okruženju u kojem će svi kritični IT dijelovi biti tekućinski hlađeni“, kaže Corell. „Ograničenja u potrošnji struje neće nestati, stoga infrastrukturu treba projektirati s mentalitetom neoclouda – što učinkovitije, kako bi unutar zadanog energetskog i prostornog proračuna stalo što više GPU-ova.“
HDD-ovi će, priznaje, i dalje imati ulogu u arhivskim i izrazito jeftinim scenarijima, no segment „toplih“ podataka brzo raste jer tvrtke sve više monetiziraju informacije. Organizacije koje već danas preurede sloj pohrane oko visokokapacitetnih SSD-ova bit će, zaključuje, one koje će sutra moći skalirati umjetnu inteligenciju bez zastoja.