Nakon više od pola stoljeća dominacije von Neumannove (i srodne Harvardove) arhitekture, pojavljuje se koncept koji bi mogao preokrenuti pravila igre. Riječ je o Determinističkom izvođenju – pristupu koji unaprijed određuje svaku instrukciju, ciklus po ciklus, umjesto da procesor nagađa i naknadno ispravlja pogreške.
Glavna razlika leži u potpunom ukidanju spekulativnog izvršavanja. Umjesto složenih mehanizama predviđanja i povratnog vraćanja, svakoj se operaciji dodjeljuje točan vremenski slot i potreban resurs. Time se:
- spajaju skalarni, vektorski i matrični izračuni na jednom čipu,
- smanjuje potrošnja energije i površina jezgre zahvaljujući jednostavnijoj upravljačkoj logici,
- jamči ciklusno precizna latencija, što je presudno za osjetljive sustave poput inferencija velikih jezičnih modela, detekcije prijevara ili industrijske automatike.
Ključni alat je matrica vrijeme-resurs – svojevrsni „vozni red” koji koordinira rad procesora, memorije i kontrolnih jedinica. Dok tradicionalni CPU-i i GPU-i čekaju stotine ciklusa na povrat podataka iz DRAM-a ili HBM-a, deterministički raspored omogućuje da se ovisne instrukcije unaprijed smjeste u točan budući ciklus, održavajući jedinice stalno zauzetima.
Rezultat je održiva propusnost na razini današnjih specijaliziranih akceleratora uz istodobno pokretanje općeg koda – dakle bez potrebe za zasebnim CPU-om i GPU-om. Za timove koji raspoređuju LLM-ove to znači točno predvidljive odzive poslužitelja, dok upravitelji infrastrukture dobivaju jedinstvenu platformu skalabilnu od ruba mreže do podatkovnog centra, bez velikih prilagodbi softvera.
Tehnika se oslanja na više inovacija:
- dvostruko bankovano registarsko polje za dvostruki broj pristupa bez povećanja broja portova,
- "fantomske" registre za dublje cjevovode,
- izravno prosljeđivanje podataka iz DRAM-a u vektorski međuspremnik, čime se prepolavlja broj pristupa memoriji i uklanja potreba za velikim SRAM-ovima,
- spremišta za ponovno izvođenje instrukcija koja zadržavaju predvidljivost i pri varijabilnoj latenciji.
Izmjerene AI i DSP petlje izvedene na prototipu pokazuju kontinuirano izvođenje bez uobičajenih zastajkivanja pri čekanju na podatke, uz manju potrošnju energije po operaciji.
Osim umjetne inteligencije, jasne koristi vide se u sigurnosno kritičnim sustavima (automobilska, zrakoplovna i medicinska elektronika), financijskoj analitici u stvarnom vremenu te edge okruženjima gdje svaki vat struje znači razliku. Predvidljivi tajming pojednostavljuje verifikaciju, povećava sigurnost i snižava operativne troškove.
Za tvrtke koje planiraju infrastrukturu sljedećeg desetljeća, Determinističko izvođenje predstavlja priliku za smanjenje složenosti hardvera, potrošnje energije i troškova softverske podrške – uz zadržavanje postojane, konkurentne razine performansi.