Umjetna inteligencija već pokreće niz svakodnevnih aplikacija, ali razlomljeni softverski ekosustav i dalje koči njezino šire usvajanje. Različiti hardverski ciljevi – od podatkovnih centara, preko mobilnih čipova, do prilagođenih akceleratora – prisiljavaju razvojne timove da iste modele neprestano prepakiraju i prilagođavaju. Prema istraživanju Gartnera, zbog takvih integracijskih prepreka više od 60 % AI inicijativa nikada ne stigne do produkcije.
Ključni problemi
• Hardverska raznolikost zahtijeva specifične optimizacije za GPU-ove, CPU-e, NPU-e i mobilne SoC-e.
• Fragmentacija alata – TensorFlow, PyTorch, ONNX, MediaPipe i drugi – podiže trošak održavanja.
• Ograničenja na rubu mreže nalažu minimalnu latenciju i potrošnju energije.
Što znači pojednostavljenje Struka se sve više usuglašava oko pet poteza koji uklanjaju višak ponovnog inženjeringa:
- Apstrakcijski slojevi neovisni o platformi.
- Visokoučinkovite knjižnice ugrađene u glavne ML okvire.
- Jedinstveni dizajn koji se proteže od podatkovnog centra do mobitela.
- Otvoreni standardi i izvođenja (ONNX, MLIR) koji smanjuju vezanost uz jednog dobavljača.
- Ekosustavi usmjereni na brzinu, ponovljivost i skalabilnost.
Rast ekosustava i stvarni signali Pojednostavljenje više nije vizija nego praksa: rezultati najnovijeg MLPerf Inference v3.1 obuhvaćaju više od 13 500 mjerenja na podatkovnim i rubnim uređajima, pokazujući koliko su optimizacije danas rasprostranjene. U isto vrijeme, nagli uspon multimodalnih modela poput LLaMA-e ili Geminija potiče potražnju za fleksibilnim izvođenjima koja mogu raditi u oblaku, ali i lokalno na uređaju.
Armov primjer suradnje hardvera i softvera Tvrtka Arm ilustrira kako duboka integracija duž cijelog računalnog sloja može ubrzati razvoj. Na sajmu COMPUTEX 2025. predstavila je kombinaciju procesora Arm9, AI instrukcijskih proširenja i Kleidi knjižnica koje se prirodno povezuju s PyTorchom, ExecuTorchom, ONNX Runtimeom i MediaPipeom. Time se uklanja potreba za ručno pisanim kernelima, a developeri ostaju u poznatom radnom okruženju.
Posljedice su vidljive na oba kraja spektra: u podatkovnim centrima Arm-ove platforme podižu omjer performanse-po-wattu, dok na potrošačkim uređajima omogućuju glasovne asistente i prijevod u stvarnom vremenu bez iscrpljivanja baterije. Prognoze za 2025. govore da će gotovo polovica poslužitelja koje kupuju veliki oblaci koristiti Arm-ovu arhitekturu.
Što još treba dogoditi
• Su-dizajn hardvera i softvera koji otkriva nove akceleratorske funkcije kroz poznate okvire.
• Pouzdani, dobro dokumentirani alati dostupni na svim uređajima.
• Otvoreni, suradnički ekosustav umjesto paralelnih, vlasničkih grana koda.
• Apstrakcije koje ne skrivaju mogućnost finog ugađanja.
• Ugrađena sigurnost i privatnost, osobito na rubnim uređajima.
Pogled unaprijed „AI’s next phase isn’t about exotic hardware; it’s also about software that travels well”, poruka je koja sažima trend. Kada isti model može jednako učinkovito raditi u oblaku, na klijentu i na rubu, timovi brže isporučuju proizvode i troše manje vremena na prilagodbu infrastrukture.
Kako se softverski sloj stabilizira, pobjeđivat će oni koji objedine platforme, guraju optimizacije u glavne repozitorije i svoj napredak mjere otvorenim benchmark testovima. Pojednostavljenje se tako potvrđuje kao nova razvojna imperativ, a ne tek još jedan marketinški slogan.