OpenAI je u četvrtak lansirao GPT-5.3-Codex-Spark, pojednostavljenu verziju svog poznatog modela za pisanje koda, optimiziranu za gotovo trenutačan odziv. Riječ je o prvom većem projektnom izvođenju („inference”) u kojem se tvrtka odmiče od uobičajene, Nvidia-dominirane infrastrukture i oslanja na hardver proizvođača Cerebras Systems iz kalifornijskog Sunnyvalea.
Cerebrasovi procesori veličine cijele pločice („wafer-scale”) specijalizirani su za radne zadatke s niskom latencijom, što OpenAI-u omogućuje da izbjegne uska grla tipična za GPU klastere. Prema internim podacima, nova varijanta Codexa postiže brzinu odgovora do 15 puta veću od prethodnika, iako zbog naglaska na brzinu zadržava nešto skromniji skup mogućnosti u odnosu na puni model GPT-5.3-Codex.
„GPU-ovi i dalje ostaju temelj našim sustavima za učenje i izvođenje modela”, poručili su iz OpenAI-a, naglašavajući da partnerstvo s Cerebrasom ne znači odustajanje od postojećih grafičkih akceleratora nego diversifikaciju izvora računalne snage.
Najava stiže u osjetljivom trenutku za OpenAI: odnosi s dugogodišnjim dobavljačem Nvidijom navodno su pod pritiskom, korisnici kritiziraju uvođenje oglasa u ChatGPT, a reorganizacija unutar tvrtke dovela je do raspuštanja sigurnosno orijentiranih timova. Upravo zato suradnja s alternativnim proizvođačem čipova mnogi promatraju kao strateški iskorak, ali i kao pokušaj da se ubrza isporuka proizvoda orijentiranih na specifične, komercijalno primjenjive zadatke poput kolaborativnog programiranja u stvarnom vremenu.