Najnoviji potez tvrtke xAI izazvao je pomutnju u korporativnom IT-u: prošlog petka lansirani Grok 4 Fast donosi gotovo istu razinu „frontier” inteligencije kao prošlogodišnji Grok 4 – ali uz višestruko manji trošak i veću brzinu.
Grok 4 Fast je „olakšana” inačica modela predstavljenog u srpnju 2025., trenirana da smanji broj tzv. „thinking tokens” za oko 40 %. Ti tokeni nastaju tijekom internog rezoniranja, ne moraju biti prikazani korisniku, ali se ipak naplaćuju i troše energiju. Prema službenoj objavi, novi model na mnogim mjerilima dostiže ili nadmašuje original:
• AIME 2025 matematika – 92 % (Grok 4: 91,7 %)
• GPQA Diamond – 85,7 % (87,5 %)
• X Bench Deepsearch – 74 % (66 %)
Neovisna analiza firme Artificial Analysis smješta Grok 4 Fast na vrh svog Intelligence Indexa po cijeni po milijunu tokena: do 64 puta jeftiniji od ranih „frontier” modela i oko 12 puta jeftiniji od njihovih današnjih tarifa. Cijena za modele s indeksom inteligencije >60 spušta se na samo 0,2 USD za ulazne i 0,5 USD za izlazne tokene.
Model stiže u dvije SKU varijante – „grok-4-fast-reasoning” i „grok-4-fast-non-reasoning” – obje s kontekstnim prozorom od 2 milijuna tokena te limitom od 4 milijuna tokena i 480 zahtjeva u minuti. Postoji i opcija keširanja upita po 0,05 USD za milijun tokena, što dodatno smanjuje trošak ponovljenih ili RAG radnih opterećenja. Za usporedbu, stari Grok 4 košta 3 USD za ulazne i čak 15 USD za izlazne tokene uz deset puta manji kontekst (256 k).
Sigurnost i sukladnost posebno su istaknuti: API prisilno dodaje fiksni „system prompt” s default-politikom sigurnosti, a svako kršenje smjernica naplaćuje se 0,05 USD po zahtjevu. Model kartica pokazuje stopu odbijanja od 100 % za osjetljive teme (CBRN, kibernapadi, CSAM) i praktično nultu uspješnost napada na prompt-injection testovima AgentDojo (0,00–0,03).
Iako Grok 4 Fast radi na golemom klasteru GPU-ova Colossus u Memphisu, njegova je glavna prednost učinkovitost, a ne sirova veličina. xAI poručuje da „intelligence density” i optimizacija pri izvođenju postaju važniji od pukog gomilanja parametara, što bi moglo preokrenuti dosadašnje tržišne odnose.
Tvrtka je na GitHubu objavila i sistemske promptove te dio recepta treniranja, čime cilja na transparentnost nužnu za korporativne audite i regulatornu usklađenost. Jedina zadrška odnosi se na još nesasvim izglancanu konzistenciju ponašanja i stopu odbijanja, no za većinu poslovnih scenarija Grok 4 Fast trenutačno predstavlja možda najprivlačniji omjer cijene i mogućnosti na tržištu vrhunskog AI-a.