Google je lansirao Gemini 3.1 Flash-Lite, najnoviji i zasad najbrži model iz svoje obitelji generativnih sustava, namijenjen tvrtkama i razvojnim timovima kojima je presudna niska latencija i povoljna cijena.
Model je, prema internim testovima i neovisnim mjerenjima, 2,5 puta brži u isporuci prvog tokena od prethodnika Gemini 2.5 Flash, a ukupno generira 363 tokena u sekundi (45 % brže nego do sada). Potpredsjednik istraživanja u Google DeepMindu Koray Kavukcuoglu brzinu je na mreži X opisao riječima: „an unbelievable amount of complex engineering to make AI feel instantaneous”.
Ključne tehničke novosti • Uvedene su „razine razmišljanja” – programeri mogu dinamički podešavati dubinu rezoniranja: za jednostavne klasifikacije model se spušta na nižu razinu radi brzine i uštede, dok se za kompleksne analize logika pojačava. • Unatoč oznaci Lite, Flash-Lite ostvario je Elo rezultat 1432 na ljestvici Arena.ai, svrstavajući se uz znatno veće modele.
Specijalizirana snaga – Znanstveno znanje (GPQA Diamond): 86,9 % – Multimodalno razumijevanje (MMMU-Pro): 76,8 % – Višejezični Q&A (MMMLU): 88,9 % – Strukturna izlazna usklađenost (LiveCodeBench): 72,0 % – Video razumijevanje (Video-MMMU): 84,8 %
Cijena koja mijenja računicu Google je model cijenio na 0,25 USD za milijun ulaznih tokena i 1,50 USD za milijun izlaznih, što je četiri do pet puta jeftinije od nekih konkurenata i 17 % povoljnije od ranije generacije Flash. U kombinaciji s Gemini 3.1 Pro – skupljim, ali dublje rezonirajućim „mozgom” sustava – poduzeća mogu prvo složene zadatke prepustiti Pro-u, a potom masovnu egzekuciju prebaciti na Flash-Lite, smanjujući trošak od 12 do 16 puta u scenarijima s više od 200 000 tokena po interakciji.
Primjene u praksi Flash-Lite cilja operacije poput: • moderiranja sadržaja u stvarnom vremenu, • strojnih prijevoda i označavanja milijuna zapisa dnevno, • generiranja korisničkih sučelja i punjenja kataloga proizvoda u sekundi, • automatiziranog usmjeravanja zahtjeva uz 94 % točnosti, prema prvim testerima.
U kontekstu rastuće potražnje za AI-jem „na klik”, Google sada nudi dvodjelnu strategiju: Pro za dubinsko promišljanje, Flash-Lite za munjevitu, povoljnu izvedbu. Time umjetna inteligencija, tvrde u tvrtki, prelazi iz skupog eksperimenta u „komunalnu uslugu” koju se isplati pokrenuti nad svakim logom, mailom ili chatom s korisnicima.