Googleova istraživačka ekipa DeepMind objavila je Gemmu 3 270M, jezični model s 270 milijuna parametara koji je dovoljno malen da radi lokalno na pametnom telefonu – bez internetske veze.
Model kombinira 170 milijuna parametara za ugrađivanje riječi s 100 milijuna parametara transformatorskih blokova, što mu omogućuje da „izvan kutije” prati upute korisnika, a pritom se može dodatno prilagoditi (fine-tunirati) u svega nekoliko minuta. Prema internim testovima, 25 razgovora na Pixelu 9 Pro u INT4 kvantiziranoj verziji trošilo je tek 0,75 % baterije, što ga čini privlačnim za zadatke kojima su ključni privatnost i rad izvan mreže.
Omar Sanseviero iz Google DeepMinda na društvenoj mreži X naglasio je da se Gemma 3 270M može pokrenuti „u pregledniku, na Raspberryju Pi pa čak i u vašem tosteru”, ilustrirajući njezinu prilagodljivost skromnom hardveru.
Na IFEval ljestvici za praćenje uputa Gemma 3 270M postigla je 51,2 %, što je iznad rezultata usporedivih malih modela poput SmolLM2 135M Instruct i Qwen 2.5 0.5B Instruct, a približava se učinku nekih višestruko većih sustava. Konkurentski startup Liquid AI, međutim, podsjetio je da njihov LFM2-350M slične veličine ostvaruje 65,12 %.
Google uz model nudi i kvantno-svjesne (QAT) kontrolne točke za INT4 preciznost, kao i vodiče za implementaciju na platformama Hugging Face, UnSloth i JAX. Licencni uvjeti dopuštaju besplatnu komercijalnu uporabu i daljnju distribuciju, uz obvezu pridržavanja Googleove politike zabrane zlouporabe i navođenja eventualnih izmjena.
Tvrtka poručuje da je ponekad „manji model pravo rješenje”: za analizu sentimenta, ekstrakciju entiteta, generiranje strukturiranog teksta ili provjere usklađenosti, specijalizirana Gemma može biti brža i jeftinija od velikih univerzalnih LLM-ova. Primjerice, Adaptive ML je ranije s Gemom 3 4B nadmašio znatno veće sustave u višeknjižnom moderiranju sadržaja za SK Telecom.
Google već demonstrira kreativne primjene: u YouTube videu aplikacija za pričanje priča prije spavanja radi u potpunosti offline u pregledniku, pogonjena upravo Gemmom 3 270M. Takvi scenariji, ističu iz kompanije, otvaraju put floti specijaliziranih, energetski učinkovitih i privatnosti-prijateljskih AI rješenja.