Tehnologija

Google DeepMind predstavlja Gemini Diffusion i otvara utrku za munjevito brze jezične modele

Eksperimentalni Gemini Diffusion zamjenjuje autoregresijsko generiranje difuzijskim postupkom denoiziranja, postiže i do 2 000 tokena u sekundi te otvara nova pitanja o brzini, cijeni i točnosti budućih velikih jezičnih modela.

min čitanja

Google DeepMind prošlog je mjeseca predstavio Gemini Diffusion, eksperimentalni model koji tekst stvara difuzijskim, a ne autoregresijskim pristupom. Umjesto da riječ po riječ gradi rečenicu, sustav kreće od „šuma” i kroz niz koraka denoizira sadržaj, što drastično ubrzava rad i otvara mogućnost paralelne obrade čitavih odlomaka.

Najavljen kao istraživački demo (prijave se primaju putem liste čekanja), Gemini Diffusion prema internim podacima generira između 1 000 i 2 000 tokena u sekundi. Za usporedbu, varijanta Gemini 2.5 Flash prosječno isporučuje 272,4 tokena u sekundi. U praktičnom testu VentureBeata odgovor na složene upite, poput izrade interaktivnih HTML aplikacija, stizao je za manje od tri sekunde, brzinom od 600 do 1 300 tokena u sekundi.

Brže – i pametnije?

Brendan O’Donoghue, znanstvenik u Google DeepMind-u i jedan od voditelja projekta, navodi četiri ključne prednosti novog pristupa:

• niže latencije; • adaptivno računanje (manje resursa za lakše zadatke, više za složenije); • nekauzalno rezoniranje zahvaljujući dvosmjernoj pažnji unutar bloka; • iterativno samoispravljanje jer se generirani tokeni vraćaju u denoiser.

Glavni nedostatak, ističe O’Donoghue, jest „higher cost of serving and slightly higher time-to-first-token (TTFT), since autoregressive models will produce the first token right away. For diffusion, the first token can only appear when the entire sequence of tokens is ready.”

Prema internom benchmarku, Gemini Diffusion rezultatima je usporediv s modelom Gemini 2.0 Flash-Lite: bolji je u kodiranju i matematici, dok Flash-Lite prednjači u rasuđivanju, znanstvenom znanju i višejezičnosti.

Alat donosi i način rada „Instant Edit”, koji omogućuje gotovo trenutačno uređivanje postojećeg teksta ili kôda – od gramatičkog dotjerivanja i SEO prilagodbi do refaktoriranja softverskih projekata.

Potencijal primjene

Brzina i sposobnost naknadnog ispravljanja čine difuzijske modele privlačnima za aplikacije kojima je ključan brzi odziv: chat-botove i konverzacijske sučelnike, titlovanje i prijevod u stvarnom vremenu te pametne IDE asistente. Iako je tehnologija još u povojima, Googleov eksperiment sugerira da bi difuzijski pristup mogao preoblikovati način na koji se ubuduće grade i primjenjuju veliki jezični modeli.

Slično

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru
Istraživanje Meta, Google DeepMind-a, NVIDIA-e i Cornella utvrdilo je da GPT-u slični modeli memoriraju fiksnih 3,6 bita po parametru, ublažavajući strah od masovnog kopiranja zaštićenog sadržaja.

min čitanja

Više

Ostalo

Oman potvrdio otkazivanje iransko-američkih nuklearnih pregovora
Nuklearni pregovori SAD-a i Irana u Muskatu otkazani su nakon napada na iranska postrojenja, potvrdio je ministar vanjskih poslova Omana.

min čitanja

Više

Gyökeres odbio Amorimov United, želi Ligu prvaka
Najbolji strijelac Sportinga odbio je prijedlog bivšeg trenera Rubena Amorima da prijeđe u Manchester United, inzistirajući na klubu koji igra Ligu prvaka.

min čitanja

Više

Matija Dedić o naslijeđu Arsena: „Dug je put do rečenice da sam bolji od oca”
Pijanist Matija Dedić prisjetio se koncerta s ocem Arsenom iz 2014. i „dugog puta” do trenutka kad ga je slavni kantautor nazvao boljim od sebe.

min čitanja

Više

Rog se oprostio od Dinama emotivnom porukom
Veznjak je na društvenim mrežama potvrdio odlazak iz Dinama uz emotivnu zahvalu klubu i navijačima.

min čitanja

Više

Prižmić juri novo slavlje u Bratislavi; Marčinko zaustavljena u Gradu
Dino Prižmić izborio finale Challengera u Bratislavi, dok je Petra Marčinko zaustavljena u polufinalu turnira u Gradu.

min čitanja

Više

U Berlinu ubijen neporaženi čečenski boksač Abu Jusupov
Nepoželjni šok u svijetu boksa: Abu Jusupov smrtno izboden u Berlinu; policija traži počinitelja.

min čitanja

Više

Rade Šerbedžija otkrio zašto je povratak u hrvatski teatar bio „atomska bomba”
Glumac i redatelj Rade Šerbedžija najavio je jubilarnu, 25. sezonu Teatra Ulysses te objasnio zašto je njegov povratak na hrvatske pozornice izazvao snažan odjek.

min čitanja

Više

Jedna osoba poginula u sudaru četiri vozila na A4, promet preusmjeren
Nesreća kod čvora Popovec odnijela je jedan život, promet na A4 zatvoren u oba smjera.

min čitanja

Više

Znanstveni skup u Benkovcu rasvjetljuje zaboravljenu bojišnicu Domovinskog rata
Benkovac je svečano obilježio 25 godina 134. domobranske pukovnije uz skup koji otvara nova poglavlja o biogradsko-benkovačkoj bojišnici.

min čitanja

Više

Na Sljemenu uručena priznanja najboljim hrvatskim skijašima
Hrvatski skijaški savez proglasio je najbolje sportaše i klubove u nordijskim, alpskim i snowboard disciplinama za sezonu 2024./2025.

min čitanja

Više