CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

11. lipnja 2025, 08:35

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru

Istraživanje Meta, Google DeepMind-a, NVIDIA-e i Cornella utvrdilo je da GPT-u slični modeli memoriraju fiksnih 3,6 bita po parametru, ublažavajući strah od masovnog kopiranja zaštićenog sadržaja.

min. čitanja

XFacebookWhatsApp

Novo zajedničko istraživanje Meta, Google DeepMind-a, NVIDIA-e i Sveučilišta Cornell donosi dosad najprecizniji odgovor na dugo postavljano pitanje: koliko sadržaja modeli poput GPT-a stvarno pamte, a koliko generaliziraju?

Rezultat je iznenađujuće stalan broj – oko 3,6 bita po parametru. Iako to zvuči apstraktno, riječ je o količini informacije dovoljnoj da se izabere jedna od 12 opcija, manje od pola ASCII znaka. Tim je vrijednost potvrđivao na stotinama eksperimenata, mijenjajući dubinu, širinu i preciznost transformera od 500 000 do 1,5 milijardi parametara.

Ključ metode bilo je treniranje modela na potpuno nasumičnim nizovima bitova. Budući da u takvom „šumu” nema nikakvih obrazaca, svako kasnije prisjećanje može doći isključivo iz memorije, a ne iz zaključivanja. Bez obzira na arhitekturu ili veličinu, modeli su na testu i dalje zadržavali tek spomenutih 3,6 bita po parametru – čak i kada su istraživači povećali preciznost s bfloat16 na float32, skok je bio skroman, do 3,83 bita.

Jedna od najzanimljivijih posljedica tiče se autorskih prava. Autori ističu da model ne „pamti više” ako ga se hrani s više podataka; naprotiv, isti kapacitet dijeli se na veći skup primjera pa je vjerojatnost doslovnog reproduciranja pojedinog zapisa manja. Voditelj studije Jack Morris sažeo je to riječima: „Treniranje na više podataka prisiljava modele da memoriraju manje po uzorku”.

Kad su se prebacili na stvarni tekst, istraživači su primijetili uravnoteženje između memorije i generalizacije. Manji korpusi potiču doslovno pamćenje, dok goleme baze omogućuju prelazak na obrasce jezika – praćen tzv. dvostrukim padom točnosti prije konačnog skoka kada generalizacija „preuzme stvar”.

Proračun kapaciteta stavlja brojke u perspektivu: model od 500 000 parametara može zapamtiti oko 225 kB, a model od 1,5 milijardi parametara otprilike 675 MB sirovih podataka. To je daleko od tipičnih veličina multimedijalnih datoteka, ali ipak relevantno za rasprave o privatnosti i sigurnosti.

Autori zaključuju da je „više podataka, a ne manje” sigurniji put za razvoj velikih jezičnih modela. U jeku sudskih sporova oko generativne umjetne inteligencije, njihovi bi rezultati mogli postati važan argument u prilog tvrdnji da treniranje na zaštićenim materijalima nije nužno jednako nedopuštenom kopiranju.

#nvidia#meta#google-deepmind#sveuciliste-cornell#jack-morris
View post on X
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Više od 70 udruga traži od Mete da odustane od prepoznavanja lica u pametnim naočalama
Koalicija civilnih organizacija smatra da bi funkcija „Name Tag” u Ray-Banu i Oakleyu omogućila tiho prepoznavanje prolaznika i ozbiljno ugrozila privatnost.
Anthony Quintano from Honolulu, HI, United States, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Građani u obrani Jadrana: u Splitu predstavljene aplikacije koje svakome otvaraju vrata znanosti
Citizen Science Day u Splitu okupio je pedesetak sudionika i predstavio niz aplikacija koje građanima omogućuju aktivno sudjelovanje u praćenju i zaštiti Jadrana.

min čitanja

Više

Tehnologija

OpenAI lansirao GPT-5.4-Cyber nakon upozorenja konkurenta
Nakon što je Anthropic odlučio zadržati svoj novi AI model pod ključem zbog straha od zlouporabe, OpenAI predstavlja GPT-5.4-Cyber, alat namijenjen kibernetičkim stručnjacima.

min čitanja

Više

Tehnologija

Poljičica prelazi u digitalno doba
U Srinjinama se 17. travnja predstavlja digitalni font Poljičice, staroga pisma proglašenog nematerijalnim kulturnim dobrom 2023. godine.

min čitanja

Više

Tehnologija

Anthropic i OpenAI u klinču zbog kontroverznog prijedloga zakona o odgovornosti AI-a u Illinoisu
Tvrtke su se razišle oko SB 3444, koji bi laboratorije oslobodio odgovornosti za masovne štete izazvane umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Iva Tolić: Stanice nas uče da je obnova srž života
Hrvatska znanstvenica Iva Tolić objašnjava kako neprekidna obnova na staničnoj razini može biti nadahnuće za suočavanje s globalnim krizama.

min čitanja

Više

Tehnologija

Prvi riječki bankomat zaškripio zbog prašine, ali najavio novu eru plaćanja
Podsjetnik na 1986.: riječki bankomat pokvarila je obična prašina, ali je unatoč tome označio početak digitalnog upravljanja novcem.

min čitanja

Više

Tehnologija

NASA-ino superračunalo: sav život na Zemlji nestaje za milijardu godina
Superračunalo NASA-e, analizirajući 400 000 scenarija, prognozira da će širenje Sunca uništiti sav život na Zemlji za otprilike milijardu godina.

min čitanja

Više

Tehnologija

Projektni dan u Splitu otkrio snagu mladih inovatora
Učenici Splitsko-dalmatinske županije na Projektnom danu Centra izvrsnosti predstavili su inovativne projekte, a najavljene su i nove prijave te velike investicije u školsku infrastrukturu.

min čitanja

Više

Tehnologija

Rijeka 28. travnja postaje središte razgovora o kibernetičkoj sigurnosti
Interaktivna izložba na Korzu i praktična radionica u Proizvodnom parku Torpedo približit će suvremene prijetnje i rješenja kibernetičke zaštite građanima i malim poduzetnicima.

min čitanja

Više

Najčitanije

Vijesti

Veliki požar progutao skladište HŽ-a u Osijeku
Skladište Hrvatskih željeznica u Donjem gradu planulo je usred dana; vatrogasci su plamen gasili satima, a uzrok se još istražuje.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Vijesti

Spaljivanje otpada izmaklo nadzoru: 47-godišnjak izazvao šumski požar u Dubravicama

Biznis

Željko Mihelić preuzeo čelo HPK-a uz upozorenje na loše brojke hrvatske poljoprivrede

Lifestyle

Opatijska knjižnica u travnju slavi knjigu: dječji tjedan, noć čitanja i šetnja Gervaisovim stihovima

Biznis

Blokada Hormuza prijeti globalnom lancu hrane: gnojiva nema, urod pada

Vijesti

Crikvenica pokreće obnovu Parka palih za domovinu vrijednu više od milijun eura

Lifestyle

Riječka Filodrammatica besplatno prikazuje dokumentarac o Luli

Vijesti

Istarska županija financira „Karijerni kompas” za srednjoškolce

Lifestyle

Rijeka sutra predstavlja dvojezičnu „Ispredenu priču“ Melite Adany

Biznis

Roko Vuletić preuzeo kormilo riječkog „3. maja”, slijedi rezanje troškova i novi vizualni identitet

Politika

Iran tajno koristio kineski satelit za nadzor američkih baza

Vijesti

Riječki maturanti srušili rekord: gotovo 140 doza krvi u dvodnevnoj MatuRijadi