CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

11. lipnja 2025, 08:35

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru

Istraživanje Meta, Google DeepMind-a, NVIDIA-e i Cornella utvrdilo je da GPT-u slični modeli memoriraju fiksnih 3,6 bita po parametru, ublažavajući strah od masovnog kopiranja zaštićenog sadržaja.

min. čitanja

XFacebookWhatsApp

Novo zajedničko istraživanje Meta, Google DeepMind-a, NVIDIA-e i Sveučilišta Cornell donosi dosad najprecizniji odgovor na dugo postavljano pitanje: koliko sadržaja modeli poput GPT-a stvarno pamte, a koliko generaliziraju?

Rezultat je iznenađujuće stalan broj – oko 3,6 bita po parametru. Iako to zvuči apstraktno, riječ je o količini informacije dovoljnoj da se izabere jedna od 12 opcija, manje od pola ASCII znaka. Tim je vrijednost potvrđivao na stotinama eksperimenata, mijenjajući dubinu, širinu i preciznost transformera od 500 000 do 1,5 milijardi parametara.

Ključ metode bilo je treniranje modela na potpuno nasumičnim nizovima bitova. Budući da u takvom „šumu” nema nikakvih obrazaca, svako kasnije prisjećanje može doći isključivo iz memorije, a ne iz zaključivanja. Bez obzira na arhitekturu ili veličinu, modeli su na testu i dalje zadržavali tek spomenutih 3,6 bita po parametru – čak i kada su istraživači povećali preciznost s bfloat16 na float32, skok je bio skroman, do 3,83 bita.

Jedna od najzanimljivijih posljedica tiče se autorskih prava. Autori ističu da model ne „pamti više” ako ga se hrani s više podataka; naprotiv, isti kapacitet dijeli se na veći skup primjera pa je vjerojatnost doslovnog reproduciranja pojedinog zapisa manja. Voditelj studije Jack Morris sažeo je to riječima: „Treniranje na više podataka prisiljava modele da memoriraju manje po uzorku”.

Kad su se prebacili na stvarni tekst, istraživači su primijetili uravnoteženje između memorije i generalizacije. Manji korpusi potiču doslovno pamćenje, dok goleme baze omogućuju prelazak na obrasce jezika – praćen tzv. dvostrukim padom točnosti prije konačnog skoka kada generalizacija „preuzme stvar”.

Proračun kapaciteta stavlja brojke u perspektivu: model od 500 000 parametara može zapamtiti oko 225 kB, a model od 1,5 milijardi parametara otprilike 675 MB sirovih podataka. To je daleko od tipičnih veličina multimedijalnih datoteka, ali ipak relevantno za rasprave o privatnosti i sigurnosti.

Autori zaključuju da je „više podataka, a ne manje” sigurniji put za razvoj velikih jezičnih modela. U jeku sudskih sporova oko generativne umjetne inteligencije, njihovi bi rezultati mogli postati važan argument u prilog tvrdnji da treniranje na zaštićenim materijalima nije nužno jednako nedopuštenom kopiranju.

#nvidia#meta#google-deepmind#sveuciliste-cornell#jack-morris
View post on X

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Groq i DeepSeek najavljuju novu stepenicu u AI utrci: Nvidia pred ključnom odlukom
Brza inferencija Groqovih LPU čipova i štedljivi MoE pristup DeepSeeka nagovješćuju novi skok u umjetnoj inteligenciji, a potez Nvidije mogao bi presuditi tko će vladati idućom fazom tržišta.

min čitanja

Više

Tehnologija

Britanija zatvara rupu u zakonu: AI chatboti odsad odgovorni za nezakonit sadržaj
London najavljuje hitnu izmjenu Zakona o internetskoj sigurnosti: nakon skandala s chatbotom Grok, sve AI platforme morat će sprječavati nezakonit i štetan sadržaj ili se suočiti s kaznama.
Simon Dawson / No10 Downing Street, OGL 3 <http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3>, via Wikimedia CommonsBy Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Volkswagen u Hrvatsku dovodi potpuno novi T-Roc: hibridni motori, moderniji interijer i napredne asistencije
Druga generacija Volkswagenova SUV-a stiže u hrvatske salone: donosi hibridne eTSI motore, redizajn i nove sustave potpore.

min čitanja

Više

Tehnologija

Amerikanci zrakoplovom prebacili mikroreaktor: proboj u brzoj nuklearnoj logistici
Mali nuklearni reaktor Ward zrakoplovom C-17 preseljen je iz Kalifornije u Utu, što američke vlasti nazivaju prekretnicom za brzu i mobilnu opskrbu električnom energijom.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Europski parlament gasi AI alate na službenim tabletima zbog sigurnosnih rizika
Parlament privremeno ukinuo automatske asistente na službenim uređajima kako bi spriječio moguće iznošenje podataka izvan EU-a.

min čitanja

Više

Tehnologija

Prvi dokumentirani napad AI-a na čovjeka uzdrmao tehnološku zajednicu
Autonomni softverski agent napao je programera Scotta Shambaugha nakon odbijenog doprinosa, otvarajući bolna pitanja o granicama AI-a, sigurnosti otvorenih projekata i pravnoj odgovornosti.

min čitanja

Više

Tehnologija

Robotaksiji Verne predstavljeni u Kerestincu: BCG vidi do tri milijuna autonomnih vozila do 2035.
P3 Mobility Mate Rimca lansirao je robotaksije Verne, dok BCG predviđa eksplozivan rast autonomnih vozila, posebno u SAD-u i Kini.

min čitanja

Više

Tehnologija

Makerska zajednica u SAD-u uzvraća ICE-u zviždaljkama, mrežama bez interneta i „oružanom nježnošću”
Američki maker prostori prerastaju u radionice otpora: od 3D-printanih zviždaljki i nosivih mesh-mreža do solarnih punjača i popravljaonica oštećene opreme.

min čitanja

Više

Tehnologija

Novi fakultativni predmet o umjetnoj inteligenciji stiže u sve srednje škole
Od nove školske godine svi hrvatski srednjoškolci moći će birati predmet o umjetnoj inteligenciji, a stručnjaci upozoravaju da će ključ uspjeha biti dobro osposobljeni nastavnici i jednaka dostupnost u svim školama.

min čitanja

Više

Tehnologija

Splitski start-upovi oduševili Amsterdam i pokazali europski potencijal
Sedam start-upova okupljenih oko „Digitalne Dalmacije” impresioniralo je investitore u Amsterdamu i otvorilo vrata širenju na europsko tržište.

min čitanja

Više

Najčitanije

Vijesti

Tragedija na gradilištu zadarske Medicinske škole: radnik pao s visine i poginuo
Radnik je pao s visine na gradilištu Medicinske škole u Zadru, a ozljede su bile kobne. Policija i inspekcija rada provode očevid kako bi utvrdile uzrok nesreće.

min čitanja

Više

Vijesti

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Na granici Karasovići pao ukrajinac s 500.000 eura skrivenih u bočnim stijenama automobila
Policija i carina na prijelazu Karasovići zaplijenile su pola milijuna eura skrivenih u automobilu s češkim tablicama i uhitile 24-godišnjeg Ukrajinca zbog sumnje u pranje novca.

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Hajduk blizu potpisa Marešića: stoper Istre stiže za 150 tisuća eura
Splićani su dogovorili sve detalje s Istrom 1961 i očekuju službenu potvrdu dolaska Darija Marešića najkasnije do sutra.

min čitanja

Više

Najnovije

Vijesti

Azijski radnici u Hrvatskoj sve češće mete rasističkih napada

Sport

Slalom drama u Bormiju: McGrathov slom otvorio put povijesnom zlatu Švicarca Meillarda

Vijesti

Zimski minusi otkrivaju slabost mobilnih radara: kazne za brzinu mogle bi pasti na sudu

Lifestyle

Srpkinja u timu pobjedničke pjesme Dore: tko je Zorja, autorica i vokal „Andromede”

Politika

Bivši predsjednik otkriva motive sukoba s HDZ-om oko pravosuđa

Tehnologija

Britanija zatvara rupu u zakonu: AI chatboti odsad odgovorni za nezakonit sadržaj

Vijesti

Najava trenažnih letova Gulfstreama G600 nad Pulom

Politika

Milanovićeva najava vlastite liste uzburkala političku scenu

Vijesti

David M. Smith ostaje na čelu IRB-a: treći mandat potvrđen jednoglasno

Biznis

Nitko ne želi Jadrolinijine „Dubravku” i „Oleu”

Vijesti

Vukovarsko-srijemska županija usvaja plan za smanjenje napuštenih pasa