Tehnologija

11. lipnja 2025, 08:35

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru

Istraživanje Meta, Google DeepMind-a, NVIDIA-e i Cornella utvrdilo je da GPT-u slični modeli memoriraju fiksnih 3,6 bita po parametru, ublažavajući strah od masovnog kopiranja zaštićenog sadržaja.

min. čitanja

Novo zajedničko istraživanje Meta, Google DeepMind-a, NVIDIA-e i Sveučilišta Cornell donosi dosad najprecizniji odgovor na dugo postavljano pitanje: koliko sadržaja modeli poput GPT-a stvarno pamte, a koliko generaliziraju?

Rezultat je iznenađujuće stalan broj – oko 3,6 bita po parametru. Iako to zvuči apstraktno, riječ je o količini informacije dovoljnoj da se izabere jedna od 12 opcija, manje od pola ASCII znaka. Tim je vrijednost potvrđivao na stotinama eksperimenata, mijenjajući dubinu, širinu i preciznost transformera od 500 000 do 1,5 milijardi parametara.

Ključ metode bilo je treniranje modela na potpuno nasumičnim nizovima bitova. Budući da u takvom „šumu” nema nikakvih obrazaca, svako kasnije prisjećanje može doći isključivo iz memorije, a ne iz zaključivanja. Bez obzira na arhitekturu ili veličinu, modeli su na testu i dalje zadržavali tek spomenutih 3,6 bita po parametru – čak i kada su istraživači povećali preciznost s bfloat16 na float32, skok je bio skroman, do 3,83 bita.

Jedna od najzanimljivijih posljedica tiče se autorskih prava. Autori ističu da model ne „pamti više” ako ga se hrani s više podataka; naprotiv, isti kapacitet dijeli se na veći skup primjera pa je vjerojatnost doslovnog reproduciranja pojedinog zapisa manja. Voditelj studije Jack Morris sažeo je to riječima: „Treniranje na više podataka prisiljava modele da memoriraju manje po uzorku”.

Kad su se prebacili na stvarni tekst, istraživači su primijetili uravnoteženje između memorije i generalizacije. Manji korpusi potiču doslovno pamćenje, dok goleme baze omogućuju prelazak na obrasce jezika – praćen tzv. dvostrukim padom točnosti prije konačnog skoka kada generalizacija „preuzme stvar”.

Proračun kapaciteta stavlja brojke u perspektivu: model od 500 000 parametara može zapamtiti oko 225 kB, a model od 1,5 milijardi parametara otprilike 675 MB sirovih podataka. To je daleko od tipičnih veličina multimedijalnih datoteka, ali ipak relevantno za rasprave o privatnosti i sigurnosti.

Autori zaključuju da je „više podataka, a ne manje” sigurniji put za razvoj velikih jezičnih modela. U jeku sudskih sporova oko generativne umjetne inteligencije, njihovi bi rezultati mogli postati važan argument u prilog tvrdnji da treniranje na zaštićenim materijalima nije nužno jednako nedopuštenom kopiranju.

#nvidia #meta #google-deepmind #sveuciliste-cornell #jack-morris

View post on X

Slično

Tehnologija

Bruxelles prozvao Metu: Facebook i Instagram otežavaju prijavu ilegalnog sadržaja

Europska komisija zaključila je da Facebook i Instagram odbijaju jednostavne prijave nasilnog i terorističkog sadržaja te ne otvaraju podatke istraživačima, što bi Meti moglo donijeti kaznu do 6 % globalnog prihoda.

min čitanja

Više

Biznis

Intel se vraća na staze rasta: Trumpovo ulaganje, skok prihoda i nova tvornica u Arizoni

Prihodi rastu, gubici se pretvaraju u dobit, a dionice lete: Intel na krilima državnog i privatnog kapitala otvara novu tvornicu i traži put natrag na vrh industrije poluvodiča.

min čitanja

Više

Tehnologija

Rafailov tvrdi: put do prave umjetne inteligencije vodi kroz učenje, ne kroz još veće modele

Istraživač Thinking Machines Laba kritizirao je utrku u gomilanju sve većih modela i pozvao na razvoj sustava koji kontinuirano uče i pamte – što vidi kao jedini realan put prema AGI-ju.

min čitanja

Više

Tehnologija

Ant Group predstavio Ring-1T, prvi otvoreni AI model s bilijun parametara

Ant Group lansirao Ring-1T, otvoreni AI model s bilijun parametara, koji se na testovima približio GPT-5 i postavio nova mjerila za kinesku tehnologiju.

min čitanja

Više

Tehnologija

Zemlja dobila sedmi kvazimjesec 2025 PN7

Mali asteroid 2025 PN7, otkriven teleskopom Pan-STARRS, potvrđen je kao sedmi kvazimjesec koji privremeno prati Zemlju.

min čitanja

Više

Tehnologija

KBC Rijeka lansirao prvu hrvatsku aplikaciju za žene s ranim rakom dojke

Brošura i aplikacija ENEA pružaju cjelovitu podršku pacijenticama s ranim rakom dojke, od dijagnoze do rehabilitacije.

min čitanja

Više

Tehnologija

Mistral predstavio AI Studio za brži i sigurniji razvoj poslovnih aplikacija

Francuski Mistral lansirao je AI Studio, platformu koja spaja izradu, nadzor i upravljanje AI aplikacijama unutar jednog okruženja te tvrtkama nudi fleksibilno i sigurno izvođenje modela.

min čitanja

Više

Tehnologija

Nova DNK analiza otkriva paratifus i povratnu groznicu među Napoleonovim vojnicima

DNK iz zuba vojnika pronađenih u Vilniusu pokazuje da su Napoleonovi vojnici tijekom povlačenja iz Rusije bili pogođeni paratifusom i povratnom groznicom, što dodatno objašnjava golem broj žrtava.

min čitanja

Više

Tehnologija

AI školski sustav zamijenio vrećicu grickalica za pištolj, policija privela učenika

Algoritam za otkrivanje oružja u srednjoj školi Kenwood u Baltimoru pogrešno je detektirao vrećicu Doritosa kao pištolj, zbog čega je učenik završio u lisicama.

min čitanja

Više

Tehnologija

Akustični tagovi i „ghost diveri” u borbi protiv duh-mreža u Jadranu

WWF Adria i međunarodni partneri u Komiži testiraju akustične tagove i podmorskog robota kako bi spriječili da izgubljene ribarske mreže desetljećima ubijaju morski svijet.

min čitanja

Više

Najčitanije

Nogomet

Modrićev blistavi nastup za Milan: kapetan Hrvatske spasio bod u nadoknadi

Luka Modrić proglašen igračem utakmice nakon što je u 93. minuti asistencijom donio bod Milanu protiv Pise.

min čitanja

Više

Nogomet

Milan u drami spasio bod protiv Pise zahvaljujući Modrićevoj asistenciji

Dramatična završnica na San Siru: Modrićev precizan centaršut u 93. minuti donio je Milanu remi i ostanak na vrhu Serie A.

min čitanja

Više

Vijesti

Američki nosač Gerald R. Ford iz Splita zaplovio prema Karibima u operaciji protiv narkotrafikanata

Pentagon je naredio hitno premještanje najvećeg nosača aviona na svijetu kako bi pojačao kampanju protiv trgovine drogom u Latinskoj Americi, što izaziva nervozu u regiji.

min čitanja

Više

Politika

Anušić iz Osijeka: „Sigurnost nema cijenu, ulaganja u obranu nisu bacanje novca”

Ministar obrane Ivan Anušić na konferenciji u Osijeku poručio da ulaganja u obranu jačaju sigurnost i gospodarstvo, dok su sudionici skupa pozvali Europu da preuzme snažniju globalnu mirotvornu ulogu.

min čitanja

Više

Nogomet

Hajduk slavio u Velikoj Gorici i zasjeo na vrh HNL-a

Pobjedom 3:1 protiv Gorice, Bijeli su preskočili Dinamo i zasjeli na vrh prvenstvene ljestvice.

min čitanja

Više

Tehnologija

11. lipnja 2025, 08:35

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru

min. čitanja

#nvidia #meta #google-deepmind #sveuciliste-cornell #jack-morris

View post on X

Slično

Tehnologija

Bruxelles prozvao Metu: Facebook i Instagram otežavaju prijavu ilegalnog sadržaja

min čitanja

Više

Biznis

Intel se vraća na staze rasta: Trumpovo ulaganje, skok prihoda i nova tvornica u Arizoni

Prihodi rastu, gubici se pretvaraju u dobit, a dionice lete: Intel na krilima državnog i privatnog kapitala otvara novu tvornicu i traži put natrag na vrh industrije poluvodiča.

min čitanja

Više

Tehnologija

Rafailov tvrdi: put do prave umjetne inteligencije vodi kroz učenje, ne kroz još veće modele

Istraživač Thinking Machines Laba kritizirao je utrku u gomilanju sve većih modela i pozvao na razvoj sustava koji kontinuirano uče i pamte – što vidi kao jedini realan put prema AGI-ju.

min čitanja

Više

Tehnologija

Ant Group predstavio Ring-1T, prvi otvoreni AI model s bilijun parametara

Ant Group lansirao Ring-1T, otvoreni AI model s bilijun parametara, koji se na testovima približio GPT-5 i postavio nova mjerila za kinesku tehnologiju.

min čitanja

Više

Tehnologija

Zemlja dobila sedmi kvazimjesec 2025 PN7

Mali asteroid 2025 PN7, otkriven teleskopom Pan-STARRS, potvrđen je kao sedmi kvazimjesec koji privremeno prati Zemlju.

min čitanja

Više

Tehnologija

KBC Rijeka lansirao prvu hrvatsku aplikaciju za žene s ranim rakom dojke

Brošura i aplikacija ENEA pružaju cjelovitu podršku pacijenticama s ranim rakom dojke, od dijagnoze do rehabilitacije.

min čitanja

Više

Tehnologija

Mistral predstavio AI Studio za brži i sigurniji razvoj poslovnih aplikacija

Francuski Mistral lansirao je AI Studio, platformu koja spaja izradu, nadzor i upravljanje AI aplikacijama unutar jednog okruženja te tvrtkama nudi fleksibilno i sigurno izvođenje modela.

min čitanja

Više

Tehnologija

Nova DNK analiza otkriva paratifus i povratnu groznicu među Napoleonovim vojnicima

min čitanja

Više

Tehnologija

AI školski sustav zamijenio vrećicu grickalica za pištolj, policija privela učenika

Algoritam za otkrivanje oružja u srednjoj školi Kenwood u Baltimoru pogrešno je detektirao vrećicu Doritosa kao pištolj, zbog čega je učenik završio u lisicama.

min čitanja

Više

Tehnologija

Akustični tagovi i „ghost diveri” u borbi protiv duh-mreža u Jadranu

WWF Adria i međunarodni partneri u Komiži testiraju akustične tagove i podmorskog robota kako bi spriječili da izgubljene ribarske mreže desetljećima ubijaju morski svijet.

min čitanja

Više

Najčitanije

Nogomet

Modrićev blistavi nastup za Milan: kapetan Hrvatske spasio bod u nadoknadi

Luka Modrić proglašen igračem utakmice nakon što je u 93. minuti asistencijom donio bod Milanu protiv Pise.

min čitanja

Više

Nogomet

Milan u drami spasio bod protiv Pise zahvaljujući Modrićevoj asistenciji

Dramatična završnica na San Siru: Modrićev precizan centaršut u 93. minuti donio je Milanu remi i ostanak na vrhu Serie A.

min čitanja

Više

Vijesti

Američki nosač Gerald R. Ford iz Splita zaplovio prema Karibima u operaciji protiv narkotrafikanata

Pentagon je naredio hitno premještanje najvećeg nosača aviona na svijetu kako bi pojačao kampanju protiv trgovine drogom u Latinskoj Americi, što izaziva nervozu u regiji.

min čitanja

Više

Politika

Anušić iz Osijeka: „Sigurnost nema cijenu, ulaganja u obranu nisu bacanje novca”

min čitanja

Više

Nogomet

Hajduk slavio u Velikoj Gorici i zasjeo na vrh HNL-a

Pobjedom 3:1 protiv Gorice, Bijeli su preskočili Dinamo i zasjeli na vrh prvenstvene ljestvice.

min čitanja

Više