CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

11. lipnja 2025, 08:35

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru

Istraživanje Meta, Google DeepMind-a, NVIDIA-e i Cornella utvrdilo je da GPT-u slični modeli memoriraju fiksnih 3,6 bita po parametru, ublažavajući strah od masovnog kopiranja zaštićenog sadržaja.

min. čitanja

Novo zajedničko istraživanje Meta, Google DeepMind-a, NVIDIA-e i Sveučilišta Cornell donosi dosad najprecizniji odgovor na dugo postavljano pitanje: koliko sadržaja modeli poput GPT-a stvarno pamte, a koliko generaliziraju?

Rezultat je iznenađujuće stalan broj – oko 3,6 bita po parametru. Iako to zvuči apstraktno, riječ je o količini informacije dovoljnoj da se izabere jedna od 12 opcija, manje od pola ASCII znaka. Tim je vrijednost potvrđivao na stotinama eksperimenata, mijenjajući dubinu, širinu i preciznost transformera od 500 000 do 1,5 milijardi parametara.

Ključ metode bilo je treniranje modela na potpuno nasumičnim nizovima bitova. Budući da u takvom „šumu” nema nikakvih obrazaca, svako kasnije prisjećanje može doći isključivo iz memorije, a ne iz zaključivanja. Bez obzira na arhitekturu ili veličinu, modeli su na testu i dalje zadržavali tek spomenutih 3,6 bita po parametru – čak i kada su istraživači povećali preciznost s bfloat16 na float32, skok je bio skroman, do 3,83 bita.

Jedna od najzanimljivijih posljedica tiče se autorskih prava. Autori ističu da model ne „pamti više” ako ga se hrani s više podataka; naprotiv, isti kapacitet dijeli se na veći skup primjera pa je vjerojatnost doslovnog reproduciranja pojedinog zapisa manja. Voditelj studije Jack Morris sažeo je to riječima: „Treniranje na više podataka prisiljava modele da memoriraju manje po uzorku”.

Kad su se prebacili na stvarni tekst, istraživači su primijetili uravnoteženje između memorije i generalizacije. Manji korpusi potiču doslovno pamćenje, dok goleme baze omogućuju prelazak na obrasce jezika – praćen tzv. dvostrukim padom točnosti prije konačnog skoka kada generalizacija „preuzme stvar”.

Proračun kapaciteta stavlja brojke u perspektivu: model od 500 000 parametara može zapamtiti oko 225 kB, a model od 1,5 milijardi parametara otprilike 675 MB sirovih podataka. To je daleko od tipičnih veličina multimedijalnih datoteka, ali ipak relevantno za rasprave o privatnosti i sigurnosti.

Autori zaključuju da je „više podataka, a ne manje” sigurniji put za razvoj velikih jezičnih modela. U jeku sudskih sporova oko generativne umjetne inteligencije, njihovi bi rezultati mogli postati važan argument u prilog tvrdnji da treniranje na zaštićenim materijalima nije nužno jednako nedopuštenom kopiranju.

#nvidia#meta#google-deepmind#sveuciliste-cornell#jack-morris
View post on X

Slično

Tehnologija

Bruxelles prozvao Metu: Facebook i Instagram otežavaju prijavu ilegalnog sadržaja
Europska komisija zaključila je da Facebook i Instagram odbijaju jednostavne prijave nasilnog i terorističkog sadržaja te ne otvaraju podatke istraživačima, što bi Meti moglo donijeti kaznu do 6 % globalnog prihoda.

min čitanja

Više

Biznis

Intel se vraća na staze rasta: Trumpovo ulaganje, skok prihoda i nova tvornica u Arizoni
Prihodi rastu, gubici se pretvaraju u dobit, a dionice lete: Intel na krilima državnog i privatnog kapitala otvara novu tvornicu i traži put natrag na vrh industrije poluvodiča.

min čitanja

Više

Tehnologija

Rafailov tvrdi: put do prave umjetne inteligencije vodi kroz učenje, ne kroz još veće modele
Istraživač Thinking Machines Laba kritizirao je utrku u gomilanju sve većih modela i pozvao na razvoj sustava koji kontinuirano uče i pamte – što vidi kao jedini realan put prema AGI-ju.

min čitanja

Više

Tehnologija

Ant Group predstavio Ring-1T, prvi otvoreni AI model s bilijun parametara
Ant Group lansirao Ring-1T, otvoreni AI model s bilijun parametara, koji se na testovima približio GPT-5 i postavio nova mjerila za kinesku tehnologiju.

min čitanja

Više

Tehnologija

Zemlja dobila sedmi kvazimjesec 2025 PN7
Mali asteroid 2025 PN7, otkriven teleskopom Pan-STARRS, potvrđen je kao sedmi kvazimjesec koji privremeno prati Zemlju.

min čitanja

Više

Tehnologija

KBC Rijeka lansirao prvu hrvatsku aplikaciju za žene s ranim rakom dojke
Brošura i aplikacija ENEA pružaju cjelovitu podršku pacijenticama s ranim rakom dojke, od dijagnoze do rehabilitacije.

min čitanja

Više

Tehnologija

Mistral predstavio AI Studio za brži i sigurniji razvoj poslovnih aplikacija
Francuski Mistral lansirao je AI Studio, platformu koja spaja izradu, nadzor i upravljanje AI aplikacijama unutar jednog okruženja te tvrtkama nudi fleksibilno i sigurno izvođenje modela.

min čitanja

Više

Tehnologija

Nova DNK analiza otkriva paratifus i povratnu groznicu među Napoleonovim vojnicima
DNK iz zuba vojnika pronađenih u Vilniusu pokazuje da su Napoleonovi vojnici tijekom povlačenja iz Rusije bili pogođeni paratifusom i povratnom groznicom, što dodatno objašnjava golem broj žrtava.

min čitanja

Više

Tehnologija

AI školski sustav zamijenio vrećicu grickalica za pištolj, policija privela učenika
Algoritam za otkrivanje oružja u srednjoj školi Kenwood u Baltimoru pogrešno je detektirao vrećicu Doritosa kao pištolj, zbog čega je učenik završio u lisicama.

min čitanja

Više

Tehnologija

Akustični tagovi i „ghost diveri” u borbi protiv duh-mreža u Jadranu
WWF Adria i međunarodni partneri u Komiži testiraju akustične tagove i podmorskog robota kako bi spriječili da izgubljene ribarske mreže desetljećima ubijaju morski svijet.

min čitanja

Više

Najčitanije

Nogomet

Modrićev blistavi nastup za Milan: kapetan Hrvatske spasio bod u nadoknadi
Luka Modrić proglašen igračem utakmice nakon što je u 93. minuti asistencijom donio bod Milanu protiv Pise.
By Светлана Бекетова - soccer.ru, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=70292659

min čitanja

Više

Nogomet

Milan u drami spasio bod protiv Pise zahvaljujući Modrićevoj asistenciji
Dramatična završnica na San Siru: Modrićev precizan centaršut u 93. minuti donio je Milanu remi i ostanak na vrhu Serie A.
By Светлана Бекетова - soccer.ru, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=70292659

min čitanja

Više

Vijesti

Američki nosač Gerald R. Ford iz Splita zaplovio prema Karibima u operaciji protiv narkotrafikanata
Pentagon je naredio hitno premještanje najvećeg nosača aviona na svijetu kako bi pojačao kampanju protiv trgovine drogom u Latinskoj Americi, što izaziva nervozu u regiji.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Politika

Anušić iz Osijeka: „Sigurnost nema cijenu, ulaganja u obranu nisu bacanje novca”
Ministar obrane Ivan Anušić na konferenciji u Osijeku poručio da ulaganja u obranu jačaju sigurnost i gospodarstvo, dok su sudionici skupa pozvali Europu da preuzme snažniju globalnu mirotvornu ulogu.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150013985

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Hajduk slavio u Velikoj Gorici i zasjeo na vrh HNL-a
Pobjedom 3:1 protiv Gorice, Bijeli su preskočili Dinamo i zasjeli na vrh prvenstvene ljestvice.

min čitanja

Više

Najnovije

Politika

Makarska planira uređenje Osejave za 2,1 milijun eura, udruge uzbunile: „Ostavite šumu na miru”

Vijesti

Hrvatski „Putokaz za Afriku” u Ruandu nosi 26 tona hrane i stotine životinja

Vijesti

Četiri mjeseca nakon oluje: Marjan i dalje opasan, čeka se izvođač za izvlačenje 4000 stabala

Politika

Rinčić i Obuljen Koržinek dogovorile korake za obnovu Fenice i riječkih kulturnih dragulja

Lifestyle

Šetnja riječkom tržnicom: uzgojene orade 9 eura, divlje 13, divlja riga skuplja od salate

Sport

Povratak kuglačkih okršaja: Osijek u Bjelovaru, Ogulin i Đakovo traže prve bodove

Biznis

Broj blokiranih Đakovčana porastao, ali im je ukupan dug ispod 13 milijuna eura

Biznis

Nepalci i dalje prednjače: u devet mjeseci izdano više od 136 tisuća radnih dozvola strancima

Politika

Macron iz vizionara u kočničara: Bruxelles sve glasnije o padu francuskog utjecaja

Vijesti

Šibenski Vodovod pred poskupljenjem od 63 %: građani pozvani na javnu sjednicu

Politika

MUP upozorava: bez europske uredbe Hrvatska gubi ključne alate za suzbijanje internetske pedofilije