CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

19. kolovoza 2025, 06:17

Novi pristup GEPA skraćuje i pojeftinjuje treniranje velikih jezičnih modela

GEPA donosi bržu i jeftiniju optimizaciju velikih jezičnih modela zamjenjujući tradicionalno učenje pojačanjem prirodnim jezičnim povratnim informacijama.

min. čitanja

Istraživači s Kalifornijskog sveučilišta u Berkeleyju, Stanforda i tvrtke Databricks predstavili su metodu optimizacije velikih jezičnih modela (LLM) nazvanu GEPA (Genetic-Pareto) koja nadmašuje klasično učenje pojačanjem uz drastično manje pokušaja.

GEPA iz procesa izbacuje tisuće iteracija temeljenih na jednostavnim numeričkim nagradama. Umjesto toga, model koristi vlastito razumijevanje jezika kako bi „promislio” o pogreškama, dijagnosticirao ih i sam dopunio upute. U praksu to donosi tri ključne novosti:

  1. genetsku evoluciju prompta – populacija promptova nasumično se „mutira” stvarajući bolje varijante;
  2. prirodnije jezično „promišljanje” – nakon svake serije izvođenja model analizira cijeli tekstualni trag, uključujući pozive alata i poruke o greškama, te piše preciznije upute;
  3. paretovski odabir – sustav zadržava raznolik skup specijaliziranih promptova umjesto da se fokusira na jednog „pobjednika”, čime izbjegava lokalni optimum.

U testovima na četiri zadatka, među kojima su više-korakovno odgovaranje na pitanja (HotpotQA) i upiti s očuvanjem privatnosti (PUPA), GEPA je ostvarila do 19 % bolje rezultate od RL-metode GRPO, uz do 35 puta manje izvođenja. Optimizacija sustava za pitanja i odgovore trajala je oko tri sata, dok je GRPO-u trebalo 24 sata, pri čemu su troškovi GPU-a pali sa 300 na manje od 20 američkih dolara.

Kraći promptovi

GEPA generira upute i do 9,2 puta kraće od trenutačno popularnog optimizatora MIPROv2, što smanjuje latenciju i cijenu API-poziva. Sustav se pokazao i robusnijim na neviđenim podacima zahvaljujući „bogatoj” povratnoj informaciji – umjesto jedne ocjene, model dobiva detaljan opis što je pošlo po zlu i zašto.

Lakshya A. Agrawal, doktorski kandidat u Berkeleyju i suautor rada, ističe da mnogim timovima klasično RL-treniranje nije izvedivo: „Za njih je dosad rješenje uglavnom bilo ručno ‘fino’ podešavanje promptova. GEPA im omogućuje bolju izvedbu bez vlastitih GPU klastera.”

Autori vide GEPA kao osnovu za „kontinuiranu” optimizaciju: primjerice, u razvojnom ciklusu softvera alat bi automatski generirao i testirao više inačica koda, a najbolju ponudio programerima na pregled. U eksperimentima s CUDA kodom time je 20 % zadataka podignuto na stručnu razinu, naspram nule posto kod jednokratnog poziva GPT-4o.

Agrawal zaključuje da metoda daje moć upravo onima koji najbolje poznaju domenu: „Krajnji korisnici više ne moraju svladavati složene RL-tehnike kako bi iz postojećih modela izvukli maksimum.”

#databricks#stanford#gepa#berkeley#hotpotqa

Slično

Tehnologija

Sunčana elektrana na krovu Srednje škole Stjepana Sulimanca gotova za deset dana
Škola u Virovitičko-podravskoj županiji dobiva 85 kW solarnu elektranu, čime će prepoloviti račune za struju i emisije CO₂.

min čitanja

Više

Tehnologija

SAP i Agilent otkrivaju kako sigurno uvesti mrežu AI agenata
Na AI Impactu u San Franciscu SAP i Agilent otkrili su kako skalirati mrežu AI agenata bez kompromisa po pitanju troškova, latencije i sigurnosti.

min čitanja

Više

Tehnologija

Kako WIRED testira pročistače zraka: od ručki i kotačića do razine buke
WIRED-ova novinarka objašnjava strogi protokol po kojem testira pročistače zraka – od snage magneta na panelu do pet izmjena zraka na sat.

min čitanja

Više

Tehnologija

AI-pokretani PDF: kraj jedne ere za Adobe?
Najave o „AI-pokretanom PDF-u” pokrenule su raspravu: priprema li Adobe kraj ere klasičnog PDF-a?

min čitanja

Više

Tehnologija

Od rasističnih memova do GPT-5 fijaska: tjedan u techu prema Wiredu
Pregled pet Wiredovih priča iz podcasta „Uncanny Valley”: od memova o deportacijama i Trumpove kripto riznice do fijaska GPT-5 i NASA-ine nuklearne utrke na Mjesecu.

min čitanja

Više

Tehnologija

London odustao od zahtjeva za Appleovim "stražnjim vratima"
Britanska vlada povukla je zahtjev za pristup Appleovoj enkripciji, čime se uklanja glavna zapreka u pregovorima s Washingtonom.

min čitanja

Više

Tehnologija

Nizozemski Teqram isporučio prvi AI brusni robot u SAD-u
EasyGrinder roboti s umjetnom inteligencijom povećavaju učinkovitost i preciznost u tvornicama Accurate Metal Products, označavajući prvu američku instalaciju Teqramove tehnologije.

min čitanja

Više

Tehnologija

Zvučni potpis azijskog stršljena otkriva novo oružje europskih pčelara
Europski znanstvenici otkrili su da azijski stršljen ima prepoznatljiv zvuk koji se može snimiti i po kojemu se gnijezda lociraju, pružajući pčelarima novu nadu u borbi protiv opasnog predatora.

min čitanja

Više

Tehnologija

Nvidia lansirao Nemotron-Nano-9B-v2: manji AI model s uključenim ‘razmišljanjem’
Nvidia je predstavila smanjeni AI model Nemotron-Nano-9B-v2 koji stane na jedan A10 GPU i korisnicima nudi prekidač za uključivanje ili isključivanje internog "razmišljanja", uz visoke rezultate na testovima točnosti.

min čitanja

Više

Tehnologija

Hugging Face savjetuje: kako tvrtke mogu smanjiti troškove umjetne inteligencije bez pada kvalitete
Hugging Face iznosi pet praktičnih koraka za rezanje troškova i potrošnje energije u umjetnoj inteligenciji, od odabira specijaliziranih modela do transparentnih oznaka energetske učinkovitosti.

min čitanja

Više

Najčitanije

Politika

Švicarska spremna dati imunitet Putinu radi mirovnih pregovora
Bern poručuje da bi Vladimir Putin dobio privremeni imunitet za dolazak na mogući mirovni summit s Volodimirom Zelenskijem, no Moskva zasad nije pokazala interes zbog švicarskog usklađivanja sa sankcijama EU-a.
By Пресс-служба Президента РФ - https://www.thetimes.com/world/europe/article/emmanuel-macron-rebrands-himself-as-anti-russia-hawk-to-german-fury-dlplhbbzs (indirectly, this is identical in framing, slightly different color, higher res), CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=155844791By © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=167601187

min čitanja

Više

Vijesti

Turudić pokreće izvanredni nadzor nad splitskim DORH-om zbog slučaja Derifaj
Glavni državni odvjetnik Ivan Turudić naredio je izvanredni nadzor nad splitskim DORH-om zbog četverogodišnjeg zastoja i proceduralnih propusta u slučaju optužnice protiv novinarke Danke Derifaj.
By Roberta F., CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=27854611

min čitanja

Više

Vijesti

Stanari rovinjske sedmerokatnice evakuirani zbog požara
Požar u Rovinju natjerao stanare na evakuaciju; jedna osoba ozlijeđena, vatrogasci još rade na lokalizaciji vatre.

min čitanja

Više

Najnovije

Sport

Jeff Strasser preuzima Luksemburg dva tjedna prije kvalifikacija

Vijesti

„Lekcije mog tate” osvojile Sarajevo, osječkoj publici stižu u subotu

Tehnologija

Sunčana elektrana na krovu Srednje škole Stjepana Sulimanca gotova za deset dana

Politika

Europljani dižu uloge kako bi pridobili Trumpa, Putin oprezan pred „prevelikim očekivanjima”

Sport

Radovi u Kranjčevićevoj ubrzani, novi stadion planiran za 2026.

Sport

Brozović asistirao, Al Nassr s igračem manje do finala Superkupa

Vijesti

Devet godina obnove: Poreč uredio tridesetak povijesnih zgrada u staroj jezgri

Vijesti

HUBOL stao iza zahtjeva hitne medicine za beneficiranim stažem i boljim uvjetima

Vijesti

Slavonci predali više od 1.300 komada streljiva i bombe policiji

Biznis

Automobilska industrija pred izazovom: Tavares najavio „novo pisanje pravila“, ali strategije još neuvjerljive

Vijesti

Češka testira 150 km/h na autocestama uz digitalnu kontrolu