CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

19. kolovoza 2025, 06:17

Novi pristup GEPA skraćuje i pojeftinjuje treniranje velikih jezičnih modela

GEPA donosi bržu i jeftiniju optimizaciju velikih jezičnih modela zamjenjujući tradicionalno učenje pojačanjem prirodnim jezičnim povratnim informacijama.

min. čitanja

XFacebookWhatsApp

Istraživači s Kalifornijskog sveučilišta u Berkeleyju, Stanforda i tvrtke Databricks predstavili su metodu optimizacije velikih jezičnih modela (LLM) nazvanu GEPA (Genetic-Pareto) koja nadmašuje klasično učenje pojačanjem uz drastično manje pokušaja.

GEPA iz procesa izbacuje tisuće iteracija temeljenih na jednostavnim numeričkim nagradama. Umjesto toga, model koristi vlastito razumijevanje jezika kako bi „promislio” o pogreškama, dijagnosticirao ih i sam dopunio upute. U praksu to donosi tri ključne novosti:

  1. genetsku evoluciju prompta – populacija promptova nasumično se „mutira” stvarajući bolje varijante;
  2. prirodnije jezično „promišljanje” – nakon svake serije izvođenja model analizira cijeli tekstualni trag, uključujući pozive alata i poruke o greškama, te piše preciznije upute;
  3. paretovski odabir – sustav zadržava raznolik skup specijaliziranih promptova umjesto da se fokusira na jednog „pobjednika”, čime izbjegava lokalni optimum.

U testovima na četiri zadatka, među kojima su više-korakovno odgovaranje na pitanja (HotpotQA) i upiti s očuvanjem privatnosti (PUPA), GEPA je ostvarila do 19 % bolje rezultate od RL-metode GRPO, uz do 35 puta manje izvođenja. Optimizacija sustava za pitanja i odgovore trajala je oko tri sata, dok je GRPO-u trebalo 24 sata, pri čemu su troškovi GPU-a pali sa 300 na manje od 20 američkih dolara.

Kraći promptovi

GEPA generira upute i do 9,2 puta kraće od trenutačno popularnog optimizatora MIPROv2, što smanjuje latenciju i cijenu API-poziva. Sustav se pokazao i robusnijim na neviđenim podacima zahvaljujući „bogatoj” povratnoj informaciji – umjesto jedne ocjene, model dobiva detaljan opis što je pošlo po zlu i zašto.

Lakshya A. Agrawal, doktorski kandidat u Berkeleyju i suautor rada, ističe da mnogim timovima klasično RL-treniranje nije izvedivo: „Za njih je dosad rješenje uglavnom bilo ručno ‘fino’ podešavanje promptova. GEPA im omogućuje bolju izvedbu bez vlastitih GPU klastera.”

Autori vide GEPA kao osnovu za „kontinuiranu” optimizaciju: primjerice, u razvojnom ciklusu softvera alat bi automatski generirao i testirao više inačica koda, a najbolju ponudio programerima na pregled. U eksperimentima s CUDA kodom time je 20 % zadataka podignuto na stručnu razinu, naspram nule posto kod jednokratnog poziva GPT-4o.

Agrawal zaključuje da metoda daje moć upravo onima koji najbolje poznaju domenu: „Krajnji korisnici više ne moraju svladavati složene RL-tehnike kako bi iz postojećih modela izvukli maksimum.”

#databricks#stanford#gepa#berkeley#hotpotqa
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Amazon preuzima Globalstar, satelitsku tvrtku čiji se sustavi koriste i u iPhoneu
Kupnjom Globalstara Amazon širi prisustvo u svemirskom sektoru, a potez bi mogao utjecati i na satelitske funkcije iPhonea.

min čitanja

Više

Tehnologija

SAD planira nuklearne reaktore na Mjesecu do 2030.
NASA, Pentagon i Ministarstvo energetike udružuju snage: srednjosnažni reaktor u orbiti do 2028., a veliki na Mjesecu do 2030.

min čitanja

Više

Tehnologija

Umjetna inteligencija potkopava monopol na tržištu čipova
Vladavina Nvidije nad AI čipovima mogla bi oslabjeti kako se alati za njihovu izradu šire i postaju dostupniji konkurenciji.

min čitanja

Više

Tehnologija

Microsoft dramatično poskupio Surface uređaje
Surface više nije „povoljan“: Microsoft je uveo poskupljenja od 250 do 300 USD, pravdajući ih skupljim memorijskim i komponentnim troškovima, što ga stavlja u nepovoljan odnos prema Appleovim MacBookovima.

min čitanja

Više

Tehnologija

Zastrašujući trenutak istraživanja: znanstvenici u potrazi za izvanzemaljskim tragovima u dubokim špiljama
Ekstremni uvjeti špilja služe kao model za potragu za životom izvan Zemlje, no terenski rad donosi i nelagodne, gotovo horor-filmske trenutke.

min čitanja

Više

Tehnologija

Bruxelles sprema anonimnu provjeru dobi na internetu
EU do ljeta planira pokrenuti aplikaciju koja anonimno potvrđuje dob korisnika i štiti djecu od opasnog online sadržaja; projekt se već testira u šest zemalja.
Autor European People's Party - EPP Lead Candidate Multimedia Content, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=148344970

min čitanja

Više

Tehnologija

Pametni detektori dima nude obavijesti, ali propuštaju pola posla
Testirane Wi-Fi inačice sve se oslanjaju samo na fotoelektrični senzor, pa stručnjaci upozoravaju da uz pametni model valja zadržati i uređaj s ionizacijskim senzorom.

min čitanja

Više

Tehnologija

Festival znanosti u Rijeci: tjedan dana više od 100 besplatnih događanja o energiji
Rijeka od 20. do 25. travnja domaćin je 24. Festivala znanosti, koji na 30 lokacija nudi više od 100 besplatnih događanja posvećenih energiji.

min čitanja

Više

Tehnologija

Havaji asfaltiraju ceste plastičnim otpadom iz oceana
Havaji pokrenuli projekt recikliranja plastičnog otpada iz oceana u asfalt za lokalne ceste, prvi takve vrste na svijetu.

min čitanja

Više

Tehnologija

Građani u obrani Jadrana: u Splitu predstavljene aplikacije koje svakome otvaraju vrata znanosti
Citizen Science Day u Splitu okupio je pedesetak sudionika i predstavio niz aplikacija koje građanima omogućuju aktivno sudjelovanje u praćenju i zaštiti Jadrana.

min čitanja

Više

Najčitanije

Ostalo

Krajač odbacuje navode o luksuznom ljetovanju na teret Judo saveza
Glavni tajnik HOO-a tvrdi da ljetovanje njegova sina nije plaćeno javnim novcem te optužuje bivšu djelatnicu Judo saveza za ucjenu.

min čitanja

Više

Politika

Plenković najavio novi potez za ublažavanje cijena goriva
Premijer najavio hitne izmjene Zakona o PDV-u radi brže intervencije u cijene goriva i otkrio da Vlada od Bruxellesa traži oslobođenje od dijela trošarina, dok se parlament bavi izborom ustavnih sudaca i predsjednika Vrhovnog suda.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Srebro i bronca za Baraka i Ružića na županijskom prvenstvu u Vrsaru

Vijesti

Dan Općine Marčana proslavljen svečanom sjednicom i nagradama zaslužnima

Vijesti

Općina Levanjska Varoš razmatra dom za starije u zaboravljenoj „Staroj kupki”

Vijesti

Video s trajekta Vladimira Nazora otkrio dramatičnu plovidbu kroz orkansku buru

Sport

NK Osijek otvorio prodaju ulaznica za Varaždin

Vijesti

Prevarili je obećanjem susreta s glazbenom zvijezdom

Sport

Rijeka dogovorila dolazak kosovskog U-21 veznjaka bez odštete

Lifestyle

Repriza „Sjećanja budućnosti“ vraća fizičko kazalište u HKD na Sušaku

Vijesti

Dan otvorenih vrata u Trogiru približio policijski poziv mladima

Politika

Bijela kuća: Nismo tražili produljenje primirja, ali pregovori s Iranom napreduju

Vijesti

Policija traga za 29-godišnjom Mihaelom Zlojić: nestala na putu Kaštela–Zagreba