CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

19. kolovoza 2025, 06:17

Novi pristup GEPA skraćuje i pojeftinjuje treniranje velikih jezičnih modela

GEPA donosi bržu i jeftiniju optimizaciju velikih jezičnih modela zamjenjujući tradicionalno učenje pojačanjem prirodnim jezičnim povratnim informacijama.

min. čitanja

XFacebookWhatsApp

Istraživači s Kalifornijskog sveučilišta u Berkeleyju, Stanforda i tvrtke Databricks predstavili su metodu optimizacije velikih jezičnih modela (LLM) nazvanu GEPA (Genetic-Pareto) koja nadmašuje klasično učenje pojačanjem uz drastično manje pokušaja.

GEPA iz procesa izbacuje tisuće iteracija temeljenih na jednostavnim numeričkim nagradama. Umjesto toga, model koristi vlastito razumijevanje jezika kako bi „promislio” o pogreškama, dijagnosticirao ih i sam dopunio upute. U praksu to donosi tri ključne novosti:

  1. genetsku evoluciju prompta – populacija promptova nasumično se „mutira” stvarajući bolje varijante;
  2. prirodnije jezično „promišljanje” – nakon svake serije izvođenja model analizira cijeli tekstualni trag, uključujući pozive alata i poruke o greškama, te piše preciznije upute;
  3. paretovski odabir – sustav zadržava raznolik skup specijaliziranih promptova umjesto da se fokusira na jednog „pobjednika”, čime izbjegava lokalni optimum.

U testovima na četiri zadatka, među kojima su više-korakovno odgovaranje na pitanja (HotpotQA) i upiti s očuvanjem privatnosti (PUPA), GEPA je ostvarila do 19 % bolje rezultate od RL-metode GRPO, uz do 35 puta manje izvođenja. Optimizacija sustava za pitanja i odgovore trajala je oko tri sata, dok je GRPO-u trebalo 24 sata, pri čemu su troškovi GPU-a pali sa 300 na manje od 20 američkih dolara.

Kraći promptovi

GEPA generira upute i do 9,2 puta kraće od trenutačno popularnog optimizatora MIPROv2, što smanjuje latenciju i cijenu API-poziva. Sustav se pokazao i robusnijim na neviđenim podacima zahvaljujući „bogatoj” povratnoj informaciji – umjesto jedne ocjene, model dobiva detaljan opis što je pošlo po zlu i zašto.

Lakshya A. Agrawal, doktorski kandidat u Berkeleyju i suautor rada, ističe da mnogim timovima klasično RL-treniranje nije izvedivo: „Za njih je dosad rješenje uglavnom bilo ručno ‘fino’ podešavanje promptova. GEPA im omogućuje bolju izvedbu bez vlastitih GPU klastera.”

Autori vide GEPA kao osnovu za „kontinuiranu” optimizaciju: primjerice, u razvojnom ciklusu softvera alat bi automatski generirao i testirao više inačica koda, a najbolju ponudio programerima na pregled. U eksperimentima s CUDA kodom time je 20 % zadataka podignuto na stručnu razinu, naspram nule posto kod jednokratnog poziva GPT-4o.

Agrawal zaključuje da metoda daje moć upravo onima koji najbolje poznaju domenu: „Krajnji korisnici više ne moraju svladavati složene RL-tehnike kako bi iz postojećih modela izvukli maksimum.”

#databricks#stanford#gepa#berkeley#hotpotqa

Slično

Tehnologija

Novi okvir Agent-R1 mijenja način treniranja jezičnih modela
Kineski istraživači osmislili su Agent-R1, okvir koji proširuje tradicionalno učenje potkrepljivanjem i omogućuje velikim jezičnim modelima rješavanje složenih višekoračnih zadataka u promjenjivim okruženjima.

min čitanja

Više

Tehnologija

Laboratorijska slanina stiže u SAD: Mission Barns dobio zeleno svjetlo FDA-e
FDA je odobrila proizvodnju i prodaju svinjske masti uzgojene u laboratoriju, a startup Mission Barns najavljuje hibridnu „slaninu“ bez klanja svinja.

min čitanja

Više

Tehnologija

Bez vidljivosti nema povjerenja: promatranje pretvara LLM-ove u pouzdan korporativni alat
Telemetrija pretvara umjetnu inteligenciju iz laboratorijskog pokusa u pouzdanu infrastrukturu – primjer iz bankarskog slučaja pokazuje zašto je promatranje ključno.

min čitanja

Više

Tehnologija

AI kompanije obećavaju „čišća“ psihodelična iskustva, dok se opasni izazovi šire među mladima
Tehnološke tvrtke razvijaju AI alate i nove molekule kako bi uklonile „loše tripove“, dok se istodobno među mladima šire opasni izazovi s lijekovima.

min čitanja

Više

Tehnologija

Zadarska tvrtka Margins prednjači na Deloitteovoj listi tehnoloških brzaca
Margins vodi hrvatski poredak na Deloitteovoj listi 50 najbrže rastućih tehnoloških kompanija srednje Europe.

min čitanja

Više

Tehnologija

KBC Rijeka prvi u javnom zdravstvu uveo preciznu „radiokirurgiju nožem od zraka”
Riječki KBC prvi u Hrvatskoj uvedenjem stereotaksijske radioterapije omogućio onkološko liječenje bez čekanja i s preciznošću „virtualnog skalpela”.

min čitanja

Više

Tehnologija

Anthropic tvrdi da je riješio ključan problem pamćenja dugotrajnih AI agenata
Anthropic predstavlja dvodijelnu arhitekturu koja Claudeu omogućuje da kroz više sesija sačuva kontinuitet rada i tako izbjegne zaborav uputa.

min čitanja

Više

Tehnologija

Airbus povlači 6.000 zrakoplova A320 zbog softvera ranjivog na Sunce
Softverska ranjivost na solarno zračenje potaknula je Airbus na hitan opoziv i kratkotrajno prizemljenje polovice globalne flote A320.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Rusija prijeti potpunom blokadom WhatsAppa zbog nesuradnje s vlastima
Roskomnadzor najavio zabranu popularne aplikacije ako Meta ne pristane dijeliti podatke u istragama prijevara i terorizma.

min čitanja

Više

Tehnologija

Stihovima do nuklearne bombe: istraživači otkrili veliku rupu u zaštiti AI sustava
Nova studija pokazuje da chatbotovi popuštaju pred opasnim zahtjevima kada su upakirani u stihove, s čak 62 % uspjeha ručno pisanih pjesama.

min čitanja

Više

Najčitanije

Vijesti

Novi šok u Medulinu: iz mora izvučeno tijelo, sumnja na sina ubijene 79-godišnjakinje
Policija istražuje povezanost tijela izvađenog iz Medulinskog zaljeva s nasilnim ubojstvom 79-godišnje žene pronađene dan ranije u njezinoj kući.

min čitanja

Više

Najnovije

Lifestyle

Deset namirnica koje dokazano snižavaju kolesterol

Vijesti

Internetske prijevare rastu: šteta u Dalmaciji skočila na sedam milijuna eura

Politika

Četiri ruska MiG-31 podigla uzbunu u Poljskoj: NATO odmah stavio Patriote u punu pripravnost

Biznis

Ytrij poskupljuje 4 400 %: Kina steže ventil, a Washington i Tokio kopaju sve dublje

Vijesti

JR ponovno omata Pont Neuf četrdeset godina nakon Christa i Jeanne-Claude

Politika

Okupljanje pred domom Dalije Orešković razotkrilo prijetnju ekstremizma

Vijesti

Vlada ugasila Brodarski institut: kraj jedne svjetski priznate priče

Vijesti

Kaprijani traže odštetu nakon 48-satnog mraka

Vijesti

Navijači pod povećalom: sporni uzvik iz 80-ih sada razlog za kazne

Sport

Whittaker brutalno riješio Gavazija u prvoj rundi

Sport

Modrić planuo zbog sporne odluke suca u derbiju Milana i Lazija