CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

19. kolovoza 2025, 06:17

Novi pristup GEPA skraćuje i pojeftinjuje treniranje velikih jezičnih modela

GEPA donosi bržu i jeftiniju optimizaciju velikih jezičnih modela zamjenjujući tradicionalno učenje pojačanjem prirodnim jezičnim povratnim informacijama.

min. čitanja

XFacebookWhatsApp

Istraživači s Kalifornijskog sveučilišta u Berkeleyju, Stanforda i tvrtke Databricks predstavili su metodu optimizacije velikih jezičnih modela (LLM) nazvanu GEPA (Genetic-Pareto) koja nadmašuje klasično učenje pojačanjem uz drastično manje pokušaja.

GEPA iz procesa izbacuje tisuće iteracija temeljenih na jednostavnim numeričkim nagradama. Umjesto toga, model koristi vlastito razumijevanje jezika kako bi „promislio” o pogreškama, dijagnosticirao ih i sam dopunio upute. U praksu to donosi tri ključne novosti:

  1. genetsku evoluciju prompta – populacija promptova nasumično se „mutira” stvarajući bolje varijante;
  2. prirodnije jezično „promišljanje” – nakon svake serije izvođenja model analizira cijeli tekstualni trag, uključujući pozive alata i poruke o greškama, te piše preciznije upute;
  3. paretovski odabir – sustav zadržava raznolik skup specijaliziranih promptova umjesto da se fokusira na jednog „pobjednika”, čime izbjegava lokalni optimum.

U testovima na četiri zadatka, među kojima su više-korakovno odgovaranje na pitanja (HotpotQA) i upiti s očuvanjem privatnosti (PUPA), GEPA je ostvarila do 19 % bolje rezultate od RL-metode GRPO, uz do 35 puta manje izvođenja. Optimizacija sustava za pitanja i odgovore trajala je oko tri sata, dok je GRPO-u trebalo 24 sata, pri čemu su troškovi GPU-a pali sa 300 na manje od 20 američkih dolara.

Kraći promptovi

GEPA generira upute i do 9,2 puta kraće od trenutačno popularnog optimizatora MIPROv2, što smanjuje latenciju i cijenu API-poziva. Sustav se pokazao i robusnijim na neviđenim podacima zahvaljujući „bogatoj” povratnoj informaciji – umjesto jedne ocjene, model dobiva detaljan opis što je pošlo po zlu i zašto.

Lakshya A. Agrawal, doktorski kandidat u Berkeleyju i suautor rada, ističe da mnogim timovima klasično RL-treniranje nije izvedivo: „Za njih je dosad rješenje uglavnom bilo ručno ‘fino’ podešavanje promptova. GEPA im omogućuje bolju izvedbu bez vlastitih GPU klastera.”

Autori vide GEPA kao osnovu za „kontinuiranu” optimizaciju: primjerice, u razvojnom ciklusu softvera alat bi automatski generirao i testirao više inačica koda, a najbolju ponudio programerima na pregled. U eksperimentima s CUDA kodom time je 20 % zadataka podignuto na stručnu razinu, naspram nule posto kod jednokratnog poziva GPT-4o.

Agrawal zaključuje da metoda daje moć upravo onima koji najbolje poznaju domenu: „Krajnji korisnici više ne moraju svladavati složene RL-tehnike kako bi iz postojećih modela izvukli maksimum.”

#databricks#stanford#gepa#berkeley#hotpotqa

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Tvrtke žure uskladiti AI agente: orkestracija postaje pitanje opstanka
Orkestracija komunikacije među AI agentima postaje presudna za sigurnost i učinkovitost. Stručnjaci upozoravaju da će tvrtke koje ne usklade agente riskirati nesporazume, halucinacije i gubitak podataka.

min čitanja

Više

Tehnologija

Musk odbacuje optužbe: „Grok nije stvarao gole maloljetnike”
Elon Musk tvrdi da AI chatbot Grok nije generirao nezakonite slike maloljetnika, dok europski i britanski regulatori najavljuju istrage zbog sumnji u duboke lažne pornografske sadržaje.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Riječki inovator odbio londonski doktorat kako bi u Hrvatskoj razvijao radiologiju
Diego Ivanović odbio je doktorat u Londonu i s Leonardom Martinisom pokrenuo Medusa Technologies, startup koji razvija AI za radiološke snimke.

min čitanja

Više

Tehnologija

AI alat Sybil otkrio propust klijenta i zbunio vlastite tvorce
Neočekivano otkriće AI alata Sybil označilo novu fazu u kibernetičkoj sigurnosti.

min čitanja

Više

Tehnologija

Je li vrijedno riskirati? Što treba znati prije uvoza kineskog pametnog telefona
Kineski pametni telefoni često nude vrhunske performanse po nižoj cijeni, no uvoz izvan službenih kanala nosi niz financijskih i servisnih rizika.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Poljska tvrdi da je ruski kibernetički napad umalo ugasio njezinu elektroenergetsku mrežu
Ministar digitalizacije Krzysztof Gawkowski otkrio da je Poljska tijekom blagdana odbila najveći kibernetički napad na svoj energetski sustav, za koji optužuje Rusiju.

min čitanja

Više

Tehnologija

Izraelski Novee izlazi iz sjene s 51,5 milijuna dolara za borbu protiv AI kibernapada
Startup iz Tel Aviva razvija vlastitog „AI hakera” za kontinuirano penetracijsko testiranje i osigurao više od 50 milijuna dolara početnih ulaganja.

min čitanja

Više

Tehnologija

Provokativna kineska aplikacija „Jesi li mrtav?” osvaja samce, mijenja ime i uvodi pretplatu
Sigurnosna aplikacija koja korisnike pita „Jesi li mrtav?” stekla je popularnost među kineskim samcima, a autori najavljuju pretplatu i novo ime Demumu.

min čitanja

Više

Tehnologija

TikTok Shop pod vatrom zbog prikaza nakita s nacističkom simbolikom
Pretraga za „hip hop nakitom” na TikTok Shopu dovela je do preporuka nakita s nacističkim simbolima, otvarajući nova pitanja o odgovornosti platforme.

min čitanja

Više

Tehnologija

Brian Cox rasprodao Lisinski devet mjeseci prije nastupa, dodan i drugi termin
Popularni fizičar ponovno puni Lisinski: zbog velike potražnje za showom „Emergence” otvoren je drugi datum u rujnu 2026.

min čitanja

Više

Najčitanije

Politika

SAD privremeno zaustavlja useljeničke vize za pet zemalja zapadnog Balkana
Washington od 21. siječnja zaustavlja obradu zahtjeva za useljeničke vize građana BiH, Crne Gore, Albanije, Kosova i Sjeverne Makedonije, uz objašnjenje da želi smanjiti mogući teret na američki sustav socijalne skrbi.

min čitanja

Više

Politika

Druga faza Trumpovog plana za Gazu: demilitarizacija Hamasa i tehnokratska vlada
SAD potvrđuje ulazak mirovnog plana u novu etapu; Hamas u Kairu prihvatio tehnokratsku vladu, no razoružanje i sigurnosni aranžmani ostaju najveći izazovi.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Košarka

Košarkaški ‘El Clasico’ na Gripama: Split protiv Cibone lovi 12. uzastopnu pobjedu
Žuti traže dvanaestu uzastopnu pobjedu za ostanak na vrhu, dok se probuđena Cibona nada iznenađenju u derbiju na Gripama.

min čitanja

Više

Najnovije

Sport

Zabok produbio krizu Šibenke na Baldekinu

Politika

Iran ponovno otvorio zračni prostor, Trump tvrdi da su pogubljenja obustavljena

Politika

Trumpova administracija blokira imigrantske vize za 75 država

Sport

Jurišić ponovo briljira na Lanzaroteu: treće mjesto kao zalog za Los Angeles 2028.

Vijesti

Radovi na Stojoj napreduju unatoč kiši i strogim konzervatorskim pravilima

Politika

Trump u intervjuu za Reuters: „Zelenski je prepreka miru, Pahlavi izgleda pristojno”

Politika

Zelenskij proglašava izvanredno stanje u energetici, Trump okrivljuje Kijev za zastoj mira

Vijesti

Mladi vozač u Koprivnici pozitivan na droge, dobio zabranu vožnje

Vijesti

Riječki mjesni odbor i škola udružili snage: donacijske kutije za djecu u riziku od siromaštva

Sport

Istra 1961 zaključila pripreme pobjedom nad Radomljem

Lifestyle

Imotska krajina ruši turističke rekorde i najavljuje još jaču sezonu