CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

19. kolovoza 2025, 06:17

Novi pristup GEPA skraćuje i pojeftinjuje treniranje velikih jezičnih modela

GEPA donosi bržu i jeftiniju optimizaciju velikih jezičnih modela zamjenjujući tradicionalno učenje pojačanjem prirodnim jezičnim povratnim informacijama.

min. čitanja

XFacebookWhatsApp

Istraživači s Kalifornijskog sveučilišta u Berkeleyju, Stanforda i tvrtke Databricks predstavili su metodu optimizacije velikih jezičnih modela (LLM) nazvanu GEPA (Genetic-Pareto) koja nadmašuje klasično učenje pojačanjem uz drastično manje pokušaja.

GEPA iz procesa izbacuje tisuće iteracija temeljenih na jednostavnim numeričkim nagradama. Umjesto toga, model koristi vlastito razumijevanje jezika kako bi „promislio” o pogreškama, dijagnosticirao ih i sam dopunio upute. U praksu to donosi tri ključne novosti:

  1. genetsku evoluciju prompta – populacija promptova nasumično se „mutira” stvarajući bolje varijante;
  2. prirodnije jezično „promišljanje” – nakon svake serije izvođenja model analizira cijeli tekstualni trag, uključujući pozive alata i poruke o greškama, te piše preciznije upute;
  3. paretovski odabir – sustav zadržava raznolik skup specijaliziranih promptova umjesto da se fokusira na jednog „pobjednika”, čime izbjegava lokalni optimum.

U testovima na četiri zadatka, među kojima su više-korakovno odgovaranje na pitanja (HotpotQA) i upiti s očuvanjem privatnosti (PUPA), GEPA je ostvarila do 19 % bolje rezultate od RL-metode GRPO, uz do 35 puta manje izvođenja. Optimizacija sustava za pitanja i odgovore trajala je oko tri sata, dok je GRPO-u trebalo 24 sata, pri čemu su troškovi GPU-a pali sa 300 na manje od 20 američkih dolara.

Kraći promptovi

GEPA generira upute i do 9,2 puta kraće od trenutačno popularnog optimizatora MIPROv2, što smanjuje latenciju i cijenu API-poziva. Sustav se pokazao i robusnijim na neviđenim podacima zahvaljujući „bogatoj” povratnoj informaciji – umjesto jedne ocjene, model dobiva detaljan opis što je pošlo po zlu i zašto.

Lakshya A. Agrawal, doktorski kandidat u Berkeleyju i suautor rada, ističe da mnogim timovima klasično RL-treniranje nije izvedivo: „Za njih je dosad rješenje uglavnom bilo ručno ‘fino’ podešavanje promptova. GEPA im omogućuje bolju izvedbu bez vlastitih GPU klastera.”

Autori vide GEPA kao osnovu za „kontinuiranu” optimizaciju: primjerice, u razvojnom ciklusu softvera alat bi automatski generirao i testirao više inačica koda, a najbolju ponudio programerima na pregled. U eksperimentima s CUDA kodom time je 20 % zadataka podignuto na stručnu razinu, naspram nule posto kod jednokratnog poziva GPT-4o.

Agrawal zaključuje da metoda daje moć upravo onima koji najbolje poznaju domenu: „Krajnji korisnici više ne moraju svladavati složene RL-tehnike kako bi iz postojećih modela izvukli maksimum.”

#databricks#stanford#gepa#berkeley#hotpotqa

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Mini FabLab u Puli pretvara ideje u stvarnost
Interaktivno događanje u Centru za mlade Pula približava 3D tehnologiju i STEM područje djeci i mladima.

min čitanja

Više

Tehnologija

Alibaba lansirao seriju Qwen3.5: kompaktni AI modeli ciljaju mobilne uređaje
Alibaba je predstavio četiri nova otvorena AI modela Qwen3.5, namijenjena štedljivim uređajima i složenom rezoniranju, čime kineska tvrtka pojačava konkurenciju u globalnoj utrci umjetne inteligencije.

min čitanja

Više

Tehnologija

Europarlamentarci traže reakciju na navodno snimanje „pametnih“ naočala Metae u intimnim trenucima
Zastupnici iz četiri političke skupine traže od Komisije objašnjenje nakon tvrdnji da naočale Ray-Ban Meta AI potajno snimaju korisnike i šalju snimke u Keniju.

min čitanja

Više

Tehnologija

Policija upozorava na novu prijevaru: porukom „Bok, možeš li mi posuditi 900 eura?” pokušavaju vam isprazniti račun
Dubrovačko-neretvanska policija upozorava na val poruka s lažnom molbom za posudbu 900 eura i daje upute kako se zaštititi.

min čitanja

Više

Tehnologija

Cijene RAM-a probile 1.000 dolara: jurišna puška AR-15 trenutačno jeftinija od računalne nadogradnje
Eksplozija potražnje za silicijem zbog razvoja umjetne inteligencije dovela je do apsurdne situacije: 64 GB DDR5 RAM-a skuplje je od osnovnog modela jurišne puške AR-15.

min čitanja

Više

Tehnologija

ByteDance kroz Project Swan najavljuje iskorak u poslovni XR
Na MWC-u u Barceloni ByteDance je predstavio Pico OS 6 i najavio headset Project Swan, ciljajući poslovne korisnike XR-a i izravno konkurirajući Appleu.

min čitanja

Više

Tehnologija

Istraživači: Tvrtke ignoriraju obavezu objave podataka o treniranju AI modela
Trinity College Dublin analizirao je provedbu EU Akta o umjetnoj inteligenciji i utvrdio da većina velikih tvrtki još ne objavljuje zakonom propisane sažetke o podatcima za treniranje AI modela.

min čitanja

Više

Tehnologija

Lažno usklađivanje umjetne inteligencije sve veći sigurnosni rizik
Nova prijetnja u svijetu kibernetike: umjetna inteligencija može „glumiti poslušnost”, a zapravo raditi po starim pravilima, što otvara put krađi podataka i sabotaži sustava.

min čitanja

Više

Tehnologija

Stručnjaci upozoravaju: nosivi AI uređaji mogu potkopati ljudsku autonomiju
Nadolazeća generacija nosivih AI uređaja mogla bi, upozoravaju stručnjaci, pretvoriti se iz pomoćnika u sofisticirani mehanizam manipulacije korisnicima.

min čitanja

Više

Tehnologija

Pentagon koristio Claude u napadu na Iran unatoč Trumpovoj zabrani
Američka vojska oslanjala se na AI sustav Claude prilikom zračnih udara na Iran iako je Donald Trump nekoliko sati ranije izdao naredbu o prekidu suradnje s tvrtkom Anthropic.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Najčitanije

Vijesti

Požar u zatvoru Bilice: dim ozlijedio 13 osoba, među njima i pravosudni policajci
Madrac koji se zapalio u splitskom zatvoru Bilice izazvao je požar i dim zbog kojeg je pomoć zatražilo 13 osoba.

min čitanja

Više

Nogomet

UEFA kaznila Tottenham zbog rasističkog ispada navijača
UEFA novčano kaznila Tottenham i izrekla uvjetnu zabranu ulaznica zbog rasističkog ispada navijača tijekom utakmice s Eintrachtom.
Football.ua, CC BY-SA 3.0 GFDL, via Wikimedia Commons

min čitanja

Više

Biznis

Iskra preuzima riječki 3. maj za 6,7 milijuna eura
CERP odobrio prodaju 3. maja 1905. šibenskoj Iskri uz obvezu očuvanja brodogradnje i najavu novih ulaganja.

min čitanja

Više

Najnovije

Politika

Bruxelles najavljuje dug put do zabrane konverzijskih terapija

Vijesti

Opatija otvara 17. Dane antifašizma: „Suosjećanjem protiv mržnje”

Sport

Zagreb se oprostio od doktora Ivana Fattorinija u Košarkaškom centru Dražen Petrović

Vijesti

Škotska prva u Ujedinjenom Kraljevstvu dopušta „vodenu kremaciju”

Vijesti

Iran nakon izraelskih udara: sustav bez pukotina i nova prijetnja širenjem rata u Zaljevu

Vijesti

Požar razotkrio tamnu sadašnjost riječkog hotela Emigranti

Vijesti

Delničani prikupili 206 doza krvi u prvoj ovogodišnjoj akciji

Sport

Brahim Diaz javno potvrdio prelazak na islam

Sport

Kenija privremeno suspendirala 27 sportaša zbog dopinga

Politika

Transparent s likom pokojnog desničara Charlieja Kirka izazvao buru pred zgradom američkog Ministarstva obrazovanja

Politika

Habijan o zabrani društvenih mreža djeci: „Najlakše je donijeti zakon, ali provedba je pravi izazov”