CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. studenog 2025, 20:22

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije

Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min. čitanja

XFacebookWhatsApp

Databricks je unaprijedio svoj okvir „Judge Builder”, interni sustav u kojem umjetna inteligencija (AI) procjenjuje rad druge AI, rješavajući pritom tzv. „ouroboros” paradoks – kružni problem dokazivanja kvalitete.

Glavne novosti

• Struktura radionica: nakon povratnih informacija korisnika tvrtka je uz tehničke alate uvela vođene radionice koje kroz tri koraka pomažu timovima da usuglase kriterije kvalitete, uhvate znanje stručnjaka i skaliraju procjene.

• Mjerenje „udaljenosti od ljudskog uzorka”: sustav uspoređuje ocjene AI-suca s ocjenama stručnjaka i tako kalibrira točnost, čineći strojne suce pouzdanim nadomjestkom ljudske evaluacije.

Tri lekcije iz prakse

  1. Stručnjaci se ne slažu onoliko koliko se misli. Batched anotacija i provjera međusobne pouzdanosti (inter-rater reliability) rano otkrivaju nesuglasice; interne ekipe dosegle su koeficijent pouzdanosti 0,6, dvostruko bolji od prosjeka vanjskih servisa.

  2. Veliki kriteriji treba razbiti na specifične suce. Umjesto jednog „općeg” suda, bolje je imati zasebne za točnost, relevantnost ili ton poruke, pa se kvar jasno locira i brže popravlja.

  3. Dovoljno je 20–30 pažljivo odabranih primjera. Radionice traju tek nekoliko sati ako se fokusiraju na granične slučajeve koji izazivaju raspravu.

Citati

„Inteligencija modela obično nije usko grlo; pravo je pitanje kako natjerati model da radi ono što želimo i kako provjeriti je li to stvarno napravio”, naglasio je glavni znanstvenik Jonathan Frankle.

Autorica okvira Pallavi Koppol dodala je: „Želite suca da provjeri je li vaš sustav dobar, no i sudac je AI. Kako onda znate da je sudac dobar?”

Poslovni učinak

• Jedan je klijent nakon prve radionice izgradio više od deset AI-sudaca i sada „mjeri sve”. • Nekoliko korisnika postali su sedmeroznamenkasti potrošači generativne AI jer mogu objektivno dokazati dobit. • Tvrtke koje su oklijevale prijeći s prompt-inženjeringa na napredno „reinforcement learning” uvele su ga jer napokon mogu mjeriti poboljšanja.

Preporučena praksa

  1. Odaberite jedan regulatorni zahtjev i jednu uočenu slabu točku kao startni portfelj sudaca.
  2. Organizirajte kratke sesije sa stručnjacima, koristite serijsku anotaciju i provjeru suglasja.
  3. Redovito revidirajte suce na temelju podataka iz produkcije – kako sustav evoluira, evoluiraju i mjerila.

Frankle zaključuje: „Kad jednom imate suca koji kvantificira ljudski ukus, možete ga iskoristiti na tisuću načina – od optimizacije promptova do nadgledanog učenja i postavljanja čvrstih ograda za svoje agente.”

#databricks#generativna-ai#jonathan-frankle#pallavi-koppol#ouroboros-paradoks

Slično

Tehnologija

OpenAI predstavio GPT-5.1: brži, razgovorljiviji i prilagodljiviji ChatGPT
OpenAI je izbacio GPT-5.1 Instant i GPT-5.1 Thinking, donoseći brže odgovore, prirodniji razgovor i više mogućnosti prilagodbe tona u ChatGPT-u.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Claude iz Anthropica preuzeo upravljanje robotskim psom
Eksperiment pokazao da veliki jezični model može direktno upravljati robotskom platformom, ali stručnjaci upozoravaju na sigurnosne izazove.

min čitanja

Više

Tehnologija

Waymo prvi put pušta robotaksije na autoceste u tri američka megapolja
Waymo proširuje autonomnu taksi uslugu na autoceste u San Franciscu, Los Angelesu i Phoenixu, skraćujući vožnje i najavljujući nova tržišta.

min čitanja

Više

Tehnologija

Dron prvi put opere 84‐metarske zvonike đakovačke katedrale
Zračni stroj zamijenio vatrogasce u zahtjevnom pranju fasade stare 143 godine pred očima nadbiskupa i okupljenih građana.

min čitanja

Više

Tehnologija

Bruxelles priprema „Chips Act 2” nakon nove krize u opskrbi poluvodičima
Nakon zapljene Nexperije i svježih američko-kineskih ograničenja, Europska komisija ubrzava rad na novom paketu za jačanje domaće proizvodnje čipova.

min čitanja

Više

Tehnologija

Robot usisavači: spas u kućnom kaosu ili još jedna briga?
Prednosti i mane robot usisavača kroz iskustvo dugogodišnje testerice.

min čitanja

Više

Tehnologija

Foxglove prikupio 40 milijuna dolara za razvoj infrastrukture za fizičku umjetnu inteligenciju
Startup za podatkovnu infrastrukturu u robotici osigurao je 40 milijuna dolara; cilj je proširiti platformu koja pomaže developerima da robote uče iz golemih skupova podataka.

min čitanja

Više

Tehnologija

Američki Tavus prikupio 40 milijuna dolara za „ljudske” AI pomoćnike
Startup iz San Francisca dobio je 40 milijuna dolara za razvoj PAL-ova, digitalnih pomoćnika koji imitiraju ljudsku mimiku, glas i ponašanje.

min čitanja

Više

Tehnologija

Startup iz San Francisca zaposlio samo AI radnike i otkrio granice „godine agenata”
Eksperiment poduzetnika Evana Ratliffa s tvrtkom u kojoj rade isključivo umjetni zaposlenici otkriva komične, ali i ozbiljne nedostatke popularne vizije „AI agenata” koji bi trebali zamijeniti ljude.
TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Hrvatski Telekom besplatno podučava AI: program „AI ti to možeš” otvara vrata digitalnoj pismenosti
Hrvatski Telekom pokreće besplatan program „AI ti to možeš” i nudi certifikat iz umjetne inteligencije, nakon što je istraživanje pokazalo veliku spremnost građana za usvajanje AI vještina.

min čitanja

Više

Najčitanije

Vijesti

Policija privela mladiće nakon masovne tučnjave kod Manduševca
Kratkotrajni sukob više maskiranih mladića pokraj Manduševca završio je policijskom intervencijom i privođenjem; motiv i broj sudionika još se utvrđuju.

min čitanja

Više

Politika

Plenković najavio proračun za 2026.: rast plaća i mirovina uz deficit unutar Maastrichta
Premijer otkrio ključne brojke i ciljeve državnog proračuna za 2026. godinu: rast od 2,7 %, inflacija 2,8 %, deficit 2,9 %, a prosječna mirovina prema 800 eura.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986Autor Kepkke. - Моја особна архива. Kepkke., Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=15184061

min čitanja

Više

Politika

Demokrati objavili e-mailove: Epstein tvrdio da je Trump znao za maloljetnice
Objavljeni e-mailovi pokojnog financijaša upućuju na to da je Donald Trump bio svjestan seksualne trgovine maloljetnicama.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524Palm Beach County Sheriff's Department, Public domain, via Wikimedia Commons

min čitanja

Više

Najnovije

Tehnologija

OpenAI predstavio GPT-5.1: brži, razgovorljiviji i prilagodljiviji ChatGPT

Vijesti

Sutra zatvaranje dijela Puta sv. Lovre zbog asfaltiranja

Sport

Trudna Veronica u suzama dok Musetti oživljava nadu u Torinu

Lifestyle

Del Toro napokon oživio Frankensteina: Netflix lansirao najskuplji projekt meksičkog majstora

Sport

Slaven Belupo ljutit zbog 557 dana bez penala: Layec potvrdio propust u Zagrebu

Sport

Osijek traži izlaz iz krize: bez Vrbančića napad je bez ideje

Lifestyle

Fićo zvijezda riječke izložbe oldtimera: stiže i Titov Mercedes

Sport

Sabalenka i Kyrgios najavili „Rat spolova” u Dubaiju

Tehnologija

Claude iz Anthropica preuzeo upravljanje robotskim psom

Politika

Riječki centar presudio: „Za dom spremni” ostaje nedvosmisleno ustaški pozdrav

Vijesti

Dan Fakulteta za fiziku: studenti najzadovoljniji na riječkom sveučilištu