CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. studenog 2025, 20:22

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije

Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min. čitanja

XFacebookWhatsApp

Databricks je unaprijedio svoj okvir „Judge Builder”, interni sustav u kojem umjetna inteligencija (AI) procjenjuje rad druge AI, rješavajući pritom tzv. „ouroboros” paradoks – kružni problem dokazivanja kvalitete.

Glavne novosti

• Struktura radionica: nakon povratnih informacija korisnika tvrtka je uz tehničke alate uvela vođene radionice koje kroz tri koraka pomažu timovima da usuglase kriterije kvalitete, uhvate znanje stručnjaka i skaliraju procjene.

• Mjerenje „udaljenosti od ljudskog uzorka”: sustav uspoređuje ocjene AI-suca s ocjenama stručnjaka i tako kalibrira točnost, čineći strojne suce pouzdanim nadomjestkom ljudske evaluacije.

Tri lekcije iz prakse

  1. Stručnjaci se ne slažu onoliko koliko se misli. Batched anotacija i provjera međusobne pouzdanosti (inter-rater reliability) rano otkrivaju nesuglasice; interne ekipe dosegle su koeficijent pouzdanosti 0,6, dvostruko bolji od prosjeka vanjskih servisa.

  2. Veliki kriteriji treba razbiti na specifične suce. Umjesto jednog „općeg” suda, bolje je imati zasebne za točnost, relevantnost ili ton poruke, pa se kvar jasno locira i brže popravlja.

  3. Dovoljno je 20–30 pažljivo odabranih primjera. Radionice traju tek nekoliko sati ako se fokusiraju na granične slučajeve koji izazivaju raspravu.

Citati

„Inteligencija modela obično nije usko grlo; pravo je pitanje kako natjerati model da radi ono što želimo i kako provjeriti je li to stvarno napravio”, naglasio je glavni znanstvenik Jonathan Frankle.

Autorica okvira Pallavi Koppol dodala je: „Želite suca da provjeri je li vaš sustav dobar, no i sudac je AI. Kako onda znate da je sudac dobar?”

Poslovni učinak

• Jedan je klijent nakon prve radionice izgradio više od deset AI-sudaca i sada „mjeri sve”. • Nekoliko korisnika postali su sedmeroznamenkasti potrošači generativne AI jer mogu objektivno dokazati dobit. • Tvrtke koje su oklijevale prijeći s prompt-inženjeringa na napredno „reinforcement learning” uvele su ga jer napokon mogu mjeriti poboljšanja.

Preporučena praksa

  1. Odaberite jedan regulatorni zahtjev i jednu uočenu slabu točku kao startni portfelj sudaca.
  2. Organizirajte kratke sesije sa stručnjacima, koristite serijsku anotaciju i provjeru suglasja.
  3. Redovito revidirajte suce na temelju podataka iz produkcije – kako sustav evoluira, evoluiraju i mjerila.

Frankle zaključuje: „Kad jednom imate suca koji kvantificira ljudski ukus, možete ga iskoristiti na tisuću načina – od optimizacije promptova do nadgledanog učenja i postavljanja čvrstih ograda za svoje agente.”

#databricks#generativna-ai#jonathan-frankle#pallavi-koppol#ouroboros-paradoks

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Tvrtke žure uskladiti AI agente: orkestracija postaje pitanje opstanka
Orkestracija komunikacije među AI agentima postaje presudna za sigurnost i učinkovitost. Stručnjaci upozoravaju da će tvrtke koje ne usklade agente riskirati nesporazume, halucinacije i gubitak podataka.

min čitanja

Više

Tehnologija

Musk odbacuje optužbe: „Grok nije stvarao gole maloljetnike”
Elon Musk tvrdi da AI chatbot Grok nije generirao nezakonite slike maloljetnika, dok europski i britanski regulatori najavljuju istrage zbog sumnji u duboke lažne pornografske sadržaje.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Riječki inovator odbio londonski doktorat kako bi u Hrvatskoj razvijao radiologiju
Diego Ivanović odbio je doktorat u Londonu i s Leonardom Martinisom pokrenuo Medusa Technologies, startup koji razvija AI za radiološke snimke.

min čitanja

Više

Tehnologija

AI alat Sybil otkrio propust klijenta i zbunio vlastite tvorce
Neočekivano otkriće AI alata Sybil označilo novu fazu u kibernetičkoj sigurnosti.

min čitanja

Više

Tehnologija

Je li vrijedno riskirati? Što treba znati prije uvoza kineskog pametnog telefona
Kineski pametni telefoni često nude vrhunske performanse po nižoj cijeni, no uvoz izvan službenih kanala nosi niz financijskih i servisnih rizika.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Poljska tvrdi da je ruski kibernetički napad umalo ugasio njezinu elektroenergetsku mrežu
Ministar digitalizacije Krzysztof Gawkowski otkrio da je Poljska tijekom blagdana odbila najveći kibernetički napad na svoj energetski sustav, za koji optužuje Rusiju.

min čitanja

Više

Tehnologija

Izraelski Novee izlazi iz sjene s 51,5 milijuna dolara za borbu protiv AI kibernapada
Startup iz Tel Aviva razvija vlastitog „AI hakera” za kontinuirano penetracijsko testiranje i osigurao više od 50 milijuna dolara početnih ulaganja.

min čitanja

Više

Tehnologija

Provokativna kineska aplikacija „Jesi li mrtav?” osvaja samce, mijenja ime i uvodi pretplatu
Sigurnosna aplikacija koja korisnike pita „Jesi li mrtav?” stekla je popularnost među kineskim samcima, a autori najavljuju pretplatu i novo ime Demumu.

min čitanja

Više

Tehnologija

TikTok Shop pod vatrom zbog prikaza nakita s nacističkom simbolikom
Pretraga za „hip hop nakitom” na TikTok Shopu dovela je do preporuka nakita s nacističkim simbolima, otvarajući nova pitanja o odgovornosti platforme.

min čitanja

Više

Tehnologija

Brian Cox rasprodao Lisinski devet mjeseci prije nastupa, dodan i drugi termin
Popularni fizičar ponovno puni Lisinski: zbog velike potražnje za showom „Emergence” otvoren je drugi datum u rujnu 2026.

min čitanja

Više

Najčitanije

Politika

SAD privremeno zaustavlja useljeničke vize za pet zemalja zapadnog Balkana
Washington od 21. siječnja zaustavlja obradu zahtjeva za useljeničke vize građana BiH, Crne Gore, Albanije, Kosova i Sjeverne Makedonije, uz objašnjenje da želi smanjiti mogući teret na američki sustav socijalne skrbi.

min čitanja

Više

Politika

Druga faza Trumpovog plana za Gazu: demilitarizacija Hamasa i tehnokratska vlada
SAD potvrđuje ulazak mirovnog plana u novu etapu; Hamas u Kairu prihvatio tehnokratsku vladu, no razoružanje i sigurnosni aranžmani ostaju najveći izazovi.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Košarka

Košarkaški ‘El Clasico’ na Gripama: Split protiv Cibone lovi 12. uzastopnu pobjedu
Žuti traže dvanaestu uzastopnu pobjedu za ostanak na vrhu, dok se probuđena Cibona nada iznenađenju u derbiju na Gripama.

min čitanja

Više

Najnovije

Sport

Zabok produbio krizu Šibenke na Baldekinu

Politika

Iran ponovno otvorio zračni prostor, Trump tvrdi da su pogubljenja obustavljena

Politika

Trumpova administracija blokira imigrantske vize za 75 država

Sport

Jurišić ponovo briljira na Lanzaroteu: treće mjesto kao zalog za Los Angeles 2028.

Vijesti

Radovi na Stojoj napreduju unatoč kiši i strogim konzervatorskim pravilima

Politika

Trump u intervjuu za Reuters: „Zelenski je prepreka miru, Pahlavi izgleda pristojno”

Politika

Zelenskij proglašava izvanredno stanje u energetici, Trump okrivljuje Kijev za zastoj mira

Vijesti

Mladi vozač u Koprivnici pozitivan na droge, dobio zabranu vožnje

Vijesti

Riječki mjesni odbor i škola udružili snage: donacijske kutije za djecu u riziku od siromaštva

Sport

Istra 1961 zaključila pripreme pobjedom nad Radomljem

Lifestyle

Imotska krajina ruši turističke rekorde i najavljuje još jaču sezonu