CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

4. studenog 2025, 20:22

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije

Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min. čitanja

XFacebookWhatsApp

Databricks je unaprijedio svoj okvir „Judge Builder”, interni sustav u kojem umjetna inteligencija (AI) procjenjuje rad druge AI, rješavajući pritom tzv. „ouroboros” paradoks – kružni problem dokazivanja kvalitete.

Glavne novosti

• Struktura radionica: nakon povratnih informacija korisnika tvrtka je uz tehničke alate uvela vođene radionice koje kroz tri koraka pomažu timovima da usuglase kriterije kvalitete, uhvate znanje stručnjaka i skaliraju procjene.

• Mjerenje „udaljenosti od ljudskog uzorka”: sustav uspoređuje ocjene AI-suca s ocjenama stručnjaka i tako kalibrira točnost, čineći strojne suce pouzdanim nadomjestkom ljudske evaluacije.

Tri lekcije iz prakse

  1. Stručnjaci se ne slažu onoliko koliko se misli. Batched anotacija i provjera međusobne pouzdanosti (inter-rater reliability) rano otkrivaju nesuglasice; interne ekipe dosegle su koeficijent pouzdanosti 0,6, dvostruko bolji od prosjeka vanjskih servisa.

  2. Veliki kriteriji treba razbiti na specifične suce. Umjesto jednog „općeg” suda, bolje je imati zasebne za točnost, relevantnost ili ton poruke, pa se kvar jasno locira i brže popravlja.

  3. Dovoljno je 20–30 pažljivo odabranih primjera. Radionice traju tek nekoliko sati ako se fokusiraju na granične slučajeve koji izazivaju raspravu.

Citati

„Inteligencija modela obično nije usko grlo; pravo je pitanje kako natjerati model da radi ono što želimo i kako provjeriti je li to stvarno napravio”, naglasio je glavni znanstvenik Jonathan Frankle.

Autorica okvira Pallavi Koppol dodala je: „Želite suca da provjeri je li vaš sustav dobar, no i sudac je AI. Kako onda znate da je sudac dobar?”

Poslovni učinak

• Jedan je klijent nakon prve radionice izgradio više od deset AI-sudaca i sada „mjeri sve”. • Nekoliko korisnika postali su sedmeroznamenkasti potrošači generativne AI jer mogu objektivno dokazati dobit. • Tvrtke koje su oklijevale prijeći s prompt-inženjeringa na napredno „reinforcement learning” uvele su ga jer napokon mogu mjeriti poboljšanja.

Preporučena praksa

  1. Odaberite jedan regulatorni zahtjev i jednu uočenu slabu točku kao startni portfelj sudaca.
  2. Organizirajte kratke sesije sa stručnjacima, koristite serijsku anotaciju i provjeru suglasja.
  3. Redovito revidirajte suce na temelju podataka iz produkcije – kako sustav evoluira, evoluiraju i mjerila.

Frankle zaključuje: „Kad jednom imate suca koji kvantificira ljudski ukus, možete ga iskoristiti na tisuću načina – od optimizacije promptova do nadgledanog učenja i postavljanja čvrstih ograda za svoje agente.”

#databricks#generativna-ai#jonathan-frankle#pallavi-koppol#ouroboros-paradoks
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Sukob tehnoloških titana: Musk i Altman na sudu zbog misije OpenAI-ja
Sudska bitka između Elona Muska i Sama Altmana mogla bi redefinirati smjer OpenAI-ja i pravila distribucije napredne umjetne inteligencije.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305TechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Google uveo „AI način” koji Chrome pretvara u stalni chat na lijevom rubu
Ažuriranje „AI načina” u Chromeu otvara linkove u istoj kartici i ostavlja chat sa strane, smanjujući potrebu za skakanjem među karticama.

min čitanja

Više

Tehnologija

Anthropic širi londonski ured i najavljuje četverostruko veći tim
Američki AI laboratorij Claudea seli u znatno veći londonski ured, pojačava suradnju s britanskim Institutom za sigurnost AI-ja i otvara do 800 radnih mjesta, najavljujući novu rundu lova na vrhunske talente.

min čitanja

Više

Tehnologija

Nissan lansira potpuno električni Juke, stari benzinac ostaje kao povoljnija opcija
Populani crossover dobiva isključivo električnu varijantu, dok ažurirani benzinac ostaje u ponudi zbog znatno niže cijene.

min čitanja

Više

Tehnologija

Start-up Sabi razvija kapu koja pretvara misli u tekst
Silicijskodalinski start-up najavljuje nosivi uređaj koji EEG-om pretvara unutarnji govor u tekst, dok stručnjaci upozoravaju na zaštitu najosjetljivijih osobnih podataka.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

AI ubrzava analizu rizika, ali ne liječi loše upravljanje
Stručnjaci u Zagrebu poručili: AI donosi bržu analizu rizika, ali bez jasnih procesa i kulture odgovornosti ostaje tek „fina šminka“.

min čitanja

Više

Tehnologija

Split dobiva prvi Telemach x HONOR shop-in-shop u Europi
Prva europska Telemach x HONOR poslovnica otvara se 20. travnja u City Centeru One Split, nudeći kombinaciju telekom usluga i najsuvremenijih HONOR uređaja te premijeru serije HONOR 600.

min čitanja

Više

Tehnologija

Europske vlade razvijaju vlastite aplikacije i izbacuju WhatsApp iz službene komunikacije
Francuska, Njemačka i još nekoliko članica EU-a napuštaju komercijalne aplikacije za dopisivanje te uvode vlastite, sigurnije sustave za državne službenike.

min čitanja

Više

Tehnologija

„Dotakni svijet” u Bistri: izložba o tehnologiji koja slijepima otvara horizonte
Međunarodna izložba „Dotakni svijet” u Tehničkom muzeju Slovenije prikazuje evoluciju pomagala za slijepe i slabovidne, potičući raspravu o današnjoj pristupačnosti tehnologije.

min čitanja

Više

Tehnologija

Prijevremeni curenjak pogonske snage: cijeli film „Avatar: Aang, The Last Airbender” osvanuo na mreži
Curenje cijelog filma „Avatar: Aang, The Last Airbender” pola godine prije premijere razveselilo je dio fanova, ali slomilo autore i potencijalno ugrozilo budućnost franšize.

min čitanja

Više

Najčitanije

Politika

Trump slavi dogovoreni prekid vatre i poziva Netanyahua i Aouna u Bijelu kuću
Američki predsjednik objavio je desetodnevno primirje Izraela i Libanona te najavio dolazak obojice čelnika u Washington.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524US Department of State, Public domain, via Wikimedia Commons

min čitanja

Više

Biznis

Keight Hotel Opatija ušao u elitni 1 % Hiltona
Boutique hotel u središtu Opatije primio je Connie Award, najviše Hiltonovo priznanje koje dobiva tek jedan posto objekata u globalnoj mreži.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Pavlešić dijeli pravdu na maksimirskom derbiju

Tehnologija

Sukob tehnoloških titana: Musk i Altman na sudu zbog misije OpenAI-ja

Sport

Crikvenica unatoč porazu slavila najuspješniju prvoligašku sezonu

Vijesti

Početak svibnja donosi kraj gužvama na brzoj cesti Solin–Klis

Vijesti

Bez poziva vatrogascima nema loženja vatre u Labinu

Vijesti

Lov na krivca: u Požegi zračnom puškom ranjena kućna mačka

Biznis

Europske tvrtke razmatraju kanadski LNG kao skuplju, ali sigurniju opciju

Politika

Plenković: Istri ne pristaje termoelektrana na ugljen, razmatra se nuklearna opcija

Lifestyle

Wine & Walk Veprinac spaja vino, šetnju i pogled na Kvarner

Sport

Messi preuzeo UE Cornellu i najavio dugoročni projekt

Lifestyle

Reddit rasprava ponovno otvorila pitanje raskošnog života mladih u Splitu