CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. studenog 2025, 20:22

Databricksov „Judge Builder” rješava „ouroboros” problem ocjenjivanja umjetne inteligencije

Databricks predstavio poboljšani AI sustav „Judge Builder” koji ocjenjuje rad drugih modela i pomaže tvrtkama da konačno izmjere kvalitetu umjetne inteligencije.

min. čitanja

XFacebookWhatsApp

Databricks je unaprijedio svoj okvir „Judge Builder”, interni sustav u kojem umjetna inteligencija (AI) procjenjuje rad druge AI, rješavajući pritom tzv. „ouroboros” paradoks – kružni problem dokazivanja kvalitete.

Glavne novosti

• Struktura radionica: nakon povratnih informacija korisnika tvrtka je uz tehničke alate uvela vođene radionice koje kroz tri koraka pomažu timovima da usuglase kriterije kvalitete, uhvate znanje stručnjaka i skaliraju procjene.

• Mjerenje „udaljenosti od ljudskog uzorka”: sustav uspoređuje ocjene AI-suca s ocjenama stručnjaka i tako kalibrira točnost, čineći strojne suce pouzdanim nadomjestkom ljudske evaluacije.

Tri lekcije iz prakse

  1. Stručnjaci se ne slažu onoliko koliko se misli. Batched anotacija i provjera međusobne pouzdanosti (inter-rater reliability) rano otkrivaju nesuglasice; interne ekipe dosegle su koeficijent pouzdanosti 0,6, dvostruko bolji od prosjeka vanjskih servisa.

  2. Veliki kriteriji treba razbiti na specifične suce. Umjesto jednog „općeg” suda, bolje je imati zasebne za točnost, relevantnost ili ton poruke, pa se kvar jasno locira i brže popravlja.

  3. Dovoljno je 20–30 pažljivo odabranih primjera. Radionice traju tek nekoliko sati ako se fokusiraju na granične slučajeve koji izazivaju raspravu.

Citati

„Inteligencija modela obično nije usko grlo; pravo je pitanje kako natjerati model da radi ono što želimo i kako provjeriti je li to stvarno napravio”, naglasio je glavni znanstvenik Jonathan Frankle.

Autorica okvira Pallavi Koppol dodala je: „Želite suca da provjeri je li vaš sustav dobar, no i sudac je AI. Kako onda znate da je sudac dobar?”

Poslovni učinak

• Jedan je klijent nakon prve radionice izgradio više od deset AI-sudaca i sada „mjeri sve”. • Nekoliko korisnika postali su sedmeroznamenkasti potrošači generativne AI jer mogu objektivno dokazati dobit. • Tvrtke koje su oklijevale prijeći s prompt-inženjeringa na napredno „reinforcement learning” uvele su ga jer napokon mogu mjeriti poboljšanja.

Preporučena praksa

  1. Odaberite jedan regulatorni zahtjev i jednu uočenu slabu točku kao startni portfelj sudaca.
  2. Organizirajte kratke sesije sa stručnjacima, koristite serijsku anotaciju i provjeru suglasja.
  3. Redovito revidirajte suce na temelju podataka iz produkcije – kako sustav evoluira, evoluiraju i mjerila.

Frankle zaključuje: „Kad jednom imate suca koji kvantificira ljudski ukus, možete ga iskoristiti na tisuću načina – od optimizacije promptova do nadgledanog učenja i postavljanja čvrstih ograda za svoje agente.”

#databricks#generativna-ai#jonathan-frankle#pallavi-koppol#ouroboros-paradoks

Slično

Tehnologija

Snowflake na BUILD-u 2025 najavio platformu koja ruši silose podataka
Na godišnjoj konferenciji BUILD 2025 Snowflake je predstavio platformu Snowflake Intelligence i novi modul Agentic Document Analytics, ciljajući na ukidanje podatakačnih silosa u korporativnoj AI analitici.

min čitanja

Više

Tehnologija

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B
Manifest AI predstavio je Brumby-14B, model koji zamjenjuje pažnju rekurentnim slojem „power retention” i dostiže performanse transformera uz desetostruko manji trošak.

min čitanja

Više

Tehnologija

Biotehnološki startup Dren Bio osvojio američku nagradu Prix Galien 2025
Dren Bio proglašen najboljim startupom u SAD-u na dodjeli nagrada Prix Galien 2025 za inovativne terapije protiv raka i autoimunih bolesti.

min čitanja

Više

Tehnologija

Istraživači tržišta grle AI, ali nepovjerenje prema točnosti i dalje traje
Gotovo svi istraživači tržišta koriste AI i osjete ubrzanje rada, ali četiri od deset ispitanika prijavljuje pogreške i nove rizike, pokazuju podaci QuestDIY-a.

min čitanja

Više

Tehnologija

Zendeskova agentička umjetna inteligencija rješava 80 % upita i predviđa probleme prije nego nastanu
Zendesk integrirao ChatGPT-5 i platformu HyperArc kako bi autonomni AI agenti rješavali većinu korisničkih upita, smanjili eskalacije i pretvorili podršku u izvor prediktivnih poslovnih uvida.

min čitanja

Više

Tehnologija

Istarski gradovi uče kako umjetna inteligencija može preobraziti javne usluge
U Puli je krenula cjelodnevna radionica na kojoj lokalni čelnici i komunalna poduzeća uče kako umjetna inteligencija može ubrzati i poboljšati javne usluge.

min čitanja

Više

Tehnologija

Sunflower Labs dobio odobrenje FAA-a za BVLOS i osigurao 16 milijuna dolara ulaganja
Američki Sunflower Labs dobio je federalno odobrenje za letove dronova izvan vidnog polja te prikupio 16 milijuna dolara za ubrzani razvoj i globalno širenje autonomnog sustava nadzora Beehive.

min čitanja

Više

Tehnologija

Tim Crni kos ponovno briljira na riječkom hackatonu
Tim Crni kos osvojio je hackaton „Lov na usluge”, razvivši igru koja mladima otkriva brojne gradske usluge.

min čitanja

Više

Tehnologija

Kako pojačati privatnost na iPhoneu: pet ključnih postavki koje vrijedi odmah promijeniti
Najnoviji iOS 26 donosi detaljne alate za zaštitu podataka, ali mnogi su skriveni. Evo kako ih pronaći i uključiti.

min čitanja

Više

Tehnologija

Što doista mijenja baterije za električne aute: pet tehnologija pred vratima i tri koje još čekaju
Analiza otkriva koje baterijske inovacije uskoro stižu u serijske električne automobile, a koje će još godinama ostati tek prototipovi.

min čitanja

Više

Najčitanije

Nogomet

By http://hospitalityguide.manutd.com/global_assets/Wine_List.pdf, Fair use, https://en.wikipedia.org/w/index.php?curid=30961834

Ronaldo o završetku karijere: sprema se na suze i proziva Manchester United
Cristiano Ronaldo najavio kraj karijere, otkrio da će vjerojatno zaplakati i ponovno kritizirao stanje u Manchester Unitedu.
By Анна Нэсси - soccer.ru, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=69972366

min čitanja

Više

Nogomet

Rijeka preimenovala Rujevicu u stadion Dean Šćulac
Klub s Kvarnera odaje počast preminulom dopredsjedniku Deanu Šćulcu preimenovanjem stadiona Rujevica u njegovu čast.

min čitanja

Više

Najnovije

Politika

Ustavni sud BiH odbacio Dodikovu apelaciju, prijevremeni izbori u RS-u 23. studenoga

Vijesti

U Susedgradu zapaljena tri automobila, policija traga za počiniteljem

Biznis

Središnje banke gomilaju zlato, HNB i dalje gleda sa strane

Vijesti

Rijeka mladim obiteljima nudi stanove za 2 eura po kvadratu

Sport

Borilački svijet tuguje: preminuo kickboksački prvak Vladimir Toktasjinov

Tehnologija

Snowflake na BUILD-u 2025 najavio platformu koja ruši silose podataka

Tehnologija

Startup Manifest AI tvrdi da je probio ograničenja transformera modelom Brumby-14B

Politika

HDZ-ova dužnosnica tvrdi da su „Dani srpske kulture” u Splitu održani bez dozvole

Sport

Sky Sport Italia uručio otkaze pripravnicima zbog euforičnog slavlja pogotka Intera

Vijesti

Dojava o bombi paralizirala Reaganovu zračnu luku u Washingtonu

Tehnologija

Biotehnološki startup Dren Bio osvojio američku nagradu Prix Galien 2025