CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

21. studenog 2025, 14:24

Tržište označavanja podataka seli fokus na provjeru agentičkih AI sustava

Tvrtke koje su dosad nudile označavanje podataka masovno prelaze na ocjenjivanje agentičkih AI sustava, a tržište potresa Meta-ino ulaganje u Scale AI.

min. čitanja

XFacebookWhatsApp

Baze podataka više nisu dovoljno jamstvo uspjeha umjetne inteligencije; korporacije danas traže dokaz da njihovi agenti donose ispravne odluke kroz složene, višekoračne zadatke.

„Potrebni su nam više ne samo ljudi u petlji, nego stručnjaci u petlji”, poručuje suosnivač HumanSignala Michael Malyuk, podsjećajući na rizike u zdravstvu i pravu gdje pogreške mogu biti skupe.

Što se sve mora ocjenjivati

  1. lanac zaključivanja i izbor alata
  2. višemodalni izlazi (tekst, kod, slike…)
  3. konzistentnost kroz više uzastopnih interakcija

Takve procjene zahtijevaju iste temeljne elemente kao klasično označavanje podataka: • strukturirana sučelja za ljudsku prosudbu
• višestruko recenziranje i usklađivanje razlika
• ogromnu količinu domenskog znanja
• čvrste povratne petlje prema modelu

Nova rješenja

HumanSignal je u Label Studio Enterprise ugradio alate za:

  • pregled cjelovitog traga rada agenta (korak po korak)
  • interaktivno vrednovanje višestrukih replika u razgovoru
  • „Agent Arenu” za usporedno testiranje različitih konfiguracija
  • fleksibilne, programski definirane rubrike prilagođene svakoj struci

Pritiska i konkurencija

Trend su prepoznali i drugi. Labelbox je u kolovozu predstavio Evaluation Studio s naglaskom na rubrično ocjenjivanje, dok je tržište dodatno uzdrmano nakon što je Meta u lipnju uložila 14,3 milijarde dolara za 49 % udjela u Scale AI-u. Taj je potez izazvao odljev Scaleovih velikih klijenata, a HumanSignal tvrdi da je upravo u tom razdoblju osvojio više natječaja zahvaljujući zrelosti platforme i podršci korisnicima.

Što to znači za tvrtke

• Polazište je „ground truth”. Kvalitetne, višestruko provjerene oznake ostaju temelj svakog daljnjeg poboljšanja.
• Nadzor nije ocjenjivanje. Platforme za praćenje rada modela bilježe aktivnosti, ali ne mjere kvalitetu; potrebno je posebno okruženje za evaluaciju.
• Ista infrastruktura poslužuje dva ciklusa. Sustavi izvorno namijenjeni označavanju podataka mogu bezbolno poslužiti i za produkcijsku provjeru.

Zaključak: usko grlo više nije izgradnja modela, nego dokazivanje da su rezultati dovoljno dobri za visoko rizična područja. Tko to shvati na vrijeme, steći će prednost u utrci za pouzdanu primjenu umjetne inteligencije.

#meta#scale-ai#michael-malyuk#humansignal#labelbox

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Yann LeCun kreće u novu AI avanturu: „Svi su se navukli na LLM-ove, a to nije put do istinske inteligencije”
Nakon odlaska iz Mete, Yann LeCun najavljuje startup koji će, kaže, zaobići ograničenja velikih jezičnih modela i ponuditi drukčiji put prema umjetnoj općoj inteligenciji.

min čitanja

Više

Tehnologija

Arcee predstavio Trinity Large: 400-milijardni model otvorenog koda s rekordnom učinkovitošću
Arcee je lansirao Trinity Large, 400-milijardni MoE jezični model, te ponudio sirovi checkpoint TrueBase za neovisne revizije i prilagodbe.

min čitanja

Više

Tehnologija

PageIndex uvodi „navigacijsko” pretraživanje i podiže točnost RAG-a za duge dokumente
Otvoreni okvir PageIndex zamjenjuje klasično „chunk-and-embed” indeksiranje stablom sadržaja, čime poboljšava preciznost AI-a pri pretraživanju vrlo dugih i složenih dokumenata.

min čitanja

Više

Tehnologija

Rimac u St. Moritzu predstavio prvu Neveru R Founderʼs Edition
Na zaleđenom jezeru St. Moritz Rimac je isporučio prvi od svega deset primjeraka ekskluzivne Nevere R Founderʼs Edition, hiperautomobila od 2107 KS rasprodanog u tjedan dana.

min čitanja

Više

Tehnologija

Tehnološki lideri ujedinjeni protiv praksi ICE-a
Otvoreno pismo zaposlenika i šefova iz Silicijske doline poziva na prekid suradnje s američkom imigracijskom službom zbog nasilnih metoda.

min čitanja

Više

Tehnologija

Aplikacija Mobile Fortify širi ovlasti ICE-a: upozorenje na opasnu kombinaciju nadzora i pristranosti
Mobilna aplikacija ICE-a prikuplja biometrijske podatke i na američkim državljanima, čuva ih 15 godina i pokazuje velike stope pristranosti, upozoravaju tužbe i stručnjaci.

min čitanja

Više

Tehnologija

Nizozemski regulator pokrenuo istragu protiv Robloxa zbog zaštite djece
ACM sumnja da popularna platforma ne poštuje odredbe DSA-a o sigurnosti maloljetnika i najavljuje moguću novčanu kaznu.

min čitanja

Više

Tehnologija

Kimi K2.5 izazvao buru: kineski tim na Redditu otkrio muke otvorenog koda
Trosatni AMA otkrio je skrivena lica najmoćnijeg otvorenog AI modela s fokusom na konkretne tehničke probleme i dilemu oko potpune otvorenosti.

min čitanja

Više

Tehnologija

Trgovci se okreću rubnom računalstvu za otpornije i brže poslovanje
Rubno računalstvo postaje ključan alat za trgovce koji se bore s višestrukim izazovima, od nestašice radnika do kibernetičkih prijetnji.

min čitanja

Više

Tehnologija

Hrvatski tim otkrio vezu kvara popravka genoma i ranog raka jetre
Istraživači pod vodstvom Ivana Đikića otkrili su kako genomski kvar potiče kroničnu upalu, rano starenje i razvoj karcinoma jetre.

min čitanja

Više

Najčitanije

Vijesti

Preminula Catherine O’Hara, nezaboravna majka iz filma „Sam u kući”
Glumica Catherine O’Hara, poznata po ulozi majke u „Samu u kući”, umrla je u 71. godini; uzrok smrti zasad nije objavljen.

min čitanja

Više

Nogomet

Remi u Puli: Istra 1961 i Lokomotiva podijelile bodove u 20. kolu HNL-a
Puljani poveli preko Prevljaka, Zagrepčani izjednačili golom Vukovića; vratari spriječili odluku u završnici.

min čitanja

Više

Politika

EPP u Zagrebu: demografija mora postati strateški prioritet EU-a
Na skupu u Zagrebu EPP usvojio deklaraciju kojom upozorava da Europa bez demografske obnove gubi snagu i poziva na zajedničku strategiju EU-a.
Autor European People's Party - EPP Summit, 24 March 2022, Brussels, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=138912279

min čitanja

Više

Vijesti

H5N1 potvrđen u trima labudovima: uvedene strože mjere za perad u cijeloj zemlji
Ministarstvo poljoprivrede potvrdilo pojavu visokopatogenog virusa ptičje gripe H5N1 u Koprivničko-križevačkoj županiji te uvelo pojačane mjere biosigurnosti za perad u cijeloj Hrvatskoj.

min čitanja

Više

Najnovije

Vijesti

Novogradiški policajci usavršili vještine prve pomoći

Biznis

Marčana pokreće poduzetnički inkubator vrijedan 1,1 milijun eura

Sport

Samoborski „Pedalinci” kreću biciklima prema Olimpijadi u Cortini

Lifestyle

Slavonija spremna za 21. Noć muzeja: od streljaštva i tambura do ledenjaka i kraljevstva

Vijesti

Trideset novih graničnih policajaca završilo obuku u centru „Spačva”

Lifestyle

Hip-hop eksplozija otvara Rocks & Stars: Hiljson Mandela, Grše i Rasta u antičkom kamenolomu

Vijesti

Balkanski kamiondžije maknuli blokade nakon europskog obećanja

Lifestyle

Veljača u Puli pretvara grad u veliko karnevalsko i glazbeno središte

Vijesti

Građani Plokita razočarani: linija 19 opet odgođena

Politika

U Osijeku ista lica na šest funkcija: Đapić prima 1 394 eura mimo saborske mirovine

Lifestyle

Pulska Ukrajinka najavljuje singl „Bolyt’” i novi umjetnički zaokret