CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

18. kolovoza 2025, 11:16

EU stručnjaci upozoravaju na manjkavosti u ocjenjivanju umjetne inteligencije

Rad Zajedničkog istraživačkog centra Europske komisije otkriva da se sadašnja mjerila za umjetnu inteligenciju lako manipuliraju i ne odražavaju stvarne sposobnosti modela, zbog čega istraživači pozivaju na strože, transparentnije i kulturno uključivije standarde.

min. čitanja

Europski istraživači upozorili su da se sadašnja mjerila za procjenu mogućnosti umjetne inteligencije lako mogu zaobići te često mjere pogrešne stvari.

U radu objavljenom prošloga tjedna Zajednički istraživački centar (JRC) Europske komisije zaključuje da komercijalni alati za usporedbu AI modela „obećavaju previše”. Autori ističu kako proizvođači sustava mogu ciljano prilagoditi modele kako bi poboljšali rezultat na uskom testu, umjesto da razvijaju stvarne sposobnosti.

Tvrtke poput OpenAI-a uvelike se oslanjaju na takve brojčane pokazatelje. Primjerice, najnoviji GPT-5 interno je testiran na dosljednom odbijanju neodgovorivih pitanja i, prema navodima tvrtke, nadmašio prethodnu verziju. No JRC poziva regulatore da detaljno preispitaju kako ti testovi funkcioniraju i što zapravo mjere.

Problem je posebno osjetljiv za Europsku uniju jer se novi Zakon o umjetnoj inteligenciji oslanja na procjene sposobnosti modela u različitim kontekstima. Prema propisu, veliki modeli mogu biti svrstani u kategoriju „posebnog rizika” ako se pokaže da posjeduju „visokoučinkovite sposobnosti”. Komisija tu definiciju može precizirati delegiranim aktom – no to još nije učinjeno.

Istodobno, Sjedinjene Države su u petak predstavile vlastiti paket alata za procjenu AI-a za savezne agencije, naglašavajući ambiciju zadržavanja globalnog vodstva na tom području.

Kako bi sustav ocjenjivanja učinili vjerodostojnim, istraživači predlažu: • usmjeravanje testova na stvarne, a ne uske zadatke; • potpunu dokumentaciju i transparentnost; • jasno definiranje ciljeva i metodologije; • uvažavanje različitih kulturnih i jezičnih konteksta, budući da se sadašnja mjerila gotovo isključivo temelje na engleskom jeziku.

„Posebno naglašavamo potrebu za novim načinima označavanja mjerila kojima se može vjerovati”, navodi se u radu, dodajući da bi dobro postavljen sustav mogao stvoriti novi „bruxelleski efekt” i postaviti globalne standarde.

Risto Uuk, voditelj za EU politiku i istraživanje u think tanku Future of Life Institute, podržava nalaze: „Poboljšanja su nužna, ali procjena sposobnosti i rizika od ključne je važnosti – oslanjanje na dojmove i anegdote jednostavno nije dovoljno.” Uuk zato predlaže da EU uvede obvezno testiranje od strane neovisnih tijela i financijski podupre razvoj čitavog ekosustava procjenjivanja.

Istraživači zaključuju da upravo sada postoji prilika da Europa postavi jasna, provjerljiva i sveobuhvatna pravila te tako spriječi da brojke u promidžbenim materijalima postanu važnije od stvarne sigurnosti i pouzdanosti AI sustava.

#europska-unija#openai#zakon-o-umjetnoj-inteligenciji#zajednicki-istrazivacki-centar#future-of-life-institute

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata
Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Hakom upozorava: bliži se rok za prijavu posredničkih digitalnih usluga
Hakom poziva digitalne posrednike da do 29. listopada 2025. elektronički prijave svoje usluge ili riskiraju visoke kazne.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata
Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

PayPal ubrzava dolazak „agentske trgovine” novim servisom za AI-tržnice
Novi PayPalov servis Shop Sync omogućuje da se katalozi trgovaca pojave u AI chatovima, dok Agent Ready planira izravna plaćanja od 2026. godine.

min čitanja

Više

Tehnologija

Ekonomisti upozoravaju: umjetna inteligencija ima sve simptome megabalona
Model povijesnih tehnoloških balona smješta generativni AI u najrizičniju kategoriju – razinu 8/8.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije
Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju
Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?
Analiza ruši mit da su stari automobili bili superiorni: današnji su brži, sigurniji i tehnološki napredniji, dok nostalgija uglavnom počiva na dizajnu i raznolikosti koje je progutala SUV revolucija.

min čitanja

Više

Tehnologija

Osijek pionir kontrastne mamografije uz potporu umjetne inteligencije
Kontrastna mamografija u Domu zdravlja Osijek postiže osjetljivost veću od 90 %, a umjetna inteligencija dodatno povećava pouzdanost nalaza.

min čitanja

Više

Tehnologija

SiLC proširuje sjedište u Monroviji i jača domaću proizvodnju fotoničkih sustava
Kalifornijski SiLC investira u širenje pogona kako bi ubrzao serijsku proizvodnju silicijskih fotoničkih čipova i vizijskih sustava za industrijsku automatizaciju i obranu.

min čitanja

Više

Najčitanije

Politika

Netanyahu naređuje snažne udare na Gazu zbog navodnog kršenja dogovora o taocima
Izrael optužuje Hamas da nije predao tijela talaca te pokreće nove udare na Gazu, dok Hamas tvrdi da upravo izraelski napadi onemogućuju ispunjenje dogovora.
US Department of State, Public domain, via Wikimedia Commons

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Sudačka komisija: poništeni gol Vukovara bio ispravan, Osijek oštećen drugom opomenom
Analiza 11. kola: komisija HNS-a potvrdila ispravnost VAR-a kod susreta Vukovar – Dinamo, dok je u dvoboju Rijeka – Osijek utvrđena pogrešna druga opomena.

min čitanja

Više

Najnovije

Vijesti

Ptičja gripa proširila se na nove vrste ptica; milijuni peradi već eutanazirani

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Biznis

Hrvatska pošta priznala propust u Bačvicama i smijenila poštara

Politika

Slovenski zastupnici traže hitnu sjednicu zbog mogućeg preuzimanja Ljubljanske burze

Vijesti

Besplatan ZET-ov prijevoz prema grobljima na blagdan Svih svetih

Sport

Torcida obilježila 75. rođendan počastom poginulim članovima

Sport

Anguissa donio Napoliju pobjedu u Lecceu, Milinković-Savić obranio penal

Vijesti

Gripe planira garažu i obnovu igrališta uz podršku gradonačelnika

Sport

Poljud gori za vaterpolski klasik Jadran – Novi Beograd

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Vijesti

Šibenski srednjoškolci među „rekorderima” po neopravdanim satima