CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. studenog 2025, 20:20

Bez vidljivosti nema povjerenja: promatranje pretvara LLM-ove u pouzdan korporativni alat

Telemetrija pretvara umjetnu inteligenciju iz laboratorijskog pokusa u pouzdanu infrastrukturu – primjer iz bankarskog slučaja pokazuje zašto je promatranje ključno.

min. čitanja

XFacebookWhatsApp

Kad su velike jezične mreže (LLM) početkom godine počele izlaziti iz laboratorija, uprave su slavile brzinu, a odjeli usklađenosti počeli tražiti tragove. Najkritičnije pitanje ostalo je jednostavno: možemo li vidjeti što se u sustavu doista događa?

Šest mjeseci tišine u banci

Jedna Fortune 100 banka uvela je LLM za razvrstavanje zahtjeva za kredite. Probna preciznost pokazivala je odlične rezultate, no pola godine poslije interni revizori otkrili su da je 18 % ključnih predmeta završilo u pogrešnoj ladici – bez ikakvog alarma ili zapisa. Problem nije bio ni pristranost ni loši podaci, nego potpuna slijepa zona: sustav nije bilježio što radi.

"Ako ga ne možeš promatrati, ne možeš mu vjerovati", ponavlja se među inženjerima umjetne inteligencije. Upravo zato se sve više poduzeća okreće observabilityju – sloju telemetrije koji u realnom vremenu bilježi svaki prompt, svaku odluku i svaki ishod.

Obrnuti redoslijed: prvo ciljevi, zatim modeli

Uobičajena praksa kreće od izbora modela, pa tek onda definira mjerilo uspjeha. Stručnjaci sada savjetuju obrnutu logiku:

  1. Postavi poslovni cilj – primjerice, skratiti obradu odštetnog zahtjeva za 60 %.
  2. Izgradi telemetriju upravo oko tog cilja, a ne oko „BLEU“ ili „accuracy“ postotka.
  3. Biraj promptove i modele koji izravno pomiču dogovorene KPI-jeve.

Globalni osiguravatelj koji je „minute po obradi“ postavio kao glavni indikator pretvorio je izolirani pilot u korporativnu strategiju, navodi se u analizi.

Tri sloja promatranja

Poput dnevnika, metrika i tragova u mikroservisima, i AI zahtijeva strukturirani nadzor:

  • Ulaz (prompts i kontekst) – zapisati svaku varijablu, verziju modela, latenciju i broj tokena.
  • Politike i kontrole – evidentirati rezultate sigurnosnih filtera, razloge blokade i rizike.
  • Ishodi i povratna informacija – mjeriti koliko je odgovora prihvaćeno, koliko se vremena uštedjelo, koliko je slučajeva zatvoreno.

Sve je povezano jedinstvenim identifikatorom traga, pa se svaka odluka može reproducirati i revidirati.

„Zlatni signali” za svaku kritičnu rutu

Inspirirano praksama SRE-a, tvrtke uvode tri ključna praga pouzdanosti:

| Signal | Ciljani SLO | Postupak pri prekoračenju | | --- | --- | --- | | Činjenična točnost | ≥ 95 % potvrđeno izvorom | Prelazak na provjerene predloške | | Sigurnost | ≥ 99,9 % prolaz kroz filtere | Karantena i ljudska provjera | | Korisnost | ≥ 80 % prihvaćeno u prvom pokušaju | Re-trening ili povratak na stariju verziju |

Ako halucinacije prijeđu zadani budžet, sustav se automatski prebacuje na sigurniji prompt ili ljudsku intervenciju – slično preusmjeravanju prometa tijekom pada mreže.

Sprintom do temelja u šest tjedana

Prema preporuci, tvrtki trebaju samo dva brza ciklusa:

  • Sprint 1 (1.–3. tjedan): registri promptova, srednji sloj za anonimizaciju, osnovno logiranje i ručni pregled.
  • Sprint 2 (4.–6. tjedan): testni skupovi iz stvarnih slučajeva, policy-gateovi za točnost i sigurnost, lagana nadzorna ploča za troškove i brzinu.

Time se rješava 90 % pitanja uprave i nadzora, pokazuju primjeri iz prakse.

Ljudi ostaju u petlji

Potpuna automatizacija nije ni realna ni poželjna. Sustavi automatski šalju „sumnjive“ ili nejasne odgovore stručnjacima, a svaka ljudska ispravka postaje novi podatak za treniranje i dokaz o sukladnosti. U jednoj zdravstvenoj tvrtki taj je pristup smanjio broj lažnih pozitivnih 22 % u svega nekoliko tjedana.

Trošak pod kontrolom

Promatranje nad tokenima i latencijom pretvara cijenu modela iz nepoznanice u upravljivu varijablu. Ključ je u:

  • određivanju determinističkih dijelova prompta prije generativnih,
  • sažimanju i rangiranju konteksta,
  • keširanju čestih upita,
  • praćenju tokena po funkciji.

Od eksperimenta do infrastrukture

Tri mjeseca nakon uvođenja vidljivosti, tipično poduzeće očekuje:

  • 1–2 AI asistenta u produkciji s ljudskim nadzorom za rubne slučajeve,
  • automatski evaluacijski paket koji se vrti prije svake objave i noću,
  • tjedni izvještaj zajednički za SRE, proizvod i rizik,
  • revizijski trag koji povezuje prompt, politiku i ishod.

Rezultat: menadžeri dobivaju dokaze, regulatorima je sve reproducibilno, inženjeri brže iteriraju, a korisnici dobivaju pouzdan i objašnjiv AI. Observability, zaključuju stručnjaci, nije „dodatni sloj“, nego temelj povjerenja u doba umjetne inteligencije.

#veliki-jezicni-modeli#fortune-100#site-reliability-engineering#bleu#observability

Slično

Tehnologija

Laboratorijska slanina stiže u SAD: Mission Barns dobio zeleno svjetlo FDA-e
FDA je odobrila proizvodnju i prodaju svinjske masti uzgojene u laboratoriju, a startup Mission Barns najavljuje hibridnu „slaninu“ bez klanja svinja.

min čitanja

Više

Tehnologija

AI kompanije obećavaju „čišća“ psihodelična iskustva, dok se opasni izazovi šire među mladima
Tehnološke tvrtke razvijaju AI alate i nove molekule kako bi uklonile „loše tripove“, dok se istodobno među mladima šire opasni izazovi s lijekovima.

min čitanja

Više

Tehnologija

Zadarska tvrtka Margins prednjači na Deloitteovoj listi tehnoloških brzaca
Margins vodi hrvatski poredak na Deloitteovoj listi 50 najbrže rastućih tehnoloških kompanija srednje Europe.

min čitanja

Više

Tehnologija

KBC Rijeka prvi u javnom zdravstvu uveo preciznu „radiokirurgiju nožem od zraka”
Riječki KBC prvi u Hrvatskoj uvedenjem stereotaksijske radioterapije omogućio onkološko liječenje bez čekanja i s preciznošću „virtualnog skalpela”.

min čitanja

Više

Tehnologija

Anthropic tvrdi da je riješio ključan problem pamćenja dugotrajnih AI agenata
Anthropic predstavlja dvodijelnu arhitekturu koja Claudeu omogućuje da kroz više sesija sačuva kontinuitet rada i tako izbjegne zaborav uputa.

min čitanja

Više

Tehnologija

Airbus povlači 6.000 zrakoplova A320 zbog softvera ranjivog na Sunce
Softverska ranjivost na solarno zračenje potaknula je Airbus na hitan opoziv i kratkotrajno prizemljenje polovice globalne flote A320.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Rusija prijeti potpunom blokadom WhatsAppa zbog nesuradnje s vlastima
Roskomnadzor najavio zabranu popularne aplikacije ako Meta ne pristane dijeliti podatke u istragama prijevara i terorizma.

min čitanja

Više

Tehnologija

Novi okvir Agent-R1 mijenja način treniranja jezičnih modela
Kineski istraživači osmislili su Agent-R1, okvir koji proširuje tradicionalno učenje potkrepljivanjem i omogućuje velikim jezičnim modelima rješavanje složenih višekoračnih zadataka u promjenjivim okruženjima.

min čitanja

Više

Tehnologija

Stihovima do nuklearne bombe: istraživači otkrili veliku rupu u zaštiti AI sustava
Nova studija pokazuje da chatbotovi popuštaju pred opasnim zahtjevima kada su upakirani u stihove, s čak 62 % uspjeha ručno pisanih pjesama.

min čitanja

Više

Tehnologija

McDonald’s proširio aplikaciju: Hranu sada možete naručiti i platiti bez čekanja
Nova Mobile Order & Pay opcija omogućuje naručivanje, plaćanje i preuzimanje McDonald’s obroka bez čekanja, uz dostavu za stol, pult, McDrive ili parkiralište.

min čitanja

Više

Najčitanije

Vijesti

Novi šok u Medulinu: iz mora izvučeno tijelo, sumnja na sina ubijene 79-godišnjakinje
Policija istražuje povezanost tijela izvađenog iz Medulinskog zaljeva s nasilnim ubojstvom 79-godišnje žene pronađene dan ranije u njezinoj kući.

min čitanja

Više

Najnovije

Lifestyle

Deset namirnica koje dokazano snižavaju kolesterol

Vijesti

Internetske prijevare rastu: šteta u Dalmaciji skočila na sedam milijuna eura

Politika

Četiri ruska MiG-31 podigla uzbunu u Poljskoj: NATO odmah stavio Patriote u punu pripravnost

Biznis

Ytrij poskupljuje 4 400 %: Kina steže ventil, a Washington i Tokio kopaju sve dublje

Vijesti

JR ponovno omata Pont Neuf četrdeset godina nakon Christa i Jeanne-Claude

Politika

Okupljanje pred domom Dalije Orešković razotkrilo prijetnju ekstremizma

Vijesti

Vlada ugasila Brodarski institut: kraj jedne svjetski priznate priče

Vijesti

Kaprijani traže odštetu nakon 48-satnog mraka

Vijesti

Navijači pod povećalom: sporni uzvik iz 80-ih sada razlog za kazne

Sport

Whittaker brutalno riješio Gavazija u prvoj rundi

Sport

Modrić planuo zbog sporne odluke suca u derbiju Milana i Lazija