CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

10. listopada 2025, 20:23

Raindrop lansirao „Experiments”, prvi A/B test za korporativne AI agente

Raindrop je predstavio Experiments, analitički alat koji korporacijama omogućuje A/B testiranje AI agenata i jasnije praćenje učinka novih modela, promptova i alata u pravim korisničkim interakcijama.

min. čitanja

Startup Raindrop, specijaliziran za nadzor rada aplikacija temeljenih na umjetnoj inteligenciji, predstavio je Experiments – analitički modul koji tvrtkama omogućuje A/B testiranje AI agenata u stvarnim uvjetima.

Osnovna ideja novog alata jest da razvojni timovi mogu u realnom vremenu usporediti učinak različitih verzija modela, promptova ili skupova alata koje agenti koriste, i to kroz milijune stvarnih interakcija s krajnjim korisnicima. Sučelje vizualno prikazuje kad testna varijanta nadmašuje ili zaostaje za osnovnom, a skokovi u negativnim signalima (npr. učestaliji neuspjesi zadataka ili nepotpuni kod) odmah se ističu.

„AI proizvodi neprestano spektakularno griješe – i to na načine koji su istodobno urnebesni i zastrašujući”, podsjetio je suosnivač i tehnički direktor Ben Hylak, objašnjavajući zašto timovi trebaju jasniji uvid u ono što se događa nakon svakog deploya. Kolegica Alexis Gauba dodala je da se prečesto događa paradoks: „Prođu svi testovi, agent u produkciji ipak zakaže.”

Ključne značajke Experimentsa • Usporedbe „bilo čega s bilo čim”: modela, promptova, novih alata ili kompletnih refaktora. • Detaljni metrički pregled (učestalost korištenja alata, stopa pogrešaka, trajanje razgovora, duljina odgovora). • Upozorenja na nedovoljan uzorak – alatom je u pravilu potrebno oko 2 000 korisnika dnevno za statistički pouzdane rezultate. • Izvorni zapisi svake interakcije dostupni su jednim klikom, što olakšava pronalazak korijena problema poput „agenta zaglavljenog u petlji”. • Integracija s popularnim platformama za upravljanje značajkama poput Statsiga, dok se za osnovne usporedbe mogu koristiti i vremenski rasjeci (npr. jučer vs. danas) bez dodatnog podešavanja.

Sigurnost i cijene Raindrop radi kao oblakom podržana usluga, ali nudi i lokalno brisanje osobnih podataka za klijente s pojačanim zahtjevima. Tvrtka je SOC 2 certificirana, a funkcija PII Guard automatski uklanja osjetljive informacije iz pohranjenih zapisa.

Experiments je dio Pro paketa koji stoji 350 USD mjesečno, odnosno 0,0007 USD po interakciji. Jeftiniji Starter (65 USD mjesečno; 0,001 USD po interakciji) donosi temeljne analitike i upozorenja, dok Enterprise paket nudi cijene i mogućnosti po mjeri velikih sustava, uključujući jednokratnu prijavu, napredne integracije i prioritetnu podršku.

Raindrop, čiji su osnivači Hylak, Gauba i Zubin Singh Koticha, nastavlja misiju probijanja „crne kutije” generativnih modela – od pukog detektiranja tihih pogrešaka do preciznog mjerenja stvarnih poboljšanja. S Experimentsom želi AI razvoju dati onu razinu transparentnosti i kontrolirane iteracije koju klasični softver ima već godinama.

#raindrop#experiments#ben-hylak#alexis-gauba#zubin-singh-koticha
Watch on YouTube

Slično

Tehnologija

Vukovarski Vodotoranj dobio glasovnog AI vodiča na svim jezicima
Novi digitalni vodič omogućuje posjetiteljima Vodotornja interaktivna objašnjenja povijesti i obnove, i to na svim jezicima.

min čitanja

Više

Tehnologija

AI ubrzava napade: nova verzija Ivantijeva VPN-a brani jezgru sustava u kritičnom 72-satom prozoru
AI omogućuje hakerima da razotkriju zakrpe u tri dana; Ivanti odgovara novom verzijom Connect Secure 25.X s tvrdokornom kernel-zaštitom i automatiziranim modelom zakrpavanja.

min čitanja

Više

Tehnologija

Toplina mora štedi troškove i štiti baštinu u rovinjskoj bolnici
Rovinjska bolnica „Martin Horvat” predstavila je projekt SEAHEaT, koji toplinom mora smanjuje troškove grijanja do 10 % i štiti kulturnu baštinu.

min čitanja

Više

Tehnologija

Nvidia tvrdi da je pronašla način za „učenje razmišljanja” još u pretreniranja modela
Metoda reinforcement learning pre-training (RLP) nagrađuje modele za korisne interne „misli” već u ranoj fazi treniranja, a pokusi pokazuju dvoznamenkasta poboljšanja na zadacima logičkog zaključivanja.

min čitanja

Više

Tehnologija

WhatsAppom hara nova prijevara: poruka „glasaj za moje dijete” krade račune i traži novac
Lažna poruka o „natjecanju za stipendiju” širi se WhatsAppom, a dijeljenjem verifikacijskog koda korisnici kibernetičkim kriminalcima predaju potpunu kontrolu nad svojim računom.

min čitanja

Više

Tehnologija

Adaptive spekulanti Together AI-ja probijaju zid performansi: ATLAS ubrzava generiranje do 400 %
Together AI predstavio je ATLAS, samoučeći sustav spekulanata koji ubrzava rad velikih jezičnih modela do 400 % i smanjuje potrebu za skupim specijaliziranim čipovima.

min čitanja

Više

Tehnologija

Bruxelles pritisnuo velike platforme: EU ispituje zaštitu djece na Snapchatu, YouTubeu i trgovinama aplikacijama
Komisija od Snapchata, YouTubea, Applea i Googlea traži dokaz da njihove mjere stvarno štite djecu od ilegalnih proizvoda i štetnog sadržaja. Hrvatska regulatorna tijela uključena su u postupak.

min čitanja

Više

Tehnologija

Milijarderi Silicijske doline grade bunkere dok raste strah od umjetne inteligencije
Tehnološki moćnici od Havaja do Novog Zelanda kopaju luksuzna skloništa, potaknuti strahom da bi brz napredak umjetne inteligencije mogao izmaknuti kontroli.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305Anthony Quintano from Honolulu, HI, United States, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia CommonsTechCrunch, CC BY 2.0 <https://creativecommons.org/licenses/by/2.0>, via Wikimedia Commons

min čitanja

Više

Tehnologija

Motorola predstavila Razr Ultra 2025: snažniji preklopni pametni telefon uz značajno sniženje cijene
Motorola je objavila novu generaciju preklopnog modela Razr Ultra i odmah ga ponudila po sniženoj cijeni, uz poboljšani zaslon od 165 Hz i niz AI-funkcija.

min čitanja

Više

Tehnologija

Peking koristi američke restrikcije: nova viza za privlačenje globalnih IT stručnjaka
Američka naknada od 100 000 dolara za H-1B vize potaknula je inženjere na odlazak, a Kina im otvara vrata novim dugoročnim vizama.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Najnovije

Vijesti

Dobrinj proglašava Dan žalosti zbog tragične smrti Filipa Crnčića

Sport

Rudeš pregazio posrnuli BSK i nanizao mu peti poraz zaredom

Sport

Rijeka od ponedjeljka pušta u slobodnu prodaju pakete za Konferencijsku ligu

Sport

Istarski judaši donijeli šest medalja sa zagrebačkog turnira

Biznis

Trump prijeti carinama Kini, cijena nafte klizi ispod 63 dolara

Sport

Rakitić postao ambasador La Lige i najavio nove karijerne korake

Sport

Femke Bol napušta prepone: nizozemska zvijezda prelazi na 800 metara

Biznis

Trump opet prijeti carinama Pekingu zbog blokade rijetkih zemnih metala

Vijesti

Snažna eksplozija u tvornici streljiva u Tennesseeju: više poginulih i nestalih, spasioci još traže stradale

Sport

Švedska u šoku nakon golemog promašaja: Bergvall u 43. minuti propustio zicer protiv Švicarske

Sport

Juventusov post na albanskom razbjesnio srpske navijače uoči okršaja s Albanijom