Zagreb, 12. siječnja 2026. – Britanski stručnjak za prepoznavanje govora Speechmatics i američki startup Sully.ai sklopili su strateško partnerstvo kako bi u zdravstvene ustanove uveli autonomne agente – od virtualnih recepcionara do kliničkih pisara – koji u stvarnom vremenu preuzimaju administrativne zadatke i time rasterećuju medicinsko osoblje.
Sully.ai je u manje od godinu dana narastao s jedne ordinacije na klijente koji okupljaju više od 500 liječnika. Njihov ključni pokazatelj, Minutes Added to Workforce (MAW), mjeri koliko vremena umjetna inteligencija vraća liječnicima i sestrama; do prosinca 2025. prikupljeno je više od 30 milijuna minuta. U prvim studijama zabilježeno je 21-struko povrata ulaganja (ROI), 5 % veće zadržavanje pacijenata, ušteda od 2,4 sata po liječniku dnevno te 18,5 % veći kapacitet termina.
Kako bi podržao širenje na velike, višelokacijske mreže klinika, Sully.ai se odlučio za Speechmaticsove medicinske modele. Interna testiranja pokazala su 93 % točnosti u stvarnom vremenu (7 % WER) i 96 % prepoznavanja medicinskih ključnih riječi, uz 50 % manju pogrešku od najbližeg konkurenta. Model je treniran na više od 16 milijardi riječi iz medicinskih razgovora i dokumenata, pa razlikuje izraze poput „hipertenzija” i „hipotenzija”, razumije nazive lijekova s različitim naglascima i hvata ICD-10 kodove pri subsekundnoj latenciji.
Sustav se izvodi na NVIDIA AI infrastrukturi (Triton Inference Server i CUDA knjižnice), što omogućuje visoki protok podataka i fleksibilno postavljanje u podatkovnim centrima, privatnom oblaku ili na rubnim uređajima. Takva arhitektura je ključna za bolnice koje moraju uskladiti korištenje podataka s HIPAA-om i drugim propisima, a pritom žele zadržati osjetljive podatke unutar vlastite mreže.
Dvije kompanije najavile su i ulazak na nova tržišta, uključujući Bliski istok, gdje početkom 2026. stiže dvojezični englesko-arapski model osposobljen za moderne i lokalne arapske dijalekte. Očekuje se da će upravo dvosmjerni, tzv. code-switching razgovori postati ključni u automatizaciji zdravstvene skrbi u toj regiji.
„Visoka točnost i niska latencija prepoznavanja govora temelj su autonomnih agenata koji doista slušaju i djeluju sigurno u kritičnim okruženjima”, poručuju iz Speechmaticsa, ističući kako novo partnerstvo donosi višestruke jezične mogućnosti bez kompromisa u kvaliteti, sigurnosti ili brzini rada.