CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. kolovoza 2025, 06:24

OpenAI lansirao gpt-realtime: glasovni model koji bolje sluša upute i zvuči prirodnije

OpenAI predstavio gpt-realtime, napredni glasovni AI model s boljim praćenjem uputa, prirodnijim govorom i sniženom cijenom.

min. čitanja

XFacebookWhatsApp

OpenAI je u sve konkurentnijem tržištu glasovne umjetne inteligencije predstavio gpt-realtime, novi model namijenjen poslovnim korisnicima koji, prema tvrdnjama tvrtke, donosi „najprirodniji i najemotivniji“ strojni glas dosad.

Model je od danas dostupan kroz Realtime API, a prate ga dvije nove sintetičke glasovne personifikacije – Cedar i Marin – te osvježene verzije postojećih glasova. Riječ je o sustavu „speech-to-speech“ koji razumije govorne upite i u istom formatu odgovara, što ga čini pogodnim za primjenu u pozivnim centrima, digitalnim asistentima ili sustavima za simultano prevođenje.

Ključne novosti • Naprednije praćenje uputa – gpt-realtime može izvesti zahtjeve poput „govori naglašeno s francuskim naglaskom“ i pritom prepoznati neverbalne signale poput smijeha ili uzdaha. • Višejezičnost u jednoj rečenici – model može glatko prelaziti s jednog jezika na drugi. • Bolji rezultati na testovima – na Big Bench Audio evaluaciji postiže 82,8 % točnosti (raniji model 65,6 %), dok na MultiChallengeu dostiže 30,5 %. • Niže cijene – OpenAI je cijenu smanjio za 20 %, na 32 USD za milijun ulaznih audio tokena i 64 USD za izlazne.

API dobiva i nove mogućnosti: podršku za MCP, prepoznavanje slike u stvarnom vremenu, Session Initiation Protocol (SIP) za izravno spajanje na telefonske linije te opciju spremanja i ponovne uporabe promptova.

Primjeri iz prakse Tijekom prijenosa uživo demonstrirani su scenariji u kojima T-Mobile koristi asistenta za preporuku novih mobitela, dok Zillow preko glasovnog agenta pomaže korisnicima pronaći idealnu četvrt za kupnju nekretnine.

Reakcije zajednice Rani dojmovi developera ističu „primjetno bolju“ kvalitetu zvuka i „strogo pridržavanje uputa“, ali i žale zbog izostanka mogućnosti kreiranja potpuno prilagođenih glasova. „Još je skupo u usporedbi s lančanim TTS-LLM-STT rješenjima“, komentirao je jedan od testera na X-u.

Tržišna utakmica OpenAI-ju se suprotstavljaju ElevenLabs s Conversation AI 2.0, Soundhound koji opslužuje drive-thru narudžbe u fast-food lancima, Humeov EVI 3 za kloniranje osobnog glasa, francuski Mistral s Voxtralom usmjerenim na prijevod u stvarnom vremenu te Google, koji glasovne značajke širi kroz NotebookLM.

Zašto je važno Pozivni centri, turističke i logističke tvrtke, banke i obrazovne platforme među prvima traže pouzdane, emotivno uvjerljive i sigurnosno certificirane glasovne asistente. U tom segmentu pobjednik će, prema procjenama analitičara, osvojiti milijarde dolara prihoda od licence i infrastrukture.

OpenAI poručuje da je gpt-realtime „najnapredniji produkcijski model“ koji je dosad izradio, no hoće li to biti dovoljno za prevagu nad sve brojnijom konkurencijom – odlučit će brzina, cijena i fleksibilnost u integraciji u postojeće radne tokove.

#openai#elevenlabs#gpt-realtime#t-mobile#zillow

Slično

Tehnologija

Mistral AI predstavlja OCR 3 i ruši cijene skeniranja dokumenata
Startup od 11,7 mlrd. € lansirao OCR 3, hvali se 74 % boljom točnošću i cijenom od 2 USD za 1 000 stranica.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Tehnologija

Ai2 predstavio Molmo 2: otvoreni video model koji izaziva veće konkurente
Allen Institute for AI lansirao je Molmo 2, kompaktni open-source video model koji u ključnim zadaćama nadmašuje i veće konkurente poput Gemini 3 Pro.

min čitanja

Više

Tehnologija

Google upozorava na novi val phishing napada na Gmail
Tehnološki div naglašava da nikada neće tražiti lozinku telefonom te savjetuje korisnicima Gmaila uključivanje dvofaktorske autentifikacije.

min čitanja

Više

Tehnologija

By Eric Bailey - Own work using: https://drive.google.com/drive/folders/1RDpuQOQMfM9mXQ61wUYWNZUbgvDc8r-n, Public Domain, https://commons.wikimedia.org/w/index.php?curid=145139541

Korisnici bijesni na iOS 26.2: „Ažuriranje je uništilo moje iPhone iskustvo”
Masovne pritužbe na iOS 26.2: spor rad, probleme s baterijom i zbunjujuće promjene izazvale su lavinu kritika na društvenim mrežama.

min čitanja

Više

Tehnologija

Međuzvjezdani komet 3I/ATLAS sutra prolazi najbližu točku Zemlji
Rijetki međuzvjezdani komet 3I/ATLAS 19. prosinca najbliži je Zemlji, nudi astronomima posljednji pogled prije definitivnog napuštanja Sunčevog sustava.

min čitanja

Više

Tehnologija

Krvni test otkriva ALS prije simptoma s 97 posto točnosti
Američki istraživači razvili su test koji ALS detektira i prije simptoma, čime bi se dijagnoza skratila s mjeseci na dane.

min čitanja

Više

Tehnologija

Božićni spektakl u Teksasu: 5 000 dronova iscrtalo Svetu obitelj na noćnom nebu
Spektakularni prizor u Mansfieldu: 5 000 dronova Sky Elementsa oblikovalo je Svetu obitelj, a snimka je postala hit na društvenim mrežama.

min čitanja

Više

Tehnologija

Google lansirao Gemini 3 Flash: brži i jeftiniji veliki jezični model za poslovne korisnike
Google je predstavio Gemini 3 Flash, brzi i povoljni veliki jezični model s performansama bliskima vrhunskom Gemini 3 Pro.

min čitanja

Više

Tehnologija

Googleov stručnjak upozorava: 95 % AI projekata propada zbog loše arhitekture
Antonio Gulli iz Googlea poručuje da poduzeća trebaju čvrstu arhitekturu, a ne samo veće modele, kako bi preokrenula alarmantnu stopu neuspjeha AI projekata.

min čitanja

Više

Tehnologija

Split od siječnja uvodi pametni prometni sustav vrijedan 13 milijuna eura
Četverogodišnji projekt optimizacije 84 semafora donosi Splitu pametni prometni sustav koji kreće u punu primjenu od siječnja.

min čitanja

Više

Najčitanije

Nogomet

Zahora tužio Martina Baturinu i oca zbog raskida suradnje
Menadžer Dario Zahora traži 3,7 milijuna eura odštete od Martina Baturine i njegova oca zbog raskida menadžerskog ugovora prije rekordnog transfera u Como.
By PIXSELL, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=148385547

min čitanja

Više

Biznis

Air India 13 godina 'zaboravila' Boeing u Kolkati
Boeing 737-200 Air Indije godinama je stajao na aerodromu u Kolkati neopažen, a otkriven je tek kada je zračna luka zatražila njegovo uklanjanje i naplatila 85 000 funti parkirnine.

min čitanja

Više

Biznis

UGP traži tromjesečnu odgodu e-fiskalizacije 2.0
Udruga Glas poduzetnika upozorava da sustav e-fiskalizacije 2.0 nije spreman te traži najmanje tri mjeseca odgode, prijelazno razdoblje bez kazni i jasne upute za poduzetnike.
By © European Union, 1998 – 2025, Attribution, https://commons.wikimedia.org/w/index.php?curid=171253370

min čitanja

Više

Najnovije

Sport

Perković svjetska viceprvakinja, hrvatski kickboksači briljirali s 24 medalje

Vijesti

Vozač mopeda teško ozlijeđen nakon udara u stup na pulskom nogostupu

Politika

Županijska kadrovska križaljka: HSP-ovci prelaze pod HDZ-ov kišobran

Tehnologija

Google upozorava na novi val phishing napada na Gmail

Politika

Zastupnici EP-a 30 godina nakon Daytona pozivaju na europski iskorak BiH

Lifestyle

Kozala sprema prvu Brudetijadu ove subote

Politika

Estonija traži objašnjenje: ruski graničari nakratko ušli na teritorij EU-a

Lifestyle

Quorum Colours vraća riječki underground u Exportdrvo

Politika

Bruxelles pred ključnom odlukom: konfiskacija ruskih milijardi na stolu

Lifestyle

Joss Stone najavila ljetni koncert na tvrđavi sv. Mihovila

Politika

USKOK optužio pet osoba zbog nezakonite gradnje uz Modro jezero