CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

22. rujna 2025, 20:05

Alibaba predstavio Qwen3-Omni, prvi otvoreni AI koji prirodno spaja tekst, sliku, zvuk i video

Kineska Alibaba lansirala je Qwen3-Omni, otvoreni AI model koji prirodno kombinira tekst, sliku, zvuk i video, nadmašuje konkurenciju na 22 od 36 testova i dolazi pod slobodnom Apache 2.0 licencom.

min. čitanja

XFacebookWhatsApp

Kineski tehnološki div Alibaba lansirao je Qwen3-Omni, veliki jezični model otvorenog koda koji izvorno razumije i obrađuje tekst, slike, zvuk i video. Tvrtka ga opisuje kao „prvi nativni end-to-end omni-modalni AI” koji sve te ulaze ujedinjuje unutar jednog sustava.

Qwen3-Omni u ulaznom obliku prihvaća tekst, slike, audio i video, a odgovara tekstom ili govorom. Dostupan je za besplatno preuzimanje i komercijalnu primjenu pod permisivnom Apache 2.0 licencijom, čime se razlikuje od vlasničkih konkurenata.

Ključni noviteti • Integrirani pristup: za razliku od modela koji su naknadno dobivali vid ili govor, Qwen3-Omni je od početka treniran multimodalno, pa zadržava odziv u stvarnom vremenu. • Tri varijante: Instruct (puni opseg funkcija), Thinking (naglasak na rezoniranje i dugačkim odgovorima) te Captioner (specijaliziran za opis audio zapisa). • Široka jezična pokrivenost: 119 jezika u tekstu, 19 za govorni ulaz i 10 za govorni izlaz. • Dugi kontekst: do 65 536 tokena u načinu Thinking.

Arhitektura „Thinker–Talker” Sustav dijeli zadatke na komponentu Thinker, koja rješava rezoniranje i multimodalno razumijevanje, i Talker, koja generira prirodan govor. Obje koriste Mixture-of-Experts dizajn za brzu izvedbu, dok odvojeni audio podsustav omogućuje latenciju od samo 234 ms za govor i 547 ms za video.

Cijene putem API-ja (za 1 000 tokena) • tekst: 0,00025 USD ulaz / do 0,00178 USD izlaz  • slika ili video: 0,00046 USD ulaz  • audio: 0,00221 USD ulaz; govoreni izlaz 0,00876 USD (tekst je tada besplatan) Besplatna kvota iznosi milijun tokena u 90 dana.

Rezultati testiranja Na 36 mjerila model drži najbolje rezultate na 22, a među otvorenim modelima na 32. Primjeri: • AIME25 (matematika): 65,0 bodova – višestruko bolje od GPT-4o (26,7) • Wenetspeech (točnost prepoznavanja govora): 4,69 WER naspram 15,30 GPT-4o  • MLVU (video razumijevanje): 75,2 bodova – ispred najbližih rivala.

Kako je treniran Ukupno je obrađeno oko dva bilijuna tokena, uključujući 20 milijuna sati nadziranog zvuka. Trening je tekao u tri faze, od odvojene prilagodbe vidnog i audio kodera do proširenja konteksta na 32 768 tokena. Dodatno fino ugađanje smanjilo je „halucinacije” i poboljšalo kvalitetu govora.

Primjene Alibaba ističe transkripciju i prijevod na više jezika, opis audio zapisa, OCR, označavanje glazbe te razumijevanje videa. Model se može postaviti kao interaktivni podrška korisnicima koja u stvarnom vremenu analizira kameru ili ekran korisnika i pruža upute.

Dostupnost Qwen3-Omni već je objavljen na platformama Hugging Face, GitHub i putem Alibaba API-ja (uključujući bržu verziju Flash). Zahvaljujući Apache 2.0 licenci, poduzeća ga mogu prilagoditi bez naknada i bez obveze da otvoreno objave vlastite modifikacije.

Najavljujući model, voditelj tima kratko je poručio: „This might bring some changes to the landscape of opensource Omni models! Hope you enjoy it!”

Objavom Qwen3-Omni Alibaba dodatno pojačava pritisak na zapadne konkurente, nudeći besplatnu i fleksibilnu alternativu za napredne multimodalne sustave.

#kina#hugging-face#alibaba#github#wenetspeech
View post on X

Slično

Tehnologija

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela
Ciscoovo istraživanje otkriva da upornost napadača dramatično povećava uspjeh „jailbreak” napada na otvorene AI modele, sa 13 % na čak 92 %, te poziva poduzeća na jače zaštitne mjere.

min čitanja

Više

Tehnologija

Apptio spaja financije i IT: jedinstveni pogled na troškove ubrzava odluke
Apptio predstavlja rješenje koje ujedinjuje financijske, operativne i poslovne podatke, omogućujući brže i točnije odluke o tehnološkim ulaganjima u doba eksplozije AI-a i clouda.

min čitanja

Više

Tehnologija

Pet velikih prekretnica: znanstvenici mapirali kako se mozak mijenja od djetinjstva do duboke starosti
Istraživači sa Sveučilišta Cambridge otkrili su da se ljudski mozak radikalno preoblikuje pet puta, s ključnim prekretnicama u dobi od 9, 32, 66 i 83 godine.

min čitanja

Više

Tehnologija

Američki startup Arcee AI lansirao Trinity Mini i Nano, najavio gigantski model za 2026.
Trinity obitelj donosi otvorene modele trenirane isključivo u SAD-u; najveći, Trinity Large, stiže početkom 2026.

min čitanja

Više

Tehnologija

Kineski DeepSeek otvorio novu frontu u AI utrci s GPT-om i Geminijem
DeepSeek je objavio open-source modele koji po rezultatima i cijeni izvedbe izazivaju GPT-5 i Gemini-3.0-Pro, unatoč političkim pritiscima i ograničenjima čipova.

min čitanja

Više

Tehnologija

Osijek uoči Green Matrix Summita: Slavonija pokazuje kako izgleda zelena i digitalna budućnost
Treće izdanje Green Matrix Summita 4. i 5. prosinca u Osijeku okuplja više od pedeset stručnjaka kako bi ubrzali zelenu i digitalnu tranziciju gospodarstva Slavonije.

min čitanja

Više

Tehnologija

Američka tvrtka Flock snimke iz nadzornih kamera šalje na obradu radnicima u inozemstvu
Otkrivene upute i popisi radnika pokazuju da Flock nadzorne snimke iz SAD-a označava radnicima na Filipinima, što potiče nova pitanja o privatnosti i nadzoru.

min čitanja

Više

Tehnologija

Cyber Monday donosi najjeftiniji HBO Max do sada: 3 dolara mjesečno, ali samo za nove korisnike
HBO Max, Disney Plus, Hulu i Apple TV+ snažno spuštaju cijene za Cyber Monday, ali popusti vrijede samo onima koji se prijavljuju prvi put.

min čitanja

Više

Tehnologija

Utrka s AI napadima: hibridna cloud sigurnost traži hitan zaokret
Umjetna inteligencija ubrzala je kibernetičke napade, a stari modeli zaštite više ne prate tempo. Istraživanja otkrivaju rekordne stope provala, dok CrowdStrike najavljuje sustav koji reagira u sekundama.

min čitanja

Više

Tehnologija

AWS i Visa udružuju snage za brži razvoj agentične trgovine
AWS donosi Visa Intelligence Commerce na svoj Marketplace i najavljuje otvorene nacrte za izgradnju AI agenata koji samostalno obavljaju kupnju i plaćanja.

min čitanja

Više

Najčitanije

Vijesti

Plava vrpca Vjesnika okupila heroje mora: od Omiša do Premude
Svečanost u Opatiji okupila hrabre spasitelje; glavna priznanja dobili Omišanin Mario Popovac, mještani Premude i crnogorska mornarica, dok je posebno priznanje pripalo profesoru Alenu Jugoviću.

min čitanja

Više

Politika

Tisuće na ulicama Sofije zbog skorog uvođenja eura: prosvjedi prerasli u sukobe s policijom
Demonstranti u bugarskoj prijestolnici napali su policiju kamenjem i pirotehnikom, prosvjedujući protiv proračuna i prelaska na euro 1. siječnja.
By European Parliament from EU - New ECB Chief Lagarde to address plenary for first time, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=96224562

min čitanja

Više

Nogomet

FIFA u subotu otkriva kompletan raspored SP-a 2026.
U Washingtonu se u petak održava ždrijeb skupina za SP 2026., a dan kasnije FIFA uživo otkriva detaljan raspored svih 104 utakmice.

min čitanja

Više

Biznis

Bruxelles odobrio sedmi hrvatski zahtjev: stiže još 1,1 milijarda eura za reforme i ulaganja
Europska komisija potvrdila je da je Hrvatska ispunila svih 22 etape i 31 cilj za sedmu tranšu sredstava iz Nacionalnog plana oporavka i otpornosti, vrijednu 1,1 milijardu eura.

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Dinamo uz golmana manje slomio Goricu i zasjeo na vrh HNL-a
Monsef Bakrar i Marko Soldo presudili Gorici, a Dinamo je s igračem manje obranio vodstvo i preuzeo vrh prvenstvene ljestvice.

min čitanja

Više

Najnovije

Politika

Nizozemski kralj u Surinamu: „Nećemo bježati od pitanja ropstva”

Politika

Broj zaposlenih osoba s invaliditetom u tri godine udvostručen, slijede nove potpore poslodavcima

Vijesti

Stručnjaci upozoravaju na uspon „prevarantskih država” u jugoistočnoj Aziji

Tehnologija

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela

Vijesti

Francuski srebrnjaci iz križarskog doba otkriveni u Baranji blistaju u Osijeku

Vijesti

E-mailovi upozoravali na psihički slom osumnjičenog za pucnjavu na pripadnike Nacionalne garde

Vijesti

Portreti obrane: Osječki veterani pokrenuli potragu za imenima 3.000 pripadnika 106. brigade

Sport

Modrić se prisjetio dolaska u Real: „Cristiano je rekao – napokon si došao”

Vijesti

Pijan sletio s ceste kod Ražina i prevrnuo automobil

Vijesti

WHO uvjetno preporučio GLP-1 lijekove za liječenje pretilosti

Vijesti

Katalonske školjke otkrivaju zvuk star 6 000 godina