Kineski tehnološki div Baidu na konferenciji „Baidu World 2025” otkrio je svoj novi temeljski model ERNIE 5.0 i niz nadogradnji proizvoda kojima želi zauzeti vodeću poziciju na svjetskom tržištu korporativne umjetne inteligencije.
Nativno multimodalan pristup
ERNIE 5.0 razvijen je za istovremenu obradu i generiranje teksta, slike, zvuka i videa, čime se razlikuje od modela koji naknadno spajaju različite modalitete. Kompanija tvrdi da u dokumentnom razumijevanju, vizualnoj interpretaciji tablica i zajedničkom radu s više vrsta podataka doseže ili nadmašuje modele GPT-5-High i Gemini 2.5 Pro.
Prema javno prikazanim slajdovima, ERNIE 5.0 postigao je vodeće rezultate na OCRBench, DocVQA i ChartQA testovima, a u internoj procjeni generiranja slika izjednačio se ili prestigao Veo3. Verzija Preview 1022 dodatno pojačava tekstualne sposobnosti i, navodi Baidu, smanjuje jaz prema najjačim engleskim modelima dok u kineskom jeziku preuzima primat.
Izvršni direktor Robin Li naglasio je smjer tvrtke: „Kada umjetnu inteligenciju internalizirate, ona postaje izvor produktivnosti, a ne trošak.”
Dva modela, dvije strategije
Za razliku od nedavno otvorenog ERNIE-4.5-VL-28B-A3B-Thinking, koji se nudi pod licencijom Apache 2.0 i može raditi na jednoj 80 GB GPU kartici, novi ERNIE 5.0 ostaje vlasnički i dostupan je isključivo preko internetske stranice ERNIE Bot i API-ja na oblaku Qianfan. Cjenovno je smješten u premijski segment, a jeftiniji modeli poput ERNIE 4.5 Turbo i dalje pokrivaju velike volumene manje zahtjevnih zadataka.
Globalna ekspanzija alata i usluga
Uz model, Baidu je najavio:
- GenFlow 3.0 – univerzalni AI agent s više od 20 milijuna korisnika;
- Famou – samorazvijajući agent za složene probleme, zasad po pozivu;
- MeDo – svjetsku inačicu alata bez koda Miaoda;
- Oreate – radni prostor za dokumente, prezentacije, slike, video i podcaste s 1,2 milijuna korisnika;
- širenje platforme digitalnih avatara, već aktivne u Brazilu, koja je tijekom kineskog „Double 11” rasprodajnog dana pomogla povećati promet za 91 %;
- servis robotaksija Apollo Go, koji je premašio 17 milijuna vožnji u 22 grada.
Rani dojmovi i poznati nedostatci
Neki razvojni inženjeri pohvalili su rezultate, ali su prijavili ponavljajuću „naviku” modela da prerano aktivira vanjske alate pri generiranju SVG-a. Baiduov podrškovni račun brzo je odgovorio kako je riječ o poznatoj pogrešci na kojoj se radi te predložio privremeno preformuliranje upita.
Širi kontekst utrke
Kombinacija vrhunskog, plaćenog API-ja i otvorenih modela pokazuje Baiduovu namjeru da osvoji i velike korporacije i razvojnu zajednicu. U vrijeme kada poduzeća traže multimodalne mogućnosti, fleksibilne licence i učinkovit rad, kineska kompanija novim modelom jasno signalizira da želi biti globalni igrač prve lige.