CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. prosinca 2025, 06:30

Gemini 3 osvojio povjerenje korisnika: novo neovisno testiranje stavlja Googleov model na vrh

Neovisni HUMAINE test na 26 000 ispitanika pokazao je da Gemini 3 postiže rekordne rezultate u povjerenju, etici i sigurnosti, nadmašivši konkurente u tri od četiri kategorije.

min. čitanja

XFacebookWhatsApp

Neovisna platforma Prolific, koju su osnovali istraživači Sveučilišta u Oxfordu, objavila je rezultate najnovijeg HUMAINE testa – opsežnog, naslijepo provedenog uspoređivanja velikih jezičnih modela s naglaskom na stvarne korisničke scenarije.

• U ispitivanju je sudjelovalo 26 000 korisnika iz Sjedinjenih Država i Ujedinjenoga Kraljevstva, reprezentativno raspoređenih prema dobi, spolu, etničkoj pripadnosti i političkoj orijentaciji. • Gemini 3 Pro postigao je rekordnu ocjenu povjerenja od 69 %, naspram 16 % koliko je bilježio prethodnik Gemini 2.5 Pro. • Model je zauzeo prvo mjesto u trima od četiri kategorije: izvedba i zaključivanje, interakcija i prilagodljivost te povjerenje i sigurnost. Jedino je u komunikacijskom stilu zaostao za DeepSeek V3, koji je preferiralo 43 % ispitanika. • U 22 promatrane demografske podskupine Googleov je model zadržao stabilno visoke rezultate, a ispitanici su ga pet puta češće birali u izravnim, naslijepo provedenim usporedbama.

Metodologija: dvije latentne sugovornice

HUMAINE test odvija se tako da korisnici istodobno razgovaraju s dva modela, ne znajući čije odgovore zapravo čitaju. Teme biraju sami sudionici, što eliminira memoriranje unaprijed pripremljenih pitanja i uočava nijanse u radu modela na „živim” primjerima. Takav pristup, ističu u Prolificu, otkriva kako se performanse mijenjaju ovisno o publici – nešto što klasični, statični benchmarkovi ne mogu zabilježiti.

„Ako kontrollirate uzorak, dobijete drukčiju ljestvicu – bilo da promatrate lijevo ili desno političko krilo, mlađe ili starije korisnike”, pojasnio je suosnivač i izvršni direktor Prolifica Phelim Bradley. Prema njegovim riječima, upravo je „dosljednost u širokom rasponu upotreba” donijela Gemini-ju 3 ukupnu pobjedu.

Ljudski faktor ostaje ključan

Iako tvrtka u nekim segmentima koristi i automatske, računalne suce, Bradley naglašava da „ljudski podaci i ljudska inteligencija i dalje stvaraju glavnu dodanu vrijednost”. U kombiniranom, pametno orkestriranom sustavu, tvrdi, ljudske i strojne evaluacije nadopunjuju se i daju pouzdaniju sliku mogućnosti svakog modela.

Što to znači za tvrtke?

Rezultati HUMAINE-a sugeriraju da organizacije, osobito one s raznolikom radnom snagom i korisničkom bazom, moraju testirati modele u uvjetima koji odražavaju stvarni sastav njihove publike. Puko oslanjanje na „vibe” ili pojedinačne tehničke metrike više nije dovoljno. Sustavno, naslijepo i demografski osviješteno testiranje pruža podatke potrebne za odluku koji će model najbolje služiti konkretnom poslovnom slučaju.

Za Googleov Gemini 3 Pro, pak, najnoviji je rezultat potvrda tvrdnji o napretku: ne samo da model računski rješava zadatke, nego to čini na način koji većina korisnika doživljava pouzdanim, etičnim i sigurnim. U svijetu u kojem će umjetna inteligencija sve češće nastupati kao nevidljivi sugovornik krajnjim korisnicima, upravo je takvo povjerenje možda najvrjednija valuta.

#sjedinjene-drzave#ujedinjeno-kraljevstvo#google#sveuciliste-u-oxfordu#prolific

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Politika

Iran nudi nuklearne ustupke, ali traži ukidanje američkih sankcija
Teheran poručuje da bi ograničio obogaćivanje uranija, ali samo uz ukidanje američkih sankcija i priznanje iranskog prava na nuklearnu tehnologiju.

min čitanja

Više

Tehnologija

Istraživači ubrzali „chain of thought”: novi model predviđa više tokena u jednom koraku
Novi pristup višestrukom predviđanju tokena ubrzava jezične modele do tri puta uz minimalan pad točnosti, tvrde istraživači iz SAD-a.

min čitanja

Više

Tehnologija

Blog.hr odlazi u povijest: gašenje kultne platforme zakazano za 1. ožujka
Nakon više od 20 godina rada, Blog.hr bit će ugašen 1. ožujka; korisnici su pozvani da preuzmu i arhiviraju svoje sadržaje dok reagiraju na kraj kultne blogerske platforme.

min čitanja

Više

Tehnologija

Novi alat Atlas donosi personaliziranu nastavu uz pomoć umjetne inteligencije
Startup Kiddom lansirao je Atlas, AI alat koji analizira učeničke zadatke i učiteljima priprema personalizirane materijale za idući dan, s prvim rezultatima napretka do 18 %.

min čitanja

Više

Tehnologija

Anthropicov Claude otkrio stotine rupa u otvorenom kodu i izazvao pomak u sigurnosnim alatima
AI model Claude pronašao je više od 500 visokorizičnih propusta u otvorenom kodu i potaknuo lansiranje novog alata za rezonirajuće skeniranje ranjivosti.

min čitanja

Više

Tehnologija

Pionirski internetski iskorak istarskog dnevnika
Istarski dnevnik prvi je u Hrvatskoj zakoračio na internet 1997., a 2004. pokrenuo je redoviti portal koji se otad stalno razvija.

min čitanja

Više

Tehnologija

Skupi tokeni koče masovnu primjenu AI agenata, otkriva DigitalOcean
Istraživanje Currents 2026 otkriva da tvrtke postižu visoke dobitke od AI agenata, ali ih visoki troškovi inferencije sprečavaju u masovnom uvođenju.

min čitanja

Više

Tehnologija

KBC Rijeka prvi u Hrvatskoj uveo SBRT terapiju za tumore jetre
Riječki KBC postao je prva bolnica u javnom zdravstvu koja primjenjuje najprecizniji oblik zračne terapije za tumore jetre, otvarajući novu stranicu u domaćoj onkološkoj skrbi.

min čitanja

Više

Tehnologija

Humanoidni duo Tonka i Rinno: hrvatski roboti spremni izaći iz laboratorija
Prva hrvatska robotica koja govori hrvatski i imotski Rinno, nakon simboličnog posjeta Vladi, otvaraju pitanja etike, sigurnosti i primjene humanoidnih robota u svakodnevnom životu.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Tehnologija

Studija otkriva: samouvjereni, ali nemoćni pred lažnim AI licima
Čak i vrsni "super-prepoznavatelji" posustaju pred novom generacijom realističnih AI portreta, otkriva australska studija koja upozorava na rastući rizik od digitalnih prijevara.

min čitanja

Više

Najčitanije

Politika

Uhićen bivši diplomat Peter Mandelson zbog veza s Epsteinom
Peter Mandelson, bivši britanski veleposlanik u SAD-u, uhićen je zbog sumnje da je zloupotrijebio javnu dužnost, nakon otkrića bliskih veza s Jeffreyjem Epsteinom.
Simon Dawson / No10 Downing Street, OGL 3 <http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3>, via Wikimedia CommonsPalm Beach County Sheriff's Department, Public domain, via Wikimedia Commons

min čitanja

Više

Nogomet

By The logo is from the following website: https://www.realmadrid.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=35239667

UEFA suspendirala Prestiannija zbog navoda o rasizmu
Argentinac iz Benfice neće igrati uzvrat s Realom dok UEFA istražuje optužbe za rasizam.

min čitanja

Više

Politika

Božinović: O migrantskom centru u Željavi odluka još nije donesena
MUP još procjenjuje lokaciju u Željavi, dok se u Korenici diže otpor zbog straha od većeg priljeva migranata.
© European Union, 2025, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Najnovije

Politika

UN upozorava: više od 600 mrtvih na Sredozemlju u prvim tjednima 2026.

Vijesti

Na granici uhvaćen vozač s 3,14 promila

Politika

Britanski mirovni aktivisti optužuju Zapad za „gangster kapitalizam” i popuštanje Trumpu

Sport

Veterani Velebita osvojili državni dvoranski naslov nakon dramatičnih penala

Sport

Suveniri ZOI-a 2026. lete na internet: plišani Milo i Tina već triput skuplji

Sport

Lindsey Vonn otkrila: zamalo su joj amputirali nogu nakon olimpijskog pada

Biznis

Regiojet uvodi ljetne autobusne linije prema Rijeci, Crikvenici i Dalmaciji

Politika

Županija financira zemljište za školu u Supetru, rasplamsala se prepirka o gradskim financijama

Politika

Orbán blokira nove sankcije Rusiji, EU čelnici optužuju Mađarsku za „političku sabotažu”

Vijesti

Dva umjerena potresa zatresla Hercegovinu i Dalmaciju

Lifestyle

Nina Badrić očarala Beograd akustikom, a poslije koncerta zapjevala Olivera