CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

4. prosinca 2025, 06:30

Gemini 3 osvojio povjerenje korisnika: novo neovisno testiranje stavlja Googleov model na vrh

Neovisni HUMAINE test na 26 000 ispitanika pokazao je da Gemini 3 postiže rekordne rezultate u povjerenju, etici i sigurnosti, nadmašivši konkurente u tri od četiri kategorije.

min. čitanja

XFacebookWhatsApp

Neovisna platforma Prolific, koju su osnovali istraživači Sveučilišta u Oxfordu, objavila je rezultate najnovijeg HUMAINE testa – opsežnog, naslijepo provedenog uspoređivanja velikih jezičnih modela s naglaskom na stvarne korisničke scenarije.

• U ispitivanju je sudjelovalo 26 000 korisnika iz Sjedinjenih Država i Ujedinjenoga Kraljevstva, reprezentativno raspoređenih prema dobi, spolu, etničkoj pripadnosti i političkoj orijentaciji. • Gemini 3 Pro postigao je rekordnu ocjenu povjerenja od 69 %, naspram 16 % koliko je bilježio prethodnik Gemini 2.5 Pro. • Model je zauzeo prvo mjesto u trima od četiri kategorije: izvedba i zaključivanje, interakcija i prilagodljivost te povjerenje i sigurnost. Jedino je u komunikacijskom stilu zaostao za DeepSeek V3, koji je preferiralo 43 % ispitanika. • U 22 promatrane demografske podskupine Googleov je model zadržao stabilno visoke rezultate, a ispitanici su ga pet puta češće birali u izravnim, naslijepo provedenim usporedbama.

Metodologija: dvije latentne sugovornice

HUMAINE test odvija se tako da korisnici istodobno razgovaraju s dva modela, ne znajući čije odgovore zapravo čitaju. Teme biraju sami sudionici, što eliminira memoriranje unaprijed pripremljenih pitanja i uočava nijanse u radu modela na „živim” primjerima. Takav pristup, ističu u Prolificu, otkriva kako se performanse mijenjaju ovisno o publici – nešto što klasični, statični benchmarkovi ne mogu zabilježiti.

„Ako kontrollirate uzorak, dobijete drukčiju ljestvicu – bilo da promatrate lijevo ili desno političko krilo, mlađe ili starije korisnike”, pojasnio je suosnivač i izvršni direktor Prolifica Phelim Bradley. Prema njegovim riječima, upravo je „dosljednost u širokom rasponu upotreba” donijela Gemini-ju 3 ukupnu pobjedu.

Ljudski faktor ostaje ključan

Iako tvrtka u nekim segmentima koristi i automatske, računalne suce, Bradley naglašava da „ljudski podaci i ljudska inteligencija i dalje stvaraju glavnu dodanu vrijednost”. U kombiniranom, pametno orkestriranom sustavu, tvrdi, ljudske i strojne evaluacije nadopunjuju se i daju pouzdaniju sliku mogućnosti svakog modela.

Što to znači za tvrtke?

Rezultati HUMAINE-a sugeriraju da organizacije, osobito one s raznolikom radnom snagom i korisničkom bazom, moraju testirati modele u uvjetima koji odražavaju stvarni sastav njihove publike. Puko oslanjanje na „vibe” ili pojedinačne tehničke metrike više nije dovoljno. Sustavno, naslijepo i demografski osviješteno testiranje pruža podatke potrebne za odluku koji će model najbolje služiti konkretnom poslovnom slučaju.

Za Googleov Gemini 3 Pro, pak, najnoviji je rezultat potvrda tvrdnji o napretku: ne samo da model računski rješava zadatke, nego to čini na način koji većina korisnika doživljava pouzdanim, etičnim i sigurnim. U svijetu u kojem će umjetna inteligencija sve češće nastupati kao nevidljivi sugovornik krajnjim korisnicima, upravo je takvo povjerenje možda najvrjednija valuta.

#sjedinjene-drzave#ujedinjeno-kraljevstvo#google#sveuciliste-u-oxfordu#prolific
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Biznis

Washington opet produljio rok za poslove s Lukoilovim crpkama
OFAC je šesti put produžio izuzeće od sankcija, dopuštajući poslovanje s Lukoilovim postajama do kraja listopada, dok je bugarskim podružnicama rok pomaknut na 2026.

min čitanja

Više

Politika

Berlin prozvao američkog potpredsjednika zbog navoda o uplitanju EU-a u mađarske izbore
Njemačka vlada odbacila je optužbe američkog potpredsjednika JD-a Vancea da EU utječe na mađarske izbore te ga prozvala za moguće miješanje u kampanju posjetom Budimpešti uoči glasovanja.
By United States Congress - Senate.gov (archived), Public Domain, https://commons.wikimedia.org/w/index.php?curid=128111508

min čitanja

Više

Tehnologija

Havaji asfaltiraju ceste plastičnim otpadom iz oceana
Havaji pokrenuli projekt recikliranja plastičnog otpada iz oceana u asfalt za lokalne ceste, prvi takve vrste na svijetu.

min čitanja

Više

Tehnologija

Građani u obrani Jadrana: u Splitu predstavljene aplikacije koje svakome otvaraju vrata znanosti
Citizen Science Day u Splitu okupio je pedesetak sudionika i predstavio niz aplikacija koje građanima omogućuju aktivno sudjelovanje u praćenju i zaštiti Jadrana.

min čitanja

Više

Tehnologija

OpenAI lansirao GPT-5.4-Cyber nakon upozorenja konkurenta
Nakon što je Anthropic odlučio zadržati svoj novi AI model pod ključem zbog straha od zlouporabe, OpenAI predstavlja GPT-5.4-Cyber, alat namijenjen kibernetičkim stručnjacima.

min čitanja

Više

Tehnologija

Poljičica prelazi u digitalno doba
U Srinjinama se 17. travnja predstavlja digitalni font Poljičice, staroga pisma proglašenog nematerijalnim kulturnim dobrom 2023. godine.

min čitanja

Više

Tehnologija

Anthropic i OpenAI u klinču zbog kontroverznog prijedloga zakona o odgovornosti AI-a u Illinoisu
Tvrtke su se razišle oko SB 3444, koji bi laboratorije oslobodio odgovornosti za masovne štete izazvane umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Iva Tolić: Stanice nas uče da je obnova srž života
Hrvatska znanstvenica Iva Tolić objašnjava kako neprekidna obnova na staničnoj razini može biti nadahnuće za suočavanje s globalnim krizama.

min čitanja

Više

Tehnologija

Prvi riječki bankomat zaškripio zbog prašine, ali najavio novu eru plaćanja
Podsjetnik na 1986.: riječki bankomat pokvarila je obična prašina, ali je unatoč tome označio početak digitalnog upravljanja novcem.

min čitanja

Više

Tehnologija

NASA-ino superračunalo: sav život na Zemlji nestaje za milijardu godina
Superračunalo NASA-e, analizirajući 400 000 scenarija, prognozira da će širenje Sunca uništiti sav život na Zemlji za otprilike milijardu godina.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Politika

Država otvara novac za fasade: krenuo poziv za sufinanciranje obnove zgrada

Vijesti

Zagreb pokreće obnovu Kina Tuškanac

Vijesti

Riječka policija uhitila 46-godišnjaka s marihuanom i sintetskim „galaxyjem”

Lifestyle

Park Angiolina slavi Dan planeta Zemlje radionicama za djecu i odrasle

Vijesti

Trik oko registarske pločice stajao motociklista 130 eura i vožnje

Biznis

Šušnjar najavio strategiju industrijskog razvoja s naglaskom na visokotehnološke sektore

Vijesti

Vozač bez dozvole pozitivan na drogu, policija traži trajno oduzimanje motocikla

Vijesti

Njemački umirovljenik zbog prešutene naknade mora vratiti 84 tisuće eura

Vijesti

Galerija Meštrović ponovno otvara vrata nakon 15 mjesečne obnove

Vijesti

Petnaest godina „Kruha sv. Elizabete”: Riječani u subotu skupljaju hranu za beskućnike

Vijesti

Rijeka dobila prvi sveobuhvatni udžbenik o kirurgiji dojke