CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

4. prosinca 2025, 06:30

Gemini 3 osvojio povjerenje korisnika: novo neovisno testiranje stavlja Googleov model na vrh

Neovisni HUMAINE test na 26 000 ispitanika pokazao je da Gemini 3 postiže rekordne rezultate u povjerenju, etici i sigurnosti, nadmašivši konkurente u tri od četiri kategorije.

min. čitanja

XFacebookWhatsApp

Neovisna platforma Prolific, koju su osnovali istraživači Sveučilišta u Oxfordu, objavila je rezultate najnovijeg HUMAINE testa – opsežnog, naslijepo provedenog uspoređivanja velikih jezičnih modela s naglaskom na stvarne korisničke scenarije.

• U ispitivanju je sudjelovalo 26 000 korisnika iz Sjedinjenih Država i Ujedinjenoga Kraljevstva, reprezentativno raspoređenih prema dobi, spolu, etničkoj pripadnosti i političkoj orijentaciji. • Gemini 3 Pro postigao je rekordnu ocjenu povjerenja od 69 %, naspram 16 % koliko je bilježio prethodnik Gemini 2.5 Pro. • Model je zauzeo prvo mjesto u trima od četiri kategorije: izvedba i zaključivanje, interakcija i prilagodljivost te povjerenje i sigurnost. Jedino je u komunikacijskom stilu zaostao za DeepSeek V3, koji je preferiralo 43 % ispitanika. • U 22 promatrane demografske podskupine Googleov je model zadržao stabilno visoke rezultate, a ispitanici su ga pet puta češće birali u izravnim, naslijepo provedenim usporedbama.

Metodologija: dvije latentne sugovornice

HUMAINE test odvija se tako da korisnici istodobno razgovaraju s dva modela, ne znajući čije odgovore zapravo čitaju. Teme biraju sami sudionici, što eliminira memoriranje unaprijed pripremljenih pitanja i uočava nijanse u radu modela na „živim” primjerima. Takav pristup, ističu u Prolificu, otkriva kako se performanse mijenjaju ovisno o publici – nešto što klasični, statični benchmarkovi ne mogu zabilježiti.

„Ako kontrollirate uzorak, dobijete drukčiju ljestvicu – bilo da promatrate lijevo ili desno političko krilo, mlađe ili starije korisnike”, pojasnio je suosnivač i izvršni direktor Prolifica Phelim Bradley. Prema njegovim riječima, upravo je „dosljednost u širokom rasponu upotreba” donijela Gemini-ju 3 ukupnu pobjedu.

Ljudski faktor ostaje ključan

Iako tvrtka u nekim segmentima koristi i automatske, računalne suce, Bradley naglašava da „ljudski podaci i ljudska inteligencija i dalje stvaraju glavnu dodanu vrijednost”. U kombiniranom, pametno orkestriranom sustavu, tvrdi, ljudske i strojne evaluacije nadopunjuju se i daju pouzdaniju sliku mogućnosti svakog modela.

Što to znači za tvrtke?

Rezultati HUMAINE-a sugeriraju da organizacije, osobito one s raznolikom radnom snagom i korisničkom bazom, moraju testirati modele u uvjetima koji odražavaju stvarni sastav njihove publike. Puko oslanjanje na „vibe” ili pojedinačne tehničke metrike više nije dovoljno. Sustavno, naslijepo i demografski osviješteno testiranje pruža podatke potrebne za odluku koji će model najbolje služiti konkretnom poslovnom slučaju.

Za Googleov Gemini 3 Pro, pak, najnoviji je rezultat potvrda tvrdnji o napretku: ne samo da model računski rješava zadatke, nego to čini na način koji većina korisnika doživljava pouzdanim, etičnim i sigurnim. U svijetu u kojem će umjetna inteligencija sve češće nastupati kao nevidljivi sugovornik krajnjim korisnicima, upravo je takvo povjerenje možda najvrjednija valuta.

#sjedinjene-drzave#ujedinjeno-kraljevstvo#google#sveuciliste-u-oxfordu#prolific

Slično

Tehnologija

Google Workspace Studio širi doseg AI agenata u uredskim alatima
Novi Google Workspace Studio trebao bi olakšati izradu i korištenje AI agenata u tvrtkama te pojačati tržišno nadmetanje s Microsoftovim Copilotom.

min čitanja

Više

Tehnologija

Norton lansirao Neo – preglednik koji nudi „nultu” potrebu za upitima i sigurnost na razini antivirusa
Norton je predstavio Neo, preglednik koji proaktivno nudi AI-savjete i sigurnosnu zaštitu bez potrebe za klasičnim promptovima.

min čitanja

Više

Tehnologija

Drugi ciklus ‘e-Umirovljenika’: 150 novih prijava pokazuje glad starijih za digitalnim znanjem
Program Digitalne Dalmacije širi edukacije za umirovljenike na četiri grada, privlači 150 novih polaznika i donosi im znanja o pametnim telefonima, internetu i umjetnoj inteligenciji.

min čitanja

Više

Tehnologija

BMW iX3 2026 otkriva novu eru: 500 milja dosega i „srce radosti“ za vožnju
Prvi model na platformi Neue Klasse donosi 800-voltno punjenje, 500 milja dosega i revolucionarno centralno računalo za dinamiku vožnje.

min čitanja

Više

Tehnologija

Tencentov Hunyuan uvodi 3D-generativnu umjetnu inteligenciju u dizajn videoigara
Tencentovi 3D AI modeli skraćuju razvoj likova s mjesec dana na minutu i potiču raspravu o budućnosti poslova u industriji videoigara.

min čitanja

Više

Tehnologija

Podaci bez uvida: Celosphere 2025 otkrio kako procesna inteligencija spašava lance opskrbe
Konferencija u Münchenu okupila tvrtke koje su digitalnim blizancima i procesnom inteligencijom pretvorile cjenovne šokove u prednost.

min čitanja

Više

Tehnologija

Bolković ismijao EU kartu „tvornica umjetne inteligencije”: Hrvatska izostavljena jer je „prirodno inteligentna”
Objava voditelja Romana Bolkovića o EU karti „tvornica umjetne inteligencije” potaknula je raspravu zašto Hrvatska nije u planu velikih AI centara.

min čitanja

Više

Tehnologija

Zašto AI pogriješi u SQL-u: semantički sloj postao je obavezna infrastruktura
Bez sloja koji definira metrike, LLM-ovi pri upitima na bazu daju točne SQL naredbe, ali pogrešne odgovore; semantički sloj povećava točnost s 17 na više od 90 posto.

min čitanja

Više

Tehnologija

Dio e-servisa Porezne uprave nedostupan od petka popodne do nedjelje ujutro
Planirani radovi na digitalnoj transformaciji Porezne uprave od 5. do 7. prosinca privremeno gase dio e-servisa, no fiskalizacija i izdavanje OIB-a nastavljaju raditi bez prekida.

min čitanja

Više

Tehnologija

Američki startup kreće u kliničko ispitivanje cjepiva protiv fentanyla
ARMR Sciences pokreće prvu studiju na ljudima kako bi provjerio može li cjepivo protiv fentanyla spriječiti smrtonosna predoziranja.

min čitanja

Više

Najčitanije

Vijesti

U Splitu teško ranjen policajac izvan službe, napadač u bijegu
Nepoznati napadač teško je ranio policajca izvan službe u splitskom naselju Bilice; policija intenzivno traga za počiniteljem.

min čitanja

Više

Nogomet

By The logo is from the following website: https://www.realmadrid.com/, Fair use, https://en.wikipedia.org/w/index.php?curid=35239667

Mbappe s dvama golovima i asistencijom odveo Real do slavlja u Bilbau
Real Madrid slavio je 3-0 kod Athletica; junak dvostruki strijelac Kylian Mbappe, uz asistenciju za Camavingin pogodak.
By Helfer Emilio - Own work, CC0, https://commons.wikimedia.org/w/index.php?curid=168449511

min čitanja

Više

Rukomet

Zagreb slomio Pelister i stigao do prve pobjede u Ligi prvaka
Hrvatski rukometni prvak prekinuo niz poraza i svladao Pelister 27-23 u zagrebačkoj Areni.

min čitanja

Više

Vijesti

Video iz Trilja prikazuje policajca kako tuče privedenog muškarca
Snimka iz Trilja podigla prašinu: policajac udara zavezana muškarca, pokrenuta istraga o prekoračenju ovlasti.

min čitanja

Više

Najnovije

Vijesti

Gripa stigla ranije: više od 3700 slučajeva, najpogođenija djeca

Lifestyle

Tajni agenti 010 nakon Zagreba i Osijeka gostuju na Krku

Biznis

Zimski red letenja donosi 25 direktnih veza Hrvatske sa svijetom

Lifestyle

Kino Valli u prosincu: Shakespeare, Ratko Rudić i jeziva noć u Freddyju

Vijesti

Tava povučena zbog arsena: kupci je moraju hitno vratiti

Sport

Osijek opet pao na jedanaesterce, sedmi put u 11 godina

Vijesti

Solin drugi najbolji srednje veliki grad za život u Hrvatskoj

Vijesti

Vrtićki radnik iz Londona priznao 26 kaznenih djela nad djecom

Politika

Tajno izvješće USKOK-a koči izbor čelnika Vrhovnog suda

Vijesti

Pad američkog F-16 u Kaliforniji, pilot se spasio katapultiranjem

Politika

London i Oslo udružuju fregate za lov na ruske podmornice