CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

20. kolovoza 2025, 06:08

Inclusion Arena nudi novu ljestvicu velikih jezičnih modela temeljenu na stvarnim korisničkim preferencijama

Istraživači Inclusion AI-ja lansirali su Inclusion Arenu, ljestvicu koja rangira velike jezične modele prema stvarnim preferencama korisnika, a ne laboratorijskim testovima.

min. čitanja

Istraživači tvrtke Inclusion AI, povezane s Ant Groupom Alibabe, predstavili su „Inclusion Arenu” – živu ljestvicu i mjerilo izvedbe velikih jezičnih modela (LLM-ova) koja se umjesto laboratorijskih testova oslanja na stvarne korisničke interakcije.

Zašto novi pristup? Tradicionalni benchmark testovi uglavnom počivaju na statičnim skupovima podataka ili umjetnim okruženjima. Autori rada tvrde da takva metodologija zanemaruje ono što poduzeća i krajnji korisnici doista vrednuju: koliko su im odgovori modela korisni i privlačni u praksi. „Naš sustav nasumično pokreće dvoboje modela tijekom višekratnih razgovora čovjeka i umjetne inteligencije u stvarnim aplikacijama”, navodi se u radu.

Kako funkcionira Inclusion Arena

  1. Integracija u aplikacije: za sada su priključene dvije – aplikacija za „character chat” Joyland i obrazovna komunikacijska platforma T-Box.
  2. Tijekom korištenja, upiti korisnika šalju se prema više LLM-ova; odgovori se prikazuju naslijepo, a korisnik odabire bolji.
  3. Sustav bilježi parne usporedbe i pomoću Bradley-Terry algoritma izračunava ocjene te formira ljestvicu. Za inicijalno uvrštavanje novog modela koristi se „placement match” mehanizam, a „proximity sampling” ograničava dvoboje na modele slične snage kako bi se smanjili troškovi.

Istaknuti rezultati • Do srpnja 2025. prikupljeno je 501 003 parnih usporedbi od 46 611 aktivnih korisnika. • Prema početnim podacima, najviše su se svidjeli odgovori modela Claude 3.7 Sonnet (Anthropic), slijede DeepSeek v3-0324, Claude 3.5 Sonnet, DeepSeek v3 i Qwen Max-0125.

Bradley-Terry nasuprot Elo ljestvici Većina današnjih ljestvica (primjerice Chatbot Arena) oslanja se na Elo rejting poznat iz šaha. Inclusion Arena koristi Bradley-Terry model jer, kažu istraživači, daje stabilnije ocjene latentnih sposobnosti kad broj usporedbi dramatično raste.

Što to znači za poduzeća Rastući broj LLM-ova otežava odabir pravog alata. Autori smatraju da njihova ljestvica, temeljena na stvarnim povratnim informacijama, „odražava praktične scenarije upotrebe” i stoga preciznije vodi tehnološke timove pri odluci kojeg modela evaluirati interno.

Sljedeći koraci Iako je trenutni uzorak aplikacija ograničen, Inclusion AI namjerava stvoriti „otvoreni savez” kako bi proširio ekosustav i povećao pouzdanost rezultata. Cilj je jasniji pregled ubrzano rastućeg krajolika generativne umjetne inteligencije – neposredno iz perspektive samih korisnika.

#inclusion-arena#inclusion-ai#ant-group#chatbot-arena#joyland

Slično

Tehnologija

Ant Group predstavio Ring-1T, prvi otvoreni AI model s bilijun parametara
Ant Group lansirao Ring-1T, otvoreni AI model s bilijun parametara, koji se na testovima približio GPT-5 i postavio nova mjerila za kinesku tehnologiju.

min čitanja

Više

Tehnologija

Doktorandi raspravljali o etičnom razvoju umjetne inteligencije na INFCON-u 25
INFCON25 u Rijeci okupio doktorande i stručnjake, fokus na etičnoj i pametnoj primjeni umjetne inteligencije.

min čitanja

Više

Tehnologija

LED svjetlo i nanočestice kositra postižu 92 % uspjeha u uništavanju raka kože
Nova fototermalna metoda uništava većinu stanica raka kože uz pomoć LED svjetla, a okolno zdravo tkivo ostaje pošteđeno.

min čitanja

Više

Tehnologija

Humanitarna aukcija dresova drugi put trijumfirala na SoMo Borcu
Projekt Nove TV „Humanitarna razmjena & aukcija dresova” osvojio je drugog SoMo Borca i u dvije sezone skupio više od 65 000 € za šibensku udrugu Kamenčići.

min čitanja

Više

Tehnologija

Mali „web detektivi” iz Bilja uče kako sigurno ploviti internetom
Osnovnoškolci u Bilju prošli radionicu „Web detektivi” i naučili kako prepoznati online opasnosti, zaštititi osobne podatke i prijaviti sumnjive sadržaje.

min čitanja

Više

Tehnologija

Samsung dovodi „Pepsi čovjeka” da preokrene svoj dizajn
Dolazak dizajnerskog veterana Mauroa Porcinija signalizira da Samsung želi stati na kraj kritikama o „dosadnom” dizajnu i stvoriti prepoznatljivo korisničko iskustvo.

min čitanja

Više

Tehnologija

Naša nova svemirska susjeda: super-Zemlja GJ 251c u nastanjivoj zoni
Super-Zemlja GJ 251c, otkrivena samo 18 svjetlosnih godina od nas, nalazi se u nastanjivoj zoni svoje zvijezde i predstavlja obećavajuće odredište u potrazi za izvanzemaljskim životom.

min čitanja

Više

Tehnologija

Kineska sonda Chang’e-6 na dalekoj strani Mjeseca otkrila tragove prastare vode
Mikroskopski fragmenti CI kondrita, meteorita bogatih vodom, prvi put su potvrđeni u uzorcima s daleke strane Mjeseca i baca novo svjetlo na izvor lunarne i zemaljske vode.

min čitanja

Više

Tehnologija

Rafailov tvrdi: put do prave umjetne inteligencije vodi kroz učenje, ne kroz još veće modele
Istraživač Thinking Machines Laba kritizirao je utrku u gomilanju sve većih modela i pozvao na razvoj sustava koji kontinuirano uče i pamte – što vidi kao jedini realan put prema AGI-ju.

min čitanja

Više

Tehnologija

Zemlja dobila sedmi kvazimjesec 2025 PN7
Mali asteroid 2025 PN7, otkriven teleskopom Pan-STARRS, potvrđen je kao sedmi kvazimjesec koji privremeno prati Zemlju.

min čitanja

Više

Najčitanije

Politika

Pavliček ostaje na čelu Hrvatskih suverenista još četiri godine
Marijan Pavliček na izbornom saboru ponovno je izabran za predsjednika Hrvatske suverenista i najavio nastavak politike kojom je osvojio Vukovar.

min čitanja

Više

Najnovije

Vijesti

Fotografija ispred Splita nasmijala mreže: američki div i mali „Umag“ rame uz rame

Politika

Goran Milić objavom o 80 godina UN-a prozvao „osipanje velike ideje”

Sport

Ferencvaros još jednom koban za Podravku u Ligi prvakinja

Sport

Zubčić kreće s brojem 10 u Söldenu, spreman za novu sezonu

Vijesti

Tri mrtva tijela pronađena u kući u Hessenu, jedan muškarac teško ozlijeđen

Sport

Kramarić golom i asistencijom vodio Hoffenheim do pobjede, Stanišić se vratio u dresu Bayerna

Vijesti

Kazna za audioknjige: policija u Sloveniji globe 88-godišnjakinju zbog „preglasnog“ slušanja

Sport

Srna dirljivom objavom otkrio borbu malog Romana: „Prošao je 36 operacija, ali ne odustaje”

Politika

Srbija se nudi za domaćinstvo ukrajinskih mirovnih pregovora

Vijesti

Maslinarska komina nije opasni otpad, tvrdi vlasnik uljare Nadin

Sport

Vušković sjajan, HSV ostao praznih ruku protiv Wolfsburga