CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

12. srpnja 2025, 13:19

Arch-Router Katanemo Labsa precizno usmjerava upite među LLM-ovima – bez skupog treniranja

Katanemo Labs lansirao je Arch-Router, 1,5-milijardni model koji s 93 % preciznosti određuje kojem LLM-u poslati upit, a sustav se prilagođava bez ponovnog treniranja.

min. čitanja

XFacebookWhatsApp

Istraživači iz Katanemo Labsa predstavili su Arch-Router, kompaktni jezični model s 1,5 milijardi parametara koji uz 93,17 % točnosti bira najprikladniji veliki jezični model (LLM) za svaki korisnički upit – i to bez dodatnog treniranja svaki put kad se promijeni portfelj modela.

Korisnici i tvrtke sve češće kombiniraju više LLM-ova: jedan za generiranje koda, drugi za sumarizaciju teksta, treći za obradu slika. Dosadašnji pristupi usmjeravanju oslanjali su se ili na fiksne zadatke ili na gole metrike izvedbe, što se pokazalo neprilagodljivim u razgovorima s nejasnim namjerama i skupim za održavanje.

„Postojeći routeri optimiziraju benchmark rezultate, a zanemaruju ljudske preferencije”, navode autori rada. Njihovo rješenje uvodi “preference-aligned routing”: programeri na prirodnom jeziku definiraju domenu (npr. „pravni”), zatim radnju (npr. „sumarizacija”), a svaku politiku vežu uz željeni LLM. Arch-Router prima cijeli popis politika u promptu i kao odgovor generira kratki identifikator politike, primjerice „image_editing”. Budući da su politike samo tekst u ulazu, nove rute mogu se dodati „u hodu”, bez ikakvog finog podešavanja modela.

Model je nastao finim podešavanjem Qwen 2.5 verzije na 43 000 pažljivo sklepanih primjera. U testiranju na četiri javna skupa podataka premašio je vlasničke sustave OpenAI-a, Anthropica i Googlea u prosjeku za 7,71 postotni bod, a prednost mu raste što je razgovor duži.

Unatoč dugim politikama u promptu, kašnjenje ostaje nisko jer izlaz sadrži tek nekoliko znakova. „Latencija ovisi o duljini izlaza, a naš je tek naziv rute”, ističe suosnivač i direktor Salman Paracha.

U praksi se Arch-Router već koristi u: • otvoreno-kôdnim razvojnim alatima gdje faze poput „dizajna koda” i „generiranja koda” šalje na različite LLM-ove; • korporativnim sustavima koji, primjerice, zahtjeve za izradu dokumenata šalju Claudeu 3.7 Sonnet, a zadatke obrade slika Geminiju 2.5 Pro; • osobnim asistentima s raznolikim zadacima – od sumarizacije do brzih faktografskih upita.

Framework je integriran u Arch, poslužitelj-proxy Katanemo Labsa, što tvrtkama dopušta da dio prometa eksperimentalno usmjere na novi model, prate metrike i tek potom ga potpuno uključe. Paracha zaključuje: „Cilj nam je fragmentirane AI implementacije pretvoriti u jedinstveno, politikama vođeno iskustvo koje korisniku izgleda neprimjetno.”

#google#openai#anthropic#katanemo-labs#salman-paracha

Slično

Tehnologija

Google i NextEra oživljavaju nuklearku u Iowi za pogon podatkovnih centara
Napuštena nuklearna elektrana Duane Arnold predviđena je za ponovno pokretanje 2029. zahvaljujući partnerstvu između Googlea i NextEra Energyja, koje bi trebalo osigurati 600 MW stalne struje za rastuću mrežu podatkovnih centara u Iowi.

min čitanja

Više

Tehnologija

Google i UC Santa Barbara razvili "štedljive" tehnike za velike jezične agente
Nova studija pokazuje kako agentima velikih jezičnih modela dati „osjećaj za novčanik” i tako uštedjeti tokene, vrijeme i novac.

min čitanja

Više

Tehnologija

Neprofitna inicijativa Fulu plaća hakere da ožive „mrtve” uređaje
Fulu nudi novčane nagrade za hakere koji oslobode potrošače ograničenja i produže vijek trajanja uređaja koje su proizvođači već otpisali.

min čitanja

Više

Tehnologija

Autorica priznala golemu pogrešku u bestseleru o umjetnoj inteligenciji
Karen Hao na X-u priznala da je u knjizi „Empire of AI” pogrešno procijenila potrošnju vode Googleova podatkovnog centra – i to za faktor 1.000.

min čitanja

Više

Tehnologija

Aplikacija Nomiea djeci otvara svijet klavira kroz igru
Nomiea, nova aplikacija koja djeci kroz igru otkriva klavir i glazbenu teoriju, predstavljena je u Dječjoj kući uz podršku stručnjaka i niz interaktivnih radionica.

min čitanja

Više

Tehnologija

Orqin hackathon na EFOS-u: studenti rješavali izazove, a tvrtka lovi nove talente
Na EFOS-u je održan Orqin hackathon na kojem su studenti radili na strategiji za usklađivanje triju Orqinih tržišta – vojnog, potrošačke elektronike i obrazovnog – dok brzo rastuća osječka tvrtka traži svježe ideje i nove zaposlenike.

min čitanja

Više

Tehnologija

Del Toro upozorava: „Algoritam ne smije istisnuti ljudsku maštu“
Guillermo del Toro kritizira bezrezervno korištenje umjetne inteligencije u filmu i otkriva detalje o svom novom, za Zlatni globus nominiranom, „Frankensteinu“.

min čitanja

Više

Tehnologija

AI2 lansirao Olmo 3.1, dosad najmoćniji model s naglaskom na učinkovitost i kontrolu
Allen Institute for AI predstavio je Olmo 3.1, novu i snažniju generaciju jezičnih modela usmjerenih na učinkovitost, transparentnost i precizno praćenje uputa.

min čitanja

Više

Tehnologija

Prvi hrvatski baterijski vlak ulazi u redoviti promet između Splita i Kaštel Staroga
Vlak domaće tvrtke Končar – Električna vozila od 15. prosinca svakodnevno će prevoziti putnike na relaciji Split – Kaštel Stari, otvarajući novu eru baterijskih vlakova na hrvatskim prugama.

min čitanja

Više

Tehnologija

Zagrebački „Guru za kulturu” pokazuje put: Riječani zazivaju vlastitu jedinstvenu platformu
Zagrebačka aplikacija „Guru za kulturu” objedinjuje sve kulturne događaje na jednom mjestu, a riječki kulturnjaci sada traže sličnu platformu za svoj grad.
Zagreb is OURS, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

min čitanja

Više

Najčitanije

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru
Prosvjednici u Budimpešti nose plišane igračke i baklje, tražeći odgovornost za lanac zlostavljanja i trgovine ljudima u državnim ustanovama za maloljetnike.

min čitanja

Više

Nogomet

Autor autorsko pravo: HNK Hajduk Split - The logo may be obtained from HNK Hajduk Split., Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=693556

Rebić i Šego donijeli Hajduku preokret i povratak na vrh
Splićani su na Maksimiru svladali Lokomotivu 3-1, prekinuli trociklus bez pobjede i preskočili Dinamo na vrhu HNL-a, dok Lokomotiva produžuje crni niz.

min čitanja

Više

Politika

Autor Government of Ukraine - ДСТУ 4512:2006 — Державний прапор України. Загальні технічні умови; Section 1, Article 20 of the Constitution of Ukraine, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=421234
Babiš odbija češka jamstva za novi zajam Ukrajini
Novi premijer Andrej Babiš najavio da Češka neće jamčiti za planirani europski kredit Ukrajini, pozvavši Bruxelles da pronađe druge načine potpore.

min čitanja

Više

Nogomet

Osječani i dalje u slobodnom padu, Gorica izdržala s igračem manje
Osijek je protiv Gorice odigrao samo 1-1 i ostao posljednji, iako je više od pola sata imao igrača više.

min čitanja

Više

Skijanje

Švicarska ofenziva u Val d’Isereu: Meillard slavio, Zubčić 24.
Švicarsko trostruko slavlje u veleslalomu Val d’Iserea, Meillard prvi, Zubčić 24.

min čitanja

Više

Vijesti

Pokušaj ubojstva u Velikoj Gorici: 26-godišnjak oštrim predmetom napao 21-godišnjakinju
Mladić (26) u Velikoj Gorici pokušao usmrtiti 21-godišnjakinju oštrim predmetom; žrtva zadobila lakše ozljede, napadač uhićen.

min čitanja

Više

Najnovije

Vijesti

Prvi slučaj kuge malih preživača u Hrvatskoj

Sport

Sopić ističe borbu za ostanak, Carević hvali hrabrost nakon remija Osijeka i Gorice

Sport

Lazio s devet igrača šokirao Parmu, isključen i Bašić

Sport

Požega najuspješnija prvog dana Dubrovnik Opena, domaćin uzeo četiri odličja

Politika

Vukušić prozvao Sarnavku zbog „dvostrukih standarda” u slučaju Ružice Ćavar

Sport

Split nastavio pobjednički niz, Vujičićev projektil donio dramu u Rijeci

Vijesti

Božić sunca i magle, prava zima možda tek krajem godine

Politika

Tisuće Mađara traže Orbanovu ostavku zbog skandala u maloljetničkom centru

Sport

Vlašićev gol prekinuo crni niz Torina

Sport

Brza razmjena golova na Maksimiru: Lokomotiva i Hajduk poravnati već nakon 20 minuta

Vijesti

Napad na policajku: slučaj marokanskog državljanina izazvao žestoke reakcije u Zadru