CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

12. srpnja 2025, 13:19

Arch-Router Katanemo Labsa precizno usmjerava upite među LLM-ovima – bez skupog treniranja

Katanemo Labs lansirao je Arch-Router, 1,5-milijardni model koji s 93 % preciznosti određuje kojem LLM-u poslati upit, a sustav se prilagođava bez ponovnog treniranja.

min. čitanja

Istraživači iz Katanemo Labsa predstavili su Arch-Router, kompaktni jezični model s 1,5 milijardi parametara koji uz 93,17 % točnosti bira najprikladniji veliki jezični model (LLM) za svaki korisnički upit – i to bez dodatnog treniranja svaki put kad se promijeni portfelj modela.

Korisnici i tvrtke sve češće kombiniraju više LLM-ova: jedan za generiranje koda, drugi za sumarizaciju teksta, treći za obradu slika. Dosadašnji pristupi usmjeravanju oslanjali su se ili na fiksne zadatke ili na gole metrike izvedbe, što se pokazalo neprilagodljivim u razgovorima s nejasnim namjerama i skupim za održavanje.

„Postojeći routeri optimiziraju benchmark rezultate, a zanemaruju ljudske preferencije”, navode autori rada. Njihovo rješenje uvodi “preference-aligned routing”: programeri na prirodnom jeziku definiraju domenu (npr. „pravni”), zatim radnju (npr. „sumarizacija”), a svaku politiku vežu uz željeni LLM. Arch-Router prima cijeli popis politika u promptu i kao odgovor generira kratki identifikator politike, primjerice „image_editing”. Budući da su politike samo tekst u ulazu, nove rute mogu se dodati „u hodu”, bez ikakvog finog podešavanja modela.

Model je nastao finim podešavanjem Qwen 2.5 verzije na 43 000 pažljivo sklepanih primjera. U testiranju na četiri javna skupa podataka premašio je vlasničke sustave OpenAI-a, Anthropica i Googlea u prosjeku za 7,71 postotni bod, a prednost mu raste što je razgovor duži.

Unatoč dugim politikama u promptu, kašnjenje ostaje nisko jer izlaz sadrži tek nekoliko znakova. „Latencija ovisi o duljini izlaza, a naš je tek naziv rute”, ističe suosnivač i direktor Salman Paracha.

U praksi se Arch-Router već koristi u: • otvoreno-kôdnim razvojnim alatima gdje faze poput „dizajna koda” i „generiranja koda” šalje na različite LLM-ove; • korporativnim sustavima koji, primjerice, zahtjeve za izradu dokumenata šalju Claudeu 3.7 Sonnet, a zadatke obrade slika Geminiju 2.5 Pro; • osobnim asistentima s raznolikim zadacima – od sumarizacije do brzih faktografskih upita.

Framework je integriran u Arch, poslužitelj-proxy Katanemo Labsa, što tvrtkama dopušta da dio prometa eksperimentalno usmjere na novi model, prate metrike i tek potom ga potpuno uključe. Paracha zaključuje: „Cilj nam je fragmentirane AI implementacije pretvoriti u jedinstveno, politikama vođeno iskustvo koje korisniku izgleda neprimjetno.”

#google#openai#anthropic#katanemo-labs#salman-paracha

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata
Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Googleovi Nest uređaji pojednostavljuju kućnu sigurnost
Google Home i Nest kamere omogućuju brzo i pristupačno postavljanje kućnog nadzora, od unutarnjih i vanjskih kamera do pametnog video zvonca.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata
Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

Kako Claude ponekad „pukne”: ambiciozni AI Anthropica pokazuje i mračnu stranu
Claude, vodeći AI model kompanije Anthropic, uglavnom je pristojan i koristan – ali ponekad iznenadi lažima, obmanama i prijetnjama, a stručnjaci još nemaju objašnjenje za te izlete na mračnu stranu.

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV
Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga
Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo
IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda
Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije
Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju
Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Najčitanije

Biznis

Slovnaft optužuje Janaf da koči isporuke neruske nafte
Slovačka rafinerija tvrdi da je smanjenje isporuka arapske nafte preko hrvatskog naftovoda ugrozilo opskrbu regije, dok Janaf poručuje da se sve odvija prema ugovoru.

min čitanja

Više

Vijesti

Autor See File history below for details. - Own work based on: Flag of Serbia construction sheet.svg (Construction sheet)The Government of Serbia, National symbols srbija.gov.rs, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=65419036
Tragedija na autocesti Novi Sad – Beograd: poginulo dijete, osmero teško ozlijeđenih
Jedno dijete smrtno je stradalo, a osmero osoba teško je ozlijeđeno u slijetanju kombija s autoceste Novi Sad – Beograd.

min čitanja

Više

Najnovije

Vijesti

Dan pune sirena: splitski vatrogasci u 24 sata gasili baraku, ispumpavali vodu i uklanjali stabla

Vijesti

Teško ozlijeđen 78-godišnjak u nesreći na Šubićevcu

Sport

Rijeka fotografijom podsjetila na trofeje i čestitala rođendan smijenjenom Đaloviću

Biznis

Od studenog skuplja struja za kućanstva

Lifestyle

Thompsonova nećakinja duhovito odgovorila „lovcima” na karte

Politika

Moskvi bliski operativci u panici: bore se da spriječe izručenje plaćenika optuženog za državni udar u Rumunjskoj

Lifestyle

Chris Evans i Alba Baptista u tajnosti dobili kćer Alma Grace

Sport

Toronto se vratio u igru: Blue Jaysi izjednačili World Series

Lifestyle

Finski vrtići zamijenili asfalt šumom i blatom: djeca zdravija nakon samo mjesec dana

Vijesti

Valdebek na nogama zbog nove antene na kući liječnice

Lifestyle

Split: studenti otkrivaju jesu li pogodili s izborom fakulteta