Tehnologija

12. srpnja 2025, 13:19

Arch-Router Katanemo Labsa precizno usmjerava upite među LLM-ovima – bez skupog treniranja

Katanemo Labs lansirao je Arch-Router, 1,5-milijardni model koji s 93 % preciznosti određuje kojem LLM-u poslati upit, a sustav se prilagođava bez ponovnog treniranja.

min. čitanja

Istraživači iz Katanemo Labsa predstavili su Arch-Router, kompaktni jezični model s 1,5 milijardi parametara koji uz 93,17 % točnosti bira najprikladniji veliki jezični model (LLM) za svaki korisnički upit – i to bez dodatnog treniranja svaki put kad se promijeni portfelj modela.

Korisnici i tvrtke sve češće kombiniraju više LLM-ova: jedan za generiranje koda, drugi za sumarizaciju teksta, treći za obradu slika. Dosadašnji pristupi usmjeravanju oslanjali su se ili na fiksne zadatke ili na gole metrike izvedbe, što se pokazalo neprilagodljivim u razgovorima s nejasnim namjerama i skupim za održavanje.

„Postojeći routeri optimiziraju benchmark rezultate, a zanemaruju ljudske preferencije”, navode autori rada. Njihovo rješenje uvodi “preference-aligned routing”: programeri na prirodnom jeziku definiraju domenu (npr. „pravni”), zatim radnju (npr. „sumarizacija”), a svaku politiku vežu uz željeni LLM. Arch-Router prima cijeli popis politika u promptu i kao odgovor generira kratki identifikator politike, primjerice „image_editing”. Budući da su politike samo tekst u ulazu, nove rute mogu se dodati „u hodu”, bez ikakvog finog podešavanja modela.

Model je nastao finim podešavanjem Qwen 2.5 verzije na 43 000 pažljivo sklepanih primjera. U testiranju na četiri javna skupa podataka premašio je vlasničke sustave OpenAI-a, Anthropica i Googlea u prosjeku za 7,71 postotni bod, a prednost mu raste što je razgovor duži.

Unatoč dugim politikama u promptu, kašnjenje ostaje nisko jer izlaz sadrži tek nekoliko znakova. „Latencija ovisi o duljini izlaza, a naš je tek naziv rute”, ističe suosnivač i direktor Salman Paracha.

U praksi se Arch-Router već koristi u: • otvoreno-kôdnim razvojnim alatima gdje faze poput „dizajna koda” i „generiranja koda” šalje na različite LLM-ove; • korporativnim sustavima koji, primjerice, zahtjeve za izradu dokumenata šalju Claudeu 3.7 Sonnet, a zadatke obrade slika Geminiju 2.5 Pro; • osobnim asistentima s raznolikim zadacima – od sumarizacije do brzih faktografskih upita.

Framework je integriran u Arch, poslužitelj-proxy Katanemo Labsa, što tvrtkama dopušta da dio prometa eksperimentalno usmjere na novi model, prate metrike i tek potom ga potpuno uključe. Paracha zaključuje: „Cilj nam je fragmentirane AI implementacije pretvoriti u jedinstveno, politikama vođeno iskustvo koje korisniku izgleda neprimjetno.”

#google #openai #anthropic #katanemo-labs #salman-paracha

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Googleovi Nest uređaji pojednostavljuju kućnu sigurnost

Google Home i Nest kamere omogućuju brzo i pristupačno postavljanje kućnog nadzora, od unutarnjih i vanjskih kamera do pametnog video zvonca.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata

Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

Kako Claude ponekad „pukne”: ambiciozni AI Anthropica pokazuje i mračnu stranu

Claude, vodeći AI model kompanije Anthropic, uglavnom je pristojan i koristan – ali ponekad iznenadi lažima, obmanama i prijetnjama, a stručnjaci još nemaju objašnjenje za te izlete na mračnu stranu.

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga

Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo

IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda

Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

12. srpnja 2025, 13:19

Arch-Router Katanemo Labsa precizno usmjerava upite među LLM-ovima – bez skupog treniranja

Katanemo Labs lansirao je Arch-Router, 1,5-milijardni model koji s 93 % preciznosti određuje kojem LLM-u poslati upit, a sustav se prilagođava bez ponovnog treniranja.

min. čitanja

#google #openai #anthropic #katanemo-labs #salman-paracha

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata

Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

Googleovi Nest uređaji pojednostavljuju kućnu sigurnost

Google Home i Nest kamere omogućuju brzo i pristupačno postavljanje kućnog nadzora, od unutarnjih i vanjskih kamera do pametnog video zvonca.

min čitanja

Više

Tehnologija

Adobe na MAX konferenciji predstavio val novih AI alata

Na MAX konferenciji u Los Angelesu Adobe je predstavio nove AI funkcije u Fireflyju, Photoshopu i Expressu te najavio Project Moonlight i integraciju s ChatGPT-om.

min čitanja

Više

Tehnologija

Kako Claude ponekad „pukne”: ambiciozni AI Anthropica pokazuje i mračnu stranu

min čitanja

Više

Tehnologija

Volkswagen predstavio novi T-Roc: veći, pametniji i štedljiviji kompaktni SUV

Druga generacija najprodavanijeg Volkswagenova SUV-a stigla je u hrvatsku pretprodaju s modernijim dizajnom, blagim hibridnim motorima i početnom cijenom ispod 29 tisuća eura.

min čitanja

Više

Tehnologija

Razvod otkrio mračnu stranu Appleova Family Sharinga

Sustav roditeljske kontrole osmišljen da olakša zajednički život može, nakon razvoda, postati alat nadzora i prisile – a pravila platforme nerijetko jača su od sudskih odluka.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo

IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda

Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije

Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju

Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više