Tehnologija

Arch-Router Katanemo Labsa precizno usmjerava upite među LLM-ovima – bez skupog treniranja

Katanemo Labs lansirao je Arch-Router, 1,5-milijardni model koji s 93 % preciznosti određuje kojem LLM-u poslati upit, a sustav se prilagođava bez ponovnog treniranja.

min čitanja

Istraživači iz Katanemo Labsa predstavili su Arch-Router, kompaktni jezični model s 1,5 milijardi parametara koji uz 93,17 % točnosti bira najprikladniji veliki jezični model (LLM) za svaki korisnički upit – i to bez dodatnog treniranja svaki put kad se promijeni portfelj modela.

Korisnici i tvrtke sve češće kombiniraju više LLM-ova: jedan za generiranje koda, drugi za sumarizaciju teksta, treći za obradu slika. Dosadašnji pristupi usmjeravanju oslanjali su se ili na fiksne zadatke ili na gole metrike izvedbe, što se pokazalo neprilagodljivim u razgovorima s nejasnim namjerama i skupim za održavanje.

„Postojeći routeri optimiziraju benchmark rezultate, a zanemaruju ljudske preferencije”, navode autori rada. Njihovo rješenje uvodi “preference-aligned routing”: programeri na prirodnom jeziku definiraju domenu (npr. „pravni”), zatim radnju (npr. „sumarizacija”), a svaku politiku vežu uz željeni LLM. Arch-Router prima cijeli popis politika u promptu i kao odgovor generira kratki identifikator politike, primjerice „image_editing”. Budući da su politike samo tekst u ulazu, nove rute mogu se dodati „u hodu”, bez ikakvog finog podešavanja modela.

Model je nastao finim podešavanjem Qwen 2.5 verzije na 43 000 pažljivo sklepanih primjera. U testiranju na četiri javna skupa podataka premašio je vlasničke sustave OpenAI-a, Anthropica i Googlea u prosjeku za 7,71 postotni bod, a prednost mu raste što je razgovor duži.

Unatoč dugim politikama u promptu, kašnjenje ostaje nisko jer izlaz sadrži tek nekoliko znakova. „Latencija ovisi o duljini izlaza, a naš je tek naziv rute”, ističe suosnivač i direktor Salman Paracha.

U praksi se Arch-Router već koristi u: • otvoreno-kôdnim razvojnim alatima gdje faze poput „dizajna koda” i „generiranja koda” šalje na različite LLM-ove; • korporativnim sustavima koji, primjerice, zahtjeve za izradu dokumenata šalju Claudeu 3.7 Sonnet, a zadatke obrade slika Geminiju 2.5 Pro; • osobnim asistentima s raznolikim zadacima – od sumarizacije do brzih faktografskih upita.

Framework je integriran u Arch, poslužitelj-proxy Katanemo Labsa, što tvrtkama dopušta da dio prometa eksperimentalno usmjere na novi model, prate metrike i tek potom ga potpuno uključe. Paracha zaključuje: „Cilj nam je fragmentirane AI implementacije pretvoriti u jedinstveno, politikama vođeno iskustvo koje korisniku izgleda neprimjetno.”

Slično

Anthropic lansirao nadzornu ploču za Claude Code kako bi tvrtkama pokazao isplativost AI-a
Nova nadzorna ploča za Claude Code omogućuje inženjerskim menadžerima da u realnom vremenu prate korištenje alata i troškove, dok interes za AI kod asistente nastavlja eksplozivno rasti.

min čitanja

Više

Pentagon angažirao Muskov Grok unatoč otvorenom sukobu s Trumpom
Pentagon je potpisao do 200 milijuna dolara vrijedan ugovor s Muskovim startupom xAI za korištenje chatbota Grok, i to usprkos javnom sukobu tehnološkog magnata s Donaldom Trumpom.

min čitanja

Više

Veliki AI rivali upozoravaju: prozor za nadzor strojnog razmišljanja ubrzano se zatvara
Istraživači iz OpenAI-ja, Google DeepMinda, Anthropica i Mete upozoravaju da bi unutarnji „lanci misli” naprednih AI sustava uskoro mogli postati nečitljivi, čime bi ljudi izgubili bitan alat za nadzor sigurnosti.

min čitanja

Više

Stručnjaci upozoravaju: ChatGPT nije terapeut, čuvajte svoje tajne
Rastući trend povjeravanja osobnih problema ChatGPT-ju izazvao je upozorenja stručnjaka o nedostatku empatije i opasnosti od curenja podataka.

min čitanja

Više

Meta privukla još dvoje OpenAI stručnjaka u laboratorij za superinteligenciju
Jason Wei i Hyung Won Chung, dosadašnji istraživači OpenAI-ja, prelaze u Metin laboratorij za superinteligenciju, dok tehnološki divovi nastavljaju međusobno vrtjeti milijunske ponude za vrhunske AI talente.

min čitanja

Više

Murati najavila 2 milijarde dolara ulaganja i skoro lansiranje otvorene AI platforme
Thinking Machines privukao je 2 milijarde dolara ulaganja i najavljuje prvi proizvod s velikom open source komponentom, dok OpenAI odgađa vlastiti otvoreni model.

min čitanja

Više

Mistral predstavio Voxtral, otvoreni model govorne AI koji konkurira skupljim rješenjima
Francuski Mistral AI lansirao je Voxtral, otvoreni model za prepoznavanje i razumijevanje govora koji, tvrde, nadmašuje komercijalne rivale uz dvostruko nižu cijenu.

min čitanja

Više

Cognition preuzima Windsurf i u njegov IDE ugrađuje svog autonomnog „inženjera” Devina
Cognition preuzima Windsurf i najavljuje integraciju autonomnog AI-inženjera Devina u popularni IDE, dok su osnivači Windsurfa već otišli u Google u odvojenom poslu vrijednom 2,4 milijarde dolara.

min čitanja

Više

OpenAI želi udio u europskim „AI gigatvornicama”
Američki OpenAI prijavio se za sudjelovanje u ambicioznom europskom projektu izgradnje AI gigatvornica te najavio suradnju s vladama na javno-privatnim fondovima za umjetnu inteligenciju.

min čitanja

Više

Studija otkriva raširenu ranjivost AI alata na zdravstvene dezinformacije
Nova studija pokazuje da četiri od pet velikih jezičnih modela bez pogovora stvaraju uvjerljive, ali opasne zdravstvene dezinformacije, upozoravajući na hitnu potrebu za jačim zaštitnim mehanizmima.

min čitanja

Više

Ostalo

Ensemble Illyrica donosi završni ton 8. Lovran Classice
Treći i završni koncert 8. Lovran Classice u petak donosi nastup internacionalnog komornog sastava Ensemble Illyrica.

min čitanja

Više

Fiume o morte! trijumfirao s šest Zlatnih arena, Velika zlatna arenu osvojio Mirotvorac
Na Pula Film Festivalu film Igora Bezinovića odnio je šest Zlatnih arena, dok je Velika zlatna arena za najbolji film pripala „Mirotvorcu”.

min čitanja

Više

Gorica mijenja travnjak, prvih šest kola igra u gostima
Zbog zamjene dotrajalog terena Gorica će prvih šest kola SuperSport HNL-a odigrati u gostima, a novi travnjak premijerno će ugostiti Slaven Belupo u 7. kolu.

min čitanja

Više

Europska investicijska banka otvara vrata financiranju vojne proizvodnje
EIB najavljuje financiranje vojne opreme, potvrđujući pomak EU prema većim ulaganjima u obranu.

min čitanja

Više

Tbilisi odbacuje „ultimatum” Bruxellesa oko ukidanja bezviznog režima
Premijer Irakli Kobakhidze tvrdi da bezvizni režim nije presudan za Gruziju i brani sporni zakon o stranim agentima, dok EU prijeti obustavom putovanja ako Tbilisi ne zaustavi demokratsko nazadovanje.

min čitanja

Više

Zastupnici u EP-u skeptični prema nejasnom zdravstvenom proračunu EU-a
Eurozastupnici kritiziraju Komisiju zbog nejasnih planova za zdravstvenu potrošnju u sljedećem proračunu EU-a, upozoravajući da bi nedostatak transparentnosti mogao razvodniti ključne prioritete.

min čitanja

Više

Dvadeset tisuća ljudi pratilo Zagrebačke kvartove kulture, novi ciklus stiže u rujnu
Projekt „Zagrebački kvartovi kulture” tijekom tri mjeseca privukao je više od 20 000 posjetitelja, a završni, treći ciklus seli u Klaku, Folnegovićevo i Cvjetno naselje tijekom rujna.

min čitanja

Više

Ribafish doplivao do cilja: Umag ovacijama zaključio RokPoluotok
Domagoj Jakopović Ribafish u Umagu je simbolično zatvorio dvogodišnji projekt RokPoluotok, isplivavši 182 kilometra oko Istre i okupivši stotine djece u ekološkoj misiji.

min čitanja

Više

Riječanin poslan u istražni zatvor zbog dječje pornografije
Riječki Županijski sud odredio je jednomjesečni pritvor 35-godišnjem Riječaninu zbog sumnje u posjedovanje i dijeljenje tisuća datoteka s dječjom pornografijom.

min čitanja

Više

Europski pregovarač traži potpunu zabranu uvoza ruske nafte
Ville Niinistö zalaže se za proširenje zabrane uvoza ruskog plina i na naftu, kako bi se prekinulo financiranje ruske ratne mašinerije.

min čitanja

Više