TensorZero, 18-mjesečni startup iz Brooklyna koji razvija otvorenu infrastrukturu za aplikacije temeljene na velikim jezičnim modelima (LLM), osigurao je seed investiciju od 7,3 milijuna američkih dolara. Krug je predvodio fond FirstMark, a sudjelovali su i Bessemer Venture Partners, Bedrock, DRW, Coalition te deseci strateških anđela-ulagača.
Tvrtka je u kratkom roku privukla veliku pažnju zajednice: njezin otvoreni repozitorij nedavno je zasjeo na prvo mjesto najpopularnijih projekata na GitHubu, skočivši s oko 3 000 na više od 9 700 zvjezdica. Razlog interesa leži u tome što se brojna poduzeća još uvijek muče s prevođenjem moćnih modela poput GPT-5 ili Claudea u stabilne produkcijske sustave.
„Unatoč svoj buci u industriji, tvrtkama i dalje nedostaju pravi alati za složene kognitivne i infrastrukturne potrebe, pa krpaju rješenja dostupna na tržištu”, izjavio je Matt Turck, generalni partner FirstMarka koji je predvodio ulaganje.
Za razliku od uobičajenog pristupa koji traži spajanje niza specijaliziranih alata različitih dobavljača, TensorZero nudi jedinstven, otvoreni stack: pristup modelima, nadzor, evaluaciju, fino podešavanje i eksperimentiranje. Srž platforme je „data and learning flywheel” – povratna sprega koja metrike iz produkcije i ljudsku povratnu informaciju pretvara u brže, pametnije i jeftinije modele.
Suosnivač i CTO Viraj Mehta iskustvo je stekao radeći na pojačanom učenju za nuklearne fuzijske reaktore tijekom doktorata na Carnegie Mellonu, gdje su podaci bili „vrijedni kao automobil – 30 000 dolara za pet sekundi”. Iz tog je konteksta proizašla filozofija maksimizacije svake prikupljene informacije. „LLM aplikacije u širem smislu izgledaju kao problemi pojačanog učenja”, pojasnio je Mehta.
Kolega suosnivač Gabriel Bianconi, bivši direktor proizvoda u Ondo Financeu, dodaje kako su mnoge tvrtke odustale od spajanja niza alata jer su dobile fragmentirana rješenja: „Shvatili smo da postoji prilika za proizvod koji omogućuje taj povratni krug u produkciji.”
Tehnička strana • Implementacija u Rustu donosi manje od jedne milisekunde dodatne latencije pri 10 000 upita u sekundi. • Usporedbe radi, Python-temeljeni LiteLLM pri 100 upita dodaje 25–100 puta veću latenciju. • Platforma podržava sve vodeće dobavljače LLM-ova preko jedinstvenog API-ja.
Među ranim korisnicima nalaze se jedan od najvećih europskih banaka, koji automatizira izradu promjena u kodu, te niz AI startupova iz zdravstva, financija i potrošačkog sektora. Otvoreni kod pruža velikim sustavima dodatnu sigurnost jer mogu pokretati TensorZero unutar vlastite infrastrukture.
Tvrtka planira ostati u potpunosti open source, bez plaćenih značajki. Buduća zarada trebala bi dolaziti iz upravljanog servisa koji će automatizirati zahtjevnije dijelove optimizacije – primjerice upravljanje GPU-ovima i proaktivne preporuke za poboljšanje modela.
Novi kapital bit će usmjeren na širenje tima u New Yorku i ubrzanje razvoja. „Naša krajnja vizija je omogućiti povratnu spregu podataka i učenja koja LLM aplikacije čini pametnijima, bržima i jeftinijima,” zaključuje Mehta.