Kineski AI startup DeepSeek objavio je novu verziju svojeg velikog jezičnog modela – DeepSeek-V3.1-Terminus. Nasljednik popularnog V3.1 donosi bolju točnost, učinkovitije korištenje vanjskih alata i uklanja ranije zamiješano ubacivanje kineskih znakova u engleske odgovore.
Najvažnije novosti
• Jača agentna izvedba: u internim testovima model nadmašuje prethodnika u zadacima koji zahtijevaju interakciju s alatima – SimpleQA (96,8 → 93,4), BrowseComp (38,5 → 30,0), SWE Verified (68,4 → 66,0), SWE-bench Multilingual (57,8 → 54,5) i Terminal-bench (36,7 → 31,3).
• Dvije radne vrste: „deepseek-chat” za brzi razgovor i pozivanje funkcija te „deepseek-reasoner” za dubinsko zaključivanje. Obje podržavaju kontekst od 128 000 tokena, no reasoner vraća do 64 000 tokena u jednom odgovoru, osam puta više od chat moda.
• Dulji izlaz bez prekida: chat verzija sada može generirati do 8 000 tokena (zadano 4 000).
• Precizniji engleski prikaz: uklonjeno slučajno miješanje jezika i „čudni” znakovi.
• Jači „Code Agent” i „Search Agent”: specijalizirani okviri koji Terminusu pomažu u pisanju kôda i sažimanju podataka s interneta.
Cijene API-ja
Naplaćuje se zbroj ulaznih i izlaznih tokena, uz nižu tarifu za „cache hit” (kada sustav koristi već pohranjene podatke):
– 1 M ulaznih tokena (cache hit): 0,07 USD
– 1 M ulaznih tokena (cache miss): 0,56 USD
– 1 M izlaznih tokena: 1,68 USD
Model je odmah dostupan putem DeepSeekovih mobilnih aplikacija, Hugging Facea i službenog API-ja, a ubrzo stiže i u popularne open-source alate AnyCoder i NovitaLabs. Tvrtkama koje žele potpunu kontrolu omogućeno je besplatno preuzimanje i samostalno hostanje pod MIT licencom.
Tehničke napomene
Arhitektura ostaje identična verziji V3.1, što olakšava prijenos postojećih rješenja. U trenutnom kontrolnom točki još je otvoreno pitanje parametra self_attn.o_proj koji ne prati UE8M0 FP8 standard; iz DeepSeeka poručuju da će to ispraviti u sljedećoj nadogradnji.
Što slijedi?
U zajednici se već šuška o verziji V4 te „najjačem” nasljedniku logičkog modela R1. DeepSeek zasad, međutim, nastavlja polirati obitelj V3, oslanjajući se na otvoreni kod i masovnu povratnu informaciju korisnika. Terminus je najnoviji dokaz da strategija čestih, inkrementalnih nadogradnji može održati tempo s najvećim igračima – i pritom ostati potpuno otvoren za prilagodbu.