CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. rujna 2025, 20:34

DeepSeek ruši cijene uz V3.2-Exp: golemi model, upola jeftiniji rad s dugim kontekstom

DeepSeek lansirao V3.2-Exp, 685-milijardi-parametarski model s rijetkom pozornošću koji prepolovljuje troškove API-ja i podržava do 128 000 tokena.

min. čitanja

Kineski laboratorij DeepSeek predstavio je eksperimentalni veliki jezični model DeepSeek-V3.2-Exp kojim cilja istodobno zadržati razinu sposobnosti prethodnika i dramatično sniziti troškove rada.

Prepolovljene cijene API-ja

• 1 000 000 ulaznih tokena (cache hit): 0,028 USD
• 1 000 000 ulaznih tokena (cache miss): 0,28 USD
• 1 000 000 izlaznih tokena: 0,42 USD

U usporedbi s prošlotjednim modelom V3.1-Terminus, cijene su snižene približno 50 %. Terminus ostaje dostupan samo do 15. listopada, nakon čega ga tvrtka povlači.

Što donosi DeepSeek Sparse Attention

Ključ ušteda krije se u novoj arhitekturi DeepSeek Sparse Attention (DSA). Umjesto klasične „guste” samopozornosti, DSA uz pomoć tzv. „lightning indexera” bira samo najrelevantnije tokene pa se memorijski i računski zahtjevi sporije povećavaju s duljinom ulaza. To omogućuje:

• podršku do 128 000 tokena (oko 300–400 stranica teksta) bez brzog rasta cijene
• brže izvođenje i manju potrošnju GPU vremena na dugim promptovima
• gotovo jednaku kvalitetu odgovora kao kod prethodne generacije

Fino ugađanje: specijalisti i objedinjeno pojačano učenje

Post-trening odvija se u dvije faze:

  1. Specijalistička destilacija – izdvojeni modeli za matematiku, natjecateljsko programiranje, logičko zaključivanje, kodne agente i pretraživanje stvaraju domensko znanje koje se potom prelijeva natrag u glavni model.
  2. Reinforcement learning – umjesto višestupanjskog pristupa, razlozi, agenti i usklađivanje s ljudskim preferencijama objedinjeni su u jednu RL fazu korištenjem metode Group Relative Policy Optimization (GRPO). Tako se izbjegava „katastrofalno zaboravljanje”, a performanse ostaju uravnotežene.

Benchmark: gotovo ista snaga, znatno niži troškovi

Na javnim testovima V3.2-Exp postiže rezultate vrlo slične Terminusu. Blagi pad vidljiv je na pojedinim zahtjevnim zadacima zaključivanja, no u većini domena (programiranje, Q&A, sažimanje) učinak je praktički nepromijenjen, dok su troškovi značajno smanjeni.

Otvoreni kod i fleksibilno raspoređivanje

Model težak 685 milijardi parametara objavljen je pod MIT licencom na Hugging Faceu i GitHubu, zajedno s optimiziranim kernelima (CUDA/FlashMLA) i Docker slikama za NVIDIA H200, AMD MI350 i NPU sustave. Okviri poput SGLang i vLLM nude podršku od prvoga dana.

Organizacije mogu birati:

• Korištenje službenog API-ja – brzi start, predvidljivi troškovi, ali podatci prolaze kroz poslužitelje tvrtke sa sjedištem u Hong Kongu.
• Samostalno hostanje – potpuna kontrola nad podatcima i lokacijom, ali i veća inženjerska složenost te potreba za GPU-ima.

Šira slika i sljedeći koraci

Lansiranje V3.2-Exp dolazi samo tjedan dana nakon Terminusa, potvrđujući intenzivan ritam iteracija unutar DeepSeeka. Tvrtka zadržava filozofiju otvorenog koda, ali istodobno ispituje granice skalabilnosti i ekonomičnosti.

Iako je model označen kao eksperiment, interni testovi sugeriraju da bi upravo rijetka pozornost mogla postati temelj budućeg izdanja V3.3 ili čak V4.0. Za sada, V3.2-Exp nudi developerima i poduzećima rijetko viđenu kombinaciju visokih mogućnosti i niskih operativnih troškova, osobito pri radu s dugim kontekstom.

#hugging-face#deepseek#github#hong-kong#deepseek-sparse-attention

Slično

Tehnologija

GitHub predstavlja Agent HQ: jedinstveni kontrolni toranj za više AI agenata
Nova platforma centralizira upravljanje više konkurentskih AI pomoćnika za pisanje koda, uvodi granularnu sigurnost i mogućnost definiranja vlastitih „custom” agenata.

min čitanja

Više

Tehnologija

IBM predstavio Granite 4.0 Nano: moćni jezični modeli stanu na prijenosno računalo
IBM lansira Granite 4.0 Nano, četvero malih jezičnih modela koji nude vrhunske rezultate i otvorenu licencu, a rade čak i na običnom prijenosniku.

min čitanja

Više

Tehnologija

Microsoft širi Copilot: razgovorom do aplikacija i automatizacije bez linije koda
Copilot dobiva App Builder, Workflows i novu verziju Copilot Studija, čime Microsoft želi omogućiti milijunima uredskih radnika da bez pisanja koda stvaraju aplikacije i automatiziraju poslove.

min čitanja

Više

Tehnologija

Polygraf AI prikupio 9,5 milijuna dolara za jačanje sigurnosti u poslovnoj primjeni umjetne inteligencije
Američki startup osigurao je 9,5 milijuna dolara kako bi svoje male jezične modele stavio u službu borbe protiv deepfakeova, curenja podataka i drugih AI prijetnji u osjetljivim industrijama.

min čitanja

Više

Tehnologija

Fortanix i NVIDIA predstavljaju platformu za „povjerljivu“ umjetnu inteligenciju
Sigurnosna tvrtka udružuje se s NVIDIA-jom i donosi rješenje koje čuva povjerljivost podataka i modela u reguliranim sektorima.

min čitanja

Više

Tehnologija

Jesu li stari automobili stvarno bili bolji?
Analiza ruši mit da su stari automobili bili superiorni: današnji su brži, sigurniji i tehnološki napredniji, dok nostalgija uglavnom počiva na dizajnu i raznolikosti koje je progutala SUV revolucija.

min čitanja

Više

Tehnologija

Osijek pionir kontrastne mamografije uz potporu umjetne inteligencije
Kontrastna mamografija u Domu zdravlja Osijek postiže osjetljivost veću od 90 %, a umjetna inteligencija dodatno povećava pouzdanost nalaza.

min čitanja

Više

Tehnologija

SiLC proširuje sjedište u Monroviji i jača domaću proizvodnju fotoničkih sustava
Kalifornijski SiLC investira u širenje pogona kako bi ubrzao serijsku proizvodnju silicijskih fotoničkih čipova i vizijskih sustava za industrijsku automatizaciju i obranu.

min čitanja

Više

Tehnologija

Eon predstavio aplikaciju koja mobitel pretvara u ključ: najam električnih vozila bez čekanja
Redizajnirana Eonova aplikacija uvodi digitalni ključ, ukida šaltere i skraćuje proces najma električnih vozila na manje od minute.

min čitanja

Više

Tehnologija

Dan Warmenhoven pridružio se upravnom odboru Secret Double Octopusa
Veteran koji je NetApp doveo do statusa S&P500 diva preuzima savjetničku ulogu u tvrtki specijaliziranoj za autentifikaciju bez lozinki.

min čitanja

Više

Najčitanije

Vijesti

Autor See File history below for details. - Own work based on: Flag of Serbia construction sheet.svg (Construction sheet)The Government of Serbia, National symbols srbija.gov.rs, Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=65419036
Tragedija na autocesti Novi Sad – Beograd: poginulo dijete, osmero teško ozlijeđenih
Jedno dijete smrtno je stradalo, a osmero osoba teško je ozlijeđeno u slijetanju kombija s autoceste Novi Sad – Beograd.

min čitanja

Više

Vijesti

Na Ovčari možda pronađeni ostaci francuskog heroja Nicoliera
Neslužbeno se doznaje da su u masovnoj grobnici na Ovčari ekshumirani posmrtni ostaci francuskog dragovoljca Jean-Michela Nicoliera, a službena identifikacija najavljena je za sutra u Vukovaru.
By Government of the Republic of Croatia, Attribution, https://commons.wikimedia.org/w/index.php?curid=48182733

min čitanja

Više

Nogomet

Anguissa donio Napoliju pobjedu u Lecceu, Milinković-Savić obranio penal
Napoli je u 9. kolu Serie A svladao Lecce 1-0 pogotkom Franka Anguisse, uz obranjeni penal Vanje Milinkovića-Savića.

min čitanja

Više

Najnovije

Politika

Mještani Svinca dižu glas protiv prostornog plana: „Postajemo rezervat bez prava na gradnju”

Politika

Dokumentarac „Facing War” otkriva posljednju godinu Jensa Stoltenberga na čelu NATO-a

Vijesti

Pješakinja lakše ozlijeđena na semaforiziranom prijelazu u Vukovaru

Vijesti

Eksplozivni dronovi nad rodnim gradom „El Chapa” šire paniku u Sinaloi

Sport

Klara Degmečić donijela zlato s Prana Opena

Vijesti

Učitelj iz Vrgorca odlikovan za 105 darivanja krvi

Politika

Bulj pod vatrom vlastitog kluba: mostovci odbili izvješće vlastitog gradonačelnika, pa krivnju svalili na većinu

Sport

Getafe nemilosrdno izbacio šesteroligaša uz 11 pogodaka

Sport

Brač ispisao tenisku povijest: 102-godišnji Australac i 97-godišnji Amerikanac odigrali najstariji meč ikad

Politika

Nusantara bi mogla ostati prazna: indonezijsko novo „političko” sjedište gubi novac, radnike i elan

Politika

Veća kvota za plavoperajnu tunu donosi predah hrvatskim ribarima