CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. rujna 2025, 20:34

DeepSeek ruši cijene uz V3.2-Exp: golemi model, upola jeftiniji rad s dugim kontekstom

DeepSeek lansirao V3.2-Exp, 685-milijardi-parametarski model s rijetkom pozornošću koji prepolovljuje troškove API-ja i podržava do 128 000 tokena.

min. čitanja

XFacebookWhatsApp

Kineski laboratorij DeepSeek predstavio je eksperimentalni veliki jezični model DeepSeek-V3.2-Exp kojim cilja istodobno zadržati razinu sposobnosti prethodnika i dramatično sniziti troškove rada.

Prepolovljene cijene API-ja

• 1 000 000 ulaznih tokena (cache hit): 0,028 USD
• 1 000 000 ulaznih tokena (cache miss): 0,28 USD
• 1 000 000 izlaznih tokena: 0,42 USD

U usporedbi s prošlotjednim modelom V3.1-Terminus, cijene su snižene približno 50 %. Terminus ostaje dostupan samo do 15. listopada, nakon čega ga tvrtka povlači.

Što donosi DeepSeek Sparse Attention

Ključ ušteda krije se u novoj arhitekturi DeepSeek Sparse Attention (DSA). Umjesto klasične „guste” samopozornosti, DSA uz pomoć tzv. „lightning indexera” bira samo najrelevantnije tokene pa se memorijski i računski zahtjevi sporije povećavaju s duljinom ulaza. To omogućuje:

• podršku do 128 000 tokena (oko 300–400 stranica teksta) bez brzog rasta cijene
• brže izvođenje i manju potrošnju GPU vremena na dugim promptovima
• gotovo jednaku kvalitetu odgovora kao kod prethodne generacije

Fino ugađanje: specijalisti i objedinjeno pojačano učenje

Post-trening odvija se u dvije faze:

  1. Specijalistička destilacija – izdvojeni modeli za matematiku, natjecateljsko programiranje, logičko zaključivanje, kodne agente i pretraživanje stvaraju domensko znanje koje se potom prelijeva natrag u glavni model.
  2. Reinforcement learning – umjesto višestupanjskog pristupa, razlozi, agenti i usklađivanje s ljudskim preferencijama objedinjeni su u jednu RL fazu korištenjem metode Group Relative Policy Optimization (GRPO). Tako se izbjegava „katastrofalno zaboravljanje”, a performanse ostaju uravnotežene.

Benchmark: gotovo ista snaga, znatno niži troškovi

Na javnim testovima V3.2-Exp postiže rezultate vrlo slične Terminusu. Blagi pad vidljiv je na pojedinim zahtjevnim zadacima zaključivanja, no u većini domena (programiranje, Q&A, sažimanje) učinak je praktički nepromijenjen, dok su troškovi značajno smanjeni.

Otvoreni kod i fleksibilno raspoređivanje

Model težak 685 milijardi parametara objavljen je pod MIT licencom na Hugging Faceu i GitHubu, zajedno s optimiziranim kernelima (CUDA/FlashMLA) i Docker slikama za NVIDIA H200, AMD MI350 i NPU sustave. Okviri poput SGLang i vLLM nude podršku od prvoga dana.

Organizacije mogu birati:

• Korištenje službenog API-ja – brzi start, predvidljivi troškovi, ali podatci prolaze kroz poslužitelje tvrtke sa sjedištem u Hong Kongu.
• Samostalno hostanje – potpuna kontrola nad podatcima i lokacijom, ali i veća inženjerska složenost te potreba za GPU-ima.

Šira slika i sljedeći koraci

Lansiranje V3.2-Exp dolazi samo tjedan dana nakon Terminusa, potvrđujući intenzivan ritam iteracija unutar DeepSeeka. Tvrtka zadržava filozofiju otvorenog koda, ali istodobno ispituje granice skalabilnosti i ekonomičnosti.

Iako je model označen kao eksperiment, interni testovi sugeriraju da bi upravo rijetka pozornost mogla postati temelj budućeg izdanja V3.3 ili čak V4.0. Za sada, V3.2-Exp nudi developerima i poduzećima rijetko viđenu kombinaciju visokih mogućnosti i niskih operativnih troškova, osobito pri radu s dugim kontekstom.

#hugging-face#deepseek#github#hong-kong#deepseek-sparse-attention

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Sigurnosni alarm nakon meteorskog uzleta OpenClawa na GitHubu
OpenClaw je u tjedan dana prikupio 180 000 GitHub zvjezdica, ali i razotkrio sigurnosne propuste u više od 1 800 javno dostupnih instanci.

min čitanja

Više

Tehnologija

Poziv na uklanjanje kineskih kamera s Magna Carte i Partenona
Aktivisti traže uklanjanje kineskih kamera Dahua i Hikvision s Magna Carte u Salisburyju i Partenona zbog sumnji na zloporabe protiv Ujgura i sigurnosnih hakiranja u Ukrajini.

min čitanja

Više

Tehnologija

Blue Origin pauzira svemirski turizam i preusmjerava sve snage na Mjesec
Tvrtka Jeffa Bezosa stavlja turističke letove na čekanje kako bi ubrzala razvoj lunarnog programa u sklopu NASA-ina Artemisa.

min čitanja

Više

Tehnologija

Precizna terapija mikrobioma donosi olakšanje oboljelima od sindroma iritabilnog crijeva
Nova kombinacija posebnih bakterijskih sojeva i bakteriofaga nudi ciljani pristup ublažavanju bolova, nadutosti i grčeva kod sindroma iritabilnog crijeva.

min čitanja

Više

Tehnologija

Arcee predstavio Trinity Large: 400-milijardni model otvorenog koda s rekordnom učinkovitošću
Arcee je lansirao Trinity Large, 400-milijardni MoE jezični model, te ponudio sirovi checkpoint TrueBase za neovisne revizije i prilagodbe.

min čitanja

Više

Tehnologija

PageIndex uvodi „navigacijsko” pretraživanje i podiže točnost RAG-a za duge dokumente
Otvoreni okvir PageIndex zamjenjuje klasično „chunk-and-embed” indeksiranje stablom sadržaja, čime poboljšava preciznost AI-a pri pretraživanju vrlo dugih i složenih dokumenata.

min čitanja

Više

Tehnologija

Rimac u St. Moritzu predstavio prvu Neveru R Founderʼs Edition
Na zaleđenom jezeru St. Moritz Rimac je isporučio prvi od svega deset primjeraka ekskluzivne Nevere R Founderʼs Edition, hiperautomobila od 2107 KS rasprodanog u tjedan dana.

min čitanja

Više

Tehnologija

Tehnološki lideri ujedinjeni protiv praksi ICE-a
Otvoreno pismo zaposlenika i šefova iz Silicijske doline poziva na prekid suradnje s američkom imigracijskom službom zbog nasilnih metoda.

min čitanja

Više

Tehnologija

Aplikacija Mobile Fortify širi ovlasti ICE-a: upozorenje na opasnu kombinaciju nadzora i pristranosti
Mobilna aplikacija ICE-a prikuplja biometrijske podatke i na američkim državljanima, čuva ih 15 godina i pokazuje velike stope pristranosti, upozoravaju tužbe i stručnjaci.

min čitanja

Više

Tehnologija

Nizozemski regulator pokrenuo istragu protiv Robloxa zbog zaštite djece
ACM sumnja da popularna platforma ne poštuje odredbe DSA-a o sigurnosti maloljetnika i najavljuje moguću novčanu kaznu.

min čitanja

Više

Najčitanije

Vijesti

Lažni policajci namamili 63-godišnjaka: policija razotkrila dobro osmišljenu telefonsku prijevaru
Zagrebačka policija kazneno prijavila četvoricu muškaraca koji su se predstavljali kao policajci i 63-godišnjaku uzeli novac, upozorava građane da policija nikada ne traži financijske podatke telefonom.

min čitanja

Više

Rukomet

Sigurdsson traži maksimum u borbi za europsku broncu protiv Islanda
Izbornik Dagur Sigurdsson ističe da su dvoboji za broncu posebni i najavljuje detaljnu analizu prethodnih susreta prije okršaja s Islandom na Europskom prvenstvu.

min čitanja

Više

Politika

Hajdaš Dončić obećao kraće radno vrijeme i jače oporezivanje kapitala
Predsjednik SDP-a na konvenciji stranke predstavio plan s kraćim radnim vremenom, višim porezima na kapital i oštrim kritikama HDZ-a.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986Autor Social Democratic Party of Croatia - https://flickr.com/photos/59485410@N07/29007717956, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=153450927

min čitanja

Više

Politika

Grafiti mržnje u Zagrebu: poziv na ubojstvo Milorada Pupovca oslikan u pothodniku
Na zidu zagrebačkog pothodnika ispisan je grafit s pozivom na ubojstvo Milorada Pupovca. Zastupnik SDSS-a poručuje da je riječ o nastavku kulture mržnje koja se slobodno širi javnim prostorom.
Autor Kepkke. - Моја особна архива. Kepkke., Javno vlasništvo, https://commons.wikimedia.org/w/index.php?curid=15184061

min čitanja

Više

Politika

Rijeka ostaje bez 3,8 milijuna eura: Fond nalaže povrat novca za kompromitiranu sortirnicu
Fond za zaštitu okoliša traži od Rijeke vraćanje 3,8 milijuna eura za projekt sortirnice, nakon presuda za korupciju u gradskoj upravi.

min čitanja

Više

Najnovije

Sport

Ajayi s dva gola donio Opatiji pobjedu i srebro na memorijalu „Drago Parać”

Politika

Karačić osporava tvrdnju da je antifašizam temelj hrvatskog identiteta

Biznis

Najskuplji stan u Šibeniku: bazen, mediteranski vrt i cijena od 1,15 milijuna eura

Vijesti

Policija razotkrila serijsku kradljivicu kućnih dekoracija u Zadru

Lifestyle

Riječkim Korzom zavladalo više od 6 500 malih maškara

Sport

Jan Bilen najbolji na šestoj Maškaranoj gimkani u Lovranu

Vijesti

Novo izdanje monografije o Turskoj kući otkriva slojevitu priču Rijeke

Vijesti

Aktivisti traže da Beč zauvijek ukloni spomenik antisemitističkom gradonačelniku

Sport

Kvandal uvjerljivo slavila u Willingenu, Nika Prevc učvrstila ukupno vodstvo

Politika

Vinkovci ispratili dugogodišnjeg župana Božu Galića

Sport

Kramarić s dva brza pogotka utišao Union