CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. rujna 2025, 20:34

DeepSeek ruši cijene uz V3.2-Exp: golemi model, upola jeftiniji rad s dugim kontekstom

DeepSeek lansirao V3.2-Exp, 685-milijardi-parametarski model s rijetkom pozornošću koji prepolovljuje troškove API-ja i podržava do 128 000 tokena.

min. čitanja

XFacebookWhatsApp

Kineski laboratorij DeepSeek predstavio je eksperimentalni veliki jezični model DeepSeek-V3.2-Exp kojim cilja istodobno zadržati razinu sposobnosti prethodnika i dramatično sniziti troškove rada.

Prepolovljene cijene API-ja

• 1 000 000 ulaznih tokena (cache hit): 0,028 USD
• 1 000 000 ulaznih tokena (cache miss): 0,28 USD
• 1 000 000 izlaznih tokena: 0,42 USD

U usporedbi s prošlotjednim modelom V3.1-Terminus, cijene su snižene približno 50 %. Terminus ostaje dostupan samo do 15. listopada, nakon čega ga tvrtka povlači.

Što donosi DeepSeek Sparse Attention

Ključ ušteda krije se u novoj arhitekturi DeepSeek Sparse Attention (DSA). Umjesto klasične „guste” samopozornosti, DSA uz pomoć tzv. „lightning indexera” bira samo najrelevantnije tokene pa se memorijski i računski zahtjevi sporije povećavaju s duljinom ulaza. To omogućuje:

• podršku do 128 000 tokena (oko 300–400 stranica teksta) bez brzog rasta cijene
• brže izvođenje i manju potrošnju GPU vremena na dugim promptovima
• gotovo jednaku kvalitetu odgovora kao kod prethodne generacije

Fino ugađanje: specijalisti i objedinjeno pojačano učenje

Post-trening odvija se u dvije faze:

  1. Specijalistička destilacija – izdvojeni modeli za matematiku, natjecateljsko programiranje, logičko zaključivanje, kodne agente i pretraživanje stvaraju domensko znanje koje se potom prelijeva natrag u glavni model.
  2. Reinforcement learning – umjesto višestupanjskog pristupa, razlozi, agenti i usklađivanje s ljudskim preferencijama objedinjeni su u jednu RL fazu korištenjem metode Group Relative Policy Optimization (GRPO). Tako se izbjegava „katastrofalno zaboravljanje”, a performanse ostaju uravnotežene.

Benchmark: gotovo ista snaga, znatno niži troškovi

Na javnim testovima V3.2-Exp postiže rezultate vrlo slične Terminusu. Blagi pad vidljiv je na pojedinim zahtjevnim zadacima zaključivanja, no u većini domena (programiranje, Q&A, sažimanje) učinak je praktički nepromijenjen, dok su troškovi značajno smanjeni.

Otvoreni kod i fleksibilno raspoređivanje

Model težak 685 milijardi parametara objavljen je pod MIT licencom na Hugging Faceu i GitHubu, zajedno s optimiziranim kernelima (CUDA/FlashMLA) i Docker slikama za NVIDIA H200, AMD MI350 i NPU sustave. Okviri poput SGLang i vLLM nude podršku od prvoga dana.

Organizacije mogu birati:

• Korištenje službenog API-ja – brzi start, predvidljivi troškovi, ali podatci prolaze kroz poslužitelje tvrtke sa sjedištem u Hong Kongu.
• Samostalno hostanje – potpuna kontrola nad podatcima i lokacijom, ali i veća inženjerska složenost te potreba za GPU-ima.

Šira slika i sljedeći koraci

Lansiranje V3.2-Exp dolazi samo tjedan dana nakon Terminusa, potvrđujući intenzivan ritam iteracija unutar DeepSeeka. Tvrtka zadržava filozofiju otvorenog koda, ali istodobno ispituje granice skalabilnosti i ekonomičnosti.

Iako je model označen kao eksperiment, interni testovi sugeriraju da bi upravo rijetka pozornost mogla postati temelj budućeg izdanja V3.3 ili čak V4.0. Za sada, V3.2-Exp nudi developerima i poduzećima rijetko viđenu kombinaciju visokih mogućnosti i niskih operativnih troškova, osobito pri radu s dugim kontekstom.

#hugging-face#deepseek#github#hong-kong#deepseek-sparse-attention

Slično

Tehnologija

Gotovo 9,1 milijun eura za transformaciju istraživačkog centra METRIS u Puli
Istarsko veleučilište osiguralo je 9,1 milijun eura iz europskog Fonda za pravednu tranziciju za proširenje prostora, nabavu opreme i razvoj novih programa u istraživačkom centru METRIS.

min čitanja

Više

Tehnologija

Toyota osvježila Corollu za 2026.: dizajn, hibrid i digitalija na prvom mjestu
Nova Toyota Corolla za 2026. donosi osvježen dizajn, napredne hibridne pogone i potpuno digitalno sučelje, uz standardni sigurnosni paket Toyota Safety Sense.

min čitanja

Više

Tehnologija

Hrvatska traži mjesto u svemiru: kolokvij na FER-u najavio novu strategiju i jače partnerstvo s Italijom
Kolokvij „Europska svemirska perspektiva“ na zagrebačkom FER-u otkrio plan izrade nacionalne svemirske strategije, dok Italija i ESA nude potporu hrvatskom ulasku u jače svemirske projekte.

min čitanja

Više

Tehnologija

Reddit tužbom izazvao australsku zabranu društvenih mreža za mlađe od 16
Reddit tvrdi da nova zabrana maloljetničkih računa na društvenim mrežama krši slobodu govora i privatnost, dok australska vlada brani mjeru kao zaštitu mladih.

min čitanja

Više

Tehnologija

AI Nomos 1 gotovo dosegao vrh na prestižnom Putnamu
Otvoreni AI sustav Nomos 1 iz Nous Researcha osvojio bi drugo mjesto na prestižnom Putnamovom natjecanju, dokazavši se kao gotovo ravnopravan ljudskim genijalcima.

min čitanja

Više

Tehnologija

Nova Gradiška dobiva AI podatkovni centar vrijedan do 450 milijuna eura
Grad i londonski NEOIX potpisali su predugovor: AI podatkovni centar od 50 MW trebao bi početi nicati u Novoj Gradiški za pola godine.

min čitanja

Više

Tehnologija

Muskovi prijetnje nakon kazne X-u unijele nelagodu u Bruxelles
Kazna od 120 milijuna eura za X izazvala je Muskov gnjev, a bruxelleski su dužnosnici zbog prijetnji počeli propitivati sigurnost putovanja u SAD.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Disney ulaže milijardu dolara u OpenAI i otvara svoje likove umjetnoj inteligenciji
Tek nakon niza tužbi Disney se okreće novoj strategiji: licencira likove OpenAI-ju, ulaže milijardu dolara i priprema se za eru AI videa na Disney+-u.

min čitanja

Više

Tehnologija

OpenAI predstavio GPT-5.2, najmoćniji model dosad
Novi GPT-5.2 donosi 400 000 tokena konteksta, tri razine rada i znatno višu cijenu API-ja, a OpenAI njime želi vratiti vodstvo u utrci s Googleovim Gemini 3.

min čitanja

Više

Tehnologija

Virtualna skrb za oboljele od KOPB-a širi se Michiganom
Priority Health sklapa partnerstvo s tvrtkom Kivo Health kako bi pacijentima s KOPB-om omogućio virtualnu, kućnu pulmološku rehabilitaciju u cijelom Michiganu.

min čitanja

Više

Najčitanije

Biznis

Hrvatski doprinos EU proračunu raste na 1,5 mlrd. eura godišnje
Plenković: Veći doprinos europskom proračunu posljedica je gospodarskog rasta, ali i obveza za još učinkovitije korištenje EU fondova.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Biznis

EU uvodi carinu od tri eura na mali uvozni paket
Fiksna carina od 3 eura po paketu ispod 150 eura stupa na snagu 2026. i najviše pogađa kineske internetske gigante Shein i Temu.

min čitanja

Više

Nogomet

Modrić talijanima: „Čekam vas na Svjetskom prvenstvu”
Kapetan Vatrenih u Milanu primio trofej „Legenda 2025” i pritom poručio Talijanima da ih očekuje na SP-u 2026., dok je oprezno ocijenio i hrvatsku skupinu s Engleskom, Panamom i Ganom.
By Светлана Бекетова - soccer.ru, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=70292659By Ludovic Péron - Own work, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=26599951

min čitanja

Više

Politika

Plenković uzvratio Milanoviću: „Neka u Parizu kaže što misli o Rafaleima”
Premijer odgovorio na Milanovićeve kritike o francuskim Rafaleima, stao u obranu molitelja na trgovima i komentirao aferu „6+6”.
Damir Sencar/HINA/POOL/PIXSELL/Social Democratic Party of Croatia, CC BY 3.0 HR <https://creativecommons.org/licenses/by/3.0/hr/deed.en>, via Wikimedia CommonsAutor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Najnovije

Politika

Novi Zakon o prostornom uređenju dobio snažnu podršku gospodarstva i geodetske struke

Lifestyle

Đakovo započelo advent: blagdanski sajam, ukrašavanje i klizalište

Vijesti

Senjani na nogama: humanitarni koncert Lige protiv raka prikupio više od 2 000 eura

Vijesti

Gripa ispraznila razrede i vrtiće, Tamiflu nestao iz ljekarni

Sport

Juventus zagrizao za Frattesija, Inter traži najmanje 35 milijuna eura

Lifestyle

Festival TranziT potvrdio snagu kazališta u izazovnim vremenima

Lifestyle

Najiznajmljivači 2025: priznanja najboljim domaćinima u Villi Propuh

Politika

Našice usvojile rekordan proračun, ali i najavile skuplji vrtić te komunalije

Lifestyle

„Zlatna boula” uručena najboljima: Zlarin, Knin i Skradin ponijeli glavne titule, novčane nagrade iznajmljivačima

Politika

Plenković: europski put i federalizam jedini su održivi smjer za BiH

Politika

Američke simulacije priznaju poraz SAD-a u mogućem sukobu s Kinom oko Tajvana