CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

29. rujna 2025, 20:34

DeepSeek ruši cijene uz V3.2-Exp: golemi model, upola jeftiniji rad s dugim kontekstom

DeepSeek lansirao V3.2-Exp, 685-milijardi-parametarski model s rijetkom pozornošću koji prepolovljuje troškove API-ja i podržava do 128 000 tokena.

min. čitanja

XFacebookWhatsApp

Kineski laboratorij DeepSeek predstavio je eksperimentalni veliki jezični model DeepSeek-V3.2-Exp kojim cilja istodobno zadržati razinu sposobnosti prethodnika i dramatično sniziti troškove rada.

Prepolovljene cijene API-ja

• 1 000 000 ulaznih tokena (cache hit): 0,028 USD
• 1 000 000 ulaznih tokena (cache miss): 0,28 USD
• 1 000 000 izlaznih tokena: 0,42 USD

U usporedbi s prošlotjednim modelom V3.1-Terminus, cijene su snižene približno 50 %. Terminus ostaje dostupan samo do 15. listopada, nakon čega ga tvrtka povlači.

Što donosi DeepSeek Sparse Attention

Ključ ušteda krije se u novoj arhitekturi DeepSeek Sparse Attention (DSA). Umjesto klasične „guste” samopozornosti, DSA uz pomoć tzv. „lightning indexera” bira samo najrelevantnije tokene pa se memorijski i računski zahtjevi sporije povećavaju s duljinom ulaza. To omogućuje:

• podršku do 128 000 tokena (oko 300–400 stranica teksta) bez brzog rasta cijene
• brže izvođenje i manju potrošnju GPU vremena na dugim promptovima
• gotovo jednaku kvalitetu odgovora kao kod prethodne generacije

Fino ugađanje: specijalisti i objedinjeno pojačano učenje

Post-trening odvija se u dvije faze:

  1. Specijalistička destilacija – izdvojeni modeli za matematiku, natjecateljsko programiranje, logičko zaključivanje, kodne agente i pretraživanje stvaraju domensko znanje koje se potom prelijeva natrag u glavni model.
  2. Reinforcement learning – umjesto višestupanjskog pristupa, razlozi, agenti i usklađivanje s ljudskim preferencijama objedinjeni su u jednu RL fazu korištenjem metode Group Relative Policy Optimization (GRPO). Tako se izbjegava „katastrofalno zaboravljanje”, a performanse ostaju uravnotežene.

Benchmark: gotovo ista snaga, znatno niži troškovi

Na javnim testovima V3.2-Exp postiže rezultate vrlo slične Terminusu. Blagi pad vidljiv je na pojedinim zahtjevnim zadacima zaključivanja, no u većini domena (programiranje, Q&A, sažimanje) učinak je praktički nepromijenjen, dok su troškovi značajno smanjeni.

Otvoreni kod i fleksibilno raspoređivanje

Model težak 685 milijardi parametara objavljen je pod MIT licencom na Hugging Faceu i GitHubu, zajedno s optimiziranim kernelima (CUDA/FlashMLA) i Docker slikama za NVIDIA H200, AMD MI350 i NPU sustave. Okviri poput SGLang i vLLM nude podršku od prvoga dana.

Organizacije mogu birati:

• Korištenje službenog API-ja – brzi start, predvidljivi troškovi, ali podatci prolaze kroz poslužitelje tvrtke sa sjedištem u Hong Kongu.
• Samostalno hostanje – potpuna kontrola nad podatcima i lokacijom, ali i veća inženjerska složenost te potreba za GPU-ima.

Šira slika i sljedeći koraci

Lansiranje V3.2-Exp dolazi samo tjedan dana nakon Terminusa, potvrđujući intenzivan ritam iteracija unutar DeepSeeka. Tvrtka zadržava filozofiju otvorenog koda, ali istodobno ispituje granice skalabilnosti i ekonomičnosti.

Iako je model označen kao eksperiment, interni testovi sugeriraju da bi upravo rijetka pozornost mogla postati temelj budućeg izdanja V3.3 ili čak V4.0. Za sada, V3.2-Exp nudi developerima i poduzećima rijetko viđenu kombinaciju visokih mogućnosti i niskih operativnih troškova, osobito pri radu s dugim kontekstom.

#hugging-face#deepseek#github#hong-kong#deepseek-sparse-attention

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Kina odobrila prvi komercijalni moždani čip za osobe s paralizom
Implant NEO tvrtke Neuracle pretvara misao u pokret robotizirane rukavice, a Peking time najavljuje i širi plan dominacije tržištem BCI tehnologija.

min čitanja

Više

Tehnologija

Besplatan proljetni kamp u Rijeci spaja startup ideje i umjetnu inteligenciju
Otvorene prijave za četverodnevni RInovatoRI Spring Camp „StartUPgrade – AI edition“ u Art-kvartu Benčić.

min čitanja

Više

Tehnologija

AI aplikacije za praćenje prehrane nude brze upute, ali i nove brige
Nova generacija aplikacija koristi umjetnu inteligenciju za brže i detaljnije bilježenje obroka, no stručnjaci upozoravaju na netočnosti algoritama i rizik od opsesivnog brojanja kalorija.

min čitanja

Više

Tehnologija

Tinder ulaže u umjetnu inteligenciju kako bi izliječio rane koje je sam stvorio
Najpopularnija aplikacija za upoznavanje uvodi grupne spojeve, astrološko sparivanje i AI nadzor, pokušavajući sanirati pad korisničkog povjerenja i zaustaviti bijeg pretplatnika.

min čitanja

Više

Tehnologija

Fitness aplikacija odala tajnu: Strava otkrila položaj nosača Charles de Gaulle
Javno objavljeni GPS trag jutarnjeg trčanja časnika otkrio je preciznu lokaciju francuskog nosača zrakoplova u istočnom Sredozemlju, priopćila je vojska.

min čitanja

Više

Tehnologija

Googleova mreža Find Hub sada pomaže zračnim lukama pratiti izgubljenu prtljagu
Nova opcija u Googleovom Find Hubu omogućuje putnicima da lokaciju svoje prtljage izravno dijele sa zrakoplovnom kompanijom, skraćujući potragu na svega nekoliko klikova.

min čitanja

Više

Tehnologija

SAD srušio četiri goleme botnet mreže: rekordni DDoS napadi utišani
Američke agencije uklonile su botnetse s više od tri milijuna zaraženih uređaja, gaseći mreže koje su prošle jeseni srušile sve DDoS rekorde.

min čitanja

Više

Tehnologija

Golubovi Županja educirali pomoćnike o umjetnoj inteligenciji i najavili uskrsni štand
Izobrazba o umjetnoj inteligenciji okupila pomoćnike u nastavi, a udruga Golubovi nastavlja humanitarnu akciju uskrsnim radovima ispred Konzuma.

min čitanja

Više

Tehnologija

Udruga Žmergo 21. ožujka organizira „Digitalnu čistku” i poziva građane na brisanje digitalnog otpada
Žmergo poziva građane da 21. ožujka izbrišu nepotrebne datoteke i tako smanje vlastiti ugljični otisak.

min čitanja

Više

Tehnologija

Od kamena do klika: Arheološki muzej u Splitu lansirao digitalnu Salonu i virtualne zbirke
Splitski Arheološki muzej predstavio je projekte digitalizacije zbirki, knjižnične građe i Salone u proširenoj stvarnosti, otvarajući baštinu široj publici.

min čitanja

Više

Najčitanije

Politika

Istarski župan Miletić čestitao Ramazanski bajram
Župan Boris Miletić uputio je poruku mira, solidarnosti i zajedništva povodom Ramazanskog bajrama.

min čitanja

Više

Najnovije

Biznis

Bruxelles mijenja pravila: nova strategija brodogradnje otvara priliku hrvatskim škverovima

Vijesti

Rijeka otvara upise u gradske vrtiće: prijave isključivo online krajem ožujka

Vijesti

Labinski četvrtaši učili o vodi uoči Svjetskog dana voda

Sport

Rudar spreman za obračun s Brodom

Sport

Split Open vraća se na Firule: domaći tenisači love trofej pred svojom publikom

Vijesti

Preminula 71-godišnjakinja ozlijeđena u Belišću, vozaču prijeti kazneni progon

Lifestyle

CTK Rijeka otvara proljeće besplatnim radionicama za mlade

Tehnologija

Kina odobrila prvi komercijalni moždani čip za osobe s paralizom

Politika

Francuska mornarica ponovno presrela tanker iz „ruske flote u sjeni”

Lifestyle

„Glavonja” ruši rekorde i otvara vrata razumijevanju neurorazličitosti

Vijesti

Instruktor vozio pijan dok je podučavao kandidata