CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

21. listopada 2025, 20:19

DeepSeek predstavio OCR koji deset puta skraćuje tekst i otvara put golemoj kontekstualnoj memoriji

DeepSeek objavio potpuno otvoren OCR model koji tekst komprimira kroz slike, omogućujući deset puta veće kontekstualne prozore za velike jezične modele.

min. čitanja

XFacebookWhatsApp

Kineska istraživačka tvrtka DeepSeek ponovno je uzdrmala pretpostavke o troškovima i metodama razvoja umjetne inteligencije. Najnoviji model, nazvan DeepSeek-OCR, objavljen je s potpunim otvorenim kodom i težinama, a nudi ono što autori nazivaju „inverzijom paradigme” u obradi jezika: tekst pretvara u vizualni zapis i tako ga komprimira i do deset puta učinkovitije od uobičajenih tekstualnih tokena.

„Through DeepSeek-OCR, we demonstrate that vision-text compression can achieve significant token reduction (7-20×) for different historical context stages, offering a promising direction for addressing long-context challenges in large language models”, navodi se u službenom radu. U praksi to znači da bi budući jezični modeli mogli odjednom obuhvaćati desetke milijuna tokena – višestruko više od današnjih granica.

Programer i su-osnivač OpenAI-ja Andrej Karpathy u objavi je reagirao riječima: „Maybe it makes more sense that all inputs to LLMs should only ever be images… Even if you happen to have pure text input, maybe you'd prefer to render it and then feed that in.” Njegov komentar odražava osjećaj dijela zajednice da bi vizualni pristup mogao postati novi standard u obradi jezika.

Ključne komponente • DeepEncoder – vizualni enkoder od 380 milijuna parametara koji spaja lokalnu percepciju iz Meta-ina SAM-a i globalno razumijevanje iz OpenAI-jevog CLIP-a te dodatno koristi modul za 16-struku kompresiju. • Mixture-of-experts dekoder – jezični model od 3 milijarde parametara (570 milijuna aktivnih) koji prevodi vizualne tokene natrag u tekst.

U testiranju na skupu Fox, model je s tek 100 vizualnih tokena dosegnuo 97,3 % točnosti na dokumentima sa 700–800 tekstualnih tokena, što predstavlja kompresijski omjer 7,5 : 1. Čak i pri omjerima blizu 20 : 1 preciznost je ostala oko 60 %.

Prijenos u praksi DeepSeek tvrdi da jedno Nvidia A100-40G grafičko procesorsko sučelje može obraditi više od 200 000 stranica dnevno. Skupina od 20 poslužitelja, svaki s osam takvih GPU-ova, prema projekciji doseže 33 milijuna stranica dnevno – dovoljno za brzo slaganje golemih skupova podataka za treniranje drugih AI sustava.

Podloga za uspjeh nalazi se i u opsežnoj obuci: 30 milijuna PDF-ova na oko 100 jezika, od čega 25 milijuna na kineskom i engleskom, te devet vrsta dokumenata – od znanstvenih radova do rukom pisanih bilješki.

Za razliku od mnogih komercijalnih laboratorija, DeepSeek je sve – od težina do skripti za inferenciju – postavio na GitHub i Hugging Face, gdje je repozitorij u samo 24 sata prikupio više od 4 000 zvjezdica.

Otvorena objava potiče pitanje skrivaju li drugi laboratoriji slične tehnologije, ali i nudi istraživačima širom svijeta alat koji bi mogao proširiti granice konteksta velikih jezičnih modela brže nego što se do jučer smatralo mogućim.

#openai#hugging-face#deepseek#deepseek-ocr#andrej-karpathy
View post on X

Slično

Tehnologija

Nvidia otvara karte: Nemotron 3 želi zadržati AI svijet na njenim čipovima
Nvidia je lansirala Nemotron 3, liniju otvorenih AI modela dostupnih u tri veličine, te objavila prateće podatke i alate za prilagodbu, nadajući se da će otvorenost očuvati potražnju za njezinim čipovima u sve konkurentnijem tržištu.

min čitanja

Više

Tehnologija

Tvrtke zaostaju za glasovnim botovima: zastarjela infrastruktura guši napredak konverzacijske umjetne inteligencije
Konverzacijska umjetna inteligencija zahtijeva milisekundni uvid u sve što korisnik govori i osjeća, no većina poduzeća još se oslanja na zastarjele CRM sustave. Izvješće Twilia otkriva da 54 % potrošača osjeća nedostatak konteksta, što vodi frustrirajućim ponavljanjima i prekidima.

min čitanja

Više

Tehnologija

Prvi baterijski vlak povezao Split i Kaštela, uvodi se 14 novih linija
Na relaciji Split – Kaštel Stari krenuo je prvi baterijski vlak u Hrvatskoj; uvedeno 14 novih polazaka i otvorene dvije postaje, a planovi modernizacije najavljuju dodatna poboljšanja.

min čitanja

Više

Tehnologija

Pula dobiva gigabitnu optiku: 3.860 adresa ulazi u mrežu Hrvatskog Telekoma
Hrvatski Telekom započeo je gradnju gigabitne optičke mreže u Puli, obuhvatit će 3.860 „bijelih” adresa, a završetak se očekuje 2026.

min čitanja

Više

Tehnologija

Nvidia predstavila Nemotron 3: hibridna arhitektura i do 500 milijardi parametara
Nvidia je objavila treću generaciju svojih AI modela, donoseći hibridnu MoE arhitekturu, milijun-token kontekst i varijante do 500 milijardi parametara.

min čitanja

Više

Tehnologija

Anušić okuplja industriju: Hrvatska cilja samodostatnu obrambenu tehnologiju
Industry Day u organizaciji MORH-a spojio je velike tvrtke, start-upove i akademiju kako bi Hrvatska razvila konkurentnu i samodostatnu obrambenu industriju.
Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150013985

min čitanja

Više

Tehnologija

Od 2027. cestarina bez zaustavljanja: novi elektronički sustav mijenja vožnju autocestama
Sabor usvojio zakon kojim se od ožujka 2027. na svim autocestama uvodi sustav elektroničke naplate cestarine bez zaustavljanja.

min čitanja

Više

Tehnologija

Start-up HyprLabs tvrdi da autonomno vozi uz znatno manje podataka
Start-up HyprLabs iz San Francisca i Pariza tvrdi da njegov softver za autonomnu vožnju uči u realnom vremenu te mu treba tek djelić podataka u odnosu na konkurenciju.

min čitanja

Više

Tehnologija

Mlada tvrtka pretvara otpad od piva i gina u ekološku „kožu”
BioTech Materials Tamare Vučetić i Andreja Marića razvija ekološku alternativu koži koristeći otpad iz proizvodnje piva i gina.

min čitanja

Više

Tehnologija

Google uvodi hitni prijenos uživo na Androidu i nove geste za Pixel Watch 4
Novi hitni sustav prijenosa uživo na Androidu i gestama bogatiji Pixel Watch 4 stižu putem nadogradnji softvera.

min čitanja

Više

Najčitanije

Vijesti

Riječka policija uhitila Brazilku traženu zbog trgovanja ljudima
Žena (43) koju traži brazilski Interpol uhićena je u Rijeci, a u istom stanu policija je zatekla i 30-godišnju sunarodnjakinju koja se bavila prostitucijom.

min čitanja

Više

Nogomet

Valladolid smijenio trenera Almadu čim je Oviedo pokazao interes
Drugoligaš je ekspresno otpustio trenera nakon što je prvoligaš Oviedo, koji je jučer smijenio vlastitog stratega, istražio mogućnost njegova angažmana.

min čitanja

Više

Vijesti

Država kreće u pregovore za rušenje nebodera Vjesnik
Branko Bačić otkrio je da je za uklanjanje nebodera Vjesnik stiglo 18 ponuda vrijednih do pet milijuna eura; slijedi pregovarački postupak odabira izvođača.
Petar Krupić, CC BY-SA 4.0 <https://creativecommons.org/licenses/by-sa/4.0>, via Wikimedia Commons

min čitanja

Više

Najnovije

Politika

Europski čelnici nude multinacionalne snage za nadzor mira u Ukrajini

Politika

Atena upozorava na „agro Grexit” dok traktori i dalje blokiraju Grčku

Vijesti

Njemački časnici iz Prvog svjetskog rata prvi osuđeni za ubijanje preživjelih brodolomaca

Politika

Opatija planira besplatan prijevoz za umirovljenike: Kirigin otkrio detalje

Politika

Velike članice EU-a ‘ohladile’ plan Bruxellesa za centraliziranu elektroenergetsku mrežu

Sport

Rebićev bljesak prekinuo hajdukov post: Lokomotiva pala u Maksimiru

Vijesti

Devetnaest godina bez pravde: apel Marina Miočića Stošića za neriješeni slučaj poginulih sestara Filipović

Politika

Šef pravnih poslova Europskog parlamenta suočen sa zahtjevom za skidanje imuniteta

Lifestyle

Splitska kantautorica Mika Štajner debitira s EP-jem „Sjene”

Sport

Fiorentina pred trećom trenerskom promjenom: Vanoli na izlaznim vratima nakon niza poraza

Vijesti

Louvre zatvoren: štrajk osoblja blokirao ulaz za tisuće posjetitelja