CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

21. listopada 2025, 20:19

DeepSeek predstavio OCR koji deset puta skraćuje tekst i otvara put golemoj kontekstualnoj memoriji

DeepSeek objavio potpuno otvoren OCR model koji tekst komprimira kroz slike, omogućujući deset puta veće kontekstualne prozore za velike jezične modele.

min. čitanja

XFacebookWhatsApp

Kineska istraživačka tvrtka DeepSeek ponovno je uzdrmala pretpostavke o troškovima i metodama razvoja umjetne inteligencije. Najnoviji model, nazvan DeepSeek-OCR, objavljen je s potpunim otvorenim kodom i težinama, a nudi ono što autori nazivaju „inverzijom paradigme” u obradi jezika: tekst pretvara u vizualni zapis i tako ga komprimira i do deset puta učinkovitije od uobičajenih tekstualnih tokena.

„Through DeepSeek-OCR, we demonstrate that vision-text compression can achieve significant token reduction (7-20×) for different historical context stages, offering a promising direction for addressing long-context challenges in large language models”, navodi se u službenom radu. U praksi to znači da bi budući jezični modeli mogli odjednom obuhvaćati desetke milijuna tokena – višestruko više od današnjih granica.

Programer i su-osnivač OpenAI-ja Andrej Karpathy u objavi je reagirao riječima: „Maybe it makes more sense that all inputs to LLMs should only ever be images… Even if you happen to have pure text input, maybe you'd prefer to render it and then feed that in.” Njegov komentar odražava osjećaj dijela zajednice da bi vizualni pristup mogao postati novi standard u obradi jezika.

Ključne komponente • DeepEncoder – vizualni enkoder od 380 milijuna parametara koji spaja lokalnu percepciju iz Meta-ina SAM-a i globalno razumijevanje iz OpenAI-jevog CLIP-a te dodatno koristi modul za 16-struku kompresiju. • Mixture-of-experts dekoder – jezični model od 3 milijarde parametara (570 milijuna aktivnih) koji prevodi vizualne tokene natrag u tekst.

U testiranju na skupu Fox, model je s tek 100 vizualnih tokena dosegnuo 97,3 % točnosti na dokumentima sa 700–800 tekstualnih tokena, što predstavlja kompresijski omjer 7,5 : 1. Čak i pri omjerima blizu 20 : 1 preciznost je ostala oko 60 %.

Prijenos u praksi DeepSeek tvrdi da jedno Nvidia A100-40G grafičko procesorsko sučelje može obraditi više od 200 000 stranica dnevno. Skupina od 20 poslužitelja, svaki s osam takvih GPU-ova, prema projekciji doseže 33 milijuna stranica dnevno – dovoljno za brzo slaganje golemih skupova podataka za treniranje drugih AI sustava.

Podloga za uspjeh nalazi se i u opsežnoj obuci: 30 milijuna PDF-ova na oko 100 jezika, od čega 25 milijuna na kineskom i engleskom, te devet vrsta dokumenata – od znanstvenih radova do rukom pisanih bilješki.

Za razliku od mnogih komercijalnih laboratorija, DeepSeek je sve – od težina do skripti za inferenciju – postavio na GitHub i Hugging Face, gdje je repozitorij u samo 24 sata prikupio više od 4 000 zvjezdica.

Otvorena objava potiče pitanje skrivaju li drugi laboratoriji slične tehnologije, ali i nudi istraživačima širom svijeta alat koji bi mogao proširiti granice konteksta velikih jezičnih modela brže nego što se do jučer smatralo mogućim.

#openai#hugging-face#deepseek#deepseek-ocr#andrej-karpathy
View post on X

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Nadolazeći „adult mode” ChatGPT-a budi strah od digitalnog voajerizma
OpenAI razmatra lansiranje erotskog „adult modea” za ChatGPT; stručnjaci upozoravaju na rizike masovnog prikupljanja iznimno intimnih podataka.

min čitanja

Više

Tehnologija

Obitelji tuže OpenAI: chatbot navodio tinejdžere na samoubojstvo
Kriza povjerenja u umjetnu inteligenciju: nakon smrti tinejdžera koji su razgovarali s chatbotovima, odvjetnici pokreću seriju tužbi protiv OpenAI-ja, Googlea i Character.ai-ja.

min čitanja

Više

Tehnologija

Kina odobrila prvi komercijalni moždani čip za osobe s paralizom
Implant NEO tvrtke Neuracle pretvara misao u pokret robotizirane rukavice, a Peking time najavljuje i širi plan dominacije tržištem BCI tehnologija.

min čitanja

Više

Tehnologija

Besplatan proljetni kamp u Rijeci spaja startup ideje i umjetnu inteligenciju
Otvorene prijave za četverodnevni RInovatoRI Spring Camp „StartUPgrade – AI edition“ u Art-kvartu Benčić.

min čitanja

Više

Tehnologija

AI aplikacije za praćenje prehrane nude brze upute, ali i nove brige
Nova generacija aplikacija koristi umjetnu inteligenciju za brže i detaljnije bilježenje obroka, no stručnjaci upozoravaju na netočnosti algoritama i rizik od opsesivnog brojanja kalorija.

min čitanja

Više

Tehnologija

Tinder ulaže u umjetnu inteligenciju kako bi izliječio rane koje je sam stvorio
Najpopularnija aplikacija za upoznavanje uvodi grupne spojeve, astrološko sparivanje i AI nadzor, pokušavajući sanirati pad korisničkog povjerenja i zaustaviti bijeg pretplatnika.

min čitanja

Više

Tehnologija

Fitness aplikacija odala tajnu: Strava otkrila položaj nosača Charles de Gaulle
Javno objavljeni GPS trag jutarnjeg trčanja časnika otkrio je preciznu lokaciju francuskog nosača zrakoplova u istočnom Sredozemlju, priopćila je vojska.

min čitanja

Više

Tehnologija

Googleova mreža Find Hub sada pomaže zračnim lukama pratiti izgubljenu prtljagu
Nova opcija u Googleovom Find Hubu omogućuje putnicima da lokaciju svoje prtljage izravno dijele sa zrakoplovnom kompanijom, skraćujući potragu na svega nekoliko klikova.

min čitanja

Više

Tehnologija

SAD srušio četiri goleme botnet mreže: rekordni DDoS napadi utišani
Američke agencije uklonile su botnetse s više od tri milijuna zaraženih uređaja, gaseći mreže koje su prošle jeseni srušile sve DDoS rekorde.

min čitanja

Više

Tehnologija

Golubovi Županja educirali pomoćnike o umjetnoj inteligenciji i najavili uskrsni štand
Izobrazba o umjetnoj inteligenciji okupila pomoćnike u nastavi, a udruga Golubovi nastavlja humanitarnu akciju uskrsnim radovima ispred Konzuma.

min čitanja

Više

Najčitanije

Politika

Istarski župan Miletić čestitao Ramazanski bajram
Župan Boris Miletić uputio je poruku mira, solidarnosti i zajedništva povodom Ramazanskog bajrama.

min čitanja

Više

Najnovije

Biznis

Bruxelles mijenja pravila: nova strategija brodogradnje otvara priliku hrvatskim škverovima

Vijesti

Rijeka otvara upise u gradske vrtiće: prijave isključivo online krajem ožujka

Vijesti

Labinski četvrtaši učili o vodi uoči Svjetskog dana voda

Sport

Rudar spreman za obračun s Brodom

Sport

Split Open vraća se na Firule: domaći tenisači love trofej pred svojom publikom

Vijesti

Preminula 71-godišnjakinja ozlijeđena u Belišću, vozaču prijeti kazneni progon

Lifestyle

CTK Rijeka otvara proljeće besplatnim radionicama za mlade

Tehnologija

Kina odobrila prvi komercijalni moždani čip za osobe s paralizom

Politika

Francuska mornarica ponovno presrela tanker iz „ruske flote u sjeni”

Lifestyle

„Glavonja” ruši rekorde i otvara vrata razumijevanju neurorazličitosti

Vijesti

Instruktor vozio pijan dok je podučavao kandidata