CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

14. studenog 2025, 20:39

Databricks predstavlja ai_parse_document: nova generacija AI obrade PDF-ova

Databricks je lansirao ai_parse_document, alat koji obećava precizno i višestruko jeftinije izvlačenje strukturiranih podataka iz složenih PDF-ova, izravno unutar svoje platforme.

min. čitanja

XFacebookWhatsApp

Databricks je u svojoj platformi Agent Bricks predstavio ai_parse_document, tehnologiju koja cilja na jedan od najvećih izazova u primjeni umjetne inteligencije u poslovanju – zaključane informacije u PDF-ovima. Tvrtka procjenjuje da se oko 80 % korporativnog znanja još uvijek nalazi u izvještajima, dijagramima i složenim dokumentima koje postojeći alati često pogrešno interpretiraju.

„It's a common assumption that parsing PDFs is a solved problem, but in reality, it isn't”, poručuje Erich Elsen, glavni istraživač u Databricksu. Prema njegovim riječima, klasični OCR sustavi gube ili krivo čitaju tablice s spojenim ćelijama, opise figura i prostorne odnose elemenata, što rezultira nepouzdanim nadograđenim AI analizama i poslovnim izvještajima.

Ključne mogućnosti nove funkcije:

  • očuvanje tablica onako kako izgledaju u izvornom dokumentu, uključujući ugniježđene strukture;
  • automatsko generiranje opisa figura i dijagrama;
  • bilježenje točnih koordinata svakog elementa u dokumentu;
  • opcionalni izlaz u obliku slika za multimodalno pretraživanje.

Rezultati se izravno spremaju u Unity Catalog kao Delta tablice, što omogućuje SQL upite nad podacima bez napuštanja Databricks okruženja. Elsen naglašava da su troškovi inferencije „3–5× niži” uz zadržavanje ili premašivanje kvalitete rješenja poput Textracta, Document AI-ja i Azure Document Intelligencea.

„To compensate, teams have had to stack multiple imperfect tools or build extensive custom pipelines, spending months on data engineering instead of innovation. ai_parse_document solves that by extracting complete, structured data from real-world documents — so organizations can finally trust and query unstructured data directly within Databricks.”

Primjene u praksi

• Rockwell Automation skratio je vrijeme podešavanja okruženja za podatkovne znanstvenike; • TE Connectivity je zamijenio kompleksne skripte jednom SQL funkcijom, čineći napredno parsiranje dostupnim i inženjerima podataka; • Emerson Electric koristi rješenje za brzu izgradnju RAG aplikacija unutar postojećeg Databricks sustava.

Funkcija je duboko integrirana s ostalim komponentama platforme, od Spark deklarativnih cjevovoda za automatsku obradu novih dokumenata, preko vektorskog pretraživanja, do lanca AI funkcija kao što su ai_extract, ai_classify i ai_summarize.

„Parsing is only the beginning and rarely an end unto itself”, zaključuje Elsen, ističući da je cilj pretvoriti korpus dokumenata u upotrebljivu bazu znanja za generativne ili informacijske agente.

Za tvrtke koje tek biraju AI infrastrukturu, ova objava signalizira pomak: inteligentno čitanje dokumenata prelazi iz zasebnih servisa u srž podatkovnih platformi, čime se smanjuje potreba za složenim povezivanjem vanjskih alata i ubrzava put do poslovnih uvida.

#databricks#erich-elsen#rockwell-automation#te-connectivity#emerson-electric

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Agentički AI korak po korak mijenja Global Business Services
Stručnjaci tvrde da će agentički AI, unatoč sporom startu, temeljito promijeniti način rada centara zajedničkih usluga – pod uvjetom da ga se uvede kroz pet jasnih koraka.

min čitanja

Više

Tehnologija

Njemačko-britanski Hypersonica obavio prvi europski let projektila bržeg od 6 Macha
Startup Hypersonica postao je prva privatna europska tvrtka koja je testirala hipersonični projektil brži od 6 Macha i osigurala 23,3 milijuna eura za nastavak razvoja.

min čitanja

Više

Tehnologija

Umjesto smeća, muzika: potrošeni vape pretvoreni u sinthesajzere
Njujorški kolektiv Paper Bag Team pretvara iskorištene jednokratne vape patrone u digitalne instrumente, spajajući borbu protiv e-otpada s eksperimentalnom glazbom.

min čitanja

Više

Tehnologija

Studiji na Sveučilištu Algebra Bernays nude brzu vezu s poslovima budućnosti
Algebra Bernays kroz programe iz programskog inženjerstva, podatkovne znanosti i kibernetičke sigurnosti priprema studente za rastuća ICT zanimanja, a uspjeh na EuroSkillsu 2025 potvrđuje vrijednost praktičnog pristupa.

min čitanja

Više

Tehnologija

Pravobraniteljica upozorava: djeci od malih nogu usađujte zdrave digitalne navike
Pravobraniteljica za djecu pozvala je roditelje i škole da od najranije dobi uče djecu sigurnom i uravnoteženom korištenju tehnologije, upozoravajući na rizike dijeljenja osobnih podataka i komunikacije s nepoznatima online.

min čitanja

Više

Tehnologija

AI prevario turiste: stotine putnika tražile nepostojeće toplice u Tasmaniji
Lažni AI članak o „najboljim tasmanijskim toplicama” naveo putnike da traže Weldborough Hot Springs, atrakciju koja nikada nije postojala.

min čitanja

Više

Tehnologija

Apple i Google nude ustupke kako bi izbjegli strože mjere britanskog regulatora
Apple i Google obećali britanskom regulatoru poštenije rangiranje aplikacija, zaštitu podataka developera i bolju interoperabilnost, uz upozorenje CMA-a da slijede strože mjere ako dogovor ne bude ispoštovan.

min čitanja

Više

Tehnologija

Sud EU-a otvorio vrata tvrtkama za izravne tužbe protiv odluka EDPB-a
CJEU je presudio da WhatsApp može izravno tužiti EDPB, otvarajući put drugim tvrtkama da osporavaju odluke europskog tijela za zaštitu podataka.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Ruski „bio-dronovi” izazvali strah: golubovi s moždanim čipovima otvaraju pitanja sigurnosti i etike
Neiry Group predstavio golubove s moždanim implantatima, no stručnjaci upozoravaju na rizike nadzora, biološkog ratovanja i narušavanja dobrobiti životinja.

min čitanja

Više

Tehnologija

Njemački Romeo poletio: eVTOL od 2,7 tona najavljuje revoluciju u hitnom zračnom prijevozu
Njemački ERC System predstavio je Romeo, težak 2,7 tona, kao jedan od najvećih europskih eVTOL prototipova namijenjenih hitnom prijevozu pacijenata.

min čitanja

Više

Najčitanije

Ostalo

Bronca za Laegreida, a u suzama pred kamerama priznao nevjeru
Norveški biatlonac šokirao je gledatelje nakon osvajanja olimpijske bronce iskrenim priznanjem da je prevario djevojku.

min čitanja

Više

Vijesti

Nelegalno odlaganje otpada na Pelješcu: kaznene prijave protiv direktorice komunalca i načelnika
Policija je otkrila neovlašteno odlaganje otpada iznad Ponikava na Pelješcu te kazneno prijavila direktoricu komunalnog društva, općinskog načelnika i još jednog građanina.

min čitanja

Više

Ostalo

Hrvatski dan na ZOI: šest nastupa bez prolaza, ali s vrijednim iskustvom
Nitko od šest hrvatskih natjecatelja nije prošao kvalifikacije, ali debitanti su stekli dragocjeno iskustvo na ZOI u Milanu i Cortini.

min čitanja

Više

Vijesti

Dubrovnik-neretvanski policajac osumnjičen za krađu droge iz sefa usred postaje
Policijski službenik iz Dubrovnika suspendiran je i kazneno prijavljen zbog sumnje da je iz službenog sefa otuđio marihuanu te pokušao novu krađu.

min čitanja

Više

Nogomet

Sudačka komisija kritizira ključne odluke s utakmice Lokomotiva – Gorica
HNS-ova sudačka komisija analizirala je šest spornih trenutaka 21. kola SuperSport HNL-a i utvrdila gdje je sudac pogriješio, a gdje je VAR ispravio odluke.

min čitanja

Više

Najnovije

Vijesti

Irska uvodi trajni temeljni dohodak za umjetnike

Politika

Europski parlament postigao dogovor o obnovi carinskog pakta s SAD-om

Politika

Vlada opet produžila mandat Ivici Budimiru na čelu Hrvatskih cesta

Lifestyle

Danijela Martinović vraća se na pozornicu Dore i prisjeća se velikog trijumfa iz 1998.

Sport

Perez nudi Camavingu i 60 milijuna eura za Enza Fernandeza

Politika

Vukovarska koalicija najavila pohod na Split i referendum o gotovini

Vijesti

Ledena cesta spojila estonske otoke, vozači bez pojasa i s ograničenjem brzine

Sport

Labinjanka Agata Miletić Lupetin brža od svih na 60 metara

Vijesti

Šest mrtvih u bugarskim planinama: „Gore od Twin Peaksa”, upozoravaju istražitelji

Sport

Taubitz potvrdila njemačku dominaciju u sanjkanju

Vijesti

Olujno jugo razvalilo šetnicu na Zvončacu, obnova cijele obale mogla bi potrajati desetljeće