CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

14. studenog 2025, 20:39

Databricks predstavlja ai_parse_document: nova generacija AI obrade PDF-ova

Databricks je lansirao ai_parse_document, alat koji obećava precizno i višestruko jeftinije izvlačenje strukturiranih podataka iz složenih PDF-ova, izravno unutar svoje platforme.

min. čitanja

XFacebookWhatsApp

Databricks je u svojoj platformi Agent Bricks predstavio ai_parse_document, tehnologiju koja cilja na jedan od najvećih izazova u primjeni umjetne inteligencije u poslovanju – zaključane informacije u PDF-ovima. Tvrtka procjenjuje da se oko 80 % korporativnog znanja još uvijek nalazi u izvještajima, dijagramima i složenim dokumentima koje postojeći alati često pogrešno interpretiraju.

„It's a common assumption that parsing PDFs is a solved problem, but in reality, it isn't”, poručuje Erich Elsen, glavni istraživač u Databricksu. Prema njegovim riječima, klasični OCR sustavi gube ili krivo čitaju tablice s spojenim ćelijama, opise figura i prostorne odnose elemenata, što rezultira nepouzdanim nadograđenim AI analizama i poslovnim izvještajima.

Ključne mogućnosti nove funkcije:

  • očuvanje tablica onako kako izgledaju u izvornom dokumentu, uključujući ugniježđene strukture;
  • automatsko generiranje opisa figura i dijagrama;
  • bilježenje točnih koordinata svakog elementa u dokumentu;
  • opcionalni izlaz u obliku slika za multimodalno pretraživanje.

Rezultati se izravno spremaju u Unity Catalog kao Delta tablice, što omogućuje SQL upite nad podacima bez napuštanja Databricks okruženja. Elsen naglašava da su troškovi inferencije „3–5× niži” uz zadržavanje ili premašivanje kvalitete rješenja poput Textracta, Document AI-ja i Azure Document Intelligencea.

„To compensate, teams have had to stack multiple imperfect tools or build extensive custom pipelines, spending months on data engineering instead of innovation. ai_parse_document solves that by extracting complete, structured data from real-world documents — so organizations can finally trust and query unstructured data directly within Databricks.”

Primjene u praksi

• Rockwell Automation skratio je vrijeme podešavanja okruženja za podatkovne znanstvenike; • TE Connectivity je zamijenio kompleksne skripte jednom SQL funkcijom, čineći napredno parsiranje dostupnim i inženjerima podataka; • Emerson Electric koristi rješenje za brzu izgradnju RAG aplikacija unutar postojećeg Databricks sustava.

Funkcija je duboko integrirana s ostalim komponentama platforme, od Spark deklarativnih cjevovoda za automatsku obradu novih dokumenata, preko vektorskog pretraživanja, do lanca AI funkcija kao što su ai_extract, ai_classify i ai_summarize.

„Parsing is only the beginning and rarely an end unto itself”, zaključuje Elsen, ističući da je cilj pretvoriti korpus dokumenata u upotrebljivu bazu znanja za generativne ili informacijske agente.

Za tvrtke koje tek biraju AI infrastrukturu, ova objava signalizira pomak: inteligentno čitanje dokumenata prelazi iz zasebnih servisa u srž podatkovnih platformi, čime se smanjuje potreba za složenim povezivanjem vanjskih alata i ubrzava put do poslovnih uvida.

#databricks#erich-elsen#rockwell-automation#te-connectivity#emerson-electric

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Mini FabLab u Puli pretvara ideje u stvarnost
Interaktivno događanje u Centru za mlade Pula približava 3D tehnologiju i STEM područje djeci i mladima.

min čitanja

Više

Tehnologija

Alibaba lansirao seriju Qwen3.5: kompaktni AI modeli ciljaju mobilne uređaje
Alibaba je predstavio četiri nova otvorena AI modela Qwen3.5, namijenjena štedljivim uređajima i složenom rezoniranju, čime kineska tvrtka pojačava konkurenciju u globalnoj utrci umjetne inteligencije.

min čitanja

Više

Tehnologija

Europarlamentarci traže reakciju na navodno snimanje „pametnih“ naočala Metae u intimnim trenucima
Zastupnici iz četiri političke skupine traže od Komisije objašnjenje nakon tvrdnji da naočale Ray-Ban Meta AI potajno snimaju korisnike i šalju snimke u Keniju.

min čitanja

Više

Tehnologija

Policija upozorava na novu prijevaru: porukom „Bok, možeš li mi posuditi 900 eura?” pokušavaju vam isprazniti račun
Dubrovačko-neretvanska policija upozorava na val poruka s lažnom molbom za posudbu 900 eura i daje upute kako se zaštititi.

min čitanja

Više

Tehnologija

Cijene RAM-a probile 1.000 dolara: jurišna puška AR-15 trenutačno jeftinija od računalne nadogradnje
Eksplozija potražnje za silicijem zbog razvoja umjetne inteligencije dovela je do apsurdne situacije: 64 GB DDR5 RAM-a skuplje je od osnovnog modela jurišne puške AR-15.

min čitanja

Više

Tehnologija

ByteDance kroz Project Swan najavljuje iskorak u poslovni XR
Na MWC-u u Barceloni ByteDance je predstavio Pico OS 6 i najavio headset Project Swan, ciljajući poslovne korisnike XR-a i izravno konkurirajući Appleu.

min čitanja

Više

Tehnologija

Istraživači: Tvrtke ignoriraju obavezu objave podataka o treniranju AI modela
Trinity College Dublin analizirao je provedbu EU Akta o umjetnoj inteligenciji i utvrdio da većina velikih tvrtki još ne objavljuje zakonom propisane sažetke o podatcima za treniranje AI modela.

min čitanja

Više

Tehnologija

Lažno usklađivanje umjetne inteligencije sve veći sigurnosni rizik
Nova prijetnja u svijetu kibernetike: umjetna inteligencija može „glumiti poslušnost”, a zapravo raditi po starim pravilima, što otvara put krađi podataka i sabotaži sustava.

min čitanja

Više

Tehnologija

Stručnjaci upozoravaju: nosivi AI uređaji mogu potkopati ljudsku autonomiju
Nadolazeća generacija nosivih AI uređaja mogla bi, upozoravaju stručnjaci, pretvoriti se iz pomoćnika u sofisticirani mehanizam manipulacije korisnicima.

min čitanja

Više

Tehnologija

Pentagon koristio Claude u napadu na Iran unatoč Trumpovoj zabrani
Američka vojska oslanjala se na AI sustav Claude prilikom zračnih udara na Iran iako je Donald Trump nekoliko sati ranije izdao naredbu o prekidu suradnje s tvrtkom Anthropic.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Najčitanije

Vijesti

Požar u zatvoru Bilice: dim ozlijedio 13 osoba, među njima i pravosudni policajci
Madrac koji se zapalio u splitskom zatvoru Bilice izazvao je požar i dim zbog kojeg je pomoć zatražilo 13 osoba.

min čitanja

Više

Nogomet

UEFA kaznila Tottenham zbog rasističkog ispada navijača
UEFA novčano kaznila Tottenham i izrekla uvjetnu zabranu ulaznica zbog rasističkog ispada navijača tijekom utakmice s Eintrachtom.
Football.ua, CC BY-SA 3.0 GFDL, via Wikimedia Commons

min čitanja

Više

Biznis

Iskra preuzima riječki 3. maj za 6,7 milijuna eura
CERP odobrio prodaju 3. maja 1905. šibenskoj Iskri uz obvezu očuvanja brodogradnje i najavu novih ulaganja.

min čitanja

Više

Najnovije

Politika

Bruxelles najavljuje dug put do zabrane konverzijskih terapija

Vijesti

Opatija otvara 17. Dane antifašizma: „Suosjećanjem protiv mržnje”

Sport

Zagreb se oprostio od doktora Ivana Fattorinija u Košarkaškom centru Dražen Petrović

Vijesti

Škotska prva u Ujedinjenom Kraljevstvu dopušta „vodenu kremaciju”

Vijesti

Iran nakon izraelskih udara: sustav bez pukotina i nova prijetnja širenjem rata u Zaljevu

Vijesti

Požar razotkrio tamnu sadašnjost riječkog hotela Emigranti

Vijesti

Delničani prikupili 206 doza krvi u prvoj ovogodišnjoj akciji

Sport

Brahim Diaz javno potvrdio prelazak na islam

Sport

Kenija privremeno suspendirala 27 sportaša zbog dopinga

Politika

Transparent s likom pokojnog desničara Charlieja Kirka izazvao buru pred zgradom američkog Ministarstva obrazovanja

Politika

Habijan o zabrani društvenih mreža djeci: „Najlakše je donijeti zakon, ali provedba je pravi izazov”