CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...
CROLENS
9.AGENCY
Politika privatnostifacebook_icon
Zatražite oglasni prostor
Učitavam...

Tehnologija

14. studenog 2025, 20:39

Databricks predstavlja ai_parse_document: nova generacija AI obrade PDF-ova

Databricks je lansirao ai_parse_document, alat koji obećava precizno i višestruko jeftinije izvlačenje strukturiranih podataka iz složenih PDF-ova, izravno unutar svoje platforme.

min. čitanja

XFacebookWhatsApp

Databricks je u svojoj platformi Agent Bricks predstavio ai_parse_document, tehnologiju koja cilja na jedan od najvećih izazova u primjeni umjetne inteligencije u poslovanju – zaključane informacije u PDF-ovima. Tvrtka procjenjuje da se oko 80 % korporativnog znanja još uvijek nalazi u izvještajima, dijagramima i složenim dokumentima koje postojeći alati često pogrešno interpretiraju.

„It's a common assumption that parsing PDFs is a solved problem, but in reality, it isn't”, poručuje Erich Elsen, glavni istraživač u Databricksu. Prema njegovim riječima, klasični OCR sustavi gube ili krivo čitaju tablice s spojenim ćelijama, opise figura i prostorne odnose elemenata, što rezultira nepouzdanim nadograđenim AI analizama i poslovnim izvještajima.

Ključne mogućnosti nove funkcije:

  • očuvanje tablica onako kako izgledaju u izvornom dokumentu, uključujući ugniježđene strukture;
  • automatsko generiranje opisa figura i dijagrama;
  • bilježenje točnih koordinata svakog elementa u dokumentu;
  • opcionalni izlaz u obliku slika za multimodalno pretraživanje.

Rezultati se izravno spremaju u Unity Catalog kao Delta tablice, što omogućuje SQL upite nad podacima bez napuštanja Databricks okruženja. Elsen naglašava da su troškovi inferencije „3–5× niži” uz zadržavanje ili premašivanje kvalitete rješenja poput Textracta, Document AI-ja i Azure Document Intelligencea.

„To compensate, teams have had to stack multiple imperfect tools or build extensive custom pipelines, spending months on data engineering instead of innovation. ai_parse_document solves that by extracting complete, structured data from real-world documents — so organizations can finally trust and query unstructured data directly within Databricks.”

Primjene u praksi

• Rockwell Automation skratio je vrijeme podešavanja okruženja za podatkovne znanstvenike; • TE Connectivity je zamijenio kompleksne skripte jednom SQL funkcijom, čineći napredno parsiranje dostupnim i inženjerima podataka; • Emerson Electric koristi rješenje za brzu izgradnju RAG aplikacija unutar postojećeg Databricks sustava.

Funkcija je duboko integrirana s ostalim komponentama platforme, od Spark deklarativnih cjevovoda za automatsku obradu novih dokumenata, preko vektorskog pretraživanja, do lanca AI funkcija kao što su ai_extract, ai_classify i ai_summarize.

„Parsing is only the beginning and rarely an end unto itself”, zaključuje Elsen, ističući da je cilj pretvoriti korpus dokumenata u upotrebljivu bazu znanja za generativne ili informacijske agente.

Za tvrtke koje tek biraju AI infrastrukturu, ova objava signalizira pomak: inteligentno čitanje dokumenata prelazi iz zasebnih servisa u srž podatkovnih platformi, čime se smanjuje potreba za složenim povezivanjem vanjskih alata i ubrzava put do poslovnih uvida.

#databricks#erich-elsen#rockwell-automation#te-connectivity#emerson-electric
Zatražite oglasni prostor
Učitavam...
Zatražite oglasni prostor
Učitavam...

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Građani u obrani Jadrana: u Splitu predstavljene aplikacije koje svakome otvaraju vrata znanosti
Citizen Science Day u Splitu okupio je pedesetak sudionika i predstavio niz aplikacija koje građanima omogućuju aktivno sudjelovanje u praćenju i zaštiti Jadrana.

min čitanja

Više

Tehnologija

OpenAI lansirao GPT-5.4-Cyber nakon upozorenja konkurenta
Nakon što je Anthropic odlučio zadržati svoj novi AI model pod ključem zbog straha od zlouporabe, OpenAI predstavlja GPT-5.4-Cyber, alat namijenjen kibernetičkim stručnjacima.

min čitanja

Više

Tehnologija

Poljičica prelazi u digitalno doba
U Srinjinama se 17. travnja predstavlja digitalni font Poljičice, staroga pisma proglašenog nematerijalnim kulturnim dobrom 2023. godine.

min čitanja

Više

Tehnologija

Anthropic i OpenAI u klinču zbog kontroverznog prijedloga zakona o odgovornosti AI-a u Illinoisu
Tvrtke su se razišle oko SB 3444, koji bi laboratorije oslobodio odgovornosti za masovne štete izazvane umjetnom inteligencijom.

min čitanja

Više

Tehnologija

Iva Tolić: Stanice nas uče da je obnova srž života
Hrvatska znanstvenica Iva Tolić objašnjava kako neprekidna obnova na staničnoj razini može biti nadahnuće za suočavanje s globalnim krizama.

min čitanja

Više

Tehnologija

Prvi riječki bankomat zaškripio zbog prašine, ali najavio novu eru plaćanja
Podsjetnik na 1986.: riječki bankomat pokvarila je obična prašina, ali je unatoč tome označio početak digitalnog upravljanja novcem.

min čitanja

Više

Tehnologija

NASA-ino superračunalo: sav život na Zemlji nestaje za milijardu godina
Superračunalo NASA-e, analizirajući 400 000 scenarija, prognozira da će širenje Sunca uništiti sav život na Zemlji za otprilike milijardu godina.

min čitanja

Više

Tehnologija

Projektni dan u Splitu otkrio snagu mladih inovatora
Učenici Splitsko-dalmatinske županije na Projektnom danu Centra izvrsnosti predstavili su inovativne projekte, a najavljene su i nove prijave te velike investicije u školsku infrastrukturu.

min čitanja

Više

Tehnologija

Rijeka 28. travnja postaje središte razgovora o kibernetičkoj sigurnosti
Interaktivna izložba na Korzu i praktična radionica u Proizvodnom parku Torpedo približit će suvremene prijetnje i rješenja kibernetičke zaštite građanima i malim poduzetnicima.

min čitanja

Više

Tehnologija

Infobip slavi 20 godina i najavljuje eru osobnih AI agenata
Tvrtka iz Vodnjana obilježila je 20. rođendan predstavljanjem platforme AgentOS i smjelim prognozama o dominaciji osobnih AI agenata u korisničkoj komunikaciji do 2030.

min čitanja

Više

Najčitanije

Vijesti

Veliki požar progutao skladište HŽ-a u Osijeku
Skladište Hrvatskih željeznica u Donjem gradu planulo je usred dana; vatrogasci su plamen gasili satima, a uzrok se još istražuje.

min čitanja

Više

Zatražite oglasni prostor
Učitavam...

Najnovije

Sport

Mascherano iznenada napustio klupu Inter Miamija

Sport

Atletico i PSG potvrdili polufinale Lige prvaka

Sport

Šanac na korak od naslova, Stoja razbila Kraljevicu

Lifestyle

Proljetni zanos cvjetnih motiva ispunio Galeriju Decumanus

Sport

Stoljeće košarke u Rijeci slavi zlatne sedamdesete Kvarnera

Vijesti

Netflix otkazao film „Perfect” nakon odlaska Millie Bobby Brown

Biznis

Pula okuplja stručnjake za energetsku tranziciju Istre

Sport

Zamet bez glavne pucačice uoči dramatične borbe za ostanak

Sport

Gužva u Vili Antonio: planinar Mirko Bjelan vodio publiku od australskih Alpa do vrhova Azije

Sport

Bašić najavljuje pohod Kvarnera: „Prava razina igre nas vodi u play-off”

Biznis

Đakovo dobiva prvi luksuzni hotel, vraća se kongresni turizam