CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

14. studenog 2025, 20:39

Databricks predstavlja ai_parse_document: nova generacija AI obrade PDF-ova

Databricks je lansirao ai_parse_document, alat koji obećava precizno i višestruko jeftinije izvlačenje strukturiranih podataka iz složenih PDF-ova, izravno unutar svoje platforme.

min. čitanja

XFacebookWhatsApp

Databricks je u svojoj platformi Agent Bricks predstavio ai_parse_document, tehnologiju koja cilja na jedan od najvećih izazova u primjeni umjetne inteligencije u poslovanju – zaključane informacije u PDF-ovima. Tvrtka procjenjuje da se oko 80 % korporativnog znanja još uvijek nalazi u izvještajima, dijagramima i složenim dokumentima koje postojeći alati često pogrešno interpretiraju.

„It's a common assumption that parsing PDFs is a solved problem, but in reality, it isn't”, poručuje Erich Elsen, glavni istraživač u Databricksu. Prema njegovim riječima, klasični OCR sustavi gube ili krivo čitaju tablice s spojenim ćelijama, opise figura i prostorne odnose elemenata, što rezultira nepouzdanim nadograđenim AI analizama i poslovnim izvještajima.

Ključne mogućnosti nove funkcije:

  • očuvanje tablica onako kako izgledaju u izvornom dokumentu, uključujući ugniježđene strukture;
  • automatsko generiranje opisa figura i dijagrama;
  • bilježenje točnih koordinata svakog elementa u dokumentu;
  • opcionalni izlaz u obliku slika za multimodalno pretraživanje.

Rezultati se izravno spremaju u Unity Catalog kao Delta tablice, što omogućuje SQL upite nad podacima bez napuštanja Databricks okruženja. Elsen naglašava da su troškovi inferencije „3–5× niži” uz zadržavanje ili premašivanje kvalitete rješenja poput Textracta, Document AI-ja i Azure Document Intelligencea.

„To compensate, teams have had to stack multiple imperfect tools or build extensive custom pipelines, spending months on data engineering instead of innovation. ai_parse_document solves that by extracting complete, structured data from real-world documents — so organizations can finally trust and query unstructured data directly within Databricks.”

Primjene u praksi

• Rockwell Automation skratio je vrijeme podešavanja okruženja za podatkovne znanstvenike; • TE Connectivity je zamijenio kompleksne skripte jednom SQL funkcijom, čineći napredno parsiranje dostupnim i inženjerima podataka; • Emerson Electric koristi rješenje za brzu izgradnju RAG aplikacija unutar postojećeg Databricks sustava.

Funkcija je duboko integrirana s ostalim komponentama platforme, od Spark deklarativnih cjevovoda za automatsku obradu novih dokumenata, preko vektorskog pretraživanja, do lanca AI funkcija kao što su ai_extract, ai_classify i ai_summarize.

„Parsing is only the beginning and rarely an end unto itself”, zaključuje Elsen, ističući da je cilj pretvoriti korpus dokumenata u upotrebljivu bazu znanja za generativne ili informacijske agente.

Za tvrtke koje tek biraju AI infrastrukturu, ova objava signalizira pomak: inteligentno čitanje dokumenata prelazi iz zasebnih servisa u srž podatkovnih platformi, čime se smanjuje potreba za složenim povezivanjem vanjskih alata i ubrzava put do poslovnih uvida.

#databricks#erich-elsen#rockwell-automation#te-connectivity#emerson-electric

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Tvrtke žure uskladiti AI agente: orkestracija postaje pitanje opstanka
Orkestracija komunikacije među AI agentima postaje presudna za sigurnost i učinkovitost. Stručnjaci upozoravaju da će tvrtke koje ne usklade agente riskirati nesporazume, halucinacije i gubitak podataka.

min čitanja

Više

Tehnologija

Musk odbacuje optužbe: „Grok nije stvarao gole maloljetnike”
Elon Musk tvrdi da AI chatbot Grok nije generirao nezakonite slike maloljetnika, dok europski i britanski regulatori najavljuju istrage zbog sumnji u duboke lažne pornografske sadržaje.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Riječki inovator odbio londonski doktorat kako bi u Hrvatskoj razvijao radiologiju
Diego Ivanović odbio je doktorat u Londonu i s Leonardom Martinisom pokrenuo Medusa Technologies, startup koji razvija AI za radiološke snimke.

min čitanja

Više

Tehnologija

AI alat Sybil otkrio propust klijenta i zbunio vlastite tvorce
Neočekivano otkriće AI alata Sybil označilo novu fazu u kibernetičkoj sigurnosti.

min čitanja

Više

Tehnologija

Je li vrijedno riskirati? Što treba znati prije uvoza kineskog pametnog telefona
Kineski pametni telefoni često nude vrhunske performanse po nižoj cijeni, no uvoz izvan službenih kanala nosi niz financijskih i servisnih rizika.

min čitanja

Više

Tehnologija

Autor Ruska Federacija, datoteku izradili R-41, Nightstallion i Dmitry Strotsev - http://flag.kremlin.ru/i/flag-big.png (Datoteku su na Zajedničkome poslužitelju Wikimedije izradili R-41, Nightstallion, Dmitry Strotsev i Bugoslav), https://commons.wikimedia.org/w/index.php?curid=9450374
Poljska tvrdi da je ruski kibernetički napad umalo ugasio njezinu elektroenergetsku mrežu
Ministar digitalizacije Krzysztof Gawkowski otkrio da je Poljska tijekom blagdana odbila najveći kibernetički napad na svoj energetski sustav, za koji optužuje Rusiju.

min čitanja

Više

Tehnologija

Izraelski Novee izlazi iz sjene s 51,5 milijuna dolara za borbu protiv AI kibernapada
Startup iz Tel Aviva razvija vlastitog „AI hakera” za kontinuirano penetracijsko testiranje i osigurao više od 50 milijuna dolara početnih ulaganja.

min čitanja

Više

Tehnologija

Provokativna kineska aplikacija „Jesi li mrtav?” osvaja samce, mijenja ime i uvodi pretplatu
Sigurnosna aplikacija koja korisnike pita „Jesi li mrtav?” stekla je popularnost među kineskim samcima, a autori najavljuju pretplatu i novo ime Demumu.

min čitanja

Više

Tehnologija

TikTok Shop pod vatrom zbog prikaza nakita s nacističkom simbolikom
Pretraga za „hip hop nakitom” na TikTok Shopu dovela je do preporuka nakita s nacističkim simbolima, otvarajući nova pitanja o odgovornosti platforme.

min čitanja

Više

Tehnologija

Brian Cox rasprodao Lisinski devet mjeseci prije nastupa, dodan i drugi termin
Popularni fizičar ponovno puni Lisinski: zbog velike potražnje za showom „Emergence” otvoren je drugi datum u rujnu 2026.

min čitanja

Više

Najčitanije

Politika

SAD privremeno zaustavlja useljeničke vize za pet zemalja zapadnog Balkana
Washington od 21. siječnja zaustavlja obradu zahtjeva za useljeničke vize građana BiH, Crne Gore, Albanije, Kosova i Sjeverne Makedonije, uz objašnjenje da želi smanjiti mogući teret na američki sustav socijalne skrbi.

min čitanja

Više

Politika

Druga faza Trumpovog plana za Gazu: demilitarizacija Hamasa i tehnokratska vlada
SAD potvrđuje ulazak mirovnog plana u novu etapu; Hamas u Kairu prihvatio tehnokratsku vladu, no razoružanje i sigurnosni aranžmani ostaju najveći izazovi.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524

min čitanja

Više

Košarka

Košarkaški ‘El Clasico’ na Gripama: Split protiv Cibone lovi 12. uzastopnu pobjedu
Žuti traže dvanaestu uzastopnu pobjedu za ostanak na vrhu, dok se probuđena Cibona nada iznenađenju u derbiju na Gripama.

min čitanja

Više

Najnovije

Sport

Zabok produbio krizu Šibenke na Baldekinu

Politika

Iran ponovno otvorio zračni prostor, Trump tvrdi da su pogubljenja obustavljena

Politika

Trumpova administracija blokira imigrantske vize za 75 država

Sport

Jurišić ponovo briljira na Lanzaroteu: treće mjesto kao zalog za Los Angeles 2028.

Vijesti

Radovi na Stojoj napreduju unatoč kiši i strogim konzervatorskim pravilima

Politika

Trump u intervjuu za Reuters: „Zelenski je prepreka miru, Pahlavi izgleda pristojno”

Politika

Zelenskij proglašava izvanredno stanje u energetici, Trump okrivljuje Kijev za zastoj mira

Vijesti

Mladi vozač u Koprivnici pozitivan na droge, dobio zabranu vožnje

Vijesti

Riječki mjesni odbor i škola udružili snage: donacijske kutije za djecu u riziku od siromaštva

Sport

Istra 1961 zaključila pripreme pobjedom nad Radomljem

Lifestyle

Imotska krajina ruši turističke rekorde i najavljuje još jaču sezonu