CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

31. siječnja 2026, 20:11

Pametnija obrada dokumenata otključava puni potencijal RAG-a u industriji

Zašto mnogi industrijski chatbotovi haluciniraju i kako im semantičko „rezanje” dokumenata te obrada slika mogu vratiti vjerodostojnost.

min. čitanja

XFacebookWhatsApp

Utrka za primjenom generativne umjetne inteligencije u poslovnim okruženjima donijela je brzu popularizaciju sustava RAG (retrieval-augmented generation) – modela koji na upite korisnika odgovaraju na temelju vlastitih baza dokumenata. No, u sektorima oslonjenima na složenu tehničku dokumentaciju, prva euforija često se pretvara u razočaranje: inženjeri traže konkretne vrijednosti iz priručnika, a chatbot odgovara pogrešno ili slegne ramenima.

Ključni problem nije u samom velikom jezičnom modelu, nego u načinu na koji se podaci pripremaju. Uobičajeni postupak „rezanja” PDF-ova na fiksnih 500 znakova pogodan je za prozu, ali razbija tablice, dijagrame i hijerarhiju naslova koji nose presudne informacije o strojevima, naponima ili sigurnosnim ograničenjima.

  1. Od fiksnih do semantičkih isječaka • Umjesto rezanja po broju znakova, alati za analizu izgleda stranice razdvajaju dokument prema stvarnim logičkim cjelinama – poglavljima, podnaslovima, pa čak i cijelim tablicama. Tako u vektorsku bazu ulazi cjelovit odlomak o jednom sklopu, zajedno s pripadajućim vrijednostima. • Interna testiranja pokazuju da je takav pristup bitno povećao točnost pronalaženja tabličnih podataka, jer više nema „odsječenih” zaglavlja bez pripadnih brojki.

  2. Rješavanje „slijepe točke” za slike Velik dio intelektualnog vlasništva tvrtki nalazi se u shemama, tehničkim crtežima i tijekovima procesa. Klasični tekstualni uvezi ih ignoriraju. Zato se prije pohrane uvodi multimodalni korak: • OCR prepoznaje tekst unutar slike; • Vizualni model opisuje dijagram prirodnim jezikom („tijek procesa u kojem A prelazi u B pri temperaturi iznad 50 °C”); • Ti se opisi pohranjuju kao metapodaci povezani s izvornom slikom, pa sustav na upit „temperaturni tijek” pronalazi i PNG iz kojeg je opis nastao.

  3. Sloj povjerenja u sučelju U ozbiljnim okruženjima nije dovoljno ponuditi odgovor; potrebno je i dokazati njegovo podrijetlo. Budući da je veza između teksta i izvornog objekta sačuvana, korisniku se uz odgovor prikazuje upravo ona tablica ili graf koji su poslužili kao dokaz. Time RAG izlazi iz sfere „vjeruj mi na riječ” i postaje alat čije se zaključke može trenutačno provjeriti.

  4. Što dolazi Dok se čekaju jeftiniji LLM-ovi s kontekstom od milijun tokena i nativni multimodalni uvezi koji spajaju tekst i slike bez opisivanja, semantičko parceliranje i „tekstualizacija” vizualnog sadržaja ostaju najisplativiji put za pouzdane, real-time sustave.

Zaključak Bez poštivanja stvarne strukture tehničkih dokumenata, RAG ostaje tek napredna ključna riječ pretraga. Kada se podaci najprije očiste i organiziraju prema njihovu izvornom smislu, AI se iz hvala-lijepoga gadgeta pretvara u pravog „pomoćnika znanja” sposobnog odgovoriti na pitanja od kojih ovisi sigurnost i produktivnost industrije.

#generativna-inteligencija#semanticko-parceliranje#tehnicka-dokumentacija

Komentari ~ 0

0/1000 znakova
Trenutno nema komentara za ovaj članak. Budite prvi.

Slično

Tehnologija

Global Game Jam okupio više od 120 domaćih gamera: Novska ponovno središte razvoja videoigara
Više od 120 natjecatelja u Novskoj, Rijeci i Zagrebu tijekom 48 sati, pod temom „Maska“, izrađuje nove videoigre u sklopu sedmog hrvatskog izdanja Global Game Jama.

min čitanja

Više

Tehnologija

Starlink mijenja pravila privatnosti: korisnički podaci ulaze u Muskov pogon za umjetnu inteligenciju
SpaceX ažurirao pravila Starlinka, dopušta opsežno korištenje podataka pretplatnika za treniranje AI modela i otvara vrata megaspoju sa xAI.
By Justin Pacheco - https://cdn.openart.ai/uploads/image_01eluJ2__1696752889349_raw.jpg, Public Domain, https://commons.wikimedia.org/w/index.php?curid=119369305

min čitanja

Više

Tehnologija

Nissan predstavio solarnu Ariyu: do 23 km dnevno bez utičnice
Konceptna Ariya s ugrađenim solarnim panelima pokazuje kako Nissan planira električnim vozilima svakodnevno dodati i do 23 km dosega bez priključivanja na mrežu.

min čitanja

Više

Tehnologija

Poziv na uklanjanje kineskih kamera s Magna Carte i Partenona
Aktivisti traže uklanjanje kineskih kamera Dahua i Hikvision s Magna Carte u Salisburyju i Partenona zbog sumnji na zloporabe protiv Ujgura i sigurnosnih hakiranja u Ukrajini.

min čitanja

Više

Tehnologija

Blue Origin pauzira svemirski turizam i preusmjerava sve snage na Mjesec
Tvrtka Jeffa Bezosa stavlja turističke letove na čekanje kako bi ubrzala razvoj lunarnog programa u sklopu NASA-ina Artemisa.

min čitanja

Više

Tehnologija

Precizna terapija mikrobioma donosi olakšanje oboljelima od sindroma iritabilnog crijeva
Nova kombinacija posebnih bakterijskih sojeva i bakteriofaga nudi ciljani pristup ublažavanju bolova, nadutosti i grčeva kod sindroma iritabilnog crijeva.

min čitanja

Više

Tehnologija

Sigurnosni alarm nakon meteorskog uzleta OpenClawa na GitHubu
OpenClaw je u tjedan dana prikupio 180 000 GitHub zvjezdica, ali i razotkrio sigurnosne propuste u više od 1 800 javno dostupnih instanci.

min čitanja

Više

Tehnologija

Arcee predstavio Trinity Large: 400-milijardni model otvorenog koda s rekordnom učinkovitošću
Arcee je lansirao Trinity Large, 400-milijardni MoE jezični model, te ponudio sirovi checkpoint TrueBase za neovisne revizije i prilagodbe.

min čitanja

Više

Tehnologija

PageIndex uvodi „navigacijsko” pretraživanje i podiže točnost RAG-a za duge dokumente
Otvoreni okvir PageIndex zamjenjuje klasično „chunk-and-embed” indeksiranje stablom sadržaja, čime poboljšava preciznost AI-a pri pretraživanju vrlo dugih i složenih dokumenata.

min čitanja

Više

Tehnologija

Rimac u St. Moritzu predstavio prvu Neveru R Founderʼs Edition
Na zaleđenom jezeru St. Moritz Rimac je isporučio prvi od svega deset primjeraka ekskluzivne Nevere R Founderʼs Edition, hiperautomobila od 2107 KS rasprodanog u tjedan dana.

min čitanja

Više

Najčitanije

Nogomet

Barcelona srušila Elche i zadržala vrh, ali Flicku nove brige zbog ozljeda
Katalonci su slavili 3:1 u Elcheu, nastavili pobjednički niz i ostali lideri La Lige, no dvostruka mišićna ozljeda unijela je novu dozu strepnje u Flickov stožer.

min čitanja

Više

Politika

Plenković: transatlantski dijalog ključan unatoč napetostima
Premijer ističe da EU nema zamjenu za odnose sa SAD-om, ali i da mora graditi vlastitu stratešku autonomiju.
By Daniel Torok - White HouseFacebook, Public Domain, https://commons.wikimedia.org/w/index.php?curid=166661524Autor © European Union, 2025, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=150011986

min čitanja

Više

Vijesti

Anđeo s licem premijerke? Rimsku restauraciju istražuje ministarstvo kulture
Ministarstvo kulture provjerava restauraciju anđela u rimskoj bazilici za koju se tvrdi da nevjerojatno sliči premijerki Giorgiji Meloni.
By Governo Italiano - www.governo.it, for the license see here, CC BY 3.0 it, https://commons.wikimedia.org/w/index.php?curid=130399752

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Varaždin s desetoricom šokirao Slaven Belupo u Koprivnici
Varaždin je u susjedskom derbiju slavio 2-0 protiv Slavena te s igračem manje prestigao Koprivničane na ljestvici HNL-a.

min čitanja

Više

Nogomet

Vuškovićev gol glavom šokirao Bayern i donio HSV-u dragocjen bod
Hrvatski tinejdžer briljirao protiv lidera Bundeslige, izabran za igrača utakmice

min čitanja

Više

Najnovije

Vijesti

Epsteinova oporuka otkriva: milijuni, dijamant i „Pedo otok” namijenjeni dugogodišnjoj djevojci

Vijesti

Neredi u Torinu: prosvjed zbog zatvaranja centra Askatasuna prerastao u nasilje

Lifestyle

Pakal pod maskama u Bregima: „Nijemci” i partizani ponovno zapucali

Lifestyle

Megadance Party 2026 rasplesao zagrebačku Arenu

Biznis

Washington okuplja partnere za savez o ključnim mineralima

Lifestyle

KUD Filip Dević obilježava 75 godina koncertom u HNK-u Split

Lifestyle

Peru očima Karin Kučić oduševio Cresane

Lifestyle

Drniš postao hit večeri Zlatnog studija

Sport

Hornetsi nastavljaju niz, Embiid zabio 40, George suspendiran

Politika

Thompsonova „Bojna Čavoglave” razljutila prolaznike u Beogradu

Lifestyle

Popularni svećenik prozvao ‘Gospodina savršenog’ kao zaglupljujuć i ponižavajuć show