Klasični pristup retrieval-augmented generationu (RAG) – rezanje dokumenata na odlomke, izračun vektorskih ugradbi i dohvat najsličnijih komadića teksta – pokazao se pouzdanim za osnovna pitanja i kraće tekstove. No u trenutku kad poduzeća pokušavaju RAG primijeniti na zadatke visokog uloga, poput revizije financijskih izvještaja ili analize farmaceutskih protokola, sustav zapinje na pitanju preciznosti.
Novi otvoreni okvir PageIndex nastoji tu granicu pomaknuti napuštajući logiku „chunk-and-embed” i tretirajući dohvat informacija više kao kretanje kroz dokument nego kao klasično pretraživanje. Umjesto gomile fragmenata, alat gradi „Globalni indeks” – stablo u čijim su čvorovima poglavlja, podpoglavlja i stranice.
Kad stiže upit, veliki jezični model izvodi pretragu stabla i za svaki čvor odlučuje je li relevantan. Time prelazi iz pasivnog dohvaćanja, gdje se samo izlistaju tekstovi slični upitu, u aktivnu navigaciju koja replicira ljudsko listanje sadržaja: od poglavlja, preko odjeljka, do točne stranice.
Primjer financijskog izvještaja dobro ilustrira prednost. Dok će vektorska baza na upit o EBITDA-i vratiti svaki odlomak u kojem se kratica spominje, „navigacijski” pristup slijedi strukturalnu poveznicu do odgovarajućeg priloga i izdvaja točan broj. Autor okvira, istraživač Zhang, naglašava da je cilj takvog procesa auditabilnost – sustav mora moći objasniti ne samo odgovor nego i put kojim je do njega došao.
Iako donosi osjetan skok preciznosti, tree-search dohvat nije univerzalni lijek. Stručnjaci ga vide kao specijalizirani alat za „dubinski rad” na dugim, jasno strukturiranim dokumentima u kojima bi pogreška skupo stajala – tehničkim priručnicima, spisima regulatornih agencija ili ugovorima o pripajanju. PageIndex se tako pozicionira kao srednje rješenje: primjenjiv tamo gdje je struktura bogata, a potreba za točnim i provjerljivim odgovorima iznad prosjeka.