Čini se jednostavno: povežete najnoviji GPT s podatkovnim skladištem, pitate „Koliki nam je prihod?” i dobijete ispravan SQL. No čim sustav napusti testno okruženje, brojke počnu skakati – 12 milijuna dolara u ponedjeljak, 9,5 milijuna u utorak, iako se podaci nisu promijenili.
Krivac nije sintaksa nego – kontekst. Jezični modeli pokušavaju iz sirovih shema odgonetnuti poslovnu logiku koju poznaju samo analitičari. Bez sloja koji definira što je „prihod”, model pogađa i promašuje povjerenje korisnika.
• Prema istraživanju iz 2024., GPT-4 je iz sirovih shema proizveo točan SQL u svega 16,7 % slučajeva. Kada je isti model „uzemljen” semantičkim slojem, točnost je skočila na 54,2 %.
• Tvrtka AtScale mjeri još bolje rezultate – 92,5 % točnosti na industrijskom TPC-DS testu – zahvaljujući unaprijed definiranim metrikama i dopuštenim putanjama spajanja tablica.
Semantički sloj evoluirao je iz pomoćnog alata za nadzorne ploče u ključnu infrastrukturu za umjetnu inteligenciju: on je „API za metrike” koji sprječava model da nagađa poslovna pravila.
Dva su pristupa kako i gdje taj sloj implementirati.
-
Platform-agnostični (headless) – Logika se definira u neutralnom posrednom servisu te služi Tableauu, Excelu i AI agentima iz istog izvora istine. – dbt (MetricFlow) i Cube automatizirano prevode YAML-definicije u optimizirani SQL i već podržavaju otvoreni standard Open Semantic Interchange (OSI) koji bi trebao učiniti metrike prenosivima između alata i oblaka.
-
Platform-native (zatvoreni vrt) – Pravila se ugrađuju izravno u skladište podataka radi performansi i nulte kopije podataka. – Microsoft Fabric (Semantic Link), Snowflake (Cortex AI) i Databricks (Unity Catalog) izvezu metrike do svojih internih copilot-alata, a Microsoft je u studenome 2025. otvorio i Power BI Modeling MCP Server za vanjske agente.
Migracija logike iz tradicionalnih BI alata, poput Lookera ili Power BI-ja, rijetko je „copy-paste”. Njihove vlasničke funkcije – primjerice Lookerovi „symmetric aggregates” ili dinamički DAX – treba nanovo modelirati u standardnom SQL-u kako bi ih AI razumio bez halucinacija.
Dok OSI obećava da će jednog dana izbrisati razliku između dviju filozofija, danas je izbor kompromis između brzine integracije i neovisnosti o platformi. No jedna je lekcija jasna: u eri „podatkovnih agenata” brzina baze više nije dovoljna – bez eksplicitno definiranog, nadziranog semantičkog sloja umjetna inteligencija doslovce izmišlja poslovne brojke.