Europska komisija u četvrtak je objavila dugo najavljivani predložak koji proizvođače generativne umjetne inteligencije obvezuje da javno sažmu podatke korištene u treniranju svojih modela – svega nekoliko dana prije nego 2. kolovoza na snagu stupe obveze iz Akta o umjetnoj inteligenciji.
• Od 2. kolovoza veliki modeli opće namjene – poput ChatGPT-a, MidJourneyja ili Mistralova „Le Chata” – morat će objavljivati tzv. sažetke skupova podataka, čime se po prvi put pravno nalaže transparentnost nad načinom njihova razvoja.
• Prema predlošku, developeri moraju navesti glavne skupove podataka, opisati materijale prikupljene pretraživanjem interneta te sve druge izvore koje su koristili.
• Kreativna industrija u tome vidi alat za lakše dokazivanje mogućih povreda autorskih prava, dok je Komisija naglasila da je cilj „pronaći ravnotežu između učinkovite transparentnosti i zaštite poslovno osjetljivih informacija”.
• Objavom predloška Bruxelles je zaokružio paket pomoćnih dokumenata – smjernice i Kodeks dobre prakse za GPAI modele publicirani su ranije ovog mjeseca – unatoč pritiscima industrije koja je tražila odgodu primjene novih pravila.
• Iako se obveze formalno počinju primjenjivati idući tjedan, provedbu nadzire novoosnovani AI Office tek od kolovoza 2026., a modeli koji su već na tržištu imaju rok do kolovoza 2027. da u potpunosti usklade svoje poslovanje, pod prijetnjom kazni.