Natrag na početnu

# google-deepmind

Google DeepMind predstavlja Gemini Diffusion i otvara utrku za munjevito brze jezične modele
Eksperimentalni Gemini Diffusion zamjenjuje autoregresijsko generiranje difuzijskim postupkom denoiziranja, postiže i do 2 000 tokena u sekundi te otvara nova pitanja o brzini, cijeni i točnosti budućih velikih jezičnih modela.

min čitanja

Više

Studija otkriva: veliki jezični modeli pamte samo 3,6 bita po parametru
Istraživanje Meta, Google DeepMind-a, NVIDIA-e i Cornella utvrdilo je da GPT-u slični modeli memoriraju fiksnih 3,6 bita po parametru, ublažavajući strah od masovnog kopiranja zaštićenog sadržaja.

min čitanja

Više