Tehnologija

Groq cilja AWS i Google: brže izvođenje modela uz partnerstvo s Hugging Faceom

Start-up Groq uvodi podršku za 131 000 tokena u Qwen3 32B modelu i postaje službeni inference-provider na Hugging Faceu, najavljujući izazov AWS-u i Googleu.

min čitanja

Start-up Groq objavio je dva poteza kojima želi uzdrmati dominaciju Amazon Web Servicesa, Googlea i Microsofta u tržištu AI inferencije.

• Puna podrška za Qwen3 32B

Groq je na vlastitoj infrastrukturi omogućio rad Alibabina jezičnog modela Qwen3 32B s cijelim kontekstnim prozorom od 131 000 tokena. Tvrtka tvrdi da nijedan drugi „brzi” pružatelj inferencije trenutačno ne nudi toliku količinu konteksta uz usporedive performanse.

Prema mjerenju neovisne kuće Artificial Analysis, Groq isporučuje oko 535 tokena u sekundi, što omogućuje obradu dugih dokumenata i složenih zadataka u stvarnom vremenu. Cijena usluge iznosi 0,29 USD za milijun ulaznih i 0,59 USD za milijun izlaznih tokena – ispod cijena mnogih konkurenata.

Ključ leži u Groqovu vlastitom Language Processing Unit čipu, građenom specijalno za inferenciju, za razliku od općih GPU-ova na koje se oslanjaju veći pružatelji.

• Integracija s Hugging Faceom

Istovremeno je Groq postao službeni inference-provider na platformi Hugging Face, s izravnim odabirom u Playgroundu i API-ju te naplatom preko Hugging Face računa. Osim Qwen3 32B, podržani su i modeli Meta Llama, Google Gemma i drugi.

Zahvaljujući tom potezu Groq dolazi pred milijune razvojnih inženjera koji svakodnevno koriste Hugging Face, čime si otvara prostor za brzi rast prometa, ali i pritiske na održavanje performansi u globalnom mjerilu.

• Što slijedi?

Tvrtka trenutno obrađuje više od 20 milijuna tokena u sekundi iz podatkovnih centara u SAD-u, Kanadi i na Bliskom istoku te planira daljnje širenje. Ipak, suočava se s golemoj konkurencijom infrastrukturnih divova poput AWS-a, Google Vertex AI-ja i Azure OpenAI-ja, koji raspolažu neusporedivo većim resursima.

Groq vjeruje da će potražnja za inferencijskim kapacitetom „eksponencijalno rasti” i da će volumen nadoknaditi niske marže: „Čak i kad bismo ove godine udvostručili planiranu infrastrukturu, i dalje ne bi bilo dovoljno kapaciteta za današnju potražnju”, poručuju iz tvrtke.

Prema procjeni Grand View Researcha, tržište čipova za AI inferenciju moglo bi do 2030. vrijediti 154,9 milijardi USD. Ako Groq ispuni obećanja o brzini i trošku, korisnici će dobiti jeftiniju alternativu za aplikacije koje zahtijevaju velike kontekstne prozore – od pravne analize do složenog „reasoning” koda. U suprotnom, rizik oslanjanja na manjeg dobavljača mogao bi nadmašiti potencijalnu uštedu.

Za sada, developerska zajednica dobila je još jednu visokoperformansnu opciju, dok tržište prati može li specijalizirani hardver dugoročno parirati globalnim oblakuša.

Slično

Qodo i Google Cloud udružili snage za besplatan AI pregled koda
Izraelski startup Qodo udružio je snage s Google Cloudom kako bi ponudio besplatan AI alat za pregled koda otvorenog koda i donio napredne modele poput Gemini 2.5 Pro u enterprise razvojne tokove.

min čitanja

Više

1Password i AWS sklopili strateški savez za sigurniji oblak s umjetnom inteligencijom
Strateški sporazum 1Passworda i AWS-a cilja zatvoriti sigurnosni jaz nastao masovnom upotrebom AI alata i neodobrenih aplikacija u hibridnom radu.

min čitanja

Više

MiniMax-M1 donosi otvorenu AI revoluciju s milijun tokena konteksta
MiniMax lansirao M1, otvoreni LLM s milijunskim kontekstom i rekordno niskim troškom treniranja.

min čitanja

Više

Silicijska dolina u potrazi za novim čudom: jesu li AI agenti doista „sljedeći veliki prodor”
Tehnološki divovi i start-upovi ulažu milijarde u AI agente koji bi samostalno obavljali zadatke umjesto ljudi. Donosimo pregled tko predvodi utrku, gdje su izazovi i što sve to znači za radna mjesta.

min čitanja

Više

Apple izazvao buru: jesu li LLM-ovi doista sposobni zaključivati?
Appleov istraživački rad o (ne)sposobnosti LLM-ova za zaključivanje izazvao je val kritika i suprotni studij koji tvrdi da su padovi performansi zapravo rezultat loše postavljenih testova, a ne manjka „inteligencije” modela.

min čitanja

Više

Kvar na Google Cloudu srušio Spotify, Discord i druge servise
Kvar na infrastrukturi Google Clouda prouzročio je privremene prekide u radu Spotifyja, Discorda, Amazon Web Servicesa i dijela Cloudflareovih usluga.

min čitanja

Više

Google Cloud zatajio: pad brojnih AI alata i popularnih servisa
Problemi u Google Cloud Platformi srušili su ChatGPT, Claude, Replit i druge AI alate te izazvali poteškoće na Discordu i Spotifyju.

min čitanja

Više

Google stavlja generativni AI u džep: AI Edge Gallery radi bez interneta
Googleova eksperimentalna aplikacija AI Edge Gallery omogućuje pokretanje naprednih AI modela izravno na Android telefonima bez internetske veze, stavljajući naglasak na privatnost, ali i otvarajući nova sigurnosna pitanja.

min čitanja

Više

„Umjetni“ agenti na telefonu više ne zvuče robotski: Phonely, Maitai i Groq probili granicu od 99 % točnosti
Partnerstvo Phonelyja, Maítaija i Groqa smanjilo je latenciju AI agenata za više od 70 % i podiglo točnost na 99,2 %, čime su prvi put prešli „uncanny valley” u govornoj podršci.

min čitanja

Više

Android 16 donosi nove mogućnosti, sigurnost i redizajn
Android 16 uvodi brojne novosti u izgledu, sigurnosti te dostupnosti, a od 10. lipnja isporučuje se na prvim uređajima. Među ključnim značajkama su live obavijesti, napredna sigurnost, AI detekcija prevara i novi dizajn.

min čitanja

Više

Ostalo

Električni autobusi koče zelenu tranziciju gradskog prijevoza: financije i mreža veći problem od javne nabave
Savjetnik Anđelko Rukelj na konferenciji ENERGREEN upozorava: hrvatski gradovi kasne s elektrifikacijom autobusa zbog visokih troškova i slabe mrežne infrastrukture, a ne zbog procedure javne nabave.

min čitanja

Više

Ubojstvo na Markuševcu: Uhićen vojnik Počasno-zaštitne bojne
Jedan od dvojice uhićenih zbog dvostrukog ubojstva na Markuševcu jest aktivni pripadnik Oružanih snaga, potvrdio je MORH.

min čitanja

Više

Katamaran Melita tonuo kod Zadra, 43 osobe evakuirane na trajekt
Svi putnici i članovi posade katamarana Melita spašeni su nakon večernje havarije u zadarskom kanalu.

min čitanja

Više

Adobe lansirao LLM Optimizer za osvajanje generativnih tražilica
Adobe na Cannes Lionsu predstavio LLM Optimizer, alat koji brendovima pomaže da se istaknu u odgovorima generativnih AI modela i prelaze s klasičnog SEO-a na novu eru GEO-a.

min čitanja

Više

Novi Nissan Leaf: pionir električne mobilnosti prelazi u crossover s dosegom od 488 km
Treća generacija Nissana Leafa stiže 2026. kao crossover, s baterijom od 75 kWh, dosegom do 488 km i tekućim hlađenjem, čime japanski proizvođač pokušava vratiti izgubljeni zamah na sve gušćem tržištu električnih vozila.

min čitanja

Više

Britanci ubrzavaju zračni vodik: 17 milijuna funti za gorive ćelije Intelligent Energyja
Intelligent Energy dobio je 17 milijuna funti državne potpore za razvoj vodikovih gorivih ćelija koje bi do 2030-ih trebale pogoniti putničke zrakoplove, smanjiti emisije CO₂ i otvoriti nova radna mjesta.

min čitanja

Više

Besplatni Microsoft 365 nudi Word, Excel i PowerPoint u pregledniku
Microsoft 365 for the web omogućuje besplatno korištenje Worda, Excela i PowerPointa u pregledniku, uz nekoliko ograničenja i dostupne alternative.

min čitanja

Više

Bruxelles stišće papučicu: nova pravila ubrzavaju GDPR postupke protiv tehnoloških divova
EU je dogovorila nova proceduralna pravila koja bi trebala ubrzati prekogranične GDPR istrage, posebice protiv tehnoloških divova. Aktivisti i industrija kritiziraju kompromis, dok ga pregovarači Bruxellesa predstavljaju kao rezanje birokracije.

min čitanja

Više

Kemijski GPS u aksolotlu otkriva tajnu regeneracije udova
Istraživači su pokazali da razgradnja retinoične kiseline, a ne njezina proizvodnja, određuje koje će dijelove uda aksolotl obnoviti, otkrivši pritom i ključni gen Shox.

min čitanja

Više