CROLENS
Najnovije
Politika
Sport
Hrvatska
Tehnologija
Biznis
Pretraži
Pretraži
CROLENS
9.AGENCY
Politika privatnostifacebook_icon

Tehnologija

17. lipnja 2025, 08:07

Groq cilja AWS i Google: brže izvođenje modela uz partnerstvo s Hugging Faceom

Start-up Groq uvodi podršku za 131 000 tokena u Qwen3 32B modelu i postaje službeni inference-provider na Hugging Faceu, najavljujući izazov AWS-u i Googleu.

min. čitanja

XFacebookWhatsApp

Start-up Groq objavio je dva poteza kojima želi uzdrmati dominaciju Amazon Web Servicesa, Googlea i Microsofta u tržištu AI inferencije.

• Puna podrška za Qwen3 32B

Groq je na vlastitoj infrastrukturi omogućio rad Alibabina jezičnog modela Qwen3 32B s cijelim kontekstnim prozorom od 131 000 tokena. Tvrtka tvrdi da nijedan drugi „brzi” pružatelj inferencije trenutačno ne nudi toliku količinu konteksta uz usporedive performanse.

Prema mjerenju neovisne kuće Artificial Analysis, Groq isporučuje oko 535 tokena u sekundi, što omogućuje obradu dugih dokumenata i složenih zadataka u stvarnom vremenu. Cijena usluge iznosi 0,29 USD za milijun ulaznih i 0,59 USD za milijun izlaznih tokena – ispod cijena mnogih konkurenata.

Ključ leži u Groqovu vlastitom Language Processing Unit čipu, građenom specijalno za inferenciju, za razliku od općih GPU-ova na koje se oslanjaju veći pružatelji.

• Integracija s Hugging Faceom

Istovremeno je Groq postao službeni inference-provider na platformi Hugging Face, s izravnim odabirom u Playgroundu i API-ju te naplatom preko Hugging Face računa. Osim Qwen3 32B, podržani su i modeli Meta Llama, Google Gemma i drugi.

Zahvaljujući tom potezu Groq dolazi pred milijune razvojnih inženjera koji svakodnevno koriste Hugging Face, čime si otvara prostor za brzi rast prometa, ali i pritiske na održavanje performansi u globalnom mjerilu.

• Što slijedi?

Tvrtka trenutno obrađuje više od 20 milijuna tokena u sekundi iz podatkovnih centara u SAD-u, Kanadi i na Bliskom istoku te planira daljnje širenje. Ipak, suočava se s golemoj konkurencijom infrastrukturnih divova poput AWS-a, Google Vertex AI-ja i Azure OpenAI-ja, koji raspolažu neusporedivo većim resursima.

Groq vjeruje da će potražnja za inferencijskim kapacitetom „eksponencijalno rasti” i da će volumen nadoknaditi niske marže: „Čak i kad bismo ove godine udvostručili planiranu infrastrukturu, i dalje ne bi bilo dovoljno kapaciteta za današnju potražnju”, poručuju iz tvrtke.

Prema procjeni Grand View Researcha, tržište čipova za AI inferenciju moglo bi do 2030. vrijediti 154,9 milijardi USD. Ako Groq ispuni obećanja o brzini i trošku, korisnici će dobiti jeftiniju alternativu za aplikacije koje zahtijevaju velike kontekstne prozore – od pravne analize do složenog „reasoning” koda. U suprotnom, rizik oslanjanja na manjeg dobavljača mogao bi nadmašiti potencijalnu uštedu.

Za sada, developerska zajednica dobila je još jednu visokoperformansnu opciju, dok tržište prati može li specijalizirani hardver dugoročno parirati globalnim oblakuša.

#google#groq#hugging-face#amazon-web-services#alibaba

Slično

Tehnologija

Kineski DeepSeek otvorio novu frontu u AI utrci s GPT-om i Geminijem
DeepSeek je objavio open-source modele koji po rezultatima i cijeni izvedbe izazivaju GPT-5 i Gemini-3.0-Pro, unatoč političkim pritiscima i ograničenjima čipova.

min čitanja

Više

Tehnologija

AWS i Visa udružuju snage za brži razvoj agentične trgovine
AWS donosi Visa Intelligence Commerce na svoj Marketplace i najavljuje otvorene nacrte za izgradnju AI agenata koji samostalno obavljaju kupnju i plaćanja.

min čitanja

Više

Tehnologija

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela
Ciscoovo istraživanje otkriva da upornost napadača dramatično povećava uspjeh „jailbreak” napada na otvorene AI modele, sa 13 % na čak 92 %, te poziva poduzeća na jače zaštitne mjere.

min čitanja

Više

Tehnologija

Apptio spaja financije i IT: jedinstveni pogled na troškove ubrzava odluke
Apptio predstavlja rješenje koje ujedinjuje financijske, operativne i poslovne podatke, omogućujući brže i točnije odluke o tehnološkim ulaganjima u doba eksplozije AI-a i clouda.

min čitanja

Više

Tehnologija

Pet velikih prekretnica: znanstvenici mapirali kako se mozak mijenja od djetinjstva do duboke starosti
Istraživači sa Sveučilišta Cambridge otkrili su da se ljudski mozak radikalno preoblikuje pet puta, s ključnim prekretnicama u dobi od 9, 32, 66 i 83 godine.

min čitanja

Više

Tehnologija

Američki startup Arcee AI lansirao Trinity Mini i Nano, najavio gigantski model za 2026.
Trinity obitelj donosi otvorene modele trenirane isključivo u SAD-u; najveći, Trinity Large, stiže početkom 2026.

min čitanja

Više

Tehnologija

Osijek uoči Green Matrix Summita: Slavonija pokazuje kako izgleda zelena i digitalna budućnost
Treće izdanje Green Matrix Summita 4. i 5. prosinca u Osijeku okuplja više od pedeset stručnjaka kako bi ubrzali zelenu i digitalnu tranziciju gospodarstva Slavonije.

min čitanja

Više

Tehnologija

Američka tvrtka Flock snimke iz nadzornih kamera šalje na obradu radnicima u inozemstvu
Otkrivene upute i popisi radnika pokazuju da Flock nadzorne snimke iz SAD-a označava radnicima na Filipinima, što potiče nova pitanja o privatnosti i nadzoru.

min čitanja

Više

Tehnologija

Cyber Monday donosi najjeftiniji HBO Max do sada: 3 dolara mjesečno, ali samo za nove korisnike
HBO Max, Disney Plus, Hulu i Apple TV+ snažno spuštaju cijene za Cyber Monday, ali popusti vrijede samo onima koji se prijavljuju prvi put.

min čitanja

Više

Tehnologija

Utrka s AI napadima: hibridna cloud sigurnost traži hitan zaokret
Umjetna inteligencija ubrzala je kibernetičke napade, a stari modeli zaštite više ne prate tempo. Istraživanja otkrivaju rekordne stope provala, dok CrowdStrike najavljuje sustav koji reagira u sekundama.

min čitanja

Više

Najčitanije

Vijesti

Plava vrpca Vjesnika okupila heroje mora: od Omiša do Premude
Svečanost u Opatiji okupila hrabre spasitelje; glavna priznanja dobili Omišanin Mario Popovac, mještani Premude i crnogorska mornarica, dok je posebno priznanje pripalo profesoru Alenu Jugoviću.

min čitanja

Više

Politika

Tisuće na ulicama Sofije zbog skorog uvođenja eura: prosvjedi prerasli u sukobe s policijom
Demonstranti u bugarskoj prijestolnici napali su policiju kamenjem i pirotehnikom, prosvjedujući protiv proračuna i prelaska na euro 1. siječnja.
By European Parliament from EU - New ECB Chief Lagarde to address plenary for first time, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=96224562

min čitanja

Više

Nogomet

FIFA u subotu otkriva kompletan raspored SP-a 2026.
U Washingtonu se u petak održava ždrijeb skupina za SP 2026., a dan kasnije FIFA uživo otkriva detaljan raspored svih 104 utakmice.

min čitanja

Više

Biznis

Bruxelles odobrio sedmi hrvatski zahtjev: stiže još 1,1 milijarda eura za reforme i ulaganja
Europska komisija potvrdila je da je Hrvatska ispunila svih 22 etape i 31 cilj za sedmu tranšu sredstava iz Nacionalnog plana oporavka i otpornosti, vrijednu 1,1 milijardu eura.

min čitanja

Više

Nogomet

Autor autorsko pravo: GNK Dinamo Zagreb - https://gnkdinamo.hr/, Poštena uporaba, https://hr.wikipedia.org/w/index.php?curid=790542

Dinamo uz golmana manje slomio Goricu i zasjeo na vrh HNL-a
Monsef Bakrar i Marko Soldo presudili Gorici, a Dinamo je s igračem manje obranio vodstvo i preuzeo vrh prvenstvene ljestvice.

min čitanja

Više

Najnovije

Politika

Nizozemski kralj u Surinamu: „Nećemo bježati od pitanja ropstva”

Politika

Broj zaposlenih osoba s invaliditetom u tri godine udvostručen, slijede nove potpore poslodavcima

Vijesti

Stručnjaci upozoravaju na uspon „prevarantskih država” u jugoistočnoj Aziji

Tehnologija

Jedan upit blokiran, deset prolazi: višekratni napadi ruše sigurnost otvorenih AI modela

Vijesti

Francuski srebrnjaci iz križarskog doba otkriveni u Baranji blistaju u Osijeku

Vijesti

E-mailovi upozoravali na psihički slom osumnjičenog za pucnjavu na pripadnike Nacionalne garde

Vijesti

Portreti obrane: Osječki veterani pokrenuli potragu za imenima 3.000 pripadnika 106. brigade

Sport

Modrić se prisjetio dolaska u Real: „Cristiano je rekao – napokon si došao”

Vijesti

Pijan sletio s ceste kod Ražina i prevrnuo automobil

Vijesti

WHO uvjetno preporučio GLP-1 lijekove za liječenje pretilosti

Vijesti

Katalonske školjke otkrivaju zvuk star 6 000 godina