Kineski start-up DeepSeek odgodio je lansiranje svojeg novog modela umjetne inteligencije R2 nakon što ga nije uspio u potpunosti istrenirati na Huaweijevim čipovima Ascend, doznaje se od nekoliko upućenih izvora.
DeepSeek je u siječnju predstavio prethodnu verziju R1, a vlasti su tvrtku potom potaknule da pri daljnjem razvoju umjesto Nvidijinih sustava koristi domaću alternativu – Ascend. Tijekom pripreme modela R2 pojavili su se međutim „ozbiljni tehnički problemi”, pa je start-up na kraju trenirao sustav na Nvidijinim čipovima, dok je Ascend zadržan samo za fazu zaključivanja (inference).
Izvori navode da su upravo ti problemi doveli do odgode planiranog svibanjskog predstavljanja modela, čime je DeepSeek izgubio prednost pred konkurencijom. Poteškoće bacaju dodatno svjetlo na jaz između kineskih i američkih poluvodičkih rješenja: insideri iz industrije tvrde da su kineski čipovi nestabilniji, sporije se povezuju i prate ih slabija softverska rješenja u odnosu na Nvidijine proizvode.
Kako bi ubrzao razvoj, Huawei je u DeepSeekov ured poslao tim inženjera, no ni uz njihovu pomoć obuka na čipu Ascend nije uspjela. Tvrtke ipak nastavljaju surađivati kako bi se Ascend u budućnosti mogao koristiti i za treniranje i za zaključivanje.
Ograničenja dolaze u trenutku kada Peking, prema pisanju Financial Timesa, od tehnoloških tvrtki traži dodatna obrazloženja za svaku narudžbu Nvidijinog novog čipa H20, nastojeći ih potaknuti na korištenje domaćih alternativa Huaweija i Cambricona. Slabiji rezultati Ascenda pokazuju, međutim, koliko je još posla pred kineskom industrijom poluvodiča u nastojanju da postigne tehnološku samodostatnost.