Nakon što je izazvao iznenađenje u svetu tehnologije sa svojim modelom umetničke inteligencije R1, kineski startup DeepSeek se suočava sa jednostavnim, ali kritičnim pitanjem: da li su njihovi tvrdnje o mogućnostima R1 realistične ili su rezultat pretjerivanja? Njihov model, koji je razvijen po znatno nižim troškovima u poređenju sa sličnim tehnologijama iz Sjedinjenih Američkih Država, potaknuo je sumnje unutar tehnološke zajednice i izazvao razne komentare o kredibilitetu navoda kompanije.
DeepSeek, kompanija sa sedištem u Hangzhou, tvrdi da je R1 razvijen uz korišćenje 2.000 komada Nvidia H800 GPU-a, što je manje napredan čip u odnosu na one koje koriste najmoćniji konkurenti. Na treniranje modela potrošili su 5,6 miliona dolara, što je u velikom kontrastu sa procenama troškova treninga AI modela kao što je OpenAI-jev GPT-4, za koji se smatra da je koštao preko 100 miliona dolara i koristio 25.000 naprednijih GPU-ova.
Pedro Domingos, profesor na Univerzitetu Washington, istakao je da je legitimnost DeepSeekovih tvrdnji veoma otvoreno pitanje. Naveo je da se konsultanti i istraživači u oblasti AI verovatno neće složiti sa DeepSeekovim modelom, dodajući da bi moglo biti više troškova nego što kompanija priznaje. U ovom povodu, skeptici sugeriraju da je moguće da DeepSeek zaista koristio naprednije tehnologije nego što su to prikazali.
Budžet kompanije izazvao je dodatnu sumnju, a Palmer Luckey, osnivač Oculus VR-a, optužio je DeepSeek za širenje “kineske propagande” i označio njihove troškove kao “lažne”. U međuvremenu, Elan Musk je takođe izrazio sumnju, komentarišući situaciju na društvenim mrežama. Alexandr Wang, izvršni direktor Scale AI, prokomentarisao je kako je moguće da DeepSeek ima pristup naprednijim čipovima nego što priznaju, ali nije pružio dokaze za svoje tvrdnje.
Još dodatnih kritika upućeno je na račune kompanije zbog cenzuriranja i osjetljivih tema vezanih za politiku u Kini, što takođe može uticati na njegovu upotrebljivost na globalnom tržištu. Korisnici R1 su primetili da su teme poput masakra na Trgu Tiananmen i statusa Tajvana podložne cenzuri, što dodatno komplikuje sliku o ovom modelu.
Uprkos brojnim kritikama, neki analitičari smatraju da je R1 značajno dostignuće. Tim Miller, profesor veštačke inteligencije na Univerzitetu Queensland, istakao je da izveštaji o DeepSeeku sadrže mnogo nejasnoća, ali da je korisnost modela očigledna. Dodao je da su veliki naučni proboji mogući, ukoliko se osigura da su troškovi i procesi transparentni.
DeepSeek je, očigledno, ušao u nevjerojatno kompetitivan prostor gde su investicije i troškovi ključni za inovacije, pa je stoga važnost procene njihovih tvrdnji ekvivalentna razumevanju novih granica umetničke inteligencije u globalnom kontekstu. Promene na tržištu, poput pada i brzog oporavka cena Nvidijinih akcija, dodatno reflektuju klimavu situaciju u kojoj se kompanija nalazi.
Sa tehnologijama koje se brzo razvijaju i tržištem koje postaje sve kompetitivnije, suštinski je pitanje ne samo koliko su troškovi treniranja AI modela upravljivi, već i da li su inovacije koje dolaze iz Kine dostatne pravim globalnim izazovima. Delo koje je napredovalo u kineskom izvozu tehnologije takođe mora razmotriti kako njihovi modeli utiču na postojeće paradigme u SAD-u i širom sveta, kao i kako se strateške odluke donose kada su u pitanju međunarodne finansije i inovacije.
Potrebno je vreme da bi se razjasnila ta situacija i postigla ravnoteža između onog što je moguće, a šta je možda samo spekulacija. R1 predstavlja pitanje koje će verovatno zahtevati dublju analizu i dalja istraživanja da bi se razjasnile sve tajne koje se kriju iza DeepSeekovog hrabrog pokušaja da uzdrma scenu veštačke inteligencije.




