Asystent AI firmy DeepSeek, oparty na DeepSeek-V3, wyprzedził konkurencyjnego ChatGPT i stał się najlepiej ocenianą bezpłatną aplikacją dostępną w App Store firmy Apple w Stanach Zjednoczonych.
Wywołało to wątpliwości co do uzasadnienia decyzji niektórych amerykańskich firm technologicznych o zainwestowaniu miliardów dolarów w AI, a akcje kilku dużych graczy technologicznych, w tym Nvidia, zostały uderzone.
Poniżej przedstawiono kilka faktów na temat firmy, która wstrząsa sektorem AI na całym świecie.
Wydanie ChatGPT firmy OpenAI pod koniec 2022 r. wywołało zamieszanie wśród chińskich firm technologicznych, które rzuciły się na tworzenie własnych chatbotów opartych na sztucznej inteligencji.
Jednak to wydanie pierwszego chińskiego odpowiednika ChatGPT, stworzonego przez giganta wyszukiwarek Baidu otwiera nową kartę. W Chinach panowało powszechne rozczarowanie luką w możliwościach AI między firmami amerykańskimi i chińskimi.
Jakość i opłacalność modeli DeepSeek wywróciły tę narrację do góry nogami. Dwa modele, które zostały obsypane pochwałami przez dyrektorów z Doliny Krzemowej i inżynierów amerykańskich firm technologicznych, DeepSeek-V3 i DeepSeek-R1, są porównywalne z najbardziej zaawansowanymi modelami OpenAI i Meta.
Są również tańsze w użyciu. DeepSeek-R1, wydany w zeszłym tygodniu, jest od 20 do 50 razy tańszy w użyciu niż model OpenAI o1, w zależności od zadania. Jednak niektórzy publicznie wyrazili sceptycyzm co do historii sukcesu DeepSeek.
Dyrektor generalny Scale AI Alexandr Wang powiedział w czwartek podczas wywiadu dla CNBC, nie przedstawiając dowodów, że DeepSeek ma 50 000 chipów Nvidia H100, które, jak twierdził, nie zostaną ujawnione, ponieważ naruszyłoby to kontrolę eksportu Waszyngtonu, która zabrania sprzedaży takich zaawansowanych chipów AI chińskim firmom. DeepSeek nie odpowiedział natychmiast na prośbę o komentarz w sprawie zarzutu.
Analitycy Bernstein podkreślili w poniedziałek w notatce badawczej, że całkowite koszty szkolenia DeepSeek dla jego modelu V3 były nieznane, ale były znacznie wyższe niż 5,58 miliona dolarów, które według startupu zostały przeznaczone na moc obliczeniową. Analitycy powiedzieli również, że koszty szkolenia równie cenionego modelu R1 nie zostały ujawnione.
DeepSeek to startup z siedzibą w Hangzhou, którego większościowym udziałowcem jest Liang Wenfeng, współzałożyciel funduszu hedgingowego High-Flyer, opartego na chińskich dokumentach korporacyjnych.
Fundusz Lianga ogłosił w marcu 2023 r. na swoim oficjalnym koncie WeChat, że „zaczyna od nowa”, wykraczając poza handel, aby skoncentrować zasoby na stworzeniu „nowej i niezależnej grupy badawczej, aby zbadać istotę AGI” (sztucznej inteligencji ogólnej). DeepSeek został stworzony pod koniec tego samego roku.
Twórcy ChatGPT OpenAI definiują AGI jako autonomiczne systemy, które przewyższają ludzi w najbardziej wartościowych ekonomicznie zadaniach.
Nie jest jasne, ile High-Flyer zainwestował w DeepSeek. High-Flyer ma biuro w tym samym budynku co DeepSeek i posiada również patenty związane z klastrami chipów używanymi do trenowania modeli AI, zgodnie z chińskimi dokumentami korporacyjnymi.
Jednostka AI High-Flyer poinformowała na swoim oficjalnym koncie WeChat w lipcu 2022 r., że posiada i obsługuje klaster 10 000 chipów A100. JAK
Sukces DeepSeek został już zauważony w najwyższych kręgach politycznych Chin. 20 stycznia, w dniu, w którym DeepSeek-R1 został udostępniony publicznie, założyciel Liang wziął udział w zamkniętym sympozjum dla biznesmenów i ekspertów, którego gospodarzem był chiński premier Li Qiang, według państwowej agencji informacyjnej Xinhua.
Obecność Lianga na spotkaniu jest potencjalnym znakiem, że sukces DeepSeek może mieć znaczenie dla celu polityki Pekinu, jakim jest przezwyciężenie kontroli eksportu Waszyngtonu i osiągnięcie samowystarczalności w strategicznych branżach, takich jak AI.