Czy DeepSeek wstrząśnie krzemową doliną
INFORMACJA29-01-2025
Czy DeepSeek wstrząśnie krzemową doliną
Wprowadzenie przez chiński startup DeepSeek najnowszych modeli AI, które według firmy są porównywalne lub lepsze od wiodących w branży modeli w Stanach Zjednoczonych, a kosztują ułamek ceny, grozi zachwianiem porządku świata technologii. Firma przyciągnęła uwagę w światowych kręgach AI po tym, jak w zeszłym miesiącu napisała w artykule, że szkolenie DeepSeek-V3 wymagało mocy obliczeniowej układów Nvidia H800 o wartości mniejszej niż 6 milionów dolarów.

Asystent AI firmy DeepSeek, oparty na DeepSeek-V3, wyprzedził konkurencyjnego ChatGPT i stał się najlepiej ocenianą bezpłatną aplikacją dostępną w App Store firmy Apple w Stanach Zjednoczonych.
Wywołało to wątpliwości co do uzasadnienia decyzji niektórych amerykańskich firm technologicznych o zainwestowaniu miliardów dolarów w AI, a akcje kilku dużych graczy technologicznych, w tym Nvidia, zostały uderzone.

Poniżej przedstawiono kilka faktów na temat firmy, która wstrząsa sektorem AI na całym świecie.

Uploaded Image
NVIDIA Corporation (NVDA), dane za ostanie 5 dni (24.01-29-01)
Dlaczego DeepSeek wywołuje poruszenie?

Wydanie ChatGPT firmy OpenAI pod koniec 2022 r. wywołało zamieszanie wśród chińskich firm technologicznych, które rzuciły się na tworzenie własnych chatbotów opartych na sztucznej inteligencji.
Jednak to wydanie pierwszego chińskiego odpowiednika ChatGPT, stworzonego przez giganta wyszukiwarek Baidu otwiera nową kartę. W Chinach panowało powszechne rozczarowanie luką w możliwościach AI między firmami amerykańskimi i chińskimi.
Jakość i opłacalność modeli DeepSeek wywróciły tę narrację do góry nogami. Dwa modele, które zostały obsypane pochwałami przez dyrektorów z Doliny Krzemowej i inżynierów amerykańskich firm technologicznych, DeepSeek-V3 i DeepSeek-R1, są porównywalne z najbardziej zaawansowanymi modelami OpenAI i Meta.

Są również tańsze w użyciu. DeepSeek-R1, wydany w zeszłym tygodniu, jest od 20 do 50 razy tańszy w użyciu niż model OpenAI o1, w zależności od zadania. Jednak niektórzy publicznie wyrazili sceptycyzm co do historii sukcesu DeepSeek.

Dyrektor generalny Scale AI Alexandr Wang powiedział w czwartek podczas wywiadu dla CNBC, nie przedstawiając dowodów, że DeepSeek ma 50 000 chipów Nvidia H100, które, jak twierdził, nie zostaną ujawnione, ponieważ naruszyłoby to kontrolę eksportu Waszyngtonu, która zabrania sprzedaży takich zaawansowanych chipów AI chińskim firmom. DeepSeek nie odpowiedział natychmiast na prośbę o komentarz w sprawie zarzutu.
Analitycy Bernstein podkreślili w poniedziałek w notatce badawczej, że całkowite koszty szkolenia DeepSeek dla jego modelu V3 były nieznane, ale były znacznie wyższe niż 5,58 miliona dolarów, które według startupu zostały przeznaczone na moc obliczeniową. Analitycy powiedzieli również, że koszty szkolenia równie cenionego modelu R1 nie zostały ujawnione.

Kto stoi za DeepSeek?

DeepSeek to startup z siedzibą w Hangzhou, którego większościowym udziałowcem jest Liang Wenfeng, współzałożyciel funduszu hedgingowego High-Flyer, opartego na chińskich dokumentach korporacyjnych.
Fundusz Lianga ogłosił w marcu 2023 r. na swoim oficjalnym koncie WeChat, że „zaczyna od nowa”, wykraczając poza handel, aby skoncentrować zasoby na stworzeniu „nowej i niezależnej grupy badawczej, aby zbadać istotę AGI” (sztucznej inteligencji ogólnej). DeepSeek został stworzony pod koniec tego samego roku.
Twórcy ChatGPT OpenAI definiują AGI jako autonomiczne systemy, które przewyższają ludzi w najbardziej wartościowych ekonomicznie zadaniach.
Nie jest jasne, ile High-Flyer zainwestował w DeepSeek. High-Flyer ma biuro w tym samym budynku co DeepSeek i posiada również patenty związane z klastrami chipów używanymi do trenowania modeli AI, zgodnie z chińskimi dokumentami korporacyjnymi.
Jednostka AI High-Flyer poinformowała na swoim oficjalnym koncie WeChat w lipcu 2022 r., że posiada i obsługuje klaster 10 000 chipów A100. JAK

Jak to widzą Chiny?

Sukces DeepSeek został już zauważony w najwyższych kręgach politycznych Chin. 20 stycznia, w dniu, w którym DeepSeek-R1 został udostępniony publicznie, założyciel Liang wziął udział w zamkniętym sympozjum dla biznesmenów i ekspertów, którego gospodarzem był chiński premier Li Qiang, według państwowej agencji informacyjnej Xinhua.
Obecność Lianga na spotkaniu jest potencjalnym znakiem, że sukces DeepSeek może mieć znaczenie dla celu polityki Pekinu, jakim jest przezwyciężenie kontroli eksportu Waszyngtonu i osiągnięcie samowystarczalności w strategicznych branżach, takich jak AI.

Udostępnij ten artykuł: