Kitajec, ki je na glavo obrnil svet umetne inteligence: “Nismo ga jemali resno”

Ko je Liang Venfeng leta 2021 začel graditi svoj podatkovni center za razvoj umetne inteligence, so poslovni partnerji menili, da gre za ekscentrično idejo. Zdaj njegov DeepSeek izziva ameriške velikane.
“Tokrat naš cilj niso hitri dobički, temveč premikanje tehnoloških meja in poganjanje rasti ekosistema,” je v intervjuju julija lani drzno dejal Liang Venfeng, ustanovitelj laboratorija za umetno inteligenco DeepSeek, ki je z letos objavljenim modelom DeepSeek R1 zatresel tehnološke trge in eni največjih družb na svetu, Nvidii, v enem dnevu zbrisal več kot 500 milijard dolarjev tržne vrednosti.
Inženir elektroinformatike in finančnik Liang Venfeng je imel v mislih pristop kitajskih podjetij, ki so dolga leta prevzemala inovacije iz tujine in jih monetizirala z razvojem lastnih aplikacij. Njegov DeepSeek temelji na ideji, da to ni dolgoročno vzdržna strategija, poleg tega pa ima po njegovem mnenju Kitajska dovolj denarja, da postane vodilna na svetu pri razvoju lastnih tehnologij.
“Kar nam manjka, ni kapital, temveč samozavest in zmožnost, da organiziramo talente visokega kalibra za učinkovite inovacije,” je Liang Venfeng še dejal v intervjuju za kitajski medij 36Kr, ki ga je poobjavil portal The China Academy.
Kako je torej 40-letnemu vlagatelju uspel veliki met z “obstranskim projektom” umetne inteligence, ki ga je financiral z dobički od trgovanja z delnicami? Prvič, ti dejavnosti se za Venfenga prepletata, saj je tudi borzne dobičke ustvaril s pomočjo umetne inteligence.

Trgovanje z umetno inteligenco
Venfeng je bil rojen leta 1985 v Žandžjangu v provinci Guangdong na jugovzhodu Kitajske. Študiral je na javni univerzi Žedžjang, kjer je leta 2007 diplomiral iz elektroinformatike in leta 2010 magistriral kot inženir informatike in komunikacij. Že v magistrski nalogi se je ukvarjal z umetno inteligenco, po študiju pa je iskal različne načine, kako znanje unovčiti.
Preboj mu je uspel leta 2015, ko je z dvema kolegoma s fakultete ustanovil kvantitativni hedge sklad High Flyer. ‘Kvantitativni’ pomeni, da odločitve o trgovanju z delnicami temeljijo na matematičnih modelih in so avtomatizirane, namesto da bi jih sprejemal upravitelj premoženja. Leta 2016 so začeli preizkušati strojno učenje in ga leta 2018 integrirali v svoje trgovanje.
Do leta 2021 je sklad po poročanju Bloomberga upravljal 90 milijard juanov (skoraj 12 milijard evrov) in je bil eden največjih takšnih skladov na Kitajskem, naslednje leto pa je zaradi pretresov na kitajskih trgih imel izgube. Zaradi izgub se je svojim vlagateljem tudi opravičil, rekoč, da je njihova umetna inteligenca v časih velikih nihanj napačno tempirala nekatere transakcije. Lani so spremenili svojo strategijo, sredstva v upravljanju pa so upadla na 60 milijard juanov (slabih osem milijard evrov).
Stranski projekt, ki bo spremenil igro
Toda v ozadju posla je Venfeng že nekaj let pripravljal drugo zgodbo. Leta 2019 je ustanovil raziskovalni laboratorij High Flyer AI, ki se je financiral iz High Flyerjevega proračuna za razvoj algoritmov umetne inteligence in se je zanašal na procesorsko moč kvantitativnega sklada.
Dve leti pozneje, v 2021, je Venfeng za svoj raziskovalni projekt kupil 10 tisoč čipov Nvidia A100, ki se uporabljajo v podatkovnih centrih za urjenje umetne inteligence, preden je stroge omejitve izvoza naprednih čipov na Kitajsko uvedel nekdanji ameriški predsednik Joe Biden. Tik pred zaključkom mandata je Bidnova administracija decembra lani še zaostrila embargo, s katerim med drugim želi omejiti kitajski napredek na področju proizvodnje polprevodnikov in razvoja umetne inteligence.
Znancem in poslovnim partnerjem se je njegov projekt zdel nenavaden in brez resne perspektive. “Ko smo ga prvič srečali, je bil kot piflarski tip z grozno frizuro. Govoril je o gradnji centra z 10 tisoč čipi za usposabljanje lastnih modelov (umetne inteligence, op. a.). Nismo ga jemali resno,” so poslovni partnerji dejali za Financial Times. A Venfeng jim je dejal, da bo projekt “spremenil igro”.

Najprej osvojil Kitajsko
Nato je maja 2023 ustanovil laboratorij DeepSeek, ki si je za cilj zadal dosego splošne umetne inteligence (artificial general intelligence – AGI) z razvojem odprtokodnih modelov generativne umetne inteligence. K temu cilju stremi tudi vodilni razvijalec OpenAI pod vodstvom direktorja Sama Altmana, ki je novembra 2022 sprožil tekmo na tem področju s klepetalnikom ChatGPT. Toda ameriški OpenAI v nasprotju z DeepSeekom – in svojemu imenu navkljub – ni odprtokoden.
DeepSeek, ki ga še vedno financira High Flyer, je novembra 2023 izdal prvi model, namenjen kodiranju, in prvi veliki jezikovni model (LLM), na katerem temeljijo klepetalniki, kot je ChatGPT.
Preboj na Kitajskem je sledil sredi lanskega leta, ko je druga verzija velikega jezikovnega modela DeepSeek V2 sprožila cenovno vojno med modeli umetne inteligence. Model DeepSeeka je namreč za nižjo ceno nudil primerljivo kakovost kot tekmeci, kar je kitajske velikane Alibaba, Tencent, Baidu in ByteDance prisililo v nižanje cen svojih modelov. Poleg tega naj bi DeepSeek kljub nižji ceni posloval z dobičkom, ostali tekmeci pa z izgubo.
Venfeng je bil nad cenovno vojno presenečen. “Nismo pričakovali, da bo cena tako občutljivo vprašanje. Enostavno smo sledili svojemu tempu, preračunali stroške in temu primerno postavljali cene. Naše načelo ni niti prodajanje z izgubo niti iskanje pretiranih dobičkov. Trenutne cene omogočajo skromno stopnjo dobička nad našimi stroški,” je dejal za 36Kr.
Svetovna senzacija
Decembra lani je DeepSeek lansiral še tretjo verzijo LLM, DeepSeek V3, ki je januarja letos skoraj čez noč tlakovala pot mednarodni slavi. Na njej namreč temelji mobilna klepetalna aplikacija DeepSeek, ki je po lansiranju 20. januarja v nekaj dneh postala najpogosteje prenesena aplikacija v Applovi trgovini App Store. Še isti dan je DeepSeek predstavil nov “razmišljujoči” (ang. reasoning) model R1, ki pri odgovorih na vprašanja razloži, kako je prišel do odgovora. Ta je po nekaterih testih primerljiv z OpenAIjevim zadnjim modelom o1.
20. januar je bil pomemben dan za Venfenga, ki so ga mediji hitro oklicali za “kitajskega Sama Altmana”. Medtem ko sta na trg prišla mobilna aplikacija in nov model, se je udeležil simpozija v Pekingu, ki ga je organiziral kitajski premier Li Čijang. Venfeng je bil povabljen kot strokovnjak za umetno inteligenco. Video kitajske državne televizije z dogodka prikazuje, kako premier pozorno posluša govor inženirja.

Čez teden dni je po širjenju besede o DeepSeeku za 17 odstotkov upadla delnica Nvidie, glavnega proizvajalca čipov za razvoj umetne inteligence. Ameriški velikan je v enem dnevu izgubil okrog 590 milijard dolarjev vrednosti, največ v zgodovini ameriških borz, medtem ko so tehnološke delnice skupaj izgubile okrog tisoč milijard dolarjev vrednosti.
DeepSeek je sprožil dvome, da so za razvoj modelov umetne inteligence potrebne milijardne naložbe v drage čipe in podatkovne centre. To je zamajalo zaupanje v poslovni model Nvidie, ki s svojimi zmogljivimi grafičnimi procesorji obvladuje okrog 80 odstotkov trga umetne inteligence. A pomanjkanje najboljših čipov Nvidie je kot glavni izziv izpostavil tudi Venfeng. “Naš izziv nikoli ni bil denar, temveč embargo na vrhunske čipe,” je dejal v intervjuju.
Nižji stroški in manj zmogljivi čipi
Podjetje je v decembrskem tehničnem poročilu zatrdilo, da so model DeepSeek V3 razvili za manj kot šest milijonov dolarjev s čipi Nvidie H800. To je prilagojena in za približno polovico manj zmogljiva različica paradnega čipa Nvidie H100, ki je ameriškemu velikanu omogočala izvoz na Kitajsko kljub prepovedi izvoza čipov A100 in H100. Ameriški razvijalci, kot so OpenAI, Google in Meta Platforms, za svoje modele namenjajo več sto milijonov dolarjev.
Nekateri zahodni analitiki opozarjajo, da ima DeepSeek podatkovni center z več kot le 10 tisoč čipi A100, ki so jih dobili pred začetkom embarga. Dylan Patel, ustanovitelj svetovalnega podjetja na področju umetne inteligence SemiAnalysis, ocenjuje, da ima podjetje tudi več kot 50 tisoč čipov linije Hopper (domnevno H800, ki jih Nvidia lahko izvaža v Kitajsko). A to je še vedno manj od tekmecev. Za primerjavo, lastnik Facebooka Meta Platforms svoje algoritme poganja s 600 tisoč precej bolj zmogljivimi čipi H100, navaja Bloomberg.
Na nizke stroške DeepSeeka sicer kaže tudi cena njegovih izdelkov. DeepSeek je uporabnikom na voljo brezplačno oziroma zelo poceni za razvijalce aplikacij, medtem ko so modeli OpenAI precej dražji. Programski vmesnik za aplikacije (API) za DeepSeek R1 stane 0,55 dolarja na milijon vhodnih žetonov in 2,19 dolarja na milijon izhodnih žetonov v primerjavi z API za OpenAIjev model o1, ki stane 15 dolarjev na milijon vhodnih oziroma 60 dolarjev na milijon izhodnih žetonov.
Naročnina na Pro verzijo ChatGPT, ki vključuje model o1, stane 200 dolarjev na mesec. DeepSeek je brezplačen, podobno kot najosnovnejši model OpenAI zahteva le registracijo.

Budnica za Silicijevo dolino
Novi ameriški predsednik Donald Trump je nedavno pozdravil prihod DeepSeeka na trg, saj kaže na to, da se da modele umetne inteligence razviti za manj denarja. “To vidim kot pozitivno, kot prednost,” je dejal na tiskovni konferenci. Obenem pa je opozoril, da je DeepSeek izziv za domačo Silicijevo dolino oziroma “budnica za našo industrijo, ki mora biti lasersko osredotočena, če hoče zmagati”.
Le nekaj dni pred tem je Trump skupaj z Altmanom iz OpenAIja, Larryjem Ellisonom iz Oracla in Masajošijem Sonom iz Softbank predstavil projekt Stargate, ki bo namenil do 500 milijard dolarjev za gradnjo podatkovnih centrov za razvoj umetne inteligence v ZDA. Prvih 100 milijard naj bi bilo zagotovljenih, gradnja prvega centra je že stekla v Teksasu, projekt pa naj bi ustvaril 100 tisoč delovnih mest v ZDA.
Venfeng, ki svoj kader programerjev novači na domačih univerzah, medtem želi, da bi Kitajska postala bolj razvojno usmerjena, namesto da bi se zanašala na inovacije iz tujine, kot je to počela v zadnjih treh desetletjih. Kot gospodarstvo v razvoju se je usmerjala predvsem v aplikacije novih tehnologij, ki lahko hitro ustvarijo dobiček, manj pa v lastne inovacije. Danes, ko je kitajsko gospodarstvo večje, velikani, kot sta lastnik TikToka ByteDance in lastnik WeChata Tencent, pa kujejo zavidljive dobičke, je potrebna sprememba miselnosti, meni.
“Inovativnost ni izključno poslovno usmerjena; zahteva radovednost in ustvarjalne ambicije. Omejujejo nas stare navade, a to je zgolj faza,” je prepričan Venfeng.
Ob tem novi guru umetne inteligence zagotavlja, da DeepSeek nikoli ne bo zaprl svoje izvorne kode, kot je to storil OpenAI. “V prelomnih tehnologijah so zaprtokodni obrambni jarki le začasni. Tudi zaprtokodni model OpenAI ne more preprečiti drugim, da bi jih dohiteli,” je dejal.