Kitajec, ki je na glavo obrnil svet umetne inteligence: “Nismo ga jemali resno”

Jan Artiček 2. februarja, 2025 14.33

Ustanovitelj DeepSeeka Liang Venfeng pravi, da bodo njihovi modeli umetne inteligence ostali odprtokodni (Foto: PROFIMEDIA)

Ko je Liang Venfeng leta 2021 začel graditi svoj podatkovni center za razvoj umetne inteligence, so poslovni partnerji menili, da gre za ekscentrično idejo. Zdaj njegov DeepSeek izziva ameriške velikane.

2. februarja, 2025 14.33

“Tokrat naš cilj niso hitri dobički, temveč premikanje tehnoloških meja in poganjanje rasti ekosistema,” je v intervjuju julija lani drzno dejal Liang Venfeng, ustanovitelj laboratorija za umetno inteligenco DeepSeek, ki je z letos objavljenim modelom DeepSeek R1 zatresel tehnološke trge in eni največjih družb na svetu, Nvidii, v enem dnevu zbrisal več kot 500 milijard dolarjev tržne vrednosti.

Trumpovi uvedbi carin sledila takojšnja reakcija Kitajske, Kanade in Mehike

Forbes Slovenija

Inženir elektroinformatike in finančnik Liang Venfeng je imel v mislih pristop kitajskih podjetij, ki so dolga leta prevzemala inovacije iz tujine in jih monetizirala z razvojem lastnih aplikacij. Njegov DeepSeek temelji na ideji, da to ni dolgoročno vzdržna strategija, poleg tega pa ima po njegovem mnenju Kitajska dovolj denarja, da postane vodilna na svetu pri razvoju lastnih tehnologij.

“Kar nam manjka, ni kapital, temveč samozavest in zmožnost, da organiziramo talente visokega kalibra za učinkovite inovacije,” je Liang Venfeng še dejal v intervjuju za kitajski medij 36Kr, ki ga je poobjavil portal The China Academy.

Kako je torej 40-letnemu vlagatelju uspel veliki met z “obstranskim projektom” umetne inteligence, ki ga je financiral z dobički od trgovanja z delnicami? Prvič, ti dejavnosti se za Venfenga prepletata, saj je tudi borzne dobičke ustvaril s pomočjo umetne inteligence.

Kitajski laboratorij za umetno inteligenco DeepSeek — Klepetalni robot DeepSeek je prejšnji teden postal najpogosteje prenesena aplikacija v trgovini App Store (Foto: PROFIMEDIA)

Trgovanje z umetno inteligenco

Venfeng je bil rojen leta 1985 v Žandžjangu v provinci Guangdong na jugovzhodu Kitajske. Študiral je na javni univerzi Žedžjang, kjer je leta 2007 diplomiral iz elektroinformatike in leta 2010 magistriral kot inženir informatike in komunikacij. Že v magistrski nalogi se je ukvarjal z umetno inteligenco, po študiju pa je iskal različne načine, kako znanje unovčiti.

Preboj mu je uspel leta 2015, ko je z dvema kolegoma s fakultete ustanovil kvantitativni hedge sklad High Flyer. ‘Kvantitativni’ pomeni, da odločitve o trgovanju z delnicami temeljijo na matematičnih modelih in so avtomatizirane, namesto da bi jih sprejemal upravitelj premoženja. Leta 2016 so začeli preizkušati strojno učenje in ga leta 2018 integrirali v svoje trgovanje.

Do leta 2021 je sklad po poročanju Bloomberga upravljal 90 milijard juanov (skoraj 12 milijard evrov) in je bil eden največjih takšnih skladov na Kitajskem, naslednje leto pa je zaradi pretresov na kitajskih trgih imel izgube. Zaradi izgub se je svojim vlagateljem tudi opravičil, rekoč, da je njihova umetna inteligenca v časih velikih nihanj napačno tempirala nekatere transakcije. Lani so spremenili svojo strategijo, sredstva v upravljanju pa so upadla na 60 milijard juanov (slabih osem milijard evrov).

Kakšne so minimalne plače po Evropi in kam se uvršča Slovenija

Forbes Slovenija

V Ljubljani želijo zgraditi 100-metrsko futuristično stolpnico

Marko Rabuza

Stranski projekt, ki bo spremenil igro

Toda v ozadju posla je Venfeng že nekaj let pripravljal drugo zgodbo. Leta 2019 je ustanovil raziskovalni laboratorij High Flyer AI, ki se je financiral iz High Flyerjevega proračuna za razvoj algoritmov umetne inteligence in se je zanašal na procesorsko moč kvantitativnega sklada.

Dve leti pozneje, v 2021, je Venfeng za svoj raziskovalni projekt kupil 10 tisoč čipov Nvidia A100, ki se uporabljajo v podatkovnih centrih za urjenje umetne inteligence, preden je stroge omejitve izvoza naprednih čipov na Kitajsko uvedel nekdanji ameriški predsednik Joe Biden. Tik pred zaključkom mandata je Bidnova administracija decembra lani še zaostrila embargo, s katerim med drugim želi omejiti kitajski napredek na področju proizvodnje polprevodnikov in razvoja umetne inteligence.

Znancem in poslovnim partnerjem se je njegov projekt zdel nenavaden in brez resne perspektive. “Ko smo ga prvič srečali, je bil kot piflarski tip z grozno frizuro. Govoril je o gradnji centra z 10 tisoč čipi za usposabljanje lastnih modelov (umetne inteligence, op. a.). Nismo ga jemali resno,” so poslovni partnerji dejali za Financial Times. A Venfeng jim je dejal, da bo projekt “spremenil igro”.

Podatkovni center Facebooka v Teksasu — Za razvoj umetne inteligence je potrebne precej računalniške moči, zato razvijalci potrebujejo energetsko intenzivne podatkovne centre. Na sliki podatkovni center Facebooka v Teksasu. (Foto: PROFIMEDIA)

Najprej osvojil Kitajsko

Nato je maja 2023 ustanovil laboratorij DeepSeek, ki si je za cilj zadal dosego splošne umetne inteligence (artificial general intelligence – AGI) z razvojem odprtokodnih modelov generativne umetne inteligence. K temu cilju stremi tudi vodilni razvijalec OpenAI pod vodstvom direktorja Sama Altmana, ki je novembra 2022 sprožil tekmo na tem področju s klepetalnikom ChatGPT. Toda ameriški OpenAI v nasprotju z DeepSeekom – in svojemu imenu navkljub – ni odprtokoden.

DeepSeek, ki ga še vedno financira High Flyer, je novembra 2023 izdal prvi model, namenjen kodiranju, in prvi veliki jezikovni model (LLM), na katerem temeljijo klepetalniki, kot je ChatGPT.

Preboj na Kitajskem je sledil sredi lanskega leta, ko je druga verzija velikega jezikovnega modela DeepSeek V2 sprožila cenovno vojno med modeli umetne inteligence. Model DeepSeeka je namreč za nižjo ceno nudil primerljivo kakovost kot tekmeci, kar je kitajske velikane Alibaba, Tencent, Baidu in ByteDance prisililo v nižanje cen svojih modelov. Poleg tega naj bi DeepSeek kljub nižji ceni posloval z dobičkom, ostali tekmeci pa z izgubo.

Venfeng je bil nad cenovno vojno presenečen. “Nismo pričakovali, da bo cena tako občutljivo vprašanje. Enostavno smo sledili svojemu tempu, preračunali stroške in temu primerno postavljali cene. Naše načelo ni niti prodajanje z izgubo niti iskanje pretiranih dobičkov. Trenutne cene omogočajo skromno stopnjo dobička nad našimi stroški,” je dejal za 36Kr.

Ameriški avtovelikan: Kopirali bomo to, kar delajo na Kitajskem

Forbes

Slovaki v Ljubljani načrtujejo 1.700 stanovanj: Presenečeni smo nad hitrostjo

Marko Rabuza

Svetovna senzacija

Decembra lani je DeepSeek lansiral še tretjo verzijo LLM, DeepSeek V3, ki je januarja letos skoraj čez noč tlakovala pot mednarodni slavi. Na njej namreč temelji mobilna klepetalna aplikacija DeepSeek, ki je po lansiranju 20. januarja v nekaj dneh postala najpogosteje prenesena aplikacija v Applovi trgovini App Store. Še isti dan je DeepSeek predstavil nov “razmišljujoči” (ang. reasoning) model R1, ki pri odgovorih na vprašanja razloži, kako je prišel do odgovora. Ta je po nekaterih testih primerljiv z OpenAIjevim zadnjim modelom o1.

20. januar je bil pomemben dan za Venfenga, ki so ga mediji hitro oklicali za “kitajskega Sama Altmana”. Medtem ko sta na trg prišla mobilna aplikacija in nov model, se je udeležil simpozija v Pekingu, ki ga je organiziral kitajski premier Li Čijang. Venfeng je bil povabljen kot strokovnjak za umetno inteligenco. Video kitajske državne televizije z dogodka prikazuje, kako premier pozorno posluša govor inženirja.

Ustanovitelj DeepSeeka Liang Venfeng (desno) je o umetni inteligenci govoril s kitajskim premierjem Li Čijangom (Foto: Zajem zaslona)

Čez teden dni je po širjenju besede o DeepSeeku za 17 odstotkov upadla delnica Nvidie, glavnega proizvajalca čipov za razvoj umetne inteligence. Ameriški velikan je v enem dnevu izgubil okrog 590 milijard dolarjev vrednosti, največ v zgodovini ameriških borz, medtem ko so tehnološke delnice skupaj izgubile okrog tisoč milijard dolarjev vrednosti.

DeepSeek je sprožil dvome, da so za razvoj modelov umetne inteligence potrebne milijardne naložbe v drage čipe in podatkovne centre. To je zamajalo zaupanje v poslovni model Nvidie, ki s svojimi zmogljivimi grafičnimi procesorji obvladuje okrog 80 odstotkov trga umetne inteligence. A pomanjkanje najboljših čipov Nvidie je kot glavni izziv izpostavil tudi Venfeng. “Naš izziv nikoli ni bil denar, temveč embargo na vrhunske čipe,” je dejal v intervjuju.

Znani hrvaški tekstilec bo ustavil proizvodnjo

Forbes Slovenija

Stroka o predlogu nepremičninskega davka: ustavno sporen in previsok

Forbes Slovenija

Nižji stroški in manj zmogljivi čipi

Podjetje je v decembrskem tehničnem poročilu zatrdilo, da so model DeepSeek V3 razvili za manj kot šest milijonov dolarjev s čipi Nvidie H800. To je prilagojena in za približno polovico manj zmogljiva različica paradnega čipa Nvidie H100, ki je ameriškemu velikanu omogočala izvoz na Kitajsko kljub prepovedi izvoza čipov A100 in H100. Ameriški razvijalci, kot so OpenAI, Google in Meta Platforms, za svoje modele namenjajo več sto milijonov dolarjev.

Nekateri zahodni analitiki opozarjajo, da ima DeepSeek podatkovni center z več kot le 10 tisoč čipi A100, ki so jih dobili pred začetkom embarga. Dylan Patel, ustanovitelj svetovalnega podjetja na področju umetne inteligence SemiAnalysis, ocenjuje, da ima podjetje tudi več kot 50 tisoč čipov linije Hopper (domnevno H800, ki jih Nvidia lahko izvaža v Kitajsko). A to je še vedno manj od tekmecev. Za primerjavo, lastnik Facebooka Meta Platforms svoje algoritme poganja s 600 tisoč precej bolj zmogljivimi čipi H100, navaja Bloomberg.

Na nizke stroške DeepSeeka sicer kaže tudi cena njegovih izdelkov. DeepSeek je uporabnikom na voljo brezplačno oziroma zelo poceni za razvijalce aplikacij, medtem ko so modeli OpenAI precej dražji. Programski vmesnik za aplikacije (API) za DeepSeek R1 stane 0,55 dolarja na milijon vhodnih žetonov in 2,19 dolarja na milijon izhodnih žetonov v primerjavi z API za OpenAIjev model o1, ki stane 15 dolarjev na milijon vhodnih oziroma 60 dolarjev na milijon izhodnih žetonov.

Naročnina na Pro verzijo ChatGPT, ki vključuje model o1, stane 200 dolarjev na mesec. DeepSeek je brezplačen, podobno kot najosnovnejši model OpenAI zahteva le registracijo.

Glavni izvršni direktor Nvidie Jensen Huang — Nvidia, ki jo vodi Jensen Huang, največ prihodkov ustvari s prodajo čipov razvijalcem umetne inteligence (Foto: PROFIMEDIA)

Budnica za Silicijevo dolino

Novi ameriški predsednik Donald Trump je nedavno pozdravil prihod DeepSeeka na trg, saj kaže na to, da se da modele umetne inteligence razviti za manj denarja. “To vidim kot pozitivno, kot prednost,” je dejal na tiskovni konferenci. Obenem pa je opozoril, da je DeepSeek izziv za domačo Silicijevo dolino oziroma “budnica za našo industrijo, ki mora biti lasersko osredotočena, če hoče zmagati”.

Le nekaj dni pred tem je Trump skupaj z Altmanom iz OpenAIja, Larryjem Ellisonom iz Oracla in Masajošijem Sonom iz Softbank predstavil projekt Stargate, ki bo namenil do 500 milijard dolarjev za gradnjo podatkovnih centrov za razvoj umetne inteligence v ZDA. Prvih 100 milijard naj bi bilo zagotovljenih, gradnja prvega centra je že stekla v Teksasu, projekt pa naj bi ustvaril 100 tisoč delovnih mest v ZDA.

Venfeng, ki svoj kader programerjev novači na domačih univerzah, medtem želi, da bi Kitajska postala bolj razvojno usmerjena, namesto da bi se zanašala na inovacije iz tujine, kot je to počela v zadnjih treh desetletjih. Kot gospodarstvo v razvoju se je usmerjala predvsem v aplikacije novih tehnologij, ki lahko hitro ustvarijo dobiček, manj pa v lastne inovacije. Danes, ko je kitajsko gospodarstvo večje, velikani, kot sta lastnik TikToka ByteDance in lastnik WeChata Tencent, pa kujejo zavidljive dobičke, je potrebna sprememba miselnosti, meni.

“Inovativnost ni izključno poslovno usmerjena; zahteva radovednost in ustvarjalne ambicije. Omejujejo nas stare navade, a to je zgolj faza,” je prepričan Venfeng.

Ob tem novi guru umetne inteligence zagotavlja, da DeepSeek nikoli ne bo zaprl svoje izvorne kode, kot je to storil OpenAI. “V prelomnih tehnologijah so zaprtokodni obrambni jarki le začasni. Tudi zaprtokodni model OpenAI ne more preprečiti drugim, da bi jih dohiteli,” je dejal.

oznake

Kitajec, ki je na glavo obrnil svet umetne inteligence: “Nismo ga jemali resno”

Trumpovi uvedbi carin sledila takojšnja reakcija Kitajske, Kanade in Mehike

Trgovanje z umetno inteligenco

Kakšne so minimalne plače po Evropi in kam se uvršča Slovenija

V Ljubljani želijo zgraditi 100-metrsko futuristično stolpnico

Stranski projekt, ki bo spremenil igro

Najprej osvojil Kitajsko

Ameriški avtovelikan: Kopirali bomo to, kar delajo na Kitajskem

Slovaki v Ljubljani načrtujejo 1.700 stanovanj: Presenečeni smo nad hitrostjo

Svetovna senzacija

Znani hrvaški tekstilec bo ustavil proizvodnjo

Stroka o predlogu nepremičninskega davka: ustavno sporen in previsok

Nižji stroški in manj zmogljivi čipi

Budnica za Silicijevo dolino

Hidria bo širila proizvodnjo na Jesenicah zaradi rasti naročil

Bojkot na Hrvaškem: trgovci izgubili milijone evrov prihodkov

Ikonična glasbena znamka v roke kitajskemu skladu

Novartis lani povečal dobiček, v Sloveniji vložil četrt milijarde evrov

Razkrivamo: namesto da bi goreli alarmi, je Spirit dodelil novo subvencijo

Previdno pri preverjanju vrednosti nepremičnin: poglejte, kaj vse spada zraven

oznake