Nemški samorog DeepL skuša premagati Google Translate in ChatGPT

Tehnologija Forbes 12. novembra, 2023 15.37 > 13. novembra, 2023 15.37
featured image

Prevajalska programska oprema DeepL, ki temelji na umetni inteligenci, se letos prvič pojavlja na seznamu Forbes Cloud 100 – po zaslugi prevajalskega modela strojnega učenja, za katerega uporabniki pravijo, da je natančnejši od Googlovega.

12. novembra, 2023 15.37 > 13. novembra, 2023 15.37

Jaroslaw Kutylowski govori nemško, poljsko in angleško (v francoščini pa lahko naroči kokakolo). S prevajalskim orodjem DeepL, ki ga je razvilo njegovo zagonsko podjetje in temelji na umetni inteligenci, lahko bere in piše v še približno 30 drugih jezikih.

Podjetje DeepL, ustanovljeno leta 2017, je razvilo programsko opremo za prevajanje. Kutylowski zanjo pravi, da je veliko natančnejša od konkurenčnih izdelkov, ki jih ponujajo Google in drugi. Zahvala gre zmogljivi umetni inteligenci, ki sodeluje z govorci maternega jezika (native speakers).

Lastno arhitekturo nevronske mreže DeepL – tehnike strojnega učenja, ki računalniku pomaga pri učenju informacij na enak način, kot to počnejo človeški možgani – so usposobili na obsežni zbirki javno dostopnih dvojezičnih (prevedenih) in enojezičnih (neprevedenih) besedil v 31 različnih jezikih, vključno s kitajščino, ruščino, španščino in italijanščino.

To je le majhen delček od 130 jezikov, ki jih lahko prevajate z Googlovim prevajalnikom. Vendar program DeepL pri prevajanju uporablja nianse, ki so jih pripravili človeški uredniki in govorci maternega jezika.

Zagonsko podjetje zaposluje 20 lastnih urednikov in več kot tisoč pogodbenih prevajalcev in govorcev maternega jezika po vsem svetu. Ti ocenjujejo kakovost prevodov modela DeepL, preverjajo točnost in jih prilagajajo.

“Potrebujemo veliko visokokakovostnih podatkov, ki jih je prevedel človek, da se naučimo posebnosti jezika, v katerega prevajamo, in sicer tako priložnostnih kot uradnih besedil,” je povedal Kutylowski.

Prevajalnik Deepl
DeepL pri svojem delovanju poskuša posnemati človeške možgane (Foto: PROFIMEDIA)

Poslovne stranke

DeepL se ponaša z več kot desetimi milijoni mesečnih aktivnih uporabnikov, od katerih jih 500.000 plača od 9 do 59 dolarjev na mesec. Med njimi so stari starši, ki uporabljajo DeepL za pogovor z vnuki v njihovem maternem jeziku, pa tudi romantični partnerji, ki se borijo z jezikovnimi preprekami.

Toda večina DeepLovih poslov izhaja iz njegovih 20.000 poslovnih strank. Med njimi so tudi Mercedes Benz, Fujitsu in nemška družba Deutsche Bahn.

Poslovne stranke uporabljajo DeepLovo programsko opremo za prevajanje vsega, od spletnih strani, pravnih pogodb in pogodb s strankami do elektronske pošte, marketinških besedil in predstavitev v PowerPointu.

Januarja 2023 je to zagonsko podjetje s sedežem v Kölnu v Nemčiji zbralo približno 100 milijonov dolarjev sredstev od globalnih podjetij tveganega kapitala, vključno z Institutional Venture Partners (IVP), Atomico in Bessemer Venture Partners.

Po oceni raziskovalne družbe Pitchbook je doseglo vrednost ene milijarde dolarjev. Izvršni direktor in ustanovitelj Kutylowski ni potrdil obsega celotnega financiranja, ki si ga je njegovo podjetje zagotovilo do zdaj.

Bolj zanesljiv od Googlovega prevajalnika?

DeepL je bil do zdaj prenesen v 25 milijonov naprav, kar je drobiž v primerjavi z več kot milijardo namestitev prevajalnika Google Translate. Toda tisti, ki so ga uporabljali, hvalijo njegovo natančnost.

Nina Gafni, prevajalka iz Washingtona, ki je prej delala za Zvezni preiskovalni urad (FBI) kot jezikoslovka in prevajalka, uporablja DeepL za prevajanje francoščine, nemščine in italijanščine v angleščino. Medtem ko sistemi strojnega učenja nikoli niso res popolni v svojih prevodih, so DeepLovi bolj kulturno niansirani in natančni kot večina, je dejala.

Prevajalnik DeepL
DeepL prevaja v 31 svetovnih jezikov (Foto: PROFIMEDIA)

“Včasih so lahko strojni prevodi preveč dobesedni, in to je velik problem,” je poudarila Gafni. “Če se znajdem v težavah, se mi zdi, da se lahko veliko bolj zanesem na DeepL kot na Google Translate.”

To je verjetno zaradi človeške kalibracije na podlagi velikih količin filmskih podnapisov, prevodov knjig in patentov ter pogovorov na forumih, ki jih uporabljajo za usposabljanje prevajalnika DeepL.

Akiko Taguči, naravna govorka japonščine, ki dela za DeepL, je za Forbes povedala, da večino svojega časa porabi za to, da so prevodi kontekstualno pravilni in zvenijo človeško.

“Napravi sem dala povratne informacije, ko je med seboj mešala formalnosti, ki se uporabljajo v japonski pisavi,” je Taguči povedala za Forbes. “Od takrat so se prevodi bistveno izboljšali.”

Prevlada nevronskih mrež

DeepL, ki je izšel iz orodja za prevajanje iskalnika Linguee, uporabnikom omogoča prevajanje celotnih dokumentov v formatih, kot so PDF, Word in PowerPoint.

Pri tem formatiranje ostane nedotaknjeno. Predlaga alternativne prevode in tonalne spremembe ter uporabnikom omogoča izdelavo slovarja po meri, s katerim določijo, kako naj bodo določene besede prevedene.

Kutylowski, ki ima doktorat znanosti na področju računalništva, je leta 2016 razvijal tehnologijo strojnega učenja, ki je podlaga za DeepL. V tistem času so se Googlovi raziskovalci ukvarjali z modelom strojnega učenja Transformer, s tehnološkim prebojem, ki temelji na prevajanju in poganja ChatGPT.

Po besedah Kutylowskega zdaj DeepL za prevajanje ne uporablja niti Transformerjev niti velikih jezikovnih modelov, ni pa želel navesti njegove natančne arhitekture.

“Vedeli smo, da bodo na tem področju zelo kmalu prevladovale nevronske mreže,” je še dodal. “Prepričani smo bili, da vse, kar se je prej uporabljalo za prevajanje, na primer statistične metode, v prihodnosti ne bo uporabno.”

Google in OpenAI
Googlov Translate za zdaj zaostaja za klepetalnim botom podjetja OpenAI ChatGTP (Foto: PROFIMEDIA)

Priložnost za rast

“To se je izkazalo za resnično,” je dejal Karthik Ramakrishnan, partner pri družbi IVP. Ta je januarja vodila DeepLov investicijski krog serije B v vrednosti 100 milijonov dolarjev. Svetovni trg prevajalskih storitev je vreden 27,9 milijarde dolarjev in še ni dobro izkoriščen.

“Večina prevajanja še vedno poteka na roke, kar je zastarel način,” je dejal Ramakrishnan. “Ljudje najemajo zunanje ponudnike jezikovnih storitev, ki potrebujejo dneve ali celo tedne, da pravočasno prevedejo vaše vsebine.”

Ob požetem odobravanju in vrednotenju v višini ene milijarde dolarjev je DeepL v ugodnem položaju, da izkoristi trg, o katerem govori Ramakrishnan.

A tudi drugi ponudniki so. Čeprav njihovo prevajalsko orodje morda ni tako natančno kot DeepL, Googlov prevajalnik podpira 130 jezikov, za njim pa stoji tehnološki velikan, ki je desetletja vlagal v umetno inteligenco.

Še en velik tehnološki konkurent je Microsoftov Translator, ki podpira več kot 100 jezikov in narečij ter ima velike poslovne uporabnike, kot je Volkswagen Group.

Razvoj lastnega jezikovnega modela

Medtem lahko ChatGPT, klepetalni bot, ki je umetno inteligenco postavil v ospredje, trenutno prevaja v 50 jezikov, vendar ima številne težave s prevajanjem, od halucinacij (tako imenovane halucinacije umetne inteligence se pojavijo, ker ta nima dovolj razuma, da bi uporabila logiko) do napačnega prevajanja pogovornega žargona. To pa se bo izboljšalo zaradi nenehnega razvoja vodilnih velikih jezikovnih modelov matične družbe OpenAI.

Klepetalnik ChatGPT podjetja OpenAI
Klepetalnik ChatGPT včasih zanese v t. i. halucinacije umetne inteligence (Foto: PROFIMEDIA)

Prevajalnik DeepL še nima lastnega velikega jezikovnega modela (large language model – LLM). Kutylowski je za Forbes povedal, da ga namerava razviti znotraj svojega podjetja in ga za boljše rezultate združiti s svojim trenutnim manjšim prevajalskim modelom.

V ta namen DeepL povečuje svojo računalniško zmogljivost za usposabljanje modelov umetne inteligence. Pri tem uporablja podatkovni center Nvidie na Švedskem, ki se osredotoča na umetno inteligenco. “Generativna umetna inteligenca je velika priložnost,” je prepričan.

“Omogočila nam bo, da bomo vključili funkcije, s katerimi bo prevajalnik postal bolj interaktiven in bolj v dialogu z uporabnikom.”

Avtorica članka je Rashi Shrivastava/Forbes.