Kako novopečeni iskalnik “krade” vsebino z novičarskih platform

Tehnologija Forbes 13. junija, 2024 05.30
featured image

Perplexity, ki so ga slavili kot Googlovega izzivalca na področju umetne inteligence, objavlja dele ekskluzivnih zgodb iz več medijev, vključno s članki Forbesa in Bloomberga, in to brez ustreznega navajanja avtorstva.

13. junija, 2024 05.30

Zdi se, da zagonsko podjetje za snovanje iskalnikov, podprtih z umetno inteligenco, Perplexity, s svojo novo funkcijo Perplexity Pages, ki ljudem omogoča urejanje in objavljanje vsebin na določeno temo, izvaja plagiatorstvo, ko gre za novinarske prispevke.

Številne objave, ki jih je na platformi “uredila” ekipa Perplexityja, so presenetljivo podobne izvirnim zgodbam iz več medijev, vključno s Forbesom, CNBC in Bloombergom. Objave, ki so zbrale že več deset tisoč ogledov, v besedilu ne navajajo imen medijev – v njih so le logotipi, ki so povezava do njih, a so tako majhni, da jih zlahka spregledamo.

Miniaturni vir navedbe

Na primer, v sestavljeni objavi Perplexityja, ki vsebuje ekskluzivno poročanje revije Forbes o projektu Erica Schmidta za izdelavo nevidnih dronov, je več delov, za katere se zdi, da so bili povzeti, vključno z ilustracijo, izdelano posebej za članek.

V zadnjih mesecih je Forbes objavil vrsto zgodb o skrivnostnih prizadevanjih nekdanjega Googlovega glavnega direktorja za razvoj vojaških letalnikov z umetno inteligenco, ta teden pa je poročal, da je Schmidt privabil strokovnjake iz podjetij SpaceX, Apple in Google ter testiral svoje drone v mestu premožnih, Menlo Parku v Silicijevi dolini.

Del prispevka vsebuje skoraj enako besedilo in vse podrobnosti, o katerih je prvi poročal Forbes. Edini dodatek je majhen, komaj prepoznaven logotip Forbesa kot vir navedbe. Objava Perplexityja vključuje tudi podobo, ki jo je ustvarila oblikovalska ekipa Forbesa in za katero je videti, da jo je Perplexity nekoliko spremenil. Perplexityjev blog iz tako nabranih vsebin je bil na prvem mestu v zavihku Discover in ima več kot 17.000 ogledov.

Na moč podobni stavki

Perplexityjeva objava z več kot 20.000 ogledi o tem, da Elon Musk preusmerja čipe, namenjene Tesli, v xAI, je bila prvotno ekskluzivna zgodba CNBC, vendar ta v objavi ni bil naveden kot vir. Označen je le v enem od štirih majhnih krogcev pod člankom.

V izvirni zgodbi piše: “Elektronska pošta, ki je krožila znotraj družbe Nvidia in jo je pridobil CNBC, kaže, da je Elon Musk proizvajalcu čipov naročil, naj pri dobavi procesorjev pred Teslo da prednost X in xAI.” In Perplexityjeva različica? “Elektronska pošta podjetja Nvidia razkriva, da je Elon Musk podjetju naročil, naj prednostno dostavi 12.000 grafičnih procesorjev H100 podjetjema X in xAI.”

Mark Gurman iz Bloomberga je prvi poročal, da Apple preučuje možnosti razvoja domačih robotov. Po navedbah Perplexityja pa Apple načrtuje “razvoj dveh projektov domače robotike: mobilnega robota, ki bo uporabnikom sledil po njihovem domu, in namizne naprave z zaslonom, ki se bo samostojno premikala”. To je bila ista informacija, ki jo je Gurman pridobil od ljudi, ki so prosili, naj jih ne imenuje, ker gre za skriven projekt”. V tem primeru je bil Bloombergov logotip skrit za tremi drugimi in je bil neviden za uporabnike Perplexityja, dokler niso kliknili na tiste pred njim.

Glavni izvršni direktor Perplexityja Aravind Srinivas je v odzivu na zapise izvršnega urednika Forbesa Johna Paczkowskega na omrežju X o tem, dejal, da ima portal Perplexity “grobe robove” ter da se bodo funkcije s časom in povratnimi informacijami izboljšale.

“Strinjamo se, da bi morali biti viri bolj poudarjeni”

“Strinjamo se, da bi morali biti viri, ki so prispevali vsebine, bolj poudarjeni in te povratne informacije bomo upoštevali, ko bomo svoj izdelek še naprej izpopolnjevali. Vedno smo skrbeli za navajanje avtorstva vsebine in smo naš izdelek od začetka zasnovali tako, da jasno navaja vir svojih gradiv, česar večina drugih klepetalnih robotov še danes ne zmore zanesljivo in jasno,” odgovarja Srinivas. CNBC in Bloomberg se na prošnjo za komentar še nista odzvala.

Strinjamo se, da bi morali biti viri, ki so prispevali vsebine, bolj poudarjeni.

– Aravind Srinivas, Perplexity

Funkcija Perplexity Pages omogoča tudi preprosto deljenje vsebine neposredno na platforme družbenih medijev, kot je LinkedIn, in zagotavlja povezavo do sestavljenega članka portala Perplexity, kar uporabnikom olajša povezovanje s Perplexityjem kot virom namesto z novičarskimi portali.

Ko so Perplexityjev iskalnik prosili, naj pove svoje mnenje o kraji vsebine objav ter nenavajanju medija in avtorstva dela novinarjev, je njegova umetna inteligenca dejala, da je neetično, če podjetje Perplexity reproducira poročanje novinarjev brez ustreznega navajanja avtorstva.

“Pomočniki na osnovi umetne inteligence lahko povzemajo in sintetizirajo informacije, vendar morajo to početi etično, tako da spoštujejo pravice intelektualne lastnine, da v celoti in pregledno navajajo izvirne vire ter ohranjajo novinarsko integriteto,” je odgovoril iskalnik. “Zdi se, da pristop Perplexityja krši ta načela.”

Iščejo 250 milijonov dolarjev

Maja 2024 je podjetje Perplexity predstavilo Perplexity Pages kot nov način, s katerim lahko njegovih 15 milijonov uporabnikov ustvarja vizualno privlačne članke in podrobna poročila o temah, ki jih zanimajo, razdeljene na pododdelke. “Svoje delo objavite v naši vse večji knjižnici vsebin, ki jih ustvarjajo uporabniki, in ga z enim klikom neposredno delite s svojim občinstvom,” so zapisali v blogu. Vendar se v prej omenjenih primerih zdi, da je vsebine ustvarila ekipa podjetja Perplexity in ne uporabniki.

Odmevni samorog v sektorju umetne inteligence, ki so ga leta 2022 skupaj ustanovili Aravind Srinivas, Denis Yarats, Johnny Ho in Andrew Konwinski, je zbral več kot 100 milijonov dolarjev tveganega kapitala, ki so ga prispevala najbolj znana imena tehnološkega sektorja, med njimi ustanovitelj družbe Amazon Jess Bezos, vodja znanstvenih raziskav družbe Google Jeff Dean, soustanovitelj podjetja Open AI Andrej Karpathy in vodja znanstvenih raziskav družbe Meta Yann LeCun. Po poročanju TechCruncha zdaj zbira 250 milijonov dolarjev pri oceni vrednosti od 2,5 do tri milijarde dolarjev.

“Po spletu lahko brska vsakdo. To je pravično,“ je aprila v intervjuju za Forbes povedal glavni izvršni direktor Perplexityja Srinivas in poudaril, da njegova platforma za iskanje na osnovi umetne inteligence zagotavlja povezavo z virom za vsak stavek, ki ga ustvari. Dodal je, da je bila med prvimi, ki to počne. “Vzemimo novinarstvo, kjer pišete nov članek. Pri tem navedete druge. Napišete recimo: Kot poroča New York Times. To počnemo tudi mi.”

Avtorici članka sta Sarah Emerson in Rashi Shrivastava.