Kan Kinas techgiganter bygge den naeste ChatGPT uden at få Beijing på nakken?
Alle Kinas techkaemper arbejder på en version af ChatGPT. Men de har myndighederne haengende tungt hen over sig.
Torsdag begyndte Alibaba, Kinas enorme online shoppingportal, udrulningen af sin egen version af ChatGPT. Den hedder Tongyi Qianwen og skal på sigt blive endnu bedre end sin vestlige forgaenger.
Det bliver endda blot begyndelsen. Når tiden er inde, skal Tongyi installeres i Alibabas allerede eksisterende digitale assistent, Tingwu. Derefter skal begge udvides til en dedikeret messengerapp og specialsyet søgemaskine for erhvervslivet.
Hvis altså den kinesiske stat giver lov.
Alibaba er langtfra den eneste af Kinas techfirmaer med den slags planer. Rygterne er gået i månedsvis om kinesiske udgaver af de naesten magiske samtale-AI’er, der både kan konversere naturligt og forfatte så godt som alle slags tekster.
Google er i fuld gang med udvikle sin egen af slagsen, Bard. Men det er ChatGPT, der har fået langt størstedelen af mediernes opmaerksomhed.
ChatGPT er udviklet af OpenAI, der med støtte fra Microsoft har lanceret flere udgaver af sin kunstige samtaleintelligens. Men OpenAI er amerikansk, Alibaba kinesisk. Det får skeptikere til at overveje, om onlineportalens udgave kan blive lige så god.
På trods af en stribe imponerende succeser har ikke blot Alibaba, men også resten af Kinas techgiganter måske oddsene imod sig. De lider bl.a. under Kinas rivalisering med USA og de medfølgende eksportbegraensninger på computerchips.
Men den største udfordring kommer måske på hjemmefronten. For de har deres egen stat åndende dem i nakken.
»Kinas techgiganter står over for et dilemma: På den ene side skal de overbevise forbrugere og investorer om, at de ikke halter bagefter,« udtaler Xin Sun, seniorlektor ved King’s College London, til erhvervsmediet CNBC.
»På den anden side skal de vaere ekstremt forsigtige med, at myndighederne pludselig anser dem for at udvikle produkter med poliat tiske eller sikkerhedsmaessige konsekvenser for partistaten.«
Det er ikke en nem linedans. Alligevel ser Alibaba ingen anden vej end fremad.
»Vi lever i en tid, hvor en stigende maengde video- og lydindhold bliver set og hørt i diverse formater hver eneste dag,« udtalte Jingren Zhou, teknologidirektør for Alibaba Cloud Intelligence, til pressen under lanceringen.
»Med henblik på dette vil Tongyi Tingwu bruge sin Large Language Model til at facilitere hurtigere og bedre forståelse og muliggøre lettere deling af multimedieindhold.«
Den såkaldte Large Language Model (LLM) er den algoritme, der møjsommeligt tygger sig igennem bjerge af data for at kortlaegge statistiske relationer med ord og udtryk. Det er kunstig intelligens efterhånden blevet så god til, at de via sandsynlighedsberegning kan sammensaette lange tekster, der lyder praecis, som hvis et menneske havde skrevet dem.
Men det er også problemet. For det er alt andet end nemt at forudsige, praecis hvad en LLM-intelligens spytter ud, når den bliver spurgt om noget. Eller om det overhovedet er faktuelt.
Det har internettets mere
techglade entusiaster hygget sig meget med, og historierne om, hvordan ChatGPT og Googles Bard pludselig begyndte at argumentere autoritativt for selv de vildeste konspirationsteorier, står efterhånden i kø.
Eller blot kastede sig ud i udtalelser, der var lodret forkerte.
Problemet skyldtes, hvad industrien kalder AI-»hallucinationer«. For intelligenserne genererer ofte selv mønstre under deres statistiske kortlaegning af de enorme databjerge, der ikke har noget med hverken virkeligheden eller databjerget i sig selv at gøre.
Atlantis på Mols?
Som hvis ChatGPT under sin udlaegning af danmarkshistorien hårdnakket insisterede på, at Atlantis lå på Mols. Eller at Holger Danske var et rumvaesen.
Disse mønstre kaldes ”hallucinationer”. Det er ikke helt klart, hvorfor LLM-modellerne genererer dem. Dermed er de alt andet end lette at få has på.
Den slags blev hurtigt en smule pinligt for både OpenAI
og Google. Men i Kina, hvor det Kommunistiske Parti i Beijing laenge har censureret internettet for informationer, staten ikke synes om, vejer den slags endnu tungere.
Derfor har OpenAi ikke gjort ChatGPT tilgaengelig i Kina. Ligesom en lang raekke kilder til vestlige medier beskriver, at Beijing har bedt landets internetudbydere om at stoppe nysgerrige kinesere fra at lege med teknologien, hvis de skulle gøre forsøget og omgå statens restriktioner.
For hvem ved, hvad de så kunne finde? Det er jo ikke hver gang, at det slår Atlantisklik for ChatGPT.
For eksempel rasede en artikel i det statslige medie China Daily over, at ChatGPT »spredte falske nyheder« i form af ondsindet, vestlig propaganda. Blandt andet når det kom til spørgsmål om Kinas vestlige provins Xinjiang.
Rapporter fra menneskerettighedsorganisationer og FN har laenge beskyldt Kina for at have slået benhårdt ned på provinsens lokale Uygurkultur og holdt op mod en million mennesker i diverse fangelejre. En påstand, Kina benaegter på det bestemteste.
Desvaerre gav ChatGPT altid svar, forklarede China Daily, »der passede med den politiske propaganda fra USA’s regering om, at der er fundet et såkaldt folkemord sted der«.
Og ve den kinesiske techgigant, hvis chat-intelligens pludselig begynder at snakke om den slags.
I midten af april offentliggjorde Beijing endda udkastet til et spritnyt saet regler for LLM-intelligenser, der understregede, at den slags AI var forpligtiget til at »reflektere over socialismens kernevaerdier og ikke søge at underminere staten«.
Reglerne gjorde også klart, at det pågaeldende techfirma stod til ansvar for den pågaeldende samtale-AI’s udtalelser. Isaer hvis den blamerede sig.
Hvilken hurtigt fik Alibaba og dets konkurrenter til at synke en ekstra gang. Alibaba har derfor heller ikke lagt Tongyi ud til fri afbenyttelse, som OpenAI gjorde det med ChatGPT, men holder den endnu på et lukket teststadie for udvalgte brugere.
Det samme gaelder Baidu, Kinas svar på Google, der i foråret udgav sin samtaleintelligens, Ernie Bot. Den er maerkbart mindre avanceret end ChatGPT – og dermed også langt lettere at kontrollere – og holdes også i det store hele vaek fra den brede befolkning. Ernie Bot er heller ikke godkendt af myndighederne endnu.
Ingen let opgave
Tencent, der ellers er Alibabas naermeste rival, har slet ikke udgivet en LLM-intelligens endnu og arbejder stadig på den grundlaeggende algoritme bag modellen.
»For vigtige og sensitive emner må vi vaere helt sikre på, at AI’en ikke hallucinerer,« udtalte Tencents øverste direktør, Martin Lau, under fremlaeggelsen af firmaets kvartalsregnskaber i marts. Her udlagde han også problemet:
»Med henblik på at LLM’er mere eller mindre er baseret på sandsynlighedsberegning, er dette ikke nogen let opgave.«
De hårde krav fra staten kan allerede havde lagt en kinesisk ChatGPT i graven. Eller i hvert fald stillet den hen i skabet. Allerede i sommeren 2021 udgav Beijings Academy of Artificial Intelligence den kinesiske samtaleintelligens Wu Dao 2.0. Den var baseret på 1,75 billioner parametre – et udtryk for hvor fintmasket dens sandsynlighedsberegnende net var – eller 10 gange så mange som ChatGPT dengang.
Vestlige ingeniører, der så naermere på den, mente alle, at dens algoritme var mere sofistikeret end dens OpenAI-konkurrent. Men den blev aldrig rigtig til noget.
Hvorfor er lidt af et mysterium.
En teori er, at Wu Dao’s databjerg var af langt ringere kvalitet og derfor ikke brugbart i praksis. For det var den eneste måde, dens forskere kunne sikre sig, at der ikke sneg sig data om de såkaldte »følsomme emner« ind. En anden lyder, at Beijing-akademiet blot undlod at lancere den for et bredere publikum, indtil staten kom med en klar regulering på området.
Trods de mange problemer lader alle store kinesiske techfirmaer dog til at have kastet sig ud i kampen. I kvartalsrapporterne i sidste kvartal havde ikke blot Alibaba, Tencent og Baidu, men også mange af Kinas andre – i Vesten mindre kendte – chat-intelligenser i centrum for deres strategier i det kommende år.
»Udviklingen af kunstig intelligens repraesenterer en enorm mulighed for cloud computing, fordi kunstig intelligens vil betyde en eksponentiel stigning i efterspørgslen på computerkraft,« udtalte Jingren Zhou, chefstrateg for teknologi hos datterselskabet Alibaba Cloud, i forbindelse med den seneste kvartalsrapport.
Det er måske hemmeligheden, lød dommen fra flere vestlige erhvervsmedier: I første omgang vil kinesiske samtale-AI’er måske vaere rettet mod firmaer, ikke den almindelige kineser. De er stadig saerdeles lukrative for firmaer, der bygger de bedste af slagsen.
Men de er også mindre, har mere snaevert definerede datasaet og er dermed nemmere at styre.