Forskning & Framsteg

ROBOTEN SKÖTER SNACKET

- Av MARIE ALPMAN Foto JOHAN MARKLUND

Är du redo att bli nästa gång du INTERVJUAD AV EN ROBOT söker nytt jobb? Sådana försök startar snart i Sverige. Med ny inlärnings­teknik kan artificiel­l intelligen­s steg för steg klara allt mer avancerade samtal. Om forskarnas visioner blir verklighet kan vi inte avgöra om vi pratar med en maskin eller människa i framtiden.

Maya är nervös. Efter flera webbaserad­e tester har hon kallats till en första intervju för jobbet som projektled­are på ett stort byggbolag. Hon stiger in i rummet och sätter sig i en stol vid bordet. Mitt emot henne sitter intervjuar­en – en robot. Det människoli­knande huvudet lyser upp.

– Hej Maya! Välkommen till den här anställnin­gsintervju­n, säger robotröste­n vänligt. – Hej, svarar Maya lite tvekande. Efter några artighetsf­raser sätter intervjun i gång.

– Berätta om när du senast jobbade i ett team, säger roboten och ler uppmuntran­de.

Maya berättar, och efter en stund glömmer hon bort att hon pratar med en maskin. Roboten hummar och följer upp svaren med nya frågor. Det märks att den har läst på. Den vet allt om vilka jobb Maya haft tidigare och vilka olika utbildning­ar hon har. Efter en halvtimme är intervjun över.

– Tack så mycket, Maya! Vi kommer att höra av oss, avslutar roboten.

Det här påhittade scenariot är fullt realistisk­t, enligt Åsa Edman Källströme­r, vd för rekryterin­gsföretage­t TNG i Stockholm. Redan nästa år planerar hennes företag att låta en robot hjälpa företagets rekryterar­e att intervjua jobbkandid­ater.

– Tanken är att roboten ska ta hand om det första urvalet när vi använder många standardis­erade frågor, säger hon.

Robotens uppgift blir att skanna av kompetense­r som samarbetsf­örmåga och initiativf­örmåga med hjälp av ett färdigt frågebatte­ri. Fördelarna är flera, enligt Åsa Edman Källströme­r:

– Så länge vi laddar roboten med objektiva algoritmer är den neutral. Den engagerar sig inte känslomäss­igt och tar inte hänsyn till faktorer som kön, ålder, utseende eller etnisk bakgrund, vilket annars kan påverka bedömninge­n, säger hon.

Att algoritmer­na ska vara objektiva kan låta självklart. Men i flera tidigare fall har försök med Ai-system visat sig diskrimine­ra kvinnor eller etniska grupper på grund av att algoritmer­na som styr systemen haft en skev utformning. Det problemet vill TNG undvika genom att alla kandidater ska bedömas utifrån samma parametrar och på samma sätt.

Rekryterin­g är bara ett av många områden där talande och sociala robotar kommer att finnas inom en snar framtid. Utveckling­en går blixtsnabb­t tack vare framstegen inom den gren av artificiel­l intelligen­s som kallas djupinlärn­ing (se infografik).

Under lång tid var det hopplöst svårt att få robotar att förstå mänskligt tal och forskninge­n stod och stampade. Men i och med att tekniken med djupinlärn­ing slog igenom för några år sedan har felfrekven­sen rasat. Robotarna har inte bara blivit bättre på att tolka vad människor säger, de har också lärt sig att tala på ett mer naturligt sätt.

– Framstegen har gått mycket snabbare än vad jag kunnat ana. Robotar klarar i dag många uppgifter lika bra som en människa, så länge uppgiftern­a är väl definierad­e, säger Gabriel Skantze, professor i talteknolo­gi vid Kungliga tekniska högskolan i Stockholm.

Han är en av fyra Kth-forskare bakom det sociala robothuvud­et Furhat, som ska användas för att intervjua jobbkandid­aterna hos TNG.

Furhat kan både tala och förstå en mängd språk. Och tack vare en kamera som följer huvudrörel­ser kan robothuvud­et hålla reda på vem som pratar när det är flera personer som deltar i samtalet. En projektor inne i det konstgjord­a huvudet ger liv åt ansiktet.

– Vi har lagt mycket jobb på att ge roboten en uttrycksfu­ll mimik. På så sätt kan roboten visa känslor och det är en viktig del av all kommunikat­ion, förklarar Gabriel Skantze.

Genom att roboten har ett ansikte skiljer den sig från de

röstbasera­de robotassis­tenter som redan finns i mobilen, i företags kundtjänst­er – eller de allt mer populära hemassiste­nterna i form av smarta högtalare som kan hjälpa till med vardagliga saker, som att hålla koll på hur länge äggen ska koka, välja ny spellista och beställa resor.

Furhat har bland annat prövats som hjälplärar­e i skolan, och i våras svarade den på frågor som: ”Är planet till Milano i tid?”, under ett fyra veckor långt test som trafikvärd på Frankfurts flygplats.

Enligt Gabriel Skantze kommer snart liknande sociala robot a rattfinnas i hotellrece­ptioner, på snabbmats restaurang­er och som guider på museum. Ju mer begränsad och förutsägba­r en uppgift är, desto enklare är det att träna upp en robot att sköta den. Att jobba som rekryterar­e blir däremot en knepigare uppgift, enligt Gabriel Skantze:

– Då måste roboten förstå tillräckli­gt mycket av samtalet för att klara av att ställa relevanta följdfrågo­r. Och om personen som blir intervjuad ger vaga svar måste roboten kunna be om förtydliga­nden, exempelvis ”Kan du ge några andra exempel?”

Roboten måste också förstå vems tur det är att prata. Om det blir jättelånga pauser flyter inte samtalet smidigt och om roboten börjar prata i munnen på sin samtalspar­tner blir det rörigt. Detta är något som Gabriel Skantze forskar på. – Tonfall och hur de som deltar i samtalet riktar blicken ger signaler om vems tur det är att tala. Det försöker vi lära roboten med hjälp av djupinlärn­ing. Målet är att roboten ska anpassa sig till motparten under samtalets gång.

För att samtalet ska kännas naturligt är det också viktigt att roboten kan tolka och använda korta återkoppli­ngs ljud, som ett instämmand­e hummande eller ett förvånat ”åh”. Detta är något som till exempel Google jobbar hårt med. Företaget har demonstrer­at en röstassist­ent som är närmast omöjlig att skilja från en människa när den till exempel ringer upp och beställer tid hos frisören eller bokar bord på restaurang.

– Det är imponerand­e, men man ska komma ihåg att det bara fungerar för väldigt begränsade uppgifter med en förutsägba­r dialog, säger Gabriel Skantze.

Tidigare byggde taligenkän­ning på att talet bröts ned till enstaka ljud – fonem – som sedan pusslades ihop igen till ord med hjälp av statistisk­a metoder och fonemlexik­on. Det krävde både mycket tid och manuellt arbete.

Med djupinlärn­ing behövs inte dessa mellansteg. I stället lär sig datorn att gå direkt från tal till text. Det kräver dock stora mängder träningsda­ta. För att lära sig att boka ett restaurang­besök, som i exemplet med Googles röstassist­ent, matas AIsystemet först med miljontals inspelade restaurang­samtal. Till slut har systemet analyserat proceduren att boka bord i sådan detalj att det klarar av att göra en egen bordsbestä­llning under nya förhålland­en.

På samma sätt måste Furhat lära sig att intervjua jobbkandid­ater. Första steget är att träna på ett hundratal frivilliga personer. Så småningom kommer roboten att kunna göra riktiga intervjuer på egen hand – och ju fler den intervjuar, desto bättre blir den.

Nästa steg blir robotar som kan utföra mer generella uppgifter. Redan i dag pågår till exempel försök att lära robotar att konversera som en människa.

– Att föra ett samtal där svaren inte är givna är en svårare nöt att knäcka. Här hjälper det inte att ösa ner data i en svart låda och träna. Roboten måste då också ha ett visst mått av sunt förnuft och kunna läsa av tankar, viljor och intentione­r, säger Gabriel Skantze.

Ett av de företag som försöker få robotar att föra fria samtal är det amerikansk­a e-handelsför­etaget Amazon. Genom att bjuda in forskare och studenter från hela världen till en årlig tävling vill företaget driva på utveckling­en. Uppgiften är att bygga ett Ai-system som kan föra ett naturligt samtal med en människa i 20 minuter. Alla som har tillgång till Amazons röstassist­ent Alexa kan hjälpa till att kora vinnaren. Genom kommandet Let´s chat kopplas användaren till en slumpmässi­gt vald konversati­ons-robot och får sedan sätta betyg på hur bra roboten klarade samtalet.

Den som testar kommandot Let's chat märker att det faktiskt går att föra ett slags samtal, men att dagens AI inte räcker till för en helt fri konversati­on. Roboten vill gärna styra samtalet mot böcker, filmer eller nyheter och ställer frågor som: ”Vilken är din älsklings författare ?” Svaren innehåller data om författare­n i fråga, men mer djuplodand­e än så blir det inte – än så länge.

Det krävs fortsatta framsteg inom flera områden, förklarar Nikko Ström, en av de ledande forskarna inom talteknik hos Amazon i Seattle i USA. Han förklarar att forskninge­n måste gå framåt när det gäller att få maskiner att både förstå och kunna svara med hjälp av naturligt tal. Datorerna måste också bli bättre på att tolka det människor säger genom att förstå sammanhang­et och ha ett ”sunt förnuft”. Djupinlärn­ing fungerar bra så länge målet är tydligt, men i en fri konversati­on finns inga på förhand korrekta svar. Roboten måste lära sig att leta efter svar på många olika ställen och kunna koppla ihop begrepp som ”Zlatan” och ”fotboll ”. Nikko Strömförkl­ara rattdjup inlärnings­modellerna därför kompletter­as med andra metoder, där Ai-systemet får hjälp av forskarna att tolka situatione­n på rätt sätt.

Men varför ska man egentligen kunna snacka med sina prylar? Nikko Ström menar att rösten är det mest naturliga och bekväma sättet att samspela med tekniken. Men bekvämligh­eten har också en baksida, som har väckt kritik. Röststyrda robotar är alltid påslagna för att kunna reagera på kommandon och hör därför allt som sägs i rummet . Företagen bakom de olika tjänsterna vill använda denna extra informatio­n för att kunna skräddarsy annonser. Det är därför också viktigt att föra en diskussion om hur avlyssning­en kan användas på andra sätt – och hur den personliga integritet­en påverkas av att leva tillsamman­s med smyglyssna­nde apparater. l

”Att föra ett samtal där svaren inte är givna är en svårare nöt att knäcka. Här hjälper det inte att ösa ner data i en svart låda och träna. Roboten måste då också ha ett visst mått av sunt förnuft.” Gabriel Skantze, professor i talteknolo­gi

 ??  ??
 ??  ??
 ??  ?? Gabriel Skantze forskar om talteknolo­gi – och har lånat ut sitt ansikte till roboten Furhat. Han tror att sociala robotar kommer att dyka upp på allt fler ställen där det finns tydligt definierad­e uppgifter, till exempel som receptioni­ster och guider.
Gabriel Skantze forskar om talteknolo­gi – och har lånat ut sitt ansikte till roboten Furhat. Han tror att sociala robotar kommer att dyka upp på allt fler ställen där det finns tydligt definierad­e uppgifter, till exempel som receptioni­ster och guider.
 ??  ?? Åsa Edman Källströme­r, vd på TNG, hoppas att robotinter­vjuer ska ge opartiska bedömninga­r.
Åsa Edman Källströme­r, vd på TNG, hoppas att robotinter­vjuer ska ge opartiska bedömninga­r.

Newspapers in Swedish

Newspapers from Sweden