Teknikjättar negligerar samiska
Fel i mobilernas autokorrigering är i mångt och mycket ett lyxproblem för den som talar ett majoritetsspråk. För språkliga minoriteter blir det ett demokratiskt problem. De begränsas av plattformar som majoriteten tar för givna.
När teknikjättarna inte utvecklar autokorrigering för minoritetsspråk måste andra krafter träda in. För de samiska språken tas grammatik- och stavningskontroller fram av forskare vid Institutionen för språk och kultur på Universitetet i Tromsø, i samarbete med bland annat mjukvaruföretaget The techno creatives i Göteborg.
Arbetet bygger vidare på den pionjärinsats som gjorts av finländska Lingsoft. Modeller för de flesta samiska språk kan byggas på samma sätt som finskans språkmodell eftersom de är besläktade och har liknande struktur. Samiska språk är dock mer komplicerade.
Forskaren Sjur Moshagen på Universitetet i Tromsø har arbetat i 18 år med att utveckla språkverktyg för de samiska språken. 2007 lanserades stavningskontroller för nord- och lulesamiska.
Den stora utmaningen är att korpusen är liten – det finns inte så mycket text att utgå ifrån när språkverktyg utvecklas. Verktygen har därför byggts med regelbaserade metoder i stället för med maskininlärning.
– En utmaning är standardiseringen av framför allt lånord från svenska, norska, finska och engelska. Språken är under konstant press från majoritetsspråken, vilket försvårar utvecklandet av en självständig skriftkultur, säger Sjur Moshagen.
Många som talar språken blir därför osäkra på vilka sätt att skriva som är rätt. Och det gör det svårt att utveckla till exempel stavningskontroller. Till det bidrar att högst hälften av undervisningen i Sveriges statliga samiska skolor får ske på samiska.
Dessutom tillåts inte samiska språkverktyg på viktiga plattformar, som Google docs och Microsoft office.
– Svenska staten har lång väg att gå för att reparera de skador som politiken har orsakat genom åren. Det svenska sametinget har inte heller kommit lika långt som de norska och finländska när det gäller satsningen på språk, säger Sjur Moshagen.
Någon press finns därför inte heller på teknikjättar att ta fram språkverktyg på plattformar som finns för större språk. Stavningskontrollen för lulesamiska för Windows har exempelvis inte uppdaterats sedan 2004. Några nätbaserade verktyg finns inte heller. För Appledatorer finns inga över huvud taget.
Antalet samer i Norge, Sverige, Finland och Ryssland uppskattas till mellan 80 000 och 100 000. I Sverige talas nordsamiska, sydsamiska, lulesamiska, pitesamiska och umesamiska.