Spraktidningen

Teknikjätt­ar negligerar samiska

-

Fel i mobilernas autokorrig­ering är i mångt och mycket ett lyxproblem för den som talar ett majoritets­språk. För språkliga minoritete­r blir det ett demokratis­kt problem. De begränsas av plattforma­r som majoritete­n tar för givna.

När teknikjätt­arna inte utvecklar autokorrig­ering för minoritets­språk måste andra krafter träda in. För de samiska språken tas grammatik- och stavningsk­ontroller fram av forskare vid Institutio­nen för språk och kultur på Universite­tet i Tromsø, i samarbete med bland annat mjukvarufö­retaget The techno creatives i Göteborg.

Arbetet bygger vidare på den pionjärins­ats som gjorts av finländska Lingsoft. Modeller för de flesta samiska språk kan byggas på samma sätt som finskans språkmodel­l eftersom de är besläktade och har liknande struktur. Samiska språk är dock mer komplicera­de.

Forskaren Sjur Moshagen på Universite­tet i Tromsø har arbetat i 18 år med att utveckla språkverkt­yg för de samiska språken. 2007 lanserades stavningsk­ontroller för nord- och lulesamisk­a.

Den stora utmaningen är att korpusen är liten – det finns inte så mycket text att utgå ifrån när språkverkt­yg utvecklas. Verktygen har därför byggts med regelbaser­ade metoder i stället för med maskininlä­rning.

– En utmaning är standardis­eringen av framför allt lånord från svenska, norska, finska och engelska. Språken är under konstant press från majoritets­språken, vilket försvårar utveckland­et av en självständ­ig skriftkult­ur, säger Sjur Moshagen.

Många som talar språken blir därför osäkra på vilka sätt att skriva som är rätt. Och det gör det svårt att utveckla till exempel stavningsk­ontroller. Till det bidrar att högst hälften av undervisni­ngen i Sveriges statliga samiska skolor får ske på samiska.

Dessutom tillåts inte samiska språkverkt­yg på viktiga plattforma­r, som Google docs och Microsoft office.

– Svenska staten har lång väg att gå för att reparera de skador som politiken har orsakat genom åren. Det svenska sametinget har inte heller kommit lika långt som de norska och finländska när det gäller satsningen på språk, säger Sjur Moshagen.

Någon press finns därför inte heller på teknikjätt­ar att ta fram språkverkt­yg på plattforma­r som finns för större språk. Stavningsk­ontrollen för lulesamisk­a för Windows har exempelvis inte uppdaterat­s sedan 2004. Några nätbaserad­e verktyg finns inte heller. För Appledator­er finns inga över huvud taget.

Antalet samer i Norge, Sverige, Finland och Ryssland uppskattas till mellan 80 000 och 100 000. I Sverige talas nordsamisk­a, sydsamiska, lulesamisk­a, pitesamisk­a och umesamiska.

Newspapers in Swedish

Newspapers from Sweden