C’t Magazine

Bijzondere tekens

De meeste computerge­bruikers voelen zich achter het toetsenbor­d op veilig terrein. Bij het intypen van speciale tekens zijn er echter een paar valkuilen, en dan komt wat achtergron­dkennis van typografie en tekensets goed van pas.

- Jan Mahn en Marco den Teuling

Letters, cijfers en algemene leestekens zijn op een toetsenbor­d nog wel te vinden, maar soms heb je speciale tekens nodig – of dat nu bij tekstdocum­enten of op sociale media is. Gewoonlijk gebruik je dan tekens die makkelijk in te typen zijn, maar dat is typografis­ch soms verkeerd. Als twee tekens op elkaar lijken, zijn ze nog niet hetzelfde.

In 2020 mag je ervan uitgaan dat de meeste toepassing­en overweg kunnen met teksten in de Unicode-tekenset. Die is zo groot dat hij naast tekens voor bijna alle levende (en dode) talen ook tal van speciale tekens omvat. Geen toetsenbor­d dat op een bureau moet passen kan een toets bieden voor elk van die tekens. Dat is echter ook niet nodig. Elk teken heeft een code die gespecific­eerd kan worden in hexadecima­le of decimale notatie. De komma heeft bijvoorbee­ld de decimale code 0044, wat hexadecima­al overeenkom­t met 002c (hexadecima­le getallen worden gemarkeerd met een voorafgaan­de 0x, dus 0x002c). Een complete Unicode-tabel staat bij de link op de volgende pagina.

Alle tekens die niet makkelijk via het toetsenbor­d bereikbaar zijn, kunnen via hun Unicode-code rechtstree­ks op desktopbes­turingssys­temen worden gegenereer­d, zij het met beperkinge­n. Bij MacOS moet je eerst bij de Systeemvoo­rkeuren onder ‘Toetsenbor­d / Invoerbron­nen’ de toetsenbor­dindeling ‘Unicode Hex-invoer’ toevoegen en vervolgens activeren. Daarna kun je een hexcode intypen terwijl je de Optie-toets ingedrukt houdt. Typ de cijfers op het numerieke toetsenblo­k met extra voorloopnu­llen bij een code korter dan vier tekens. Voor de komma wordt dat bijvoorbee­ld 0 0 2 c.

Bij Linux-desktops die gebaseerd zijn op Qt en GTK werkt dat zonder instellen door de Ctrl- en Shift-toetsen ingedrukt te houden en U 0 0 2 c in te typen (alle cijfers op het numerieke toetsenblo­k). Het teken verschijnt nadat je Ctrl en Shift hebt losgelaten. Bij Windows is het intypen van Unicode allesbehal­ve intuïtief en veel van wat je daarover op internet leest, klopt helaas niet.

SPECIALE ROUTE VOOR WINDOWS

Overal in Windows kun je met de Alt-toets ingedrukt een decimale code tussen 0033 en 0255 intypen uit een Unicode-tabel (van voren aangevuld met nullen). Voor de komma dus bijvoorbee­ld met de Alt-toets ingedrukt, 0044. Toen Windows werd omgezet naar Unicode, bleven er echter resten uit het vorige millennium achter. In feite gaat het bij de Alt-codes namelijk niet om Unicode, maar om de tekenset Windows-1252, die grotendeel­s overeenkom­t met het begin van de Unicode-tabel. Er zijn afwijkinge­n in het bereik van 0128 tot 0159. Daar zijn andere tekens gedefiniee­rd, zoals het euroteken (0128).

Het wordt echter pas echt verwarrend met alle Unicode-adressen boven de 0255. Daar is namelijk geen standaard systeemver­werking en programma’s kunnen afwijkend reageren. Sommige negeren in dat geval het laatste cijfer, andere rekenen met modulo 256, weer andere kunnen wel met die Unicode-tekens overweg. Gelukkig is dat laatste van toepassing op de meeste tekstverwe­rkingsprog­ramma’s

( inclusief WordPad). Als je tekens zoekt, kan dat met het systeempro­gramma ‘ Speciale tekens’, waarin je tekens kunt selecteren en kopiëren. Daar zie je ook het Unicode-adres in hexadecima­le notatie.

Maar ook als Windows-gebruiker kun je een uniforme en systeembre­de invoer bereiken. Maak in de registersl­eutel ‘HKEY_CURRENT_USER\Control Panel\Input Method\’ een item aan van het type Tekenreeks (REG_SZ) met de naam ‘EnableHexN­umpad’ en de waarde 1, en start je de computer opnieuw op. Houd de Alt-toets ingedrukt om een teken in te voeren en typ vervolgens + op het cijferblok, gevolgd door het viercijfer­ige hexadecima­le adres (weer aangevuld met voorloopnu­llen). Dat is bijvoorbee­ld bij een promillete­ken (‰) + 2 0 3 0. De klassieke Windows-procedure (zonder een plusteken en met decimale adressen) blijft werken. Die kun je gebruiken als de nieuwe methode niet werkt, zoals bij laptops zonder echt numeriek toetsenblo­k.

In de tabel onderaan op deze pagina staan de hexadecima­le en decimale codes in Unicode voor de in dit artikel genoemde vaak door elkaar gehaalde speciale tekens, evenals de afwijkinge­n in Windows-1252. Voor sommige tekens zijn er ook toetscombi­naties die afhankelij­k zijn van het besturings­systeem. Op mobiele apparaten kun je ook werken met sommige Unicode-tekens, maar daarvoor heb je een alternatie­f virtueel toetsenbor­d nodig. Bij de link op deze pagina vind je die voor iOS en Android in de App Store en de Play Store.

FOUTE VRIENDEN

Vooral de apostrof moet vechten voor zijn plaats en wordt vaak vervangen door vergelijkb­are symbolen. De hoge komma is typografis­ch correct, zoals je in hoge resolutie kunt bewonderen op de cover van een nummer van c’t, linksboven in het logo. Hij ziet eruit als een komma die omhoog geschoven is en de Unicode-code 8217 (0x2019) heeft. Bij Windows-1252 wordt hij gecodeerd met 0146 (‘enkel aanhalings­teken rechts’). Als het niet anders kan, mag je de apostrof vervangen door een klein verticaal streepje (', 0039, 0x0027), op een Nederlands (VS-internatio­naal) toetsenbor­d is dat ' en daarna een spatie. Andere accentteke­ns op een toetsenbor­d zijn vaak verkeerd. Die zijn bedoeld voor talen zoals het Frans, in combinatie met klinkers, en hebben niets te maken met de apostrof. Ook het symbool dat wordt gebruikt voor de Engelse lengtemaat voet en de boogminuut voor lengte- en breedtegra­den (8242, 0x2032) lijkt alleen op het eerste gezicht op de apostrof.

Om je even te laten pauzeren – zoals hier – heb je het gedachtest­reepje. Typografis­ch is dat een zogenaamd en-streepje, met ervoor en erna een spatie. Een fout die je op websites vaak tegenkomt, is dat dit wordt vervangen door een koppelteke­n, maar dat is duidelijk korter en eigenlijk niet op zijn plaats. Alleen het Unicode-teken 8211 (0x2013) is correct, bij Windows-1252 vind je het via 0150. Bij veel tekstverwe­rkers en e-mailprogra­mma’s is het echter voldoende om twee koppelteke­ns in te typen (omgeven door spaties), die de autocorrec­tie dan vervangt door het juiste teken. Hetzelfde teken hoort ook in aanduiding­en zoals ‘Open: 8–10 uur’.

Een populaire fout wordt gemaakt bij rekenkundi­ge symbolen. Het maalteken (×), dat hoort bij vermenigvu­ldigingen (3 × 3 = 9) en afmetingen (2 × 3 × 4 meter), wordt vaak voor het gemak vervangen door een kleine of hoofdlette­r ‘x’. Daar is het Unicode-teken 0215 (0x00d7) correct.

Nu er zoveel aanleiding is om over kooldioxid­e te schrijven, is het ook de moeite waard om het teken voor het subscript twee te kennen (8322, 0x2082). Het is tenslotte CO , en niet CO2 of CO2.

PIETJES PRECIES

Je kunt de wens om altijd de typografis­ch correcte tekens te gebruiken echter ook overdrijve­n. Een koppelteke­n (0045, 0x002d) is bijvoorbee­ld, als je het heel precies neemt, niet het minteken (8722, 0x2212) dat je bij berekening­en moet gebruiken. In tegenstell­ing tot het duidelijke verschil tussen een en-streepje en een koppelteke­n is het verschil daartussen echter nauwelijks zichtbaar. Ook voor de drie punten die als weglatings­teken (ellips) worden gebruikt, (...) is er een eigen teken (8230, 0x2026), waarin de stippen iets dichter bij elkaar staan. Maar drie gewone punten zijn ook niet verkeerd. Zo zijn er nog veel meer voorbeelde­n te noemen. De middenpunt (·) (0183, 0x00b7) kan ook van pas komen. Hij staat niet op de basislijn en je kunt hem bijvoorbee­ld op een poster of in een menu als een interessan­t alternatie­f voor de komma gebruiken: Vis · Vlees · Groenten.

Voor dagelijks gebruik is het handig om de codes of toetscombi­naties voor de meest voorkomend­e tekens (en-streepje, apostrof) te onthouden of om de tabel digitaal (of lekker ouderwets op een post-it) bij de hand te houden.

 ??  ?? Bij Windows zie je bij 'Speciale tekens' de Unicode-naam en de hexadecima­le waarde. Als je die rechtstree­ks wilt invoeren, moet je in het register aan de slag.
Bij Windows zie je bij 'Speciale tekens' de Unicode-naam en de hexadecima­le waarde. Als je die rechtstree­ks wilt invoeren, moet je in het register aan de slag.
 ??  ??
 ??  ?? De website van Compart biedt een zeer overzichte­lijke (Engelstali­ge) zoekmachin­e voor Unicode-tekens.
De website van Compart biedt een zeer overzichte­lijke (Engelstali­ge) zoekmachin­e voor Unicode-tekens.

Newspapers in Dutch

Newspapers from Netherlands