Bijzondere tekens
De meeste computergebruikers voelen zich achter het toetsenbord op veilig terrein. Bij het intypen van speciale tekens zijn er echter een paar valkuilen, en dan komt wat achtergrondkennis van typografie en tekensets goed van pas.
Letters, cijfers en algemene leestekens zijn op een toetsenbord nog wel te vinden, maar soms heb je speciale tekens nodig – of dat nu bij tekstdocumenten of op sociale media is. Gewoonlijk gebruik je dan tekens die makkelijk in te typen zijn, maar dat is typografisch soms verkeerd. Als twee tekens op elkaar lijken, zijn ze nog niet hetzelfde.
In 2020 mag je ervan uitgaan dat de meeste toepassingen overweg kunnen met teksten in de Unicode-tekenset. Die is zo groot dat hij naast tekens voor bijna alle levende (en dode) talen ook tal van speciale tekens omvat. Geen toetsenbord dat op een bureau moet passen kan een toets bieden voor elk van die tekens. Dat is echter ook niet nodig. Elk teken heeft een code die gespecificeerd kan worden in hexadecimale of decimale notatie. De komma heeft bijvoorbeeld de decimale code 0044, wat hexadecimaal overeenkomt met 002c (hexadecimale getallen worden gemarkeerd met een voorafgaande 0x, dus 0x002c). Een complete Unicode-tabel staat bij de link op de volgende pagina.
Alle tekens die niet makkelijk via het toetsenbord bereikbaar zijn, kunnen via hun Unicode-code rechtstreeks op desktopbesturingssystemen worden gegenereerd, zij het met beperkingen. Bij MacOS moet je eerst bij de Systeemvoorkeuren onder ‘Toetsenbord / Invoerbronnen’ de toetsenbordindeling ‘Unicode Hex-invoer’ toevoegen en vervolgens activeren. Daarna kun je een hexcode intypen terwijl je de Optie-toets ingedrukt houdt. Typ de cijfers op het numerieke toetsenblok met extra voorloopnullen bij een code korter dan vier tekens. Voor de komma wordt dat bijvoorbeeld 0 0 2 c.
Bij Linux-desktops die gebaseerd zijn op Qt en GTK werkt dat zonder instellen door de Ctrl- en Shift-toetsen ingedrukt te houden en U 0 0 2 c in te typen (alle cijfers op het numerieke toetsenblok). Het teken verschijnt nadat je Ctrl en Shift hebt losgelaten. Bij Windows is het intypen van Unicode allesbehalve intuïtief en veel van wat je daarover op internet leest, klopt helaas niet.
SPECIALE ROUTE VOOR WINDOWS
Overal in Windows kun je met de Alt-toets ingedrukt een decimale code tussen 0033 en 0255 intypen uit een Unicode-tabel (van voren aangevuld met nullen). Voor de komma dus bijvoorbeeld met de Alt-toets ingedrukt, 0044. Toen Windows werd omgezet naar Unicode, bleven er echter resten uit het vorige millennium achter. In feite gaat het bij de Alt-codes namelijk niet om Unicode, maar om de tekenset Windows-1252, die grotendeels overeenkomt met het begin van de Unicode-tabel. Er zijn afwijkingen in het bereik van 0128 tot 0159. Daar zijn andere tekens gedefinieerd, zoals het euroteken (0128).
Het wordt echter pas echt verwarrend met alle Unicode-adressen boven de 0255. Daar is namelijk geen standaard systeemverwerking en programma’s kunnen afwijkend reageren. Sommige negeren in dat geval het laatste cijfer, andere rekenen met modulo 256, weer andere kunnen wel met die Unicode-tekens overweg. Gelukkig is dat laatste van toepassing op de meeste tekstverwerkingsprogramma’s
( inclusief WordPad). Als je tekens zoekt, kan dat met het systeemprogramma ‘ Speciale tekens’, waarin je tekens kunt selecteren en kopiëren. Daar zie je ook het Unicode-adres in hexadecimale notatie.
Maar ook als Windows-gebruiker kun je een uniforme en systeembrede invoer bereiken. Maak in de registersleutel ‘HKEY_CURRENT_USER\Control Panel\Input Method\’ een item aan van het type Tekenreeks (REG_SZ) met de naam ‘EnableHexNumpad’ en de waarde 1, en start je de computer opnieuw op. Houd de Alt-toets ingedrukt om een teken in te voeren en typ vervolgens + op het cijferblok, gevolgd door het viercijferige hexadecimale adres (weer aangevuld met voorloopnullen). Dat is bijvoorbeeld bij een promilleteken (‰) + 2 0 3 0. De klassieke Windows-procedure (zonder een plusteken en met decimale adressen) blijft werken. Die kun je gebruiken als de nieuwe methode niet werkt, zoals bij laptops zonder echt numeriek toetsenblok.
In de tabel onderaan op deze pagina staan de hexadecimale en decimale codes in Unicode voor de in dit artikel genoemde vaak door elkaar gehaalde speciale tekens, evenals de afwijkingen in Windows-1252. Voor sommige tekens zijn er ook toetscombinaties die afhankelijk zijn van het besturingssysteem. Op mobiele apparaten kun je ook werken met sommige Unicode-tekens, maar daarvoor heb je een alternatief virtueel toetsenbord nodig. Bij de link op deze pagina vind je die voor iOS en Android in de App Store en de Play Store.
FOUTE VRIENDEN
Vooral de apostrof moet vechten voor zijn plaats en wordt vaak vervangen door vergelijkbare symbolen. De hoge komma is typografisch correct, zoals je in hoge resolutie kunt bewonderen op de cover van een nummer van c’t, linksboven in het logo. Hij ziet eruit als een komma die omhoog geschoven is en de Unicode-code 8217 (0x2019) heeft. Bij Windows-1252 wordt hij gecodeerd met 0146 (‘enkel aanhalingsteken rechts’). Als het niet anders kan, mag je de apostrof vervangen door een klein verticaal streepje (', 0039, 0x0027), op een Nederlands (VS-internationaal) toetsenbord is dat ' en daarna een spatie. Andere accenttekens op een toetsenbord zijn vaak verkeerd. Die zijn bedoeld voor talen zoals het Frans, in combinatie met klinkers, en hebben niets te maken met de apostrof. Ook het symbool dat wordt gebruikt voor de Engelse lengtemaat voet en de boogminuut voor lengte- en breedtegraden (8242, 0x2032) lijkt alleen op het eerste gezicht op de apostrof.
Om je even te laten pauzeren – zoals hier – heb je het gedachtestreepje. Typografisch is dat een zogenaamd en-streepje, met ervoor en erna een spatie. Een fout die je op websites vaak tegenkomt, is dat dit wordt vervangen door een koppelteken, maar dat is duidelijk korter en eigenlijk niet op zijn plaats. Alleen het Unicode-teken 8211 (0x2013) is correct, bij Windows-1252 vind je het via 0150. Bij veel tekstverwerkers en e-mailprogramma’s is het echter voldoende om twee koppeltekens in te typen (omgeven door spaties), die de autocorrectie dan vervangt door het juiste teken. Hetzelfde teken hoort ook in aanduidingen zoals ‘Open: 8–10 uur’.
Een populaire fout wordt gemaakt bij rekenkundige symbolen. Het maalteken (×), dat hoort bij vermenigvuldigingen (3 × 3 = 9) en afmetingen (2 × 3 × 4 meter), wordt vaak voor het gemak vervangen door een kleine of hoofdletter ‘x’. Daar is het Unicode-teken 0215 (0x00d7) correct.
Nu er zoveel aanleiding is om over kooldioxide te schrijven, is het ook de moeite waard om het teken voor het subscript twee te kennen (8322, 0x2082). Het is tenslotte CO , en niet CO2 of CO2.
PIETJES PRECIES
Je kunt de wens om altijd de typografisch correcte tekens te gebruiken echter ook overdrijven. Een koppelteken (0045, 0x002d) is bijvoorbeeld, als je het heel precies neemt, niet het minteken (8722, 0x2212) dat je bij berekeningen moet gebruiken. In tegenstelling tot het duidelijke verschil tussen een en-streepje en een koppelteken is het verschil daartussen echter nauwelijks zichtbaar. Ook voor de drie punten die als weglatingsteken (ellips) worden gebruikt, (...) is er een eigen teken (8230, 0x2026), waarin de stippen iets dichter bij elkaar staan. Maar drie gewone punten zijn ook niet verkeerd. Zo zijn er nog veel meer voorbeelden te noemen. De middenpunt (·) (0183, 0x00b7) kan ook van pas komen. Hij staat niet op de basislijn en je kunt hem bijvoorbeeld op een poster of in een menu als een interessant alternatief voor de komma gebruiken: Vis · Vlees · Groenten.
Voor dagelijks gebruik is het handig om de codes of toetscombinaties voor de meest voorkomende tekens (en-streepje, apostrof) te onthouden of om de tabel digitaal (of lekker ouderwets op een post-it) bij de hand te houden.