=WAT.ALS (Excel;IN (“desoep”); DRAAIT(?))
Hoe 15.841 coronagevallen onvermeld bleven
Excel-rekenbladen zitten vol cijfers en formules. En vol fouten. ‘In 2 à 3 procent van de rekenbladen zit een fout’, zegt Felienne Hermans, professor computerwetenschappen aan de Universiteit Leiden, die er een doctoraat over schreef. Verwonderlijk is dat niet: niets is menselijker dan missen. Maar Excel is extra foutgevoelig. Het programma is heel toegankelijk, maar je raakt er ook snel het overzicht in kwijt. Zeker wanneer je geen programmeur bent. Om spreadsheetgebruikers te helpen, is er de European Spreadsheet Risks Interests Group, die jaarlijks congressen geeft, en ook blunders oplijst.
Een bloemlezing van enkele opmerkelijke rekenbladfouten.
1. Over de grens
Tussen 25 september en 2 oktober werden in het Verenigd Koninkrijk 15.841 bevestigde coronagevallen niet gerapporteerd. Bijgevolg werden ook hun contacten niet verwittigd. Dat komt doordat die gegevens in een Excel-bestand verwerkt werden. Helaas kozen de makers voor de verouderde .xls-versie en niet de moderne .xlsx-versie, meldt de BBC. Die telt maximaal 65.536 rijen (twee tot de zestiende macht). Omdat elke besmette persoon meerdere rijen in het rekenblad inneemt, was het aantal patiënten in elke template beperkt tot 1.400 gevallen. Waren er meer, dan werden die simpelweg genegeerd.
Het probleem is ondertussen opgelost. Public Health England (PHE) splitst zijn bestanden gewoon op, zodat de limiet niet langer bereikt wordt.
2. Deze keer is het anders Excel leent zich prima om snel wat berekeningen te maken. Van die mogelijkheid maakten de Harvard-economen Carmen Reinhart en Kenneth Rogoff in 2010 dankbaar gebruik. De conclusie van dat rekenwerk: als de schuldgraad van een land groter is dan 90 procent van het bbp, wordt de economische groei drastisch gefnuikt.
Bij economiestudent Thomas Herndon brak in 2013 het koud zweet uit toen hij er niet in slaagde om hun resultaten te repliceren voor een taak. Wanneer hij uiteindelijk het Excel-bestand van Rogoff kreeg, bleek waarom. De professoren hadden een foutje gemaakt in hun formule, waardoor ze vijf landen, waaronder België, niet hadden meegenomen in hun analyse.
Reinhart en Rogoff reageerden laconiek. ‘Het is ontnuchterend dat zo’n fout in een van onze artikels kon sluipen. Maar dat wijzigt de centrale boodschap van ons werk niet.’ Nochtans gold de grens van 90 procent niet langer. Extra sneu is dat precies die grens aangehaald werd door de voorstanders van een streng begrotingsbeleid, zoals toenmalig Europees Commissaris Olli Rehn. 3. Niet goed verborgen
In het spreadsheetprogramma kun je rijen of kolommen verbergen, maar dat betekent niet dat ze weg zijn. Dat ontdekte de zakenbank Barclays in 2008 tot haar scha en schande. Toen de bank contracten wilde overnemen van het ter ziele gegane Lehman Brothers, stopte ze ongewenste contracten in een verborgen kolom. Maar toen van dat Excel-bestand een pdf gemaakt werd, kwamen die plots weer tevoorschijn. Zo zat Barclays opgezadeld met 179 contracten die het liever kwijt dan rijk was.
Ook de persoonlijke gegevens van 36.000 werknemers van luchtvaartbedrijf Boeing belandden op die manier in 2017 bij een onbevoegde. De verborgen kolommen bevatten onder meer de naam, geboortedatum en socialezekerheidsnummers van de werknemers.
4. Help, hoe zet ik de gasinstallatie aan?
‘Een bedrijf had een gasinstallatie gekocht, maar daar was geen software bijgeleverd’, vertelt Hermans over een van de opmerkelijkste spreadsheets die ze bestudeerde.
Die software zou nog eens honderdduizenden euro’s kosten. ‘Toen programmeerde de spreekwoordelijke Henk van de beheersafdeling dat gewoon in Excel. Met een druk op de knop in Excel kon je een gasinstallatie in werking stellen.’ Fout liep het niet: er is nooit een gasinstallatie ontploft. ‘Maar toen de spreekwoordelijke Henk met pensioen ging, was er niemand die nog begreep hoe dat bestand in elkaar stak.’
Net als bij de Britse covid-19-gegevens ging het om oneigenlijk gebruik van de rekenbladen. Maar Hermans heeft er wel begrip voor. ‘Hoe gebeurt zoiets? Iemand die geen softwareprofessional is, begint met een Excelsheet en dat groeit hem boven het hoofd. Dus is een softwareoplossing nodig. Wanneer de aanbesteding en ontwikkeling daarvan klaar zijn, zijn we alweer een halfjaar verder. Die tijdelijke oplossing is niet per se de slechtste keuze. Maar er is niets zo permanent als een tijdelijke oplossing.’
De Britse covidgegevens werden verwerkt in een verouderde versie van Excel. Gevolg: het programma negeerde 15.841 bevestigde gevallen