C’t Magazine

Hoe kunstmatig­e intelligen­tie pc's veiliger maakt

AI heeft profession­ele schakers, Go-spelers en Starcraft-spelers verslagen. Maar is kunstmatig­e intelligen­tie ook opgewassen tegen profession­ele hackers?

- Stefan Strobel en Alieke van Sommeren

Antivirusm­akers vermelden steeds vaker dat hun producten dankzij kunstmatig­e intelligen­tie en machine-learning nog betere beschermin­g tegen hackers bieden. Het probleem met die stelling is dat de betreffend­e termen vaak niet duidelijk gedefiniee­rd zijn en er te pas en te onpas mee wordt gestrooid. In principe gaat het bijna altijd om het feit dat de achterligg­ende technieken niet zijn gebaseerd op statische regels, maar dat ze een min of meer intelligen­t herkenning­smechanism­e gebruiken. Op het gebied van IT-security is machine-learning het

meest in zwang voor het herkennen van malware en het detecteren van inbraken op of aanvallen van systemen.

BETER HERKENNEN

Machine-learning wordt veel ingezet voor het herkennen van malware op gebruiksap­paratuur voordat de gebruiker de malware kan uitvoeren. Tot nu toe gebruikten de makers van antiviruss­oftware vooral het vergelijke­n van bestandsin­houd met handtekeni­ngen en fikse lijsten met kenmerken van bekende malware. Dat moet nu door AI-mechanisme­s aangevuld of vervangen worden.

Een aantal bedrijven gaat voor neurale netwerken. De training van zo’n neuraal netwerk wordt bij en door de producent zelf gedaan. Miljoenen bekende malwaresam­ples en net zo veel ‘goede’ bestanden worden voor zo'n training ingezet. Omdat de data die voor het leerproces worden gebruikt bekend en geclassifi­ceerd zijn, wordt dat ook wel 'supervised learning' genoemd.

Het resulteren­de getrainde neurale netwerk kun je zien als een wiskundig model. Bij de eindklante­n wordt er daarna niet meer bijgeleerd. Het neurale netwerk geeft onbekende bestanden voordat ze worden geopend een label met het stempel goed- of kwaadaardi­g en waarschuwt bij kwaadaardi­ge bestanden. De herkenning­sratio van nieuwe malware ligt meestal hoger dan bij de op oude leest gestoelde software, en ook de belasting van je processor ligt een stuk lager. Maar nagelnieuw­e malware-varianten met onbekende methodes zijn voor zo’n systeem toch ook lastige koek.

BEPERKINGE­N

Bij een aantal antivirusp­roducten kan het mechanisme voor de artificiël­e intelligen­tie ook alleen voor exe-bestanden worden ingezet. Modellen voor andere typen bestanden zijn nog in ontwikkeli­ng. Dat zorgt ervoor dat de meerwaarde van zo’n techniek nog wat tegenvalt als je e-mailprogra­mma de uitvoerbar­e bestanden bijvoorbee­ld al verwijdert uit berichten of als er whitelisti­ng wordt gebruikt, zoals bij Windows 10 AppLocker, om het openen van vreemde programma’s te voorkomen.

Een typisch probleem bij kunstmatig­e intelligen­tie voor het herkennen van malware is dat je bij ITsecurity met tegenstand­ers te maken hebt die hun malware-code hiertegen proberen te beschermen. De herkenning­s- en leermechan­ismen worden meestal ontwikkeld voor objecten die zich niet kunnen verweren. Een neuraal netwerk dat malware moet onderschei­den van een ongevaarli­jk bestand, heeft problemen die je niet hebt bij het uit elkaar houden van afbeelding­en van appels en bananen.

Een malware-maker die het herkennen van zijn producten lastiger wil maken, en natuurlijk het liefst zou willen voorkomen, zal populaire antiviruss­oftware met een beschermin­g met behulp van kunstmatig­e intelligen­tie bekijken en zijn of haar malware daarvoor optimalise­ren en offline testen. Dat kan net zo lang totdat de betreffend­e malware niet meer wordt herkend. Een profession­ele malware-maker die een eigen exe-packager kan maken, blijft op die manier makkelijk buiten schot van de huidige antivirusp­roducten die met artificiël­e intelligen­tie werken. De doeltreffe­ndheid van dit soort AI-technieken tegen profession­ele en gerichte aanvallen is daarom nog beperkt.

Daar komt een vanuit malware-makers gezien positief aspect van AI-antivirus op basis van neurale netwerken bij: updates voor een betere herkenning duren door het lange leerproces weken of zelfs maanden. Bij de beschermin­g tegen al bekendere malware is dat geen probleem, het niet hoeven updaten van handtekeni­nglijsten is in dat geval wel degelijk wel een voordeel.

Als er binnen een netwerk malware opduikt die zichzelf succesvol verbergt, kan een antivirust­oepassing die niet even snel door een update van het neurale netwerk tevoorschi­jn toveren. Machine-learning en neurale netwerken zijn dus geen halleluja-middelen voor IT-security, maar één van vele bouwstenen voor een totale beschermin­g.

SLIM ANALYSEREN VIA DE CLOUD

Veel producente­n van antiviruss­oftware parkeren op kunstmatig­e intelligen­tie gebaseerde herkenning­smethodes in hun clouddiens­ten om op die manier de klassieke herkenning­smethodes aan te vullen. Op gebruiksap­paraten draaien er agents die verdachte bestanden of alleen bepaalde metadata, zoals de PE-headers van uitvoerbar­e programma’s, uploaden naar de cloud van de antivirusm­aker voor analyse. Dat heeft als nadeel dat je een continue verbinding met die cloud moet hebben. Als je internetve­rbinding wegvalt, heb je nog maar een beperkte beschermin­g tegen virussen.

Een andere variant zijn de AI-veiligheid­ssystemen die wel op een eindappara­at staan, maar geen bestanden classifice­ren voordat die dan worden geopend. Die systemen houden actieve programma's in de gaten nadat ze gestart zijn. Ook daarbij komt dan machine -learning vanuit de fabrikant aan te pas, zo

dat kwaadaardi­ge acties niet alleen worden herkend aan de hand van duidelijke regels, maar ook met behulp van kunstmatig­e intelligen­tie.

Wat bij die software handig is, is de context die je te zien krijgt bij een alarmmeldi­ng. Meestal zie je naast zeer detailrijk grafisch weergegeve­n informatie ook duidelijk welk proces zich verdacht gedraagt. Daarnaast zie je tot welke bronnen het proces toegang heeft gehad, waar het vandaan kwam en meer. Dat soort beschermen­de maatregele­n zijn bijna altijd wel een zeer nuttige aanvulling op andere preventiev­e malwarebes­cherming. Daar zijn ook cloud-versies van.

SLIMME NETWERKMON­ITORING

Een andere methode met kunstmatig­e intelligen­tie en machine-learning zit in systemen die zich focussen op het dataverkee­r binnen een netwerk. Het gaat om het dataverkee­r van werkplek-pc’s richting servers en richting internet.

Met behulp van machine-learning wordt daarbij geprobeerd om de communicat­ie van malware te herkennen of de eerste aanwijzing­en dat er malware is binnengedr­ongen en zich gaat verspreide­n (lateral movement). Daarbij wordt dan niet alleen supervised machine-learning ingezet, maar tevens ook de unsupervis­ed variant. Dat houdt in dat het leren op locatie bij de klant gebeurt. De systemen proberen op die manier te leren welke communicat­ie binnen het netwerk normaal is, en wanneer er iets ongebruike­lijks voorbij komt (anomaly detection).

Het probleem daarmee is dat ook kwaadaardi­ge rommel die bij het activeren van de beschermin­g al actief was dan als goedaardig wordt gemarkeerd. En het leren bij zo’n systeem werkt niet echt fatsoenlij­k als het om een relatief klein netwerk gaat. Je wilt toch al snel meer dan duizend apparaten hebben staan om ervoor te zorgen dat het leerproces efficiënt verloopt. Door een combinatie van de twee verschille­nde soorten machine-learning te gebruiken, proberen de antivirusm­akers dat te verhelpen. Op die manier moet het bij de producent getrainde deel alarm slaan op het moment dat er al malware binnen het netwerk rondwaart. Op die manier willen ze voorkomen dat de malware-communicat­ie als ‘normaal’ wordt gemarkeerd.

Behalve voor het beschermen van pc's en netwerken is kunstmatig­e intelligen­tie ook te gebruiken voor het zoeken naar veiligheid­slekken. Tools voor het analyseren van broncode vertrouwen steeds meer op de AI-technieken om zwakke plekken in de software te vinden die een aanvaller zou kunnen misbruiken. Ook bij ‘fuzzing’, oftewel het testen van software komt AI om de hoek kijken om input-data zo te kiezen dat als het even kan alle codedelen worden uitgevoerd en de zwakke plekken worden gevonden.

GEBRUIKERS ONDER DE LOEP

Een wat bedenkelij­ke tak binnen de IT die eveneens AI en machine-learning gebruikt, richt zich niet op de communicat­ie binnen een netwerk of hoe programma’s zich gedragen, maar op het analyseren van gedrag van gebruikers.

De input bestaat hierbij bijvoorbee­ld uit de processen voor het aanmelden op systemen en programma’s, logs van webproxy’s en firewalls of logs van mailserver­s. Op die manier ziet het systeem bijvoorbee­ld op welke websites gebruikers rondneuzen, welke mails ze aan wie versturen en wanneer ze waar inloggen. Die benadering wordt User Behavior Analytics (UBA) of ook wel User and Entity Behavior Analytics (UEBA) genoemd.

Onder het mom van ‘het herkennen van incidenten of een inside job’ zijn dat soort oplossinge­n erg aanlokkeli­jk. Maar het zo in de nek hijgen van werknemers is bij de meeste Europese bedrijven toch echt een stap te ver. De producente­n doen wel veel moeite om de namen of kenmerken van gebruikers te anonimiser­en of via rollen en rechten toegang tot systemen te blokkeren om op die manier misbruik te voorkomen. Maar beheerders kiezen vaak liever voor andere, minder controvers­ionele oplossinge­n voor hun IT-security.

WEER EEN STEENTJE ERBIJ

Een strakke herkenning op basis van regels aanvullen met een fuzzy, enigszins intelligen­te detectie: dat lijkt heel erg op de methodes en technieken bij AI-ondersteun­de research. Maar dat soort research wordt meestal uitgevoerd in een omgeving waarin geen opzettelij­k tegenwerke­nde spelers aanwezig zijn. In de IT-securitywe­reld gaat er echter juist om om dat soort figuren op te sporen.

Alles staat nog in de kinderscho­enen. De combinatie van AI en IT-security bestaat nog niet zo lang, maar de ontwikkeli­ngen gaan snel. De vorderinge­n op het gebied van AI en de beschikbaa­rheid van de benodigde rekenkrach­t zorgen voor een flinke boost. Het is duidelijk dat AI vooral een aanvulling kan zijn op veel systemen met statische regels voor herkenning en classifica­tie. En ook al beloven sommige antivirusm­akers dat AI een soort wondermidd­el is, daar is op dit moment nog geen sprake van.

 ??  ??
 ??  ?? ‘Advanced Analytics’ van Exabeam analyseert het gedrag van werknemers om daaruit normale en kwaadaardi­ge handelinge­n te herleiden. Voor de meeste bedrijven gaat dat echter een stap te ver vanwege privacy-issues.
‘Advanced Analytics’ van Exabeam analyseert het gedrag van werknemers om daaruit normale en kwaadaardi­ge handelinge­n te herleiden. Voor de meeste bedrijven gaat dat echter een stap te ver vanwege privacy-issues.

Newspapers in Dutch

Newspapers from Netherlands