Zonder IT-herstelplan geen bedrijfscontinuïteit
24 procent van de managers maakt zich zorgen over het gebrek aan een IT-herstelplan bij een ernstige IT-storing, blijkt uit de Black-Out Preventie gids van Strict. Oktober is cybersecuritymaand en een goed moment om over zo'n plan na te denken. Maar wat moet er in zo'n plan staan? Strategieconsultant Kor Gerritsma van Strict deelt zijn tips.
Bij het opstellen van een herstelplan gaan organisaties uit van de wat als-scenario's. Niet alleen op IT-gebied, eigenlijk moeten alle facetten van de bedrijfsvoering daar in zitten.
Zit het bedrijf bijvoorbeeld in een regio wat een mogelijk overstromingsgebied is, dan moet er een herstelplan zijn dat ook daarop inspeelt. Wat betekent dat voor de organisatie en hoe gaan zij daarmee om?
Wordt er bijvoorbeeld nog veel op locatie gewerkt, dan is de volgende vraag: waar moeten werknemers absoluut bij kunnen komen? Zijn daar de benodigde IT-middelen voor geregeld? Hoe zorg je er voor dat medewerkers bij nood ook vanuit andere locaties door kunnen blijven werken?
Veel bedrijven denken waarschijnlijk: wij hebben onze lessen wel geleerd, na de overstromingen in Limburg en de lockdowns tijdens de pandemie. Toch blijkt uit ons onderzoek dat er nog flinke gaten zijn in de huidige herstelplannen.
Wat is belangrijk in een IT-herstelplan?
Een aansprekend voorbeeld is dat van het ziekenhuis. Moeten zij in hun herstelplan opnemen dat tv's in patiëntenkamers altijd blijven werken? Waarschijnlijk niet: dat een patiënt geen tv kan kijken is vervelend, maar niet levensbedreigend.
Waar ziekenhuizen zich wel op moeten focussen zijn de bedrijfskritische componenten, zoals de operatiekamers, de intensive care en de eerste noodhulp. Dat betekent dat er bijvoorbeeld een noodstroomvoorziening in het plan moet staan. Maar ook dat bedrijfskritische systemen redundant zijn uitgevoerd. In situaties waar bijvoorbeeld een quarantaine een rol speelt, kan dat zelfs een afzuigsysteem omvatten.
Het ziekenhuis kan niet op zwart komen te staan als iemand per ongeluk een kabel raakt bij graafwerkzaamheden.
Dit principe geldt voor ieder bedrijf. Organisaties moeten steeds bepalen wat echt nodig is om te blijven bestaan. Dat begint bij het onderkennen van de bedrijfskritische onderdelen, oftewel de onderdelen waar de organisatie haar bestaansrecht aan ontleent. Een voorbeeld: voor effectbanken zijn dit de IT-middelen waarover gehandeld wordt. Uitval ervan leidt binnen een zeer korte tijd, vaak al binnen enkele uren, tot grote betalingsproblemen en verlies van vertrouwen, en dus imagoschade.
De rol van de cloud
Ook cloud-providers kunnen storingen hebben en (deels) uitvallen. Dat heeft directe gevolgen voor organisaties die deze cloud gebruiken: zij zijn dan ook niet meer bereikbaar.
Volledig overstappen naar de cloud verandert het vraagstuk rond redundantie niet. Staat alles bij één provider en die valt uit, ontstaat er een probleem. Als de organisatie via één enkele verbinding met die cloudprovider communiceert en dat pad valt uit, geldt hetzelfde.
Organisaties moeten er dus voor zorgen dat zij op meerdere manieren een dienst of dienstverlening kunnen bereiken of ontsluiten. Dat hoort ook in het plan.
Vergelijk het met de fysieke locatie van het bedrijf: als er één brug voor staat en die stort in, ontstaat er een probleem. Met twee bruggen blijft de locatie bereikbaar. Datzelfde geldt voor IT-middelen. Als organisaties twee deuren hebben, kunnen zij er altijd in, mits ze de sleutels hebben.
Sleutelbeheer
Het beheer van die sleutels hoort ook in het plan. Als iemand zijn huissleutel verliest en buiten staat, staat die voor een dichte deur en is er een breekijzer nodig om binnen te komen. Dat geldt ook in IT.
Als een organisatie een certificaat nodig heeft om bij diensten te komen en dat certificaat verloopt en is niet opnieuw aan te vragen, ontstaat er een probleem. Dan heeft de organisatie de sleutel tot de dienstverlening niet meer. Daar moet altijd een fallback scenario voor zijn.
Zeker in de cloud is dit cruciaal. Als clouddiensten goed beveiligd zijn, dan zijn ze versleuteld. Bij verlies of vernietiging van de sleutel blijft er alleen nog een hoop enen en nullen over, maar geen data en geen informatie.
Hoelang is de hersteltijd?
Gaat het toch mis, dan moeten organisaties weten hoeveel tijd het kost om te herstellen. Hoelang duurt het om de herstelacties voor te bereiden? Hoeveel tijd kost de daadwerkelijke uitvoering? Welke mensen zijn daarbij nodig? Welk mandaat? Welke toeleveranciers?
Bij het voorkomen van een crisis moeten dit soort zaken vooraf worden vastgelegd en afgesproken. Dat hoort dus in het plan.
Ook de volgordelijkheid waarin het herstel wordt uitgevoerd is belangrijk. Eerst moet het netwerk het weer doen. Zonder deze laag kun je immers geen gegevens transporteren. Daarna zijn de applicatie en datalaag aan de beurt.
Waarom is deze volgorde van belang? In een andere volgorde kunnen er problemen ontstaan met de tijdstempels. Als die niet meer synchroon lopen, praten de applicaties niet meer met elkaar en leidt dit tot verlies van gegevens.
Zonder plan geen herstel
In een goed IT-herstelplan staat ook zeker een goede procesbeschrijving. Wie mag welke stappen ondernemen? Wie communiceert met wie? Desnoods worden er uitgetypte werkinstructies gemaakt, die dummyproof zijn. Dan kan altijd iemand processen herstellen, zelfs als de vaste IT-beheerder dat niet kan.