Haken en ogen aan open data

Al jaren worden overheidsinstellingen gestimuleerd openbare gegevens vrij en zonder beperkingen te publiceren op het internet. Bedrijven plukken daar de vruchten van, want die gebruiken die gegevens in allerlei apps en software. Maar hoever mag je eigenlijk gaan met het koppelen en verwerken van die open data?

Je zal er misschien niet direct bij stil staan, maar een belangrijk deel van de apps en software waarmee je dagelijks werkt maken gebruik van grote open databanken. De bekendste is misschien wel Buienradar. Zij maken gebruik van de databanken van het KNMI om de regen te voorspellen. Een minder bekend voorbeeld (maar evenzo succesvol) is softwarebedrijf Esri, dat gebruik maakt van de kaarten van het kadaster in locatiesoftware.

En ook iVoertuig is een mooi voorbeeld. Dat is een iPhone app waarmee gebruikers de databanken van de RDW kunnen raadplegen. Al die mooie toepassingen waren niet mogelijk geweest als het KNMI, de RDW en het Kadaster niet hun datasets zonder grote beperkingen ter beschikking hadden gesteld. In het ideale geval zou er zelfs sprake zijn van open databanken, vrij van juridische en technische beperkingen. We spreken van open data, openbare gegevensbronnen die vrij uitleesbaar zijn en voor iedereen te gebruiken.

De Nederlandse overheid en de Europese Unie proberen al jaren van de eigen verzamelde databanken open data te maken. Wanneer gegevens vrij toegankelijk zijn, draagt dat bij aan een transparante overheid. Bovendien hebben al die gegevens commerciƫle waarde en daar kunnen allerlei internetondernemers gebruik van maken.

Sinds 2003 is er daarom een EU-richtlijn die het ontsluiten van gegevens als open data moet stimuleren. Bovendien zet de overheid zelf het beste beentje voor door zelf gegevensbronnen vrij te publiceren. Gemeentes als Utrecht, Amsterdam en Rotterdam zijn bijvoorbeeld eigen dataportals gestart waar burgers en bedrijven open datasets kunnen raadplegen en ook de rijksoverheid geeft eigen databronnen vrij via data.overheid.nl.

Niet iedereen is even blij met ongebreideld openstellen

Toch is niet iedereen even blij met het ongebreideld openstellen van data. Dezelfde instellingen die de open data publiceren, hebben vaak ook hun bedenkingen over hoe ver ze mogen gaan met het publiceren van hun databanken op internet. Zo kan open data privacygevoelige informatie bevatten of er kan auteursrecht rusten op bepaalde openbaar gemaakte stukken.

Afkomst kan verwarring veroorzaken

Ook kan er verwarring ontstaan over van wie informatie afkomstig is. Een site als kadasterdata.nl is bijvoorbeeld een commercieel bedrijf dat gegevens van het Kadaster inkoopt, maar gebruikers denken dat ze met het Kadaster zelf te maken hebben. Het is dus nog niet zo eenvoudig om databronnen als open data te publiceren. En ook voor de software- en appbouwers is het lang niet altijd duidelijk hoever ze mogen gaan met het gebruik van open data. Welke beperkingen zijn er en waar moet je op letten als je met open data aan de slag gaat?

Willen of moeten?

Beleidsadviseur Dick Eertink van het Kadaster is gematigd positief over het publiceren van overheidsgegevens als open data. Binnen het Kadaster is hij de belangrijkste woordvoerder op dit gebied. 'Er zijn eigenlijk twee belangrijke motivaties voor ons om onze gegevens als open data beschikbaar te stellen', zegt hij. 'Op de eerste plaats zijn er de verplichtingen die uitgaan van de EU-richtlijn. Die schrijft voor dat, openbare data bij voorkeur vrij, zonder technische en juridische beperkingen gepubliceerd dient te worden.

Het was een vrij losse formulering waar weinig dwang vanuit ging. Dit jaar is die richtlijn echter aangescherpt en we verwachten dat dit volgend jaar in de Nederlandse wetgeving (Wet Openbaarheid Bestuur) wordt vertaald. In feite zal er dan een verplichting bestaan die stelt dat alle openbare data als open data moet worden aangeboden. Een tweede reden is het feit dat we als Kadaster in het leven zijn geroepen om gegevens te verzamelen en die beschikbaar te stellen aan instanties en burgers. Binnen die doelstelling past het gebruik van open data en zodoende publiceren we ook de nodige datasets.'

'Open is niet altijd de beste manier'

Het Kadaster maakt echter wel een duidelijke kanttekening bij het publiceren van datasets als open data. 'Open is niet in alle gevallen de beste manier', stelt Eertink. Met name wanneer het aankomt op de privacywetgeving heeft hij reserveringen en is er nog veel onduidelijkheid. 'De wetgeving rond privacy stelt dat je persoonsgegevens best mag publiceren en verwerken, als dat maar past in het doel waarvoor ze verzameld zijn. Dat weet je bij open data nooit. De doelbinding die ten grondslag ligt aan de privacybescherming is dan weg.

Ook het ministerie realiseert zich wel dat dit een probleem is en we zijn met elkaar nu in overleg over welke gegevens wel en welke niet voor open data in aanmerking komen.' Ook de herkenbaarheid van de bron vindt Eertink een belangrijk probleem. Het Kadaster staat voor rechtszekerheid en het is daarom van groot belang dat de gegevens kloppen. Afnemers van die gegevens dragen die verantwoordelijkheid echter niet. 'Resellers' van Kadasterdata moeten daarom duidelijk aangeven dat zij niet het Kadaster zijn. Ook wil Eertink zich door middel van voorwaarden verzekeren dat een afnemer zorgvuldig omgaat met de data.

Een ander belangrijk probleem heeft te maken met de financiering. 'Van een organisatie als het Kadaster wordt verwacht dat hij z'n eigen broek ophoudt. Dat kunnen we nu voor een belangrijk deel doen door onze data te verkopen. Individuele gebruikers kunnen bijvoorbeeld tegen betaling van 3,20 euro een kadastrale kaart van een perceel aanschaffen. Voor een gebruiker is dat natuurlijk niet zo'n probleem, maar voor bedrijven die veel data afnemen kan dat flink oplopen. Als van ons wordt verwacht dat we die tarieven schrappen, moeten we andere tarieven verhogen, maar daar zitten andere gebruikers ook niet op te wachten.'

'Privacyrecht is het belangrijkste probleem'

Advocaat Joost Gerritsen van De Gier & Stam Advocaten heeft minder reserveringen met betrekking tot het gebruik van open data. Hij adviseert bedrijven die van open data gebruik maken. De bezwaren met betrekking tot de financiering zijn eigenlijk van korte termijn. 'Binnen de EU is deze discussie al vaker gevoerd en dit is eigenlijk ten gunste van open data beslist. De lange termijn voordelen voor de economie wegen zwaarder dan het korte termijn belang van de instellingen.' Het belangrijkste probleem is volgens hem vooral het privacyrecht. 'Het punt met open data is dat gegevens kunnen verkleuren.', vertelt hij. 'Daarmee bedoel ik dat sommige gegevens in beginsel geen persoonsgegevens zijn, maar door ze te koppelen aan andere data kan plotseling wel een persoon uit de gegevens worden herleid.

Een mooi voorbeeld waar dit fout ging kwam in Engeland. Daar hebben ze ooit een criminele kaart gemaakt, een kaart waar je op postcodeniveau kon zien waar inbraken en delicten hadden plaatsgehad. Je kon echter zo erg inzoomen op de kaart dat je het adres kon herkennen waar bepaalde strafbare feiten hadden plaatsgevonden. Dan kom je ineens in de privacysfeer van mensen, want dan kunnen mensen zien of er bij jou is ingebroken of niet.'

Goede afspraken maken is belangrijk

Of open data goed wordt gebruikt hangt voor Gerritsen daarom voor een belangrijk deel af van de vraag die mensen met de open data willen beantwoorden. 'Ik denk dat het wel degelijk mogelijk is om data te laten verwerken door derden, mits we maar goede afspraken maken over hoe er met die data gewerkt wordt. Het Kadaster is van oudsher gewend precies te weten met wie zij zaken doen en hoe afgenomen gegevens gebruikt worden. Dat is niet meer zo. Door het open karakter van internet kunnen het allerlei bedrijven zijn die van de gegevens gebruik maken en je weet daardoor niet hoe zij met die gegevens omspringen.'

Het zou volgens Gerritsen helpen wanneer de afnemers van open data zich zouden verenigen, dan kunnen zij met overheidsinstellingen gemakkelijker tot afspraken komen. 'Dat gebeurt nu eigenlijk te weinig. Er zijn wel per branche wat activiteiten, maar geen groep pakt het overkoepelend aan.'

Haken en ogen aan open data
Overheidsinstellingen worden gestimuleerd openbare gegevens vrij en zonder beperkingen te publiceren op het internet. Maar hoever mag je gaan met het koppelen en verwerken ervan?