Vissen in overheidsdata

Een open datalab met alle gegevens over burgers in betrekking tot de overheid. Dat lijkt informaticus Stefan de Konink een mooie proeftuin om fraudes op het spoor te komen.

Neem de gegevens van Noord-Brabant van de afgelopen vijf jaar: data van de belastingdienst, rijbewijzen, gemeentelijke basisregistratie, UWV, contacten van burgers met politie, kentekenregistraties. Ofwel alle interacties tussen burgers en overheid. Alleen zijn de namen weggehaald en de sofinummers (BSN) versleuteld. De Konink schat dat het in totaal om 1 terabyte aan data gaat voor een provincie. “Dat past precies op een laptop die je in de trein kunt laten liggen.” De dertigjarige informaticus, voorzitter van de Stichting OpenGeo en eigenaar van de eenmanszaak Kinkrsoftware, verkeert in Delft met een gastvrijheidsverklaring vanwege samenwerking op het gebied van verkeersinformatica.

“We hebben open datasets zoals Facebook, Twitter en LinkedIn en we hebben gesloten datasets zoals die van de gemeente en andere overheden. Maar er is geen experimenteertuin waar alles aan sociale data bij elkaar komt. Waar dat wel zo is, praten we over het werk van geheime diensten. Ik denk dat het beter is om dat soort onderzoek in een open academische omgeving plaats te laten vinden met duidelijke vragen over wat je wilt onderzoeken en heldere indicatoren als uitkomst.”

De Wet Bescherming Persoonsgegevens staat dat niet toe. De bepaling dat gegevens ‘doelgebonden’ zijn, houdt in dat je geen verbanden mag leggen tussen bijvoorbeeld het hebben van een rijbewijs en kentekenregistraties. De Konink zou graag een lokale ontheffing krijgen van die wet om op een gesloten netwerk naar interessante ‘indicatoren’ te kunnen vissen.
Als voorbeelden van zulke indicatoren noemt hij de inschrijving van tientallen kentekens op hetzelfde adres, bestuurders van stichtingen die een uitkering ontvangen, de koppeling van dozijnen BSN-nummers aan eenzelfde IP-adres of de inschrijving van honderden bedrijven op dezelfde twintig vierkante meter kantoor.

In het datalab dat De Konink voorstaat, kunnen informatici op zoek naar verbanden tussen echte gegevens. Ze kunnen algoritmen ontwikkelen om autokatters, uitkeringsfraudeurs en stromannen eruit te filteren. Zo’n verband is geen bewijs – iemand kan echt twaalf auto’s als een uit de hand gelopen hobby in zijn achtertuin hebben staan – maar het kan wel dienen als startpunt voor een opsporingsambtenaar van de Fiod of Belastingdienst.

Op de vraag of zoiets al bestaat verwijst De Konink naar het platform Transparant Nederland, een databank waaruit de relaties en verbindingen tussen politici en mensen en organisaties in het bedrijfsleven, maatschappelijke organisaties, overheid, universiteiten en denktanks gedestilleerd worden. Dat wordt ondersteund door het Stimuleringsfonds voor de Journalistiek. De Konink: “Ik controleer liever de overheid dan dat ik de overheid help om mij te controleren.”

 

In een open datalab kunnen informatici algoritmen ontwikkelen om uitkeringsfraudeurs en stromannen eruit te filteren. (Foto: Sam Rentmeester)

In een open datalab kunnen informatici algoritmen ontwikkelen om uitkeringsfraudeurs en stromannen eruit te filteren. (Foto: Sam Rentmeester)

 

Blijf op de hoogte van het onderzoek

Ontvang de Delft Integraal nieuwsbrief 4 keer per jaar