Data verkennen:

het ritme en de melodie vastleggen

Belangrijk aspecten van een muziekstuk zijn het ritme en de melodie. In het ritme zit een specifieke herhaling door middel van accenten, die een zeker patroon of regelmaat vertonen: het komt steeds herkenbaar terug. Samen met de melodie geeft het ritme een muziekstuk vorm, het wordt hierdoor herkenbaar en uniek, met een duidelijk begin en einde.

Werken met data wordt snel geassocieerd met IT en het uitvoeren van technische activiteiten en handelingen, terwijl hier veel meer bij komt kijken. Het ‘datawiel’ toont uiteenlopende aspecten die de techniek niet direct raken, maar die minstens zo belangrijk zijn. De inzet van data is geen doel op zich, maar kan een middel zijn om meer inzicht te krijgen in een vraagstuk of om het integraal te kunnen benaderen. Om dit te bereiken is het goed om een stevige basis te leggen als het gaat om data. Elke keer kun je terugkerende vragen beantwoorden over de inzet ervan. Betrek hierbij collega’s uit diverse beleidsvelden om met elkaar in gesprek te gaan. Door deze diversiteit wordt de (data) vraag vanuit meerdere invalshoeken besproken en geanalyseerd, wat bijdraagt aan het verscherpen van de vraag. Vertrouw data niet blindelings maar blijf vooral kritisch, data is geen objectief gegeven. De datavraag Wat wordt daadwerkelijk gemeten en hoe worden deze metingen gedaan? Maar ook, wat wordt niet gemeten? Dit en meerdere aspecten, zoals schonen van de data, hebben invloed op de kwaliteit van de data. Er moet dus op een verantwoordelijke manier met data worden omgegaan. Data die gebruikt worden bij vraagstukken moeten altijd van hoge kwaliteit en betrouwbaar zijn. Keuzes en beslissingen die gemaakt worden rondom het gebruik van data moeten te verantwoorden en uit te leggen zijn. Dit geldt ook bij het gebruik van algoritmen om de data te analyseren. In het belang van informatiebeveiliging en de AVG is het verstandig hier voldoende aandacht aan te besteden. De deskundigen op dit gebied binnen de provincie kunnen hierbij advies geven. Een ander aandachtspunt is het eigenaarschap van de data. Het zou namelijk kunnen dat er rechten op de data rusten. Dit kan gevolgen hebben op wat met de data gedaan mag worden en of de data met derden te delen is. Denk tenslotte na over wat het doel is van de datavraag en wie de doelgroep is. De manier van het delen van de resultaten moeten bij deze groep aansluiten om de uitkomsten over te brengen.

© Anne Schoenmakers, provincie Noord-Brabant

Datavraag

Zoals de afbeelding al weergeeft, staat de datavraag centraal. Het draait uiteindelijk om de vraag waarbij data een hulpmiddel kan zijn om de vraag te beantwoorden.

De dialoog Ga het gesprek aan met betrokkenen. Dit kan bijvoorbeeld de eigenaar van de data zijn, of een data-analist, maar ook een collega vanuit een ander beleidsveld of een ander discipline.

Samenwerken Belangrijk bij datavragen is het samenwerken met collega’s vanuit andere beleidsvelden en met andere achtergronden. Hierdoor wordt een datavraag vanuit meerdere invalshoeken geanalyseerd waardoor de vraag scherper wordt. Hierover lees je meer bij het verkennen van je netwerk.

AVG en Informatiebeveiliging Een onderdeel dat zeker niet vergeten mag worden is de privacywet AVG en informatiebeveiliging. Het uitgangspunt hierbij is het op een zorgvuldige en nauwkeurige manier omgaan met data. Controleer of data (bijzondere) persoonsgegevens bevatten. Wanneer persoonsgegevens verwerkt worden, moet dit altijd vastgelegd worden in het verwerkingsregister van de provincie. Zorg ook dat deze data op een veilige, afgeschermde plek staat waar alleen de geautoriseerde personen bij kunnen. Bij twijfel of vragen kun je het beste contact opnemen met de Functionaris Gegevensbescherming of een privacy officer. Archivering en verantwoordelijk gebruik De burger verlangt transparantie van de overheid. De Archiefwet stelt eisen aan de archieven van de overheid, waardoor reconstructie van het handelen mogelijk wordt gemaakt. Het duurzaam bewaren van de algoritmische toepassingen van data valt onder de werking van de Archiefwet. Elke algoritmische toepassing bestaat uit vier componenten, namelijk trainingsdata, output, logica en documentatie. Bij het ontwerpen van een algoritme dient per component bepaald te worden hoe lang deze duurzaam bewaard dient te blijven, voor wie deze toegankelijk kan zijn (eigenlijk andersom: voor wie deze expliciet NIET toegankelijk mag zijn) en de vorm waarin het algoritme wordt vastgelegd. Visualisatie Denk na over hoe het eindproduct eruit moet gaan zien en zorg dat dit aansluit bij het doel en de doelgroep. Meer hierover lees in het volgende hoofdstuk. Eigenaar Ga na wie de eigenaar is/eigenaren zijn van de databronnen die gebruikt worden om de datavraag te beantwoorden. Het kan namelijk zijn dat er rechten rusten op de data of dat er bepaalde licenties op de databronnen zitten. Dit kan gevolgen hebben wat er met de data gedaan mag worden. Meestal gaat het om auteursrechten (Auteurswet) of databankrechten (Databankenwet). Vanuit de overheid is hier een snelle beslisboom voor gemaakt. Kwaliteit De kwaliteit van de data die gebruikt wordt moet van hoge kwaliteit zijn om er betrouwbare resultaten mee te behalen. Neem daarom ook een moment om de data te controleren op een aantal aspecten. Zo kan het nodig zijn om de data te laten opschonen wanneer er fouten in de datasets voorkomen. Ga er niet vanuit dat data objectief is, juist ook in data kunnen vooroordelen zitten. Bijvoorbeeld, ook als er iets niet wordt gemeten, heeft dat invloed op de uitkomsten. Open of gesloten Wanneer de resultaten slechts voor een beperkte groep beschikbaar gesteld wordt, is het gesloten data. Dit kan bijvoorbeeld zijn omdat er persoonsgegevens gebruikt zijn of omdat het gevoelige informatie betreft. Wanneer de resultaten voor iedereen beschikbaar worden gesteld, zijn het open data. Het uitgangspunt van de provincie is “Open, tenzij…”. Dat betekent dat de data alleen niet toegankelijk is als er een uitzonderingsregel geldt (zie voor meer informatie de WOB). Het technische deel Om een datavraag te kunnen beantwoorden, zal er ook technisch het een en ander geregeld moeten worden. Hier zijn specialisten voor die bijvoorbeeld de databronnen aan elkaar kunnen koppelen. Betrek bij deze fase een dataspecialist.