Onderdeel van de route Waardecreatie door verantwoorde toegang en gebruik van big data
Hoofdaanvrager: Prof. dr. ir. R.L. (Inald) Lagendijk, Technische Universiteit Delft

Big Data speelt een grote rol in onze maatschappij, in het bedrijfsleven en in de wetenschap. Steeds meer keuzen en besluiten worden gebaseerd op de analyse van verzamelde gegevens. Het is echter vaak niet duidelijk wie kan en mag beschikken over de gegevens, hoe analysemethoden precies werken en hoe nauwkeurig ze zijn, en hoe Big Data op een manier kan worden ingezet die juridisch en ethisch verantwoord en maatschappelijk acceptabel is. Het themaprogramma VWData geeft een impuls aan wetenschappelijk onderzoek en aan technische en maatschappelijke oplossingen voor het verantwoord omgaan met Big Data.

Aanpak

Elk werkpakket concentreert zich op een specifiek aspect van de uitdaging “verantwoorde toegang tot en gebruik van big data”. De termen FACT en FAIR data science staan als overkoepelende begrippen centraal. FACT verwijst naar verantwoorde data science wat betreft Fairness, Accuracy, Confidentially en Transparency. FAIR verwijst naar de eigenschappen die onderzoeksdata zouden moeten hebben om optimaal gebruikt te kunnen worden: Findable, Accessible, Interoperable, Re-usable.

Binnen elk project richten de onderzoeksactiviteiten zich steeds op een specifiek maatschappelijk, economisch of wetenschappelijk use case. Het programma is zo samengesteld dat waardecreatie in drie domeinen plaatsvindt: informatiediensten/media, gezondheidszorg en veiligheid. Zo wordt tegelijkertijd een impuls gegeven aan het kennis- en innovatiesysteem op het gebied van data science in de breedte én van geselecteerde domeinen. Gedurende twee jaar worden ook verschillende symposia georganiseerd voor wetenschappers, bedrijfsleven en politiek. Ook zullen er publicaties verschijnen met de belangrijkste inzichten en aanbevelingen voor de toekomst. De overkoepelende activiteiten worden gecoördineerd door het Netherlands eScience Center, TNO en NWO.


Subprojecten

De verschillende subprojecten staan hieronder kort beschreven.

(1) FairNews: Nieuwsvoorziening in een Big Data Data tijdperk
Contactpersoon: prof. dr. C.H. (Claes) de Vreese (UvA)

Gelijke toegang tot nieuws is een randvoorwaarde voor een goed functionerende democratie. Door data analytics en gepersonaliseerde aanbevelingen is het mogelijk nieuws vóór te sorteren op basis van individuele gebruikersprofielen en ‘social sorting’. In dit project wordt onderzocht in hoeverre algoritmen kunnen en mogen gaan in het filteren van informatie met het oog op “fairness”. ls toegang tot informatie niet gelijk, dan kan dit grote gevolgen hebben voor de vrijheid van meningsuiting en non-discriminatie. Dit onderzoek draagt ook bij aan het kunnen uitleggen waarom algoritmen bepaald gedrag vertonen, i.c. transparantie. De resultaten leiden tot een fair-recommender systeem dat vooringenomenheid van nieuwsaanbevelingen zichtbaar maakt. In dit project werken informatici, communicatie- en informatierechtswetenschappers van de UvA en TU Delft samen met de Volkskrant aan demonstraties en tests met nieuwsgebruikers om het debat over eerlijke nieuwsvoorziening te stimuleren. De bevindingen van dit project dragen ook in hoge mate bij aan het programmabrede begrip van wat we bedoelen met verantwoorde toegang toe en gebruik van big data.

(2) Capturing Bias: Diversity-aware Computation for Accurate Big Media Data Analysis
Contactpersoon: Prof. dr. L.M. (Lora) Aroyo (VU)

Dit project richt zich op het bereiken van betrouwbare en uitlegbare big data analyse van mediabestanden. In het bijzonder zullen er metrieken worden ontwikkeld die aangeven hoe nauwkeurig de resultaten van de big data analyse zijn. Hierbij wordt gebruik gemaakt van onder andere crowd-sourcing van de mening van burgers. Waar in het eerdere project de nadruk ligt op het bereiken van “fairness”, ligt hier de nadruk op het kwantificeren van de mate van “accuracy”, relatie tot andere waarden zoals diversiteit en het vervolgens visualiseren van de resulterende complexiteit van besluitvorming in de media analyse. In het project werken informatici, mediawetenschappers en bestuurskundigen van de VU, Universiteit Utrecht, Leiden Universiteit en TU Delft samen met het Instituut Beeld&Geluid aan use-cases en technische demonstraties. Hiermee wil het project niet alleen wetenschappelijke vooruitgang boeken, maar ook handelingsperspectief bieden voor nieuwe vormen van presentatie en communicatie over de resultaten van big data analysetechnieken.

(3) Enabling of privacy-friendly analysis of network data and beyond
Contactpersoon: J.E.J. (Joeri) de Ruiter (RU)

Hedendaagse big data analyse kenmerkt zich niet alleen door de vereiste enorme rekenkracht, maar ook de breedbandige netwerkverbindingen tussen computer en “de cloud”. Dit netwerkverkeer bevat veel privacy gevoelige informatie, van de gebruikte termen in zoekmachines tot persoonlijke medische informatie. Recent onderzoek naar pseudonimisering heeft grote vooruitgang laten zien dank zij de aanpak van Polymorfe Encryptie en Pseudonimisatie (PEP). Dankzij PEP kan data bij een lek niet zomaar gecombineerd worden, terwijl geoorloofde deling van data wel mogelijk is. In dit project werken informatici van Radboud Universiteit en Universiteit van Twente samen met SURF om deze techniek verder te ontwikkelen zodat grote hoeveelheden data op hoge snelheid gepseudonimiseerd, gedeeld, en geanalyseerd kunnen worden op privacy-vriendelijke wijze. De resultaten van dit project zijn technisch van aard en kunnen gezien worden als bouwsteen voor project bouwsteen voor de laatste twee projecten (zie verderop), terwijl de andere beschreven projecten juist ethische, juridische en maatschappelijke input kunnen leveren voor dit project in het bereiken van de gewenste mate van privacy en pseudonimisering.

(4) Responsible Collection and Analysis of Personal Data for Justice and Security
Contactpersoon: dr. M. (Marc) Steen (TNO)

Juist in het veiligheidsdomein is steeds vaker de vraag in hoeverre veiligheidsdiensten transparant en aansprakelijk moeten zijn in het omgaan met persoonlijk big data, zoals zoektermen en openbare surveillance. Dit leidt tot verschillende dilemma’s rond veiligheid, data protection wetgeving, eerlijkheid en rechtvaardigheid. Het is noodzakelijk tijdig deze dilemma’s te doordenken, en voor VWData om een beeld hierover te vormen. Dit project draagt daarom in hoge mate bij aan de programmabrede ontwikkeling van verantwoord omgaan met big data. Onderzoekers van TNO, Politieacademie en TU Delft ontwikkelen toekomstige scenario’s en gaan middels demonstraties de dialoog aan met belanghebbenden in de wetenschap, overheid en industrie.

(5) Data-gedreven diensteninnovatie: compliancy en transparency ‘by design’
Contactpersoon: Dr. ir. M (Marlies) van Steenbergen (HU)

Om FAIR en FACT te bereiken, moeten leveranciers van data-gedreven diensten voldoen aan de regels over databescherming, en in het bijzonder aan concrete eisen van transparantie van algoritmische besluitvorming in de General Data Protection Regulation (GDPR). Dit project volgt de value-sensitive design aanpak als ontwikkelingsmethode voor data-gedreven diensteninnovatie. Ten opzichte van de andere – meer wetenschappelijk – projecten in VWData, richt dit project zich op de concrete operationalisatie van de wettelijke eisen in één of meer concrete data-gedreven diensten die als use-cases kunnen dienen in de andere projecten. Daarmee dragen de onderzoekers van de HBO’s Fontys, Utrecht en Zuyd en de Open Universiteit bij aan het concreet maken van onderzoeksresultaten en levert dit nieuwe verbindingen met universiteiten en andere kennisinstellingen op.

(6) Distributed FAIR information systems to enable federated learning and reasoning
Contactpersoon: prof. dr. ir. C.T.A.M. (Cees) de Laat (UvA)

Databronnen van verschillende eigenaren nemen aanzienlijk in waarde toe wanneer ze gecombineerd kunnen worden. Echter, veelal is de data te omvangrijk of te kwetsbaar om naar buiten gebracht te kunnen worden. Om die reden nemen federatieve oplossingen voor big data analyse sterk in belangstelling toe. In dit project werken informatici van UvA, VU, Universiteit Leiden en TNO samen met een reeks toepassers (zoals levenswetenschappers in GO-FAIR en ASTRON) bij het ontwikkelen van de architectuur voor een netwerk van FAIR data-hubs en services. De resulterende architectuur biedt leer- en redeneerprocessen met volledige transparantie, en anticipeert op heterogene data met verschillende betrouwbaarheden. Het project levert servicedemonstraties gebaseerd op een federatie van ten minste drie verschillende data-hubs. Dit project steunt op kennis over privacy, fairness en accuracy uit de andere projecten.

(7) Analyzing partitioned FAIR health data responsibly
Contactpersoon: Prof. dr. M (Michel) Dumontier (UM)

Waar in het vorige project de nadruk op de architectuur van federatieve oplossingen ligt, concentreert dit project zich op het federatieve learning framework, en op de ethische, juridische en maatschappelijke aspecten daarvan. Het project richt zich op het federatief gebruik van alle data in de “Maastricht study” (10,000 burgers) en gerelateerde CBS-data om te komen tot begrip van de relaties tussen diabetes, lifestyle, en socio-economische factoren. Het project, dat uitgevoerd wordt door informatici, medici en ethici van de Universiteit Maastricht, sluit aan bij het nationale “Personal Health Train” initiatief. Dankzij de synergie op het gebied van algoritmische, juridische en ethische vraagstukken, biedt dit de overige projecten de kans op nieuwe verbindingen in de medische sector. Tegelijkertijd kan zal in dit project juist worden geleerd van use-cases in andere domeinen, zoals veiligheid en media- en informatiediensten.

 

Consortiumleden

Het consortium bestaat o.a. uit: Erasmus Universiteit Rotterdam, Leids Universitair Medisch Centrum, Open Universiteit, Radboud Universiteit, Technische Universiteit Delft, Technische Universiteit Eindhoven, UMC Maastricht, Universiteit Leiden, Universiteit Maastricht, Universiteit Twente, Universiteit Utrecht, Universiteit van Amsterdam, Vrije Universiteit Amsterdam, Wageningen Universiteit en Researchcentrum, Instituut voor Informatierecht (IViR), Data Science Center Eindhoven (DSC/e), Netherlands eScience Center, SURF, TNO, Fontys Hogeschool, Hogeschool Utrecht, Hogeschool van Amsterdam, Zuyd Hogeschool, Ministerie van Justitie en Veiligheid.

 

Terug naar route

Boegbeeld

  • Inald Lagendijk (TU Delft en topteam ICT)


Contact
Wilco Hazeleger (Netherlands eScience Center)
wilco.hazeleger@esciencecenter.nl