platform voor kennis, nieuws en debat
platform voor kennis, nieuws en debat
Artikel

Big Data: de realiteit en de uitdagingen

Big Data: de realiteit en de uitdagingen

Data

De echte disruptie moet nog komen volgens hoogleraar Sander Klous

16 jun 2016 - Een apparaatje dat ons rijgedrag monitort (wat vervolgens een premiekorting kan opleveren op onze autoverzekering), datagegevens die helpen bij het voorspellen of couveusebaby’s mogelijk een infectie onder de leden hebben en een digitale munt die wel eens voor hele grote veranderingen kan gaan zorgen binnen het financiële stelsel. Nieuwe technologie in combinatie met Big Data spelen een steeds belangrijkere rol in de samenleving. Alle sectoren hebben of krijgen er mee te maken. “De echte disruptie moet nog komen”, zegt Sander Klous, hoogleraar Big Data Ecosystems aan de Universiteit van Amsterdam, tijdens een lezing op de Provada. Een lezing doorspekt met aanprekende voorbeelden.

Sander Klous is auteur van Wij zijn Big Data, de toekomst van de informatiesamenleving. De impact van nieuwe technologie is enorm. Het raakt alle sectoren, houdt de auteur zijn toehoorders voor. Het begon met de muzieksector waar muziek downloaden steeds populairder werd. Sander Klous noemt Pirate Bay, iTunes en Spotify. “Toen dachten we nog dat het bij één sector zou blijven”, als het gaat om nieuwe technologie en data. Maar niets is minder waar: de reisbranche volgde met het Nederlandse booking.com, binnen de taxisector kwam het online boekingsplatform Uber van de grond en een andere variant is airbnb.com, de online marktplaats voor de verhuur van privé-accommodatie. En dan was er ook nog   Bitcoin en van meer recente datum Ethereum: digitale munten waarmee men zonder tussenkomst van een derde partij een transactie kan uitvoeren. Sander Klous vertelt dat het ook mogelijk is om met Ethereum digitaal contracten af te sluiten. “Dit gaat voor een enorme revolutie zorgen, zowel aan de achterkant als aan de voorkant van financiële instellingen.”

Andere manier omgaan met data
Feit is dat de financiële sector concurrentie krijgt uit een heel andere hoek dan het gewend is. In zijn boek over Big Data schrijft Sander Klous: “De traditionele partijen in de financiële sector doen er goed aan om alvast te bedenken wat hun toegevoegde waarde kan zijn als dit soort nieuwe concepten doorbreken.”
De hoogleraar komt tijdens de lezing met nog een voorbeeld waarop nieuwe technologie in combinatie met Big Data een rol kan spelen voor de financiële sector én de consument. Stel iemand doet een creditcardbetaling waarbij het dankzij nieuwe technologie mogelijk is om de betaalpas te koppelen aan de mobiel van de creditcardhouder. Zodra blijkt dat de locatie van de creditcard en de mobiel van een bepaalde klant niet overeenkomen tijdens een betaling, ontvangt die persoon een sms’je. Dit om te voorkomen dat er fraude kan plaatsvinden.

Goedkopere polis

Ook verzekeraars maken (uiteraard) gebruik van Big Data. Achmea geeft klanten de mogelijkheid om  een kastje in de auto van klanten te laten installeren. Dit meetkastje geeft informatie over het rijgedrag van die desbetreffende klant: snelheid, maar ook andere dingen die met rijgedrag te maken hebben. Sander Klous vraagt de toehoorders welke groep (klanten) naar hun idee de grootste interesse toonde om dit apparaatje te laten installeren. Dit met de hoop korting op de verzekeringspremie te scoren…
Vooral jongeren, meldt Sander Klous. Zij ontvangen nog geen of weinig no claim-korting omdat ze nog maar een korte rijhistorie hebben. Dankzij het meetkastje kunnen ze aantonen dat ze veilig rijden. Volgens Sander Klous kan de verzekeraar jonge klanten op deze manier ‘binnen houden’, dus voorkomen dat ze naar de concurrent gaan. Deze klant betaalt een lagere premie en de maatschappij profiteert omdat het rijgedrag veiliger wordt. 

Armin van Buuren
Data – de beschikking daarover – kan ons profijt opleveren: op individueel niveau en op macro niveau. Dat leert ons het voorbeeld van Achmea. Sander Klous komt met nog een  voorbeeld. Op Koningsdag waren veel mensen in Amsterdam op de been. Er werd (via een meting van mobiele telefoon antennes) gekeken hoe die mensenmassa zich door de stad bewoog en hoeveel mensen zich richting het Centraal Station verplaatsen. “Als dan blijkt dat meer dan 30.000 mensen zich richting het station begeven, dan is het handig om Armin van Buuren nog een extra nummer te laten draaien.”

Met behulp van data kan het gedrag van mensen worden bijgestuurd. Dreigt Amsterdam CS te snel vol te lopen, dan kan een dj (dankzij de informatie die hij krijgt toegespeeld) daarop inspelen en het publiek trakteren op een extra nummer. Er zijn natuurlijk nog veel meer mogelijkheden denkbaar waarbij data – de beschikbaarheid daarover – kan bijdragen aan een oplossing. Belangrijk punt is dat data relevant is én betrouwbaar. We worden immers bedolven onder data.  

Volgens Sander Klous is het belangrijk om andere bronnen toe te voegen als we aan de slag gaan met data om vervolgens een betere inschatting te kunnen maken over de betrouwbaarheid van de data. In de periode dat de hoogleraar bij CERN in Geneve meedeed aan onderzoek naar elementaire deeltjes – experimenten met de deeltjesversneller – bleek bijvoorbeeld ook de stand van de maan relevant. De stand van de maan beïnvloedde de waterstand en dit had vervolgens weer invloed op de energieën van de ronddraaiende deeltjes in de deeltjesversneller.

Correlatie en causualiteit
Het is niet altijd wat het lijkt. Dat is wel duidelijk. In zijn boek schrijft Sander Klous dat het van het grootste belang is dat we het verschil tussen correlatie en causaliteit niet uit het oog verliezen.
Het kan overigens ook zo goed zijn dat er een verband bestaat, zonder dat we weten waarom.
Tijdens de lezing op de Provada komt de hoogleraar met een wat hij noemt beroemd voorbeeld: couveusebaby’s uit Toronto die gevoelig bleken voor infecties. Uit data bleek (gek genoeg) dat de te vroeg geboren baby’s die een infectie onder de leden hadden, 24 uur voordat die infectie zich openbaarde regelmatig stabielere levensfuncties lieten zien in plaats van instabieler. Het ging dan om dingen als een regelmatige ademhaling en een regelmatige hartslag. “Totaal het tegenovergestelde van wat je verwacht.”
Zonder te begrijpen hoe dat komt, konden artsen dankzij data besluiten deze baby’s al te gaan behandelen. “De correlatie was zo sterk. Dat konden ze niet aan zich voorbij laten gaan. Het waarom komt soms pas als je het hebt aangetoond.”

Maar er is ook een andere kant aan deze medaille. In zijn boek schrijft Sander Klous dat het een reëel gevaar is in een van data doordrenkte maatschappij dat we conclusies gaan verbinden aan correlaties.  “We weten dat het mogelijk is om met grote hoeveelheden data uit verschillende bronnen een paar jaar van tevoren al te voorspellen dat iemand in financiële problemen zal komen. In zo’n geval is het echter bepaald nog geen uitgemaakte zaak dat we die data dan ook op die manier moeten gebruiken.”


2016.11.03_banner big data congres

Donderdag 3 november, TU Delft Unit Culture

De impact van technologie op gebiedsontwikkeling wordt steeds concreter. Het wordt steeds makkelijker om data te verzamelen, te gebruiken en te delen. Uitvindingen op de gebieden van energie, van mobiliteit en van communicatie veranderen de manier waarop de stad wordt beleefd en gebruikt.

Geïnteresseerd? Bekijk hier het gehele programma en informatie om u op te geven.
Blijf op de hoogte