Eind jaren tachtig deed ik onderzoek naar de toepassingen van kunstmatige intelligentie in de scheikunde. Op basis van het werk van o.a. Rumelhart, Hinton en Kohonen werkten we aan de Katholieke Universiteit Nijmegen (nu Radboud Universiteit) aan zelflerende algoritmen voor het oplossen van complexe niet-lineaire problemen. Het was de tijd van mainframe-computers waarvoor we de software zelf schreven en waarbij het automatisch leren van een eenvoudig tekstherkenningsprobleem weken tot maanden kon duren. Een van de conclusies in mijn afstudeerverslag destijds was dat het ooit mogelijk zou moeten zijn om op basis van grote hoeveelheden data, patronen te herkennen waarmee we sneller, slimmer en op maat geneesmiddelen kunnen ontwikkelen.
Vijfentwintig jaar later raadt Amazon ons boeken aan, raadt LinkedIn ons banen aan en geeft TomTom ons advies om een andere route te nemen bij een file. Met dezelfde technologie berekent Google hoe virussen zich verspreiden, Twitter wie de verkiezingen gaat winnen en Shell waar we het best naar olie kunnen boren. Aan de basis van deze ontwikkeling staan de explosieve groei aan digitale gegevens en de steeds krachtigere algoritmes waarmee we de gegevens onderzoeken. Het is inmiddels mogelijk om patronen en verbanden te ontdekken die het menselijk denkvermogen ver te boven gaan. In de toekomst – sneller dan we denken – zullen we op deze manier ook berekenen welke behandeling een patiënt moet krijgen, waar een inbraak gaat plaatsvinden en wie in aanmerking moet komen voor een promotie. We staan aan het begin van een big data-revolutie. En volgens experts gaat dit een grotere impact hebben op onze levens dan het internet!
Tijd om eens in de boeken te duiken van onderzoekers en auteurs als Viktor Mayer-Schönberger, Kenneth Cukier, Steve Lohr en Alex Pentland.
De Big Data Revolutie
We beginnen met het boek ‘De big data revolutie‘ (2013) van Viktor Mayer-Schönberger en Kenneth Cukier waar we al eerder over schreven op dit blog.
Viktor Mayer-Schönberger is hoogleraar internet governance aan de Universiteit van Oxford. Hij schreef meer dan 100 artikelen en verschillende boeken, waaronder ‘Delete: The Virtue of Forgetting in the Digital Age.’ Kenneth Neil Cukier was jarenlang journalist voor onder andere The Washington Post, Wall Street Journal en The New York Times, waarvoor hij schreef over technologie, innovatie en internet governance. Vanaf 2012 is hij werkzaam als dataredacteur bij The Economist.
Mayer-Schönberger en Cukier beschrijven aan de hand van tal van voorbeelden wat zij onder big data verstaan en vooral wat de mogelijke impact van big data is op mens en samenleving. Yolanda van Heese geeft op managementboek.nl een korte samenvatting van deze impact die volgens de auteurs drieledig is:
- ‘Van klein naar groot’: Het is niet langer nodig om steekproeven te nemen. Daar waar dat in het verleden nodig was om kosten en de tijd van gegevensverzameling te beperken zijn vandaag de dag vrijwel alle gegevens beschikbaar. N=alles.
- ‘Van exact naar ongeveer’: Door de combinatie van verschillende gegevensbronnen en systemen neemt het aantal meetfouten toe. Dit hoeft volgens de auteurs geen probleem op te leveren – juist omdat de hoeveelheid gegevens zo enorm groot is.
- ‘Van waarom naar wat’: Big data laat alleen zien welke correlatie er is tussen gegevens en zegt niets over oorzaak en gevolg.
Wiskundige modellen doen op basis van een enorme hoeveelheid gegevens voorspellingen en leren vervolgens van de beslissingen die gebruikers nemen – zo doen ze de volgende keer nauwkeurigere voorspellingen. Zo leidt het gebruik van big data tot nieuwe concurrentie en verdienmodellen. Walmart weet beter waar hij specifieke producten moet plaatsen in de winkel, Target weet welke kortingsbonnen klanten zullen gebruiken en verhoogt zo de omzet, UPS verlaagt de onderhoudskosten van zijn wagenpark door slimme signaleringen. En niet alleen bedrijven, ook de overheid kan big data inzetten. Denk maar aan de brandweer van Amsterdam – zij hebben risicogevoelige panden in kaart gebracht en een preventief bezoek gebracht.
Drie soorten bedrijfsmatige activiteiten ontstaan rondom big data:
- Het beheer en eigendom van de gegevens,
- de expertise om gegevens te combineren en benutten met wiskundige modellen en
- de creatieve kant: bedenken op welke manier je big data voor innovatie kunt inzetten.
Helaas brengt het gebruik van omvangrijke gegevensbestanden ook risico’s met zich mee. Mensen verstrekken immers vaak nietsvermoedend gegevens aan instellingen, die de gegevens vervolgens inzetten voor commerciële doeleinden. Daarbij wordt de privacy nog wel eens uit het oog verloren. Ook kan big data leiden tot een zogenaamde ‘gegevensdictatuur’. De auteurs pleiten daarom voor nieuwe regels en functies binnen organisaties (te vergelijken met een interne controller) die oneigenlijk gebruik moeten voorkomen.
Wie geen moeite heeft met de Duitse taal, kan ik de presentatie ‘Freiheit und Vorhersage: Über die ethischen Grenzen von Big Data‘ van Viktor Mayer-Schönberger aanbevelen. Vooral zijn slotbetoog over hoe in de toekomst om te gaan met big data spreekt voor zich:
To be continued
Sociale Big Data
Dit is Big Data
Boeken:
- De big data-revolutie, Viktor Mayer-Schönberger en Kenneth Cukier (2013)
- Sociale Big Data, Alex Pentland (2014)
- Dit is Big Data, Steve Lohr (2015)
Films:
- Minority Report (2002)
- Ex Machina (2015)
Cases:
6 reacties
Via Twitter de suggestie van Sander Klous om op vrijdag 26 juni verder te praten over dit onderwerp in Pakhuis de Zwijger: Data Driven Society.
Ik lees momenteel het boek van Pentland, benieuwd wat je er van vindt. Als ik nog een video mag aanraden, vorige week verscheen op YouTube een presentatie van Juan Miguel Lavista, data scientist bij Microsoft. Ik vind het erg vermakelijk om naar hem te luisteren, hij vermijdt moeilijk taalgebruik en maakt het begrip big data daardoor erg toegankelijk…
Dank voor de link naar Juan Miguel Lavista!
Ik ben vanmiddag ook begonnen in Alex Pentland’s Social Big Data. Zal laten weten wat ik er van vind!
Mooie quote van Dan Ariely in de video: ‘Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.’
Mooie overzicht, o.a. Pentland gelezen , erg de moeite waard wat mij betreft. In aansluiting op lezen over Big Data vond ik een kort maar scherpe essay over Artificial Intelligence ook de moeite waard, “Smarter than us: the rise of machine intelligence
AI voor beginners in feite, logisch vervolg stap op de Big Data ontwikkeling wat mij betreft. Inspireerde mij om ook Nick Bostrom te gaan lezen, maar daar kwam ik niet helemaal doorheen.
Ben nu met Pentland bezig, moet nog even inkomen. Vond Viktor Mayer-Schönberger en Kenneth Cukier wat toegankelijker geschreven. Dank voor de suggestie voor het boek van Stuart Armstrong, gaat op mijn leeslijst!