Inspiratie

DataNatives – Inspirerend congres over Big Data

19 en 20 november 2015 was ik in Berlijn bij DataNatives – A Conference for the Data Driven Generation. Een inspirerend congres over met name de technische kant van Big Data. Twee dagen met meer dan 40 sprekers, vier panelgesprekken en meer dan 450 deelnemers. We waren het er snel over eens dat ‘generatie’ niet gaat over leeftijd maar over mentaliteit. Mensen van allerlei leeftijden vonden elkaar in gesprekken over techniek en innovatie.

DataNatives

De drie thema’s van het congres: Big Data, IoT en FinTech. Big Data staat voor de overvloed aan gegevens die we in de 21e eeuw voor onze kiezen krijgen. IoT is Internet of Things: steeds meer machines en apparaten hebben een internetverbinding waardoor ze op afstand bestuurbaar zijn en hun gegevens afstaan zijn voor analyse. FinTech staat voor Financial technology, het bankieren van de toekomst met behulp van nieuwe technologie. 

Mijn interesse ging vooral uit naar de eerste twee, hoewel een kijkje in de keuken van het moderne bankwezen zeker leuk was. Big Data en IoT overlappen, zeker voor de niet-specialist, dus voor het gemak duid ik ze in de rest van dit artikel samen aan als Big Data. Wees niet bang voor gedetailleerde uitleg met een hoog nerdgehalte. Het gaat me er nu vooral om, weetjes met je te delen, en hopelijk begrijp je na lezing van dit verhaal een beetje hoe Big de wereld van Big Data is en waarom ik die zo vreselijk interessant vind.

Weetjes over Big Data

Allereerst de term Big Data – is die hype niet zo’n beetje voorbij en slaat die term wel ergens op?

  • Elke tijd heeft z’n Big Data – weet je nog dat een USB stick van 256 MB groot was? Dus wat we nu Big noemen is binnen een paar jaar XXS.
  • Maar … 80% van alle data op de wereld is het afgelopen jaar geboren, heb ik me laten vertellen. Dat is toch best wel een flinke groei.

Big Data

Wat is er dan wel zo Big aan Big Data? Vier Engelse termen met een V die vaak worden gebruikt om snel uit te leggen wat Big Data is:

  • Volume – er is véél van, en elke dag komen er miljoenen gigabytes bij
  • Variety – er is van alles: databases, spreadsheets en tweets, sensorgegevens en klikgedrag
  • Velocity – gegevens zijn live beschikbaar en je moet direct reageren
  • Veracity – onbetrouwbaarheid ligt op de loer doordat je nooit alles kunt controleren

Op internet zijn er geweldige infographics over te vinden, zoals deze.

Big Data = Big Brother?

Je laat een spoor van gegevens achter via je mobiel, bankpas en OV-chipkaart, en door het bezoeken van websites. Je staat in duizenden databanken, vanaf het moment dat je vader je inschrijft bij de burgerlijke stand. Die databanken worden snel en vaak aan elkaar gekoppeld. Je dacht dat de belastingdienst je niet controleerde omdat je nooit iets van hen hoort? Word wakker: de controleurs staan niet meer op de stoep maar houden je digitaal in de gaten.

Ok, er zijn best twijfelachtige voorbeelden van gegevensgebruik:

  • Over dynamic pricing (als er meer vraag is stijgt de prijs) wordt verschillend gedacht: verkopers vinden het een mooie manier om een extraatje te verdienen, klanten willen hetzelfde betalen als een ander;
  • Online advertenties op maat, gebaseerd op je surfgedrag: persoonlijk vind ik ze irritant, en ik vraag me af wat de zin ervan is me iets te tonen wat ik al heb gekocht, maar uit onderzoek blijkt dat het de adverteerders veel oplevert, en een meerderheid van de klanten vindt het handig;
  • Aanbiedingen op je mobiel als je een winkel binnenloopt: je voelt je betrapt, of je vindt het juist een meevallertje;
  • De koelkast die zelf nieuwe voorraad bestelt zorgt ervoor dat je altijd hetzelfde eet;
  • Als je de prijs van hetzelfde vliegticket meerdere keren opzoekt krijg je op sommige sites een steeds hogere prijs te zien;
  • Door koppeling tussen twee apps kan het zomaar voorkomen dat gegevens die je in de ene app als vertrouwelijk hebt aangemerkt via de andere op straat liggen;
  • Identiteitsdiefstal kan onschuldige slachtoffers jaren achtervolgen.

Citaten van DataNatives

Maar wist je dat het rijtje hieronder ook met Big Data te maken heeft, alleen kan werken door het verzamelen van heel veel gegevens uit verschillende bronnen?

  • Je zoekt een goedkoop vliegticket en laat je een alert sturen als de reis van je keuze onder een bepaald bedrag komt, of de prijs juist begint te stijgen;
  • Je reisadvies wordt continu aangepast aan de actuele situatie op het spoor;
  • De tekst die je typt op je smartphone wordt automatisch aangevuld – en de suggesties kloppen steeds beter;
  • De voorraad van een winkel wordt automatisch op peil gehouden zodat je geen lege schappen ziet en er minder wordt weggegooid;
  • Filemeldingen worden steeds preciezer door gebruik van gegevens over mobiele telefoons op de weg;
  • Robotauto’s kunnen alleen functioneren met gebruikmaking van vele gigabytes aan ervaringsgegevens;
  • Slimme klimaatbeheersingsinstallaties ‘leren’ van de gebruikers van het pand door hun gegevens te vergelijken met andere gebruikers wereldwijd;
  • Creditcardmaatschappijen kunnen steeds sneller fraude opsporen (en banken witwasoperaties) door slimme software die meteen een seintje geeft als er iets afwijkends gebeurt – om iets als afwijking te bestempelen heb je heel veel vergelijkingsmateriaal nodig;
  • Een ziekenhuisbed is omgeven met sensoren, waardoor de medische staf direct wordt gealarmeerd als er iets met de patiënt aan de hand is;
  • Gecombineerde gegevens van sensoren over de hele wereld geven steeds accuratere tsunamiwaarschuwingen;
  • Een databank met medicijngegevens heeft meer kennis paraat dan de beste apotheker in de wereld;
  • Bitcoin brengt wereldwijde betalingen binnen bereik van wie geen bankrekening heeft;
  • Een modern vliegtuig geeft zelf een seintje als het tijd is om een onderdeel na te kijken, ver voordat het uit elkaar valt of zelfs de meest ervaren monteur de slijtage heeft gezien;
  • Banken kunnen uit het betaalgedrag van hun klanten beter aflezen hoe ze met een lening zullen omgaan dan het BKR dat kan;
  • Kijken naar locatiegegevens van foto’s op Flickr, Facebook en Instagram levert veel meer informatie op over het reisgedrag van toeristen dan enquêtes afnemen op het vliegveld;
  • Door uitwisseling tussen de Open Source gemeenschap en het bedrijfsleven krijgt innovatie een kans, en komt een deel van de winst van bedrijven bij goede doelen terecht;
  • Onlangs werd na lang speuren een internationaal kinderpornonetwerk opgerold doordat een beheerder een netwerkcode gebruikte bij een foto op Facebook.

Waar blijft de mens?

Verschillende DataNatives sprekers deden daarover hun zegje:

  • De mens bedenkt de ideeën: sensors kunnen prima meten, computers beter rekenen dan alle mensen bij elkaar, maar jij beslist wat je wilt meten en interpreteert de resultaten;
  • De mens stelt prioriteiten: als de zonnecellen op je ramen de zonwering omhoog willen om zon te vangen en de airco wil ‘m omlaag om het binnen koel te houden zul jij toch moeten beslissen wie de strijd wint;
  • De mens beslist de koers: tegenover elk succesvol project staan 11 mislukkingen – als je de computer z’n gang laat gaan lopen er 12 projecten door, de mens trekt in 11 gevallen de stekker eruit en maakt de twaalfde tot een succes;
  • Een machine kan prima advies geven over een aankoop, maar het is de verkoper die je beïnvloedt en overtuigt.

Drie oneliners:

  • Om je positie te bepalen in de wereld van Big Data maak voor jezelf deze zin af: “I’m going to do X with my data, to make X better, as measured by X, and it is worth X.”
  • Zeven jaar geleden kwam de eerste iPhone uit: we hebben geen enkel idee hoe de wereld er over zeven jaar uitziet.
  • Big Data gebeurt, of we willen of niet. De enige keuze die we hebben is meedoen of niet.

Al met al: een kritische blik op de wereldwijde technologische ontwikkelingen kan nooit kwaad, maar roepen dat Big Data en Big Brother familie zijn is een béétje kort door de bocht.