Big data

Interview: Data is de toekomst; en zo gebruik je het

Officieel heb ik deze blog geschreven voor MarketingMed.

Dat data de toekomst is, daar kunnen we niet omheen. Via deze blog maak je kennis met de waarde van data, ontdek je (toekomstige) ontwikkelingen en weet je hoe je data in jouw voordeel gebruikt. De blog komt voort uit het interview dat ik hield met Ivo Mesters, spreker op ‘Data Driven Commerce’.

 

  1. Data Driven Commerce & Ivo Mesters

Data Driven Commerce is een event over, je raadt het al, data. Het event is op 18 februari in DeFabrique in Utrecht. Data Driven Commerce richt zich op de toekomst van omnichannel commerce processen. Processen die volledig ontwikkeld zijn vanuit de belevingswereld van de klant, maar bovenal gebaseerd zijn op harde data en inzichten in de breedste zin.

Tijdens het event zijn er interessante en waardevolle bijdrages van onder andere Google, Adidas, Oxford University, Nespresso en Philips. Voor Philips spreekt Ivo Mesters. Een kort overzicht van Ivo zijn werkzaamheden:

“Binnen Philips is Ivo verantwoordelijk voor de vertaling van de digital analytics strategie naar operatie, het inrichten, leiden en innoveren van de bijbehorende centrale activiteiten en het wereldwijd leveren van analytics gerelateerde services, zoals data collectie, reporting, data analyze support en optimalisatie, aan markten en business groepen. Daarnaast is Ivo een drijvende kracht achter het tot stand komen van de digital analytics strategie zelf en de vormgeving, inrichting en doorontwikkeling van de onderliggende IT architectuur.” Bron.

Ivo spreekt bij Data Driven Commerce over data-architectuur, dus hoe zij vanuit Philips IT hebben gebruikt en ingericht om uiteindelijk op een schaalbare manier inzichten te genereren en deze toegankelijk te maken voor de gehele organisatie. Vanuit MarketingmMed kreeg ik het genoegen om Ivo te interviewen naar aanleiding van het event. In dit anderhalf uur durende telefoongesprek bespraken we vrijwel alle facetten van data. Deze blog bevat de meest waardevolle informatie voortgekomen uit het interview.

big data
Bron
  1. Data, kun je dat volledig automatiseren?

Een topic dat ik graag met Ivo wilde bespreken was het automatiseren. Er wordt tegenwoordig veel geautomatiseerd, maar kun je het gehele traject van data (verzamelen, rapporteren en het concluderen/adviseren) ook volledig automatiseren of is er altijd een menselijke vaardigheid nodig?

Ivo: De trend is dat er steeds meer geautomatiseerd gaat worden. Dit komt omdat er ook steeds meer mogelijkheden tot automatiseren zijn. Een trend die je ziet in ‘behavioral targeting’, dus het vinden van bepaalde gedragspatronen op je website en daarop reageren met specifieke content, is dat dat ook steeds meer wordt geautomatiseerd. Net als de ‘predictive kant’ van analytics, dus het doorgronden van datasets en daaruit waarde voorspellen.

In alles wat je doet is data-driven een heel belangrijk component, maar het zal nooit het enige component zijn. De data kan jou tot heel ver vertellen wat er gebeurt, maar uiteindelijk moet je gaan bepalen hoe je hierop gaat anticiperen. Daar komt creativiteit bij kijken. Het is hierbij belangrijk dat je hypethesissen gaat formuleren en deze vervolgens weer gaat testen en data gaat gebruiken om deze hypethesissen te valideren.

big data visualisatie

Door het automatiseren verdwijnt het menselijk aspect niet, maar schuift het juist op. Er zijn altijd mensen nodig die hun creativiteit moeten gebruiken om  algoritmes te schrijven. Dit soort zaken zijn zeker de aankomende tijd waar het mensen werk nodig zal zijn. De mainstream zaken worden steeds sneller geautomatiseerd, maar ik geloof/verwacht niet de mens volledig uit het proces verdwijnt.

 

  1. Hedendaagse data en de data van vroeger; what’s the difference?

Aangezien er tegenwoordig zoveel data is dat je kunt verzamelen, wilde ik het met Ivo hebben over: Hoe houd je het verzamelen van data overzichtelijk en hoe weet je welke data belangrijk is? En uiteraard: Wat is het verschil vergeleken met enkele jaren geleden.

Ivo: Het verzamelen van data an sich is – denk ik – voor geen enkel bedrijf een probleem; de dagelijkse activiteiten van elk bedrijf en instelling genereren hele bergen data, vaak zonder dat je er specifiek iets voor hoeft te doen. Wat het probleem, en tevens het interessante is, is hoe je de data gaat filteren en zo inzet dat het daadwerkelijk bruikbaar en waardevol is. De beperkende factor is niet meer zozeer de opslagcapaciteit (denk aan Cloudopslag) of processing power, maar vooral wat je ermee gaat doen. Welke vragen stel je eraan? Je kunt altijd vragen stellen waarop data een antwoord geeft, maar stel je wel de juiste vragen? En is het gevonden antwoord dus bruikbaar en waardevol voor het bereiken van jouw doelstellingen. Bedrijven verzamelen namelijk meer data dan dat ze daadwerkelijk nodig hebben. Het is goed om je op de juiste vraagstukken te focussen. Hierbij helpt het helder formuleren van je businessdoelstellingen, zodat je altijd kunt kijken of het in verband staat met het ‘grote geheel’.

Voor zowel kleine- als grote bedrijven is het aankomende jaren de truc om heldere doelstellingen te formuleren met betrekking tot bijvoorbeeld:

– Wanneer ben je succesvol?

– Wat wil je bereiken met deze campagne?

Dit maak je meetbaar door doelstellingen te koppelen aan KPI’s (het liefst zo min mogelijk). Deze KPI’s moeten bijdragen aan je businessdoelstelling(en). Vervolgens kun je de juiste vragen stellen met betrekking tot wat er onderliggend is aan hetgeen deze KPIs zichtbaar maken en kun je daarmee de gecollecteerde data op een gerichte en relevante manier inzetten.

Mike: Wat is het grote voordeel van nu ten opzichte van de data in het verleden, bijvoorbeeld 10 jaar geleden? Ikzelf denk dat het een groot voordeel is dat je meerdere data kunt combineren. Je ziet dus niet alleen causaal verband, maar ook correlatie.

Ivo: Ik denk zeker dat dit een aspect is waar je gelijk in hebt. Om causaal verband te vinden moet je vaak veel meer hebben dan alleen correlatie. Terwijl vaak, zeker bij big data, correlatie wordt gebruikt. Vaak heb je geeneens een causaal verband nodig om daarop te acteren. Het is een nobel streven om causale verbanden vast te willen stellen, maar vaak niet nodig, of te tijdrovend, om effectieve operationele beslissingen te kunnen maken.

De data ten opzichte van 10 jaar geleden is niet veel anders. De volumes zijn zeker (exponentieel) gestegen, maar het fenomeen data zelf is niet anders dan 10 jaar geleden: ook toen was er (veel) data, alleen minder methoden en infrastructurele mogelijkheden om er effectief en efficiënt veel mee te kunnen. In de tussentijd zijn wel de methodes waarmee je die data kunt ontsluiten gigantisch gevorderd, waardoor je veel meer kunt met die data.

Mike: 10 jaar geleden was de technologie de limiterende factor.

Ivo: Klopt. Daar is nu veel meer mee mogelijk. De limiterende factor van nu is na mijn inzicht tweeledig;

 

  1. Het ontsluiten van data;

Veel organisaties (vooral grotere organisaties) zijn niet een volledig samenwerkende organisatie, van zowel links naar rechts als boven naar onder. Het bestaat uit diverse afdelingen. Al deze afdelingen hebben vaak hun eigen data. En grote bedrijven, zoals Philips, hebben ook bedrijven gekocht die hun eigen systemen en data hebben. Dit moet op één of andere manier geïntegreerd worden.

Dus, elke organisatie heeft data, vaak heel veel data. De uitdaging is die data op een dusdanige manier te ontsluiten dat deze toegankelijk wordt voor de mensen en machines die er iets zinnigs mee kunnen gaan doen.

 

  1. De bemensing

De echte data-scientisten zijn erg schaars. Dit zijn vooral de mensen die statistisch erg sterk zijn, maar ook kunnen programmeren. Hierdoor kun je je statistische kennis omzetten tot algoritmes die ook daadwerkelijk iets met die data kunnen doen.

Hiernaast is het erg belangrijk dat je daarnaast je conclusies/bevindingen kunt overbrengen, bijvoorbeeld naar andere marketeers of de directie. Je kunt een briljante analist zijn, maar als je het niet kunt overbrengen dan heb je er niet iets aan. De waarde van data ligt uiteindelijk in wat ermee gedaan wordt: de beslissingen en/of acties die op basis van inzichten genomen worden. Het niet kunnen overbrengen van inzichten betekent dat er effectief niets met de data gebeurd, hoe briljant het inzicht ook is. In dat geval is alle tijd, geld en andere middelen die ingezet worden om de data te analyseren, niets meer of minder dan verspilling.

big data scientist

Mike: Het is erg herkenbaar dat je dat zegt. Er zijn soms ook eigenaren of mensen met wie ik werk die analyses zien als tijdverspilling, want zij baseren hun beslissingen op intuïtie.

Ivo: Wat jij zegt, is voor mij ook herkenbaar, want dit is één van de grootste uitdagingen binnen Philips en menig andere organisatie. Je kunt de meest briljante inzichten naar voren brengen, maar uiteindelijk ben je afhankelijk van of iemand dat ook zo ziet of dat dat hij zijn beslissingen nog baseert op intuïtie. Dit gebeurt tegenwoordig nog heel vaak.

 

  1. Welke data is nu echt belangrijk?

Je kunt veel data verzamelen. Daarom wilde ik weten wat volgens Ivo echt belangrijk is. Hierom vroeg ik hem welke 3 soorten data belangrijk zijn voor een bedrijf om te meten en te analyseren?

Ivo: Waar wij ons op focussen is:

  1. Digital Marketing & Sales, het e-commercedomein en de daaraan gerelateerde marketing. Voorbeeld hiervan is ‘Clickstream data’, hiermee meten we alles wat er op de websites gebeurt. Maar ook data uit onze e-mail marketing systemen maken hier onderdeel van uit.
  2. Media data, we investeren veel in ‘Paid Search’, display advertising, etc., en willen graag een beter beeld krijgen op de ‘return on investment’ (ROI) hiervan.
  3. Wat gebeurt er op de conversiekanalen (b2c specifiek); we hebben ook een shop, maar wat daarop gebeurt is minimaal in vergelijking met de e-retailers. De datasets die betrekking hebben op wat er gebeurt op de websites van de e-retailers, bijvoorbeeld Amazon, is voor ons ook erg belangrijk.

Deze datasets zijn de 3 ‘core’ datasets, op het B2C gebied, bij hetgeen wat wij doen.

 

  1. Privacy en Data; zijn mijn gegevens wel veilig?

Er wordt veel data verzameld. Soms schuurt het zelfs tegen privacy aan. Hoe kijkt Ivo hier tegenaan: Waar ligt de grens van het meten en analyseren van bezoekers- en klantgedrag?

Ivo: Dat is op zich een groot, maar ook vaak, een grijs gebied, maar in het algemeen is het wel één van de meest belangrijke topic. Het is ook iets wat binnen Philips heel veel aandacht krijgt. Wij hebben iemand die continue waarborgt of wat we willen doen überhaupt legaal is, zowel het verzamelen als hoe wij de data hier intern gebruiken. Het is hierbij goed om rekening te houden dat je niet alleen onderzoek doet of iets mag, maar ook of het wenselijk is. Misschien mag iets wel, maar is het niet wenselijk vanuit klant, consument en/of bedrijfsperspectief.

Bij Philips anonimiseren we veel data. Het maakt bijvoorbeeld wel uit wat er gekocht wordt, maar niet wie het koopt om er relevante inzichten uit te halen. Op dergelijke manieren waarborgen we zowel de privacy van onze klanten als ook de mogelijkheid om patronen te onderzoeken.

Mike: Je zei dat het belangrijk is om te kijken of het zowel toegestaan- als wenselijk is. Denk je dat de consument zich bewust is van wat er gemeten wordt en wat voor gegevens hij achterlaat?

Ivo: Ik denk dat het merendeel van de consumenten dat niet weet. Daarnaast is er een groot deel die zich daar wel bewust van is, maar daar geen problemen meeheeft. Zij vertrouwen dat de bedrijven goed met de data omgaan. Dit kan wel omkeren als er informatie naar buitenkomt met bedrijven die data verkeerd inzetten, bijvoorbeeld verkopen. Het waarborgen van een goede omgang met privacy gevoelige data en daarmee het behouden van het vertrouwen dat onze klanten en consumenten in ons stellen is voor Philips heel belangrijk.

Mike: Er komt regelmatig een bericht naar buiten dat data op de straat komt te liggen. Hoe kan een bedrijf ervoor zorgen dat de data gewaarborgd blijft en veilig is?

Ivo: Dit kun je niet 100% waterdicht maken. Als je het kunt opslaan en verzamelen, kun je er ook inbreken. Voor bedrijven is het belangrijk om alleen hetgeen te meten wat ze ook daadwerkelijk nodig hebben. Hiernaast moeten ze de consument volledig informeren over wat er wordt verzamelt. Als je de data verzamelt, zorg dan voor een goede beveiliging, restrictieve toegang en anonimiseer het zoveel mogelijk.

 

  1. Een ‘teveel’ aan data?

In het interview benoemden we meerdere malen dat er steeds meer data beschikbaar komt en dat data in jouw voordeel kan werken. Nu bedacht ik mij dat het kan zijn dat er op een gegeven moment een knikpunt moet zijn. Dus dat de hoeveelheid zo groot is, dat het een negatief effect heeft.

Ivo: Persoonlijk denk ik dat dat punt al bereikt is. Maar de middelen die we ter onze beschikking hebben, zorgen dat we veel meer data aankunnen. Het is en blijft (zelfs nu al) teveel data. Je moet daarom de juiste vragen stellen waarop je de antwoorden wilt vinden, zodat je focus kunt brengen met betrekking tot welke (delen van) datasets voor jou het belangrijkste zijn op dat moment.

Mike: Het stellen van de juiste vragen en hypothesissen is een gehele vaardigheid. Hoe kun je dat jezelf aanleren of moet dat in je zitten?

Ivo: Dit kun je zeker leren. En er kan ook een standaard methode voor ontwikkeld worden. Het is belangrijk dat je gaat kijken wat je wilt bereiken en leren? Daar ga je vragen omheen stellen. Begin bij je businessdoelstellingen. Hier koppel je datasets aan, want hierin zit het antwoord verborgen.

Dit zal je misschien 2 of 3 keer mis hebben, maar de 4de keer is raak. Iedereen kan vragen stellen, maar ze moeten relevant voor jouw business zijn. Op deze manier ga je gerichter te werk en schiet je niet met hagel.

 

big data overload
Bron
  1. Methodieken en theorie voor big data

Er blijven ontwikkelingen en modellen voor big data komen. Wat is volgens Ivo nu interessant om te gebruiken en/of te volgen?

Ivo: Een methodiek waar ik grote voorstander ben is Lean Startup van Eric Ries. Dit gaat zeker niet specifiek over het omgaan met (big) data, maar de principes van deze methode kunnen mijns inziens prima worden toegepast bij het optimaliseren van je product/dienst/etc. op basis van data. Een belangrijke learning hieruit is dat in principe alles wat je doet of wat je denkt dat een verbetering is eigenlijk een set is van niet-geteste hypothesissen. Lean Startup biedt de methodologie om bijna op een ‘scientific-methode’, gedreven door data, jouw hypothesissen te gaan testen met zo min mogelijk kosten en zo kort mogelijke iteraties.

Door zo snel mogelijk een product te leveren die een (gedeelte) van de behoefte van jouw doelgroep vervult, en deze ‘voor te leggen’ aan echte klanten, kun je data verzamelen. Wanneer je diep in deze data duikt, bijvoorbeeld door patroonanalyse of A/B-testing voor het testen van varianten, kun je stap voor stap een product/dienst verbeteren op een manier dat het daadwerkelijk aanspreekt bij jouw doelgroep. Je hoeft dus niet vooraf veel te investeren, je kunt kleinschalig testen en leren van echte klanten. Het toepassen van een dergelijke gestructureerde aanpak van (iteratieve) optimalisatie dwingt je om je datasets op een even zo gerichte manier in te zetten: de ‘juiste vragen’ zijn dan in de context van het valideren of ontkrachten van de hypotheses.

Mike: Lean Startup en Lean Analytics zijn (offline) bronnen. Heb je nog meerdere bronnen die je aanraadt voor mensen die zich erin willen verdiepen?

Ivo: Lean Startup en Lean Analytics zijn goede bronnen. Lean Startup is meer de theoretische kant en Lean Analytics is toegespitst op analytics. Niet hoe pas ik Lean Startup toe op analytics, maar hoe pas ik analytics toe in een Lean Startup.

Running Lean van Ash Maurya is ook een goed boek. Hij las/hoorde veel over deze theorieën. Hij besloot om al deze theorieën in de praktijk te brengen. Terwijl hij dit deed heeft hierover een blog bijgehouden, die uiteindelijk zijn uitgelopen in een boek. Het hele proces van het schrijven van dat boek zelf is een aaneenschakeling geworden van MVPs (minimal viable products) en het in de praktijk toepassen van de theorieën. Daarom vind ik dit een hele interessante aanvulling op de Lean Startup reeks, waarbij hier vooral ervaringen uit de praktijk centraal staan.

Hiernaast is natuurlijk ook Avinash Kaushik een autoriteit op het gebied van digital analytics specifiek. Er zijn uiteraard meerderen die hierover schreven, maar hij heeft een leuke schrijfwijze. Zelf vind ik het veel leuker en interessanter om zelf te experimenteren. Als je er dan mee aan de slag gaat, kies je een topic en dan vlieg je het aan. Op deze manier kom je ook ongetwijfeld op andere blogs.

 

Hopelijk hebben Ivo en ik een duidelijk beeld geschapen over hoe jij data kunt inzetten. Wil je meer weten of data? Zorg dan zeker dat je een bezoek brengt aan Data Driven Commerce. Hoe ga jij om met data? Laat het ons weten!

Geef een reactie