Big data in evolutie van volume tot waarde: het grote data dossier

Big data: inleiding, toepassingen, voordelen, evoluties, uitdagingen en pijnlijke vaststellingen in een wereld waar big data mainstream is en deel uitmaakt van een data-gedreven cultuur met een focus op uitkomsten in plaats van volume. Tenminste: zo zou het toch moeten zijn.

Men kan big data bekijken vanuit het technologische perspectief maar uiteindelijk betekent big data gewoon “alle gegevens” in de context van het ecosysteem van je bedrijf.

En er is nogal wat data vandaag. Het pure volume van data waar we over (kunnen) beschikken of toegang toe kunnen verkrijgen is duizelingwekkend en als je kijkt naar de groei van de datavolumes in het digitale universum word je er stil van. Je zag ongetwijfeld al een van de talloze infografieken waar de Terabytes je om de oren vliegen. Als dat niet zo is: we hebben er eentje toegevoegd onderaan. Leuk om te zien maar je wordt er niet meteen “beter” van zoals we zullen bespreken in dit ‘grote big data in evolutie’ dossier.

Dossier big data

Inhoudstafel

Het begin: complexe en grote data sets

Oorspronkelijk was big data voornamelijk bedoeld als een term die verwees naar de grootte en complexiteit van data sets en de verschillende vormen van verwerking, opslag en analyse die nodig waren (en zijn) om die grotere en meer complexe data sets te kunnen beheren en, vooral, om er de waarde uit te kunnen puren – die uiteindelijk het enige criterium is dat het verschil maakt.

Vat krijgen op big data en fast data kan organisaties helpen verandering op te merken binnen hun markten en klantenecosystemen en er dan iets mee te doen.

De meeste mensen keken naar de aspecten van volume en variëteit aan gegevens. En helaas gebeurt vooral dat eerste nog in hoge mate. Meer data, meer soorten data, meer bronnen van data, noem maar op. Maar data op zich heeft geen betekenis of waarde. Het zelfde geldt voor volume.

Wat werkelijk telt is net die betekenis, context, informatie waar je iets mee kan DOEN en die actiegerichte intelligentie.

Dit betekent niet dat volume en variëteit geen belang hebben. Zeker de grote verscheidenheid aan gegevens en gegevensbronnen, vooral op het vlak van ongestructureerde data, zorgt voor uitdagingen. En voor geweldige mogelijkheden zoals we later zullen bespreken.

We beginnen eerst even met een wat doorgedreven inleiding tot big data evoluties vooraleer we naar de actiegerichtheid en waarde kijken.

Big data: volume en variatie

Het is begrijpelijk dat we zo gefascineerd zijn door de volumes en diversiteit aan data als je je realiseert hoeveel data er in deze ‘digitale wereld’ werkelijk is. De estimaties lopen nogal uiteen en sommige cijfers gaan al wel even mee maar we zien ze nog dagelijks opduiken in nieuwe infografiekje of weer maar eens een artikel op pakweg Forbes over de groei van big data (ja, we zijn echt geobsedeerd door volumes).

Big data universum

De gegevens in papierbergen en ongestructureerde bronnen

Voeg daar nog de gegevens aan toe die verborgen zitten in allerhande documenten en papieren bronnen of onverwerkte informatiesilos en je kunt je wel een idee vormen.

Zaken doen aan de snelheid van papier is geen zaken doen aan de snelheid van de klant, de market, het digitale bedrijf en de versnellende digitale transformatie economie.

In tegenstelling tot wat men vaak lijkt te denken worden er dagelijks nog massa’s documenten gedigitaliseerd om er de belangrijke gegevens uit te distilleren die belangrijk zijn voor diverse mogelijke redenen. Dat kan gaan van het optimaliseren van dienstverlening aan de klant, het verbeteren van bedrijfsprocessen of de beschikking over die gegevens in digitale vorm om kosten te besparen, wetenschappelijk onderzoek te verbeteren of, in het kader van digitale transformatie projecten, nieuwe zakelijke modellen te verwezenlijken of de ervaring van klanten, patiënten, burgers – kortom, mensen – te verbeteren in een wereld waar ze steeds meer aan ‘self-service’ willen doen en zelf snel beschikking willen hebben over belangrijke gegevens en waar ze voor staan.

Digitale transformatie en papieren gegevensdragers

Noteer trouwens dat het puren van data uit papieren bronnen en het omvormen er van tot digitale gegevens en vervolgens informatie in het kader van processen nogal eens digitale transformatie wordt genoemd, wat het oorspronkelijk ook betekende.

Maar nu de term digitale transformatie in een heel andere context wordt gebruikt en bijzonder ‘hot’ is, springen al die bedrijven weer op de kar van die oude term zodat het verwarring alom wordt omdat zowat iedereen zijn producten en oplossingen lijkt te willen slijten onder de hippe noemer digitale transformatie die voor heel wat anders staat vandaag.

Digitale transformatie heeft an sich niets te maken met het scannen, digitaliseren en verwerken van gegevens in papieren dragers. Omgekeerd is het wel zo dat je moeilijk aan digitale transformatie kunt doen als je niet over digitale gegevens beschikt omdat ze ergens in een archief zitten of niet snel genoeg gedigitaliseerd worden. In het Engels spreekt men over ‘digitization’ als het gaat over het digitaliseren van gegevens uit papieren dragers. Digitalization (twee letters meer) is dan weer synoniem van digital transformation in de zin die we vandaag bedoelen. Inderdaad, best verwarrend.

Het probleem van informatiechaos

Tijd voor een voorbeeld (er zijn er duizenden meer) van hoe dat precies zit met die digitale gegevens, papieren dragers en vooral ongestructureerde data.

Processen papierloos maken door digitalisering resulteert in vier maal snellere responstijden.

We nemen het voorbeeld van een contact center. Veel interacties en vragen voor hulp komen binnen in ongestructureerde vorm (niet via een databank zeg maar) zoals e-mails of sociale ‘oproepen’. Een contact center agent beschikt doorgaans over een resem gestructureerde data over de klant en zijn historiek. Maar om ook de essentie van die e-mails en tweets in het proces te krijgen heb je meer nodig.

Het wordt nog complexer als er papier mee gemoeid is. Denk aan een verzekeringsbedrijf. Je sluit een polis af en wacht op de afhandeling van je dossier waarbij ook papier gemoeid is. Die documenten worden behandeld maar vaak niet zo snel en met behulp van back-office systemen die dikwijls los staan van andere systemen. Dus als je dan telefoneert naar de verzekeraar om de stand van zaken van je dossier te kennen (en terwijl misschien ook een mail stuurt en ondertussen nog even een tweet verstuurt) zijn helpdeskmedewerkers tussen al die bronnen en communicatiemiddelen in de praktijk verloren. Als dan ook nog eens de gegevensverwerking (en status) van je papieren documentenproces erg traag verloopt is je end-to-end klantervaring negatief. Dat is de uitdaging waar veel bedrijven voor staan. En die heeft meer te maken met gegevensdragers, data-formaten, processen en silo’s dan met volumes. Dit voorbeeld is een schoolvoorbeeld van wat men wel eens informatiechaos noemt (verder meer).

Big data: het volumeperspectief

Terug naar big data en dat aspect van ‘big’. Het is inderdaad allemaal erg groot en dat zal niet veranderen, wel integendeel. De vraag is echter of dat volume zo belangrijk is. Zoals gezegd zijn velen er in elk geval door gepassioneerd (en wat geobsedeerd).

Bedrijven weten niet wat ze allemaal kunnen realiseren met een overvloed aan data en missen de capaciteiten om inzichten en waarde uit gegevens te puren.

Soms lijkt het zelfs alsof er bijna evenveel data over de grootte van en groei van het universum aan gegevens is als er gegevens zelf zijn. Dat is natuurlijk overdreven maar toch. Je hebt amper een of andere bron geraadpleegd en daar komt alweer een andere bron of een update die je toont hoe exponentieel de groei aan gegevens wel is en in hoeveel manieren, vormen en formaten meer data komen uit een steeds grotere waaier aan bronnen.

Enkele voorbeelden. Denk aan alle data op het Web, transactielogs, sociale data en zoals net vermeld de gegevens die worden gepuurd uit tonnen documenten die dagdagelijks worden gedigitaliseerd. Denk ook aan verschillende types ongestructureerde data(bronnen) zoals e-mails en zelfs afbeeldingen of tekstboodschappen (SMS maar ook ingesproken), data die worden gegenereerd door diverse applicaties, geo-locatiegegevens en, steeds vaker, data uit sensors en andere apparaten en componenten in een context van het Internet der Dingen (Internet of Things).

Het maakt niet uit wanneer je dit leest: als je de denkt dat de volumes data in het algemeen en in het ecosysteem van je bedrijf minder snel gaan groeien, stel je best je verwachtingen bij. Je kunt je allicht voorstellen hoe big data en het Internet der Dingen, samen met de artificiële intelligentie en ‘cognitive computing‘ toepassingen die nodig zijn om de zin, essentie en waarde uit gegevens te halen, nog maar een glimp laten zien van hun enorme impact. Dit is geen hype maar eenvoudigweg een realiteit.

Op weg naar waarde: de opportuniteit inzake informatie, intelligentie en actie in big data

In deze tijden van steeds meer data, met vooral een enorme groei aan ongestructureerde data (unstructured data), wil men het wel eens hebben over een echte data chaos.

Slechts 4 procent van de bedrijven kan volledig waarde uit data en informatie halen.

Maar, net zoals informatiechaos, een begrip we eerder vermeldden en dat de laatste jaren gretig werd gebruikt door AIIM (een vereniging van information management professionals waar we lid van zijn) om informatiebeheerders en de ECM (Enterprise Content Management) industrie wakker te schudden eigenlijk gaat over de opportuniteiten die informatie ons biedt, is dat net het zelfde met big data chaos: focus op de uitkomsten.

Tijd dus om dat volumeaspect wat achterwege te laten. Big data chaos bestaat niet voor wie kijkt naar doelstellingen en mogelijkheid. Bovendien is het mooie aan big data dat “het” (het is geen ding) niet de klassieke regeltje van data-en informatieprocessen volgt en dat zelfs “domme data” tot enorme voordelen kan leiden zoals Greg Satell uitlegde op Forbes.

De focus verschuift dan ook steeds meer van het groeiende volume van grote en complexe data sets naar andere attributen zoals snelheid.

Denk maar aan hoe belangrijk fast data zijn in een economie waarbij de reële tijd steeds belangrijker wordt en snelle toegang tot informatie belangrijker wordt, al is het “maar” vanuit het perspectief van de steeds meer veeleisende klant of van processen die moeten blijven draaien in een industriële Internet of Things toepassing context.

Van big data naar ‘big’ inzichten en vooral beslissingen

We zijn van volume naar waarde gegaan. Natuurlijk gebeurt dat niet zomaar.

De transformatie van data in informatie, intelligentie, kennis en actie gebeurt in verschillende stappen. We kunnen er een zeeeer oud model bij halen dat informatiebeheerders wel kennen: het DIKW model.

Inzichten leiden tot acties

Dat is, eenvoudig gezegd, een hiërarchisch model (met de nadruk op model) waarbij we van data naar actie evolueren.

We zullen het er eens uitgebreider over hebben ook al wordt het minder gebruikt maar het helpt ons in het verduidelijken van sommige aspecten van informatiebeheer, digitalisering en ook wel big data. Je kunt er wat over lezen op onze Engelstalige site en, opnieuw, het is een model en bovendien een lineair model.

Een klassieke data-information-knowledge-wisdom pyramide - via Mushon
Een klassieke data-information-knowledge-wisdom pyramide – via Mushon

Data, ook big data, staan onderaan de ladder (de D van DIKW). Daarboven staat informatie (de I), dan kennis (knowledge, de K) en vervolgens wijsheid (wisdom, de W). In die wijsheid zit ook het actie-element al voegden sommigen dat er nog aan toe. Nog anderen voegden er een E aan toe, de E van Enlightenment of “verlichting”. Dat lijkt ons iets te veel van het goede waarbij de vraag zich aandient waarom we het model vermelden.

Data is geen informatie, kennis noch actie

Ten eerste omdat we een verschil moeten maken tussen data en informatie, hoewel we dat vaak niet doen. Data is gewoon data. Daar gaat big data over. Als je context toevoegt aan data krijg je informatie en zit je in het domein van informatiebeheer.

Doe er betekenis bij en je krijgt kennis. En met een scheut inzichten krijg je wijsheid en vooral actie. Dat is ook de richting waarin het denken en vooral de praktijk van big data zich beweegt. Het gebeurt allemaal met behulp van lang bekende operaties en systemen die we in een artikel over informatiebeheer zullen uitleggen. Maar er komt in de context van het gebruik van big data ook heel wat “nieuwe” technologie bij. Cognitive computing, big data analytics en algoritmes om betekenis uit data en informatie te puren kaderen hier perfect in.

Ten tweede kunnen we je met behulp van het model even meenemen doorheen de zogezegde V’s van big data waar je ongetwijfeld al veel van kent maar waarbij we toch net even dieper gaan.

Een andere kijk op DIKW -hier als een omgekeerde pyramide - vanuit het big data perspectief - via Doclens
Een andere kijk op DIKW -hier als een omgekeerde pyramide – vanuit het big data perspectief – via Doclens

Het is ook een mooi vertrekpunt als we het gaan hebben over het gebruik van big data vandaag, de evoluties en, belangrijk voor wie interesse heeft in de veranderingen in de wereld van informatiebeheer, toepassingen en IT, onderwerpen zoals de verschuiving van ‘systems of records’ (noodzakelijk) naar ‘systems of engagement’ (interessanter uit het perspectief van klanten en waarde) en ‘systems of insight’ (zeer interessant: big data analytics).

De hernieuwde aandacht voor big data en de veranderende betekenis

Hopelijk hebben we kunnen benadrukken dat de betekenis van de term big data sterk gewijzigd is en net zoals dat wel vaker het geval is met ‘technologische fenomenen’ is het eigenlijk een paraplubegrip geworden dat steeds verder weg evolueert van zijn oorspronkelijke betekenis.

Big data in de zin van het controleren van de volume, velociteit en variëteit van data zoals reeds beschreven in 2001 in dit document van META Group/Gartner (PDF opent) dus.

Zoals je merkt aan het jaar van die publicatie is big data dus ook echt niets nieuws. Wel is er een hernieuwde aandacht voor gekomen die steeds verder gaat. Die hernieuwde aandacht voor big data is een combinatie van de komst van open source technologieën om data op te slaan en te bewerken, de toenemende volumes, technologieën van het zogeheten derde platform zoals cloud, mobile en een resem bijkomende ‘versnellers’ zoals het Internet der Dingen.

Het big data ecosysteem is in deze ontmoeting van diverse veranderingen en versnellingen enkel maar breder geworden zoals de onderstaande grafiek toont.

Het big data ecosysteem - van data tot beslissingen - via IDC - klik voor volledige afbeelding
Het big data ecosysteem – van data tot beslissingen – via IDC – klik voor volledige afbeelding

Waarom data – en vooral de juiste data – cruciaal zijn

Vandaag, en zeker op deze site, kijken we naar het perspectief van ‘business intelligence’, beslissingen, waarde en mogelijkheden. Van volume naar waarde dus. Value is voor ons trouwens een cruciale bijkomende ‘V van big data’.

Van volume naar waarde zoals in het stellen van de vraag welke gegevens we nodig hebben om een bepaald doel te bereiken of waarde te creëren. Van bij data chaos naar ‘mining’ en betekenis/context/intelligentie, waarbij de klemtoon komt te liggen op data analyse, inzichten en acties.

Het gaat al lang niet meer om big data. Het gaat om de vraag naar de juiste data. En die vraag kadert in een holistisch en doelgericht perspectief.

73 procent van de bedrijven beweert data-gedreven te zijn. Slechts 29 procent is goed in het omturnen van data in actie. (Forrester)

Met het Internet der Dingen als een realiteit in het bedrijfsleven en de voortschrijdende digitalisering zijn het de ‘slimme’ collectie, het verwerken, de analyse, de praktische doelstellingen en de genomen acties, die het verschil uitmaken, nu en in de komende jaren. Zoals je misschien al tussen de regels las zullen we nog vaak over data en informatie praten op deze site, vanuit heel veel verschillende invalshoeken. Dat kan ook niet anders want data en informatie zijn niet alleen het ‘levensbloed’ van het digitale bedrijf en digitale transformatie, ze zijn ook het levensbloed van innovatie, de lijm die alle technologische evoluties en menselijke toepassingen verbindt, steeds meer economische ‘assets’ en zelfs verhandelde ‘goederen’ an sich en, super-belangrijk, het levensbloed van menselijke interactie.

De V’s van big data in zakelijk perspectief

Met dit allemaal voor ogen (en we beschreven nog maar het topje van de ijsberg en zeker ook van allerhande uitdagingen) zijn we bij die “V’s van big data” beland.

We gaan daarbij niet technisch worden en vooral naar de betekenis kijken.

De oorsprong, betekenis en evolutie van de V’s van big data (met een verhaaltje)

De oorspronkelijke 3V's van big data – volume, velocity and variety
De oorspronkelijke 3V’s van big data: volume, velocity and variety – Shutterstock – Copyright: a-imager

Allicht ken je ze en we vermeldden er al twee van (Volume en Varieteit). We voegden er ook één aan toe: Waarde. Dat begint ook met een V, die van Value.

Anderen voegden nog andere V’s toe zoals IBM dat alweer jaren geleden aan het klassieke trio van, en nu gaan we ze in het Engels vermelden, Volume, Velocity en Variety, ook Veracity er bij gooide.

Even een zijsprongetje (met een reden zoals je verder zal lezen). Doug Laney van Gartner heeft zich destijds behoorlijk druk gemaakt over die vier V’s van IBM.

IBM’s model was immers geschoeid op het model in het eerder vermelde document van META Group/Gartner uit 2001 van Doug die toen nog bij META Group zat en in de pen kroop om dat even in herinnering te brengen na een boze commentaar.

De discussie die zich ontspon op de IBM pagina met het onderstaande model van de vier V’s was soms wel interessant. Terwijl Doug vooral boos was omdat IBM niet naar zijn model had gerefereerd en dus niet eens citeerde (en sommigen hem daarin bijsprongen), voegden anderen er nog een aantal V’s aan toe. De ene vond de toevoeging van een vierde V (Veracity dus) nodeloos omdat big data dan in de sfeer van het traditionele dataverwerking denken kwam, Doug die vond het al helemaal niks en vond het ingaan tegen het principe achter de 3V’s en de andere vond dat de originele 3 V’s oubollig waren en te veel op infrastructuur en IT waren gericht. Met Veracity maar ook met Visualization (nog zo een ‘big topic’ in big data) en Value, keken we meer naar wat nu telt heette het toen in een commentaar. Zo meteen meer.

Maar eerst overlopen we even de vier V’s “van IBM” en die vijfde die we er graag aan toevoegen. We bekijken ze vooral vanuit het perspectief van toepassingen en bedrijfsrealiteiten, eerder dan als beschrijvende karakteristieken.

De bekende en voor sommigen omstreden vier Vs van big data door IBM - klik voor grotere afbeelding
De bekende en voor sommigen omstreden vier V’s van big data door IBM – klik voor grotere afbeelding

Volume: aan de basis van uitkomsten en functie van soms gigantische toepassingen

Volume hebben we al uitvoerig toegelicht. Het enorme volume aan data dat in de beloofde infografiek over het digitale universum in alweer achterhaalde cijfers wordt toegelicht.

Dat volume is er en als je er gebruik van maakt gaat het hier over infrastructuur, opslag, verwerking, beheer, beveiliging en zoveel meer, steeds vanuit een geprioriteerde en selectieve benadering. Dat volume is natuurlijk wel belangrijk en in sommige toepassingen hebben je inderdaad heeeeel veel data nodig. Wie de evolutie van het klimaat over de wereld met behulp van talloze bronnen, sensors en zo meer wil op de voet volgen heeft bijvoorbeeld wel wat meer gegevens nodig.

Velocity: als tijd geld is, is snelheid een kwestie van overleven en concurrerend vermogen

Snelheid! Cruciaal in de realiteit van het digitale bedrijf en de digitale transformatie economie, die onder anderen mee aangestuurd wordt door klanten die het steeds sneller moeten hebben.

De oude aanpak was data- en informatiebeheer. De nieuwe aanpak is intelligentie die leidt tot actie op het juiste moment.

Hier en nu in de real-time economie voor de klanten en andere ‘stakeholders’ in het ecosysteem van je bedrijf zoals werknemers, helpdesk agenten zoals we zagen in ons voorbeeld, partners, toeleveranciers, afnemers, investeerders, ga maar door. Snelheid is een competitief voordeel geworden en maakt soms het verschil tussen grote winsten en grote verliezen (financiële markten bijvoorbeeld), tussen goede en slechte klantervaringen, in innovatie, in go-to-market beslissingen, in medische toepassingen en het overleven van het bedrijf zelf.

We hebben het bij dat laatste niet eens over ‘disruptie’ maar denk bijvoorbeeld aan ‘supply chains’ en handelaars die door hoge concurrentie moeten kosten drukken door just-in-time leveringen te ontvangen en in real-time de status van orders doorheen de hele keten moeten kunnen volgen om hun voorraden te beheren en klanten tevreden te houden. De lijst is eindeloos.

Snelheid heeft natuurlijk niet alleen te maken met data zelf (denk bijvoorbeeld ook aan ‘fast data’) maar vooral met de analyse van de data.

Big data analytics dus, dat ruimschoots aan bod komt in de volgende V.

Variety: zoeken naar stroomlijning, waarde en context

Ook over de dimensie van variëteit hadden we het eerder maar ze is essentieel. Bedrijven worstelen met de diversiteit aan dataformaten, gegevensbronnen en dies meer. Ze slagen er moeilijk in om alles te aligneren in functie van een specifieke uitkomst.

Verschillende vormen van data – en van informatie ook overigens – zitten op verschillende plaatsen en worden enorm onderbenut. Silo’s staan overal in de weg van een gestroomlijnd informatiebeheer en de pogingen om de waarde uit vooral ongestructureerde data te halen zijn nog vrij ad hoc.

Systemen van inzicht zijn er op gericht inzichten te verwerven/bemeesteren en op een consistente manier data in acties om te zetten.

Bovendien zijn veel van de systemen en benaderingen die werden gebouwd om te werken met bedrijfscontent, gestructureerde data, en ‘records’ (systems of records) totaal niet aangepast aan die wildgroei van ongestructureerde data waar massa’s waarde in zit.

Ongestructureerde data ‘begrijpen’ voegt een dimensie van “waarom” toe aan de dimensie van “wat” waar we ons vaak toe beperken.

Met big data zie je wat er gebeurt en kun je daaraan acties koppelen. Met het extraheren van betekenis uit ongestructureerde data kun je ook begrijpen waarom iets gebeurt en zit je een stap hoger in die DIKM pyramide die we eerder vermeldden. Het is hier dat big data analytics, de essentie van big data en ook artificiële intelligentie en ‘cognitive computing’ aan bod komen: betekenis, context en een veel beter voorspellend vermogen.

In de praktijk is de enorme variëteit van data en vooral de veel sneller groeiende categorie van ongestructureerde data, waar je niet zomaar regeltjes kunt op toepassen, DE uitdaging voor veel bedrijven. En die gaat hand in hand met de uitdaging van stroomlijning van informatiestromen, processen, klantgerichte processen, de lijst is lang.

Veracity: is het waar?

Waarheidsgetrouwheid. Dat is dus die toevoeging van IBM waar zoveel om te doen was. Het lijkt wel een morele waardering maar het is het niet.

Slechte datakwaliteit is de oorzaak van meer dan 20 procent van de kosten in zakelijke processen.

De ethische aspecten van het gebruik van (big) data komt overigens wel nog eens aan de orde. Gegevens moeten accuraat zijn. Simpel. Foute gegevens, foute uitkomsten. We kunnen verwijzen naar het aloude GIGO principe uit de IT-wereld: Garbage In, Garbage Out. Het is net zo met data en big data. Al moeten we toegeven dat je soms met ‘domme’ en op het eerste zicht nutteloze data wel één en ander kunt doen. Maar het principe is duidelijk. En uiteraard gaat het niet alleen over de accuraatheid van de gegevens an sich maar ook over de accuraatheid waarmee ze, in ons DIKM modelletje, worden omgeturnd van data tot informatie tot intelligentie tot kennis en tot beslissingen. Je kunt je voorstellen dat ook hier wel eens wat kan mislopen en dan hebben we het nog niet over verkeerde interpretaties.

Maar goed. In strikte zin gaat het hier over de accuraatheid en kwaliteit van data zelf. En er heerst op dat vlak nogal wat onzekerheid, ook in bedrijven die willen data-gedreven werken.

Slechte datakwaliteit kost handenvol geld en inspireert niet meteen tot een goed gebruik van gegevens. Dat is deels inherent aan de data zelf. Vooral je kunt iets doen met data moeten ze correct, ‘leesbaar’ en geldig zijn.

Value: wat is het allemaal waard op zich en waar creëert (big) data waarde?

Bij waarde blijven we even langer stilstaan omdat het cruciaal is maar ook uit verschillende invalshoeken moet bekeken worden.

Op zich zijn gegevens betekenisloos. Maar ze verkrijgen wel betekenis uit het oogpunt van de intentie waarvoor ze vergaard worden. Het gebruik er van dus. Dat wil niet zeggen dat data an sich ook geen waarde kan hebben. Alleen neemt de waarde toe in functie van het doel.

De data economie

Het is duidelijk dat in een data-gedreven economie data een belangrijke hoeksteen vormen. Bovendien is er ook een data economie waarbij gegevens handelswaar worden.

Denk maar aan hoe gegevens en/of de toegang er toe worden samengevoegd en daarbij een monetaire waarde krijgen. Data als economisch goed en zelfs als immaterieel bedrijfsmiddel op zich. Een ‘business asset’ dus. En net als andere business assets moeten die beschermd en zorgvuldig beheerd worden. Maar kan dat? Kun je gegevens en ook klanten, waarvan sommigen zeggen dat ze als een cruciale business asset moeten behandeld worden, als activa toevoegen in de balans van je bedrijf?

Het is opmerkelijk om te zien hoe vaak er wordt gezegd dat gegevens in dit digitale tijdperk effectief cruciale bedrijfsmiddelen zijn al bedoelt niet iedereen er mee dat ze ook effectief als activa moeten ingeschreven zijn.

Die boodschap is terecht al is het maar omdat het dringend tijd is dat alle aspecten rond data (inclusief de beveiliging er van) en ook rond klanten en klantervaring, een plaats in de ‘boardroom’ krijgen. Alleen dan krijgen ze de aandacht die ze dringend nodig hebben. Vergelijk het met ECHTE digitale transformatie: die wordt ook geïnitieerd door het management. Op exact dezelfde manier moet men alle aspecten rond gegevens “sturen” omdat er gewoon te veel silo’s zijn en te weinig wordt gedaan op een strategisch en gecoördineerd vlak.

Data als een business asset

Het idee om data als een bedrijfsmiddel te zien wordt bijna dagelijks in analyses, onderzoek, rapporten en blogs aangehaald in een context van digitale transformatie en digitaal bedrijf.

Organisaties die weten een gedifferentieerde informatie-waardeketen te bemeesteren, winnen een concurrend voordeel (IDC).

Maar het is alles behalve nieuw. Meer zelfs: er wordt al meer dan twee decennia over gesproken, gedoceerd en nagedacht met heuse onderzoeksgebieden tot gevolg. Die hernieuwde aandacht voor de ‘data is an asset’ boodschap heeft natuurlijk veel te maken met het feit dat men eindelijk inziet dat gegevens echt wel cruciaal zijn.

Het idee kwam doorheen de tijd ook vanuit verschillende invalshoeken. Zo schreef Thomas C. Redmand op 15 januari 1995 (!) in de MITSloan Management Review, vrij vertaald, “we stellen drie strategieën voor het verbeteren van datakwaliteit voor…de tweede stap is om data te behandelen als een asset. Terwijl vrijwel iedereen het er over eens is dat data van kritisch belang zijn, behandelen weinigen ze als dusdanig”.

Of neem deze van 15 december 1999 uit een paper (PDF) van NewVantage Partners: “Veel Fortune 500 bedrijven erkennen bedrijfsgegevens als een strategische business asset. Leidende ondernemingen gebruiken schatten aan operationele gegevens om hun processen te optimaliseren, intelligente producten te creëren en hun klanten te verrukken”.

Maar het idee om data ECHT als business assets te zien, inclusief het onderzoek naar manieren om de economische waarde van gegevens en informatie te kunnen bepalen, begon met het werk van Doug Laney (daar is hij weer) die baanbrekend werk verrichtte op dat vlak onder de naam “infonomics”. We zullen het er zeker nog over hebben. “Bedrijfsleiders”, schreef Doug op Forbes, “struikelen vaak over de gangbare misvatting dat informatie enkel waarde heeft als ze toegepast wordt. Data heeft dus geen waarde als ze gewoon in een databank zit, denken ze. Dat is gewoonweg niet zo.”

Waarde als in risico’s, inbreuken, onverwachte kosten en gemiste opportuniteiten

Toch is dat allemaal nog niet de essentie van waarde. Een ander belangrijk aspect als we het over de waarde van data hebben is het omgekeerde: de kost als er iets mee gebeurt wat we niet willen en de kost van het niet extraheren van waarde uit gegevens die ergens verstopt zitten en zouden kunnen processen of klantervaringen verbeteren, om er maar enkele te noemen.

Het eerste gaat over security, governance en dies meer. Data is niet alleen een goudmijn voor bedrijven, het is er ook een voor echte syndicaten van cybercriminelen die steeds meer efficiënt te werk gaan en zelfs van overheden die ook wel uit zijn op cruciale data zoals we steeds meer horen.

Het aantal inbreuken is enorm toegenomen en vaak wordt er geaasd op zeer persoonlijke data. We vertellen je nog wel eens wat de kosten daarvan zijn en hoe bijvoorbeeld het (optionele) luik van de volkstelling (census) in Australië in de zomer van 2016 werd stilgelegd omwille van pogingen om censusdata te stelen. En het is duidelijk dat het daarbij om wel erg persoonlijke gegevens gaat. Ook privacy komt hier aan bod maar we gaan later uitgebreider op al deze thema’s ingaan.

Waarde uit data creëren: de realiteit

Vervolgens is er de waarde van de big data markt zelf die we voor een andere keer houden en, last but not least, natuurlijk die cruciale vraag hoe je nu van data naar kennis, acties en inzichten gaat.

Die vraag is zo essentieel dat we er een apart artikel zullen aan besteden. De cijfers over de capaciteiten van bedrijven om echt waarde te puren uit gegeven en hun informatieprocessen te stroomlijnen voor een doel zijn namelijk erg bedroevend.

Terwijl iedereen roept dat data moet behandeld worden als een business asset in dit digitale tijdperk en in de context van digitale transformatie, ongeacht het doel, is niemand er echt klaar voor. Hieronder vind je, ter afsluiting, enkele recente bevindingen.

Zijn we wel klaar om waarde uit data en informatie te puren?

In een artikel over een webinar dat we presenteerden voor Dow Jones en de vragen uit het ‘publiek’ over hoe je nu zorgt dat je maturiteit inzake data en informatie op peil is om niet bij de achterophinkende meerderheid te behoren gaan we aan de slag met adviezen om beter te doen in de praktijk. Hieronder die enkele bevindingen en daaronder de beloofde infografiek.

We zijn niet klaar voor de toename aan data

Tegen 2020 zal het digitale universum bestaan uit 44 biljoen gigabytes. Dat is een vertienvoudiging tegenover 2013. In de realiteit staat het gros van de bedrijven nog maar aan het begin van de ‘reis’ om waarde uit informatie te puren.

Bron: IDC (hier zie je trouwens ook hoe IDC zegt dat digitale leiders data moeten behandelen als een asset, ja, de geschiedenis herhaalt zich). Je leest meer over de analyse van het IDC onderzoek en veel meer in onze Engelstalige gids tot informatiebeheer.

We willen digitaal transformeren maar moeten nog digitaliseren

68 procent van de bedrijven zijn van plan om een transformatie uit te voeren, vond Forrester Consulting in onderzoek voor Alfresco. De realiteit is echter dat slechts een klein deel hun content- en informatie-centrische bedrijfsprocessen hebben gedigitaliseerd. Daar sta je doen.

Bron: persbericht naar aanleiding van het onderzoek (bekijk ook de andere data). Analyse op onze Engelstalige site.

De misleide meerderheid – waar je niet toe wilt behoren

Slechts 4 procent van ondernemingen is in staat de volle waarde uit hun informatie te puren vond PwC in onderzoek voor Iron Mountain.

Nu is het misschien ambitieus om alle mogelijke waarde te halen uit je data en informatie maar het wordt erger als we weten dat 43 procent weinig tastbare waarde weet te generen en 23 procent zelfs helemaal geen.

Research van PwC en Iron Mountain toont waar het probleem zit - bron en meer informatie
Research van PwC en Iron Mountain toont waar het probleem zit – bron en meer informatie

De grote meerderheid van bedrijven valt in de categorie van wat het rapport “de misleide meerderheid” noemt. En daar wil je geen deel van uitmaken. Hoe dat zo komt lees je in de analyse op onze Engelstalige website. Het onderzoek is trouwens ook gebaseerd op een informatiewaarde-index die PwC in het leven riep. Meer hier.

In toekomstige bijdragen zullen we zeker nog andere bevindingen publiceren, ook van buiten de wereld van analisten en ondernemingen. Zo hebben diverse onafhankelijke vakorganisaties feiten en cijfers die ons wel eens vaker hebben doen achterom vallen en denken dat de realiteit en de ‘preken’ echt wel heel erg verschillend zijn van de praktijk.

Tot slot nog dit: het aloude mantra van informatiebeheer geldt nu in alle aspecten van het digitale bedrijf en van digitale transformatie, ook in big data en ongeacht het doel. De juiste gegevens en informatie op de juiste plaats en via de juiste kanalen op het juiste moment voor de juiste mensen, processen en doelstellingen.

Infografiek: big data chaos

En zoals beloofd hieronder die ‘big data chaos’ infografiek (door Visual Capitalist) die ook al een voorsmaakje geeft van thema’s die nog aan bod zullen komen.

Big data infografiek - van big data chaos naar big data toepassingen - door Visual Capitalist
Big data infografiek – van big data chaos naar big data toepassingen – door Visual Capitalist

 

Bovenste afbeelding: Shutterstock – Copyright: Melpomene – Alle andere afbeeldingen behoren toe aan de vermelde bronnen.