Wat te doen met de groeiende databerg? /reageer

Wat te doen met de groeiende databerg?
  • door: Redactie MT
    over: privacy, strategie, businesstrends
    op: 3 april 2012
  • De markt voor het beheren van ruwe datastromen is nu zo'n 150 miljard dollar waard

  • En databergen blijven groeien: YouTube verwerkt elke minuut 48 uur aan videomateriaal, Twitter ruim een half miljard berichtjes per dag

We schreven het eerder al: big data is de nieuwe modeterm in de IT-wereld. Een duik in de vier grote-gegevens-vragen waar iedereen het antwoord op moet weten, plus enkele voorbeelden van bedrijven die met een goede toepassing hun data ten gelde hebben gemaakt.

Hetzelfde als business intelligence?

Ja en nee. Big data is een containerbegrip voor de enorme berg aan beschikbare digitale gegevens. Plus de belofte dat je uit deze berg allerlei waardevolle informatie kunt halen. Voorheen werd dat datamining of KDD (knowledge discovery in databases) genoemd, en de eruit voortkomende kennis business intelligence. Wordt deze kennis gebruikt om toekomstige ontwikkelingen te voorspellen, dan spreek je van predictive analytics.

WalMart

Absolute voorloper op het gebied van commerciële Big Data-toepassingen is Wal-Mart. RetailLink, het voorraad­managementsysteem van WalMart, vertelt leveranciers precies hoe de verkoop van hun producten verloopt. Diverse grote leveranciers zijn zelfs volledig verantwoordelijk gemaakt voor het voorraadbeheer, en verkopen hun product pas bij de kassa’s van WalMart. Zo is de supermarkt veranderd in een zeer efficiënt gerund pakhuis.

Datamining en business intelligence waren ooit een hype, maar de resultaten van de specialistische systemen vielen vaak tegen. Nu de databergen van ­bedrijven exponentieel groeien, is big data de nieuwe vlag waaronder de ict-sector zichzelf heeft verenigd.
Die datagroei is indrukwekkend. Twintig jaar geleden was praten over terabytes, oftewel 1.000 gigabyte aan informatie, als praten over tijdreizen.

Nu is het de gewoonste zaak van de wereld. YouTube verwerkt elke minuut 48 uur aan videomateriaal, Twitter meer dan een half miljard berichtjes per dag. En het bedrijfsleven doet vrolijk mee. Supermarktketen WalMart voegt elk uur ruim 1 miljoen klanttransacties toe aan een database met nu al ruim 2,5 petabyte aan gegevens, omgerekend een 4,5 kilometer hoge toren aan cd-romschijfjes.

Kaggle

Kaggle, de startup van de Australische econoom Anthony Goldbloom, organiseert competities waarbij de deelnemers tot bijzondere voorspellingen moeten komen door grote datasets te analyseren. Sinds april 2010 bracht Kaggle enkele tienduizenden data-analisten bijeen die streden in meer dan 30 competities. Nadat een ­uni­versiteit de genetische gegevens van een groot aantal HIV-patienten bijeenbracht, wist een team de progressie van het virus bijvoorbeeld binnen anderhalve week met 70 procent zekerheid te voorspellen. De universiteitsonderzoekers deden zelf vier jaar over deze ‘academische mijlpaal’.

Volgens marktonderzoeker IDC genereert de wereld dit jaar 2.700 exabytes aan digitale informatie, oftewel 2.700 miljard gigabyte, een hoeveelheid die jaarlijks met zo’n 60 procent groeit. Opslagmogelijkheden groeien zo snel dat bewaren nu goedkoper is dan verwijderen.

De uitdaging is om uit die enorme brij aan informatie waardevolle patronen te destilleren. Koren op de molen van softwarereuzen als Oracle, IBM, SAP, Exact en Microsoft, dat hiervoor onlangs een nauwe samenwerking met Logica bekendmaakte. Ruwe datastromen ­managen en analyseren vormt een markt die momenteel zo’n 150 miljard dollar waard is, schat IBM. In 2015 moet dat 208 miljard dollar zijn.

Wat kun je er mee?

“Inefficiënties of zwakke punten in productieprocessen signaleren”, stelt Edo Roos Lindgreen, UvA-hoogleraar IT & Auditing en partner bij KPMG. “En dat kan leiden tot besparing, risicobeperking en winstoptimalisatie.”

Volgens het McKinsey Global Institute zou de Amerikaanse gezondheidszorg zo een besparing van 300 miljard kunnen realiseren, terwijl de omzet van retailers met liefst 60 procent zou kunnen stijgen. De trend gaat van controle achteraf naar het voorspellen van de toekomst. Door analyse van duizenden websites, blogs en sociale netwerken voorzag Google Trends bijvoorbeeld zeer accuraat het verloop van de vogelgriep en de Amerikaanse presidentsverkiezingen.

Capital One

Algoritmes bepalen welke pagina ­bezoekers van de website van creditcardmaatschappij Capital One te zien krijgen. In tweetiende van een seconde stelt de ‘predictive optimization engine’ met een ‘grote mate van nauwkeurigheid’ vast tot welke sociale en inkomensklasse de bezoeker behoort, en welke (creditcard)aanbieding daarbij hoort. Daartoe wordt een database met onder meer demografische informatie realtime gekoppeld aan andere informatie, bijvoorbeeld welke websites de bezoeker daarvoor heeft bezocht. Voor de onwetende klant kan dat onder andere betekenen dat hij niet voor bepaalde kaarten in aanmerking komt of een hogere rente moet betalen over zijn uitstaande tegoed.

Hal Varian, befaamd hoofdeconoom van Google, verwacht ‘revolutionaire veranderingen op economie- en marketing­gebied’ door dit soort predictive analytics. “Mensen hebben vaak ideeën en voorgevoelens over de toekomst”, stelt de voormalig hoogleraar information economics. “Maar als je eenmaal data hebt, kun je voorspellingen toetsen en goed onderbouwde toekomstbeslissingen nemen.”

Wie dat kunstje beheerst, kan de concurrentie ver achter zich laten, blijkt uit het recente onderzoeksrapport Big Data: Harnessing a game-changing asset van de Economist Intelligence Unit. De waarde van beschikbare data binnen een bedrijf – inmiddels data equity gedoopt – stijgt hard. Niet gek dus dat uit recent onderzoek van de Erasmus Universiteit en PwC blijkt dat 6 op 10 professionele analisten en beleggers meer inzicht willen in de waarde ervan. Financiële rapportages zouden op die behoefte moeten worden aangepast, stellen zij dan ook.

Op de volgende pagina: waarom merken we zo weinig, en hoe zit het met privacy?