Home » Technology » Hoe u Big Data in Big Results verandert

Hoe u Big Data in Big Results verandert

Tech Page One

Verder kijken dan de hype: big data brengt echt voordeel

Big data gebruiken

 

De IT-wereld bedenkt voortdurend nieuwe buzzphrases, vaak samengesteld door marketingteams, terwijl de IT-afdelingen zich afvragen of de gebruikte terminologie geen lege retoriek is.

Big data is er daar een van. De term klinkt bijna gezellig, maar de geruststellende aard van het begrip is nogal misleidend – hiervoor is keiharde zakelijke besluitvorming nodig.

Om echt zakelijk voordeel te hebben, moeten bedrijven ervan overtuigd zijn dat big data meer dan alleen een hype is. Dat is niet bepaald vlot gegaan – in de beginfase leek het erop dat organisaties niet in de technologie investeerden, maar dat is nu wel anders.

Big data als investering

Volgens Frank Buytendijk van Gartner (in een rapport van oktober 2015), verbergt de hype eigenlijk wat er werkelijk aan de hand is. “Terwijl iedereen over big data praat, is de invoering simpelweg al gaande in alle sector- en bedrijfsfuncties. Volgens een recent rapport van Gartner investeert 64%van de respondenten al in big data of staat het op de rol voor de komende 12 tot 24 maanden.”

Als twee derde van de bedrijven die kant op lijkt te gaan, is er reden te denken dat deze technologie een blijvertje is. Maar nog is het niet duidelijk wat big data precies betekent – het begrip levert nog steeds gefronste wenkbrauwen op.

Big data heeft last van dezelfde handicap als cloudcomputing had in zijn beginperiode, namelijk het ontbreken van een standaarddefinitie voor deze technologie. Het is gemakkelijk om te zeggen dat het gaat om een nieuwe naam voor een grote dataset, maar dat is te kort door de bocht. Een realistischer definitie is: “het verzamelen en analyseren van een gemengde dataset, met gestructureerde en ongestructureerde gegevens, om een samenhangende bedrijfsstrategie te ontwikkelen”.  Het gaat om de combinatie van zaken als omzetcijfers, opmerkingen in sociale media en YouTube-video’s, die samen nauwkeurige resultaten kunnen geven.

De drie V’s

Deskundigen op het gebied van big data gebruiken vaak ‘de drie V’s’ om uit te leggen hoe het werkt. De V staat voor velocity, variety en volume (snelheid, verscheidenheid en volume). Dit gaat over de snelheid waarmee je data kunt benaderen en bevragen, de verscheidenheid van de te onderzoeken data en de omvang van de database. Soms wordt een vierde element toegevoegd, veracity (waarheidsgetrouwheid), maar je moet ervan uitgaan dat gegevens kloppen. Als gegevens niet accuraat zijn, levert dit altijd problemen op.

We zien voordelen voor bedrijven als het Internet of Things een rol gaat spelen. De toename van met elkaar verbonden apparaten gaat een overweldigende hoeveelheid gestructureerde en ongestructureerde gegevens opleveren. Dat geldt niet alleen voor specifieke bedrijfstakken, maar dit raakt iedere organisatie die grote hoeveelheden data verwerkt.  De gegevens hoeven niet altijd van klanten te komen. Lokale overheden bijvoorbeeld verzamelen steeds meer gegevens over hun burgers om lokale diensten beter aan te bieden.

Werken met data-analyse in de gezondheidszorg

Werken met big dataDe zorgsector is een goed voorbeeld van hoe de wereld op het punt staat te veranderen. Met elkaar verbonden apparaten veranderen de manier waarop de zorg werkt – en dat leidt ook tot veranderingen in gegevensverwerking.

Een van de belangrijkste problemen waarmee artsen worden geconfronteerd, is de neiging van patiënten om weinig waarheidsgetrouw te zijn bij vragen over zaken als alcoholgebruik of lichaamsbeweging. De regel is altijd geweest dat je het aantal consumpties dat de patiënt zegt te nemen, verdubbelt. De komst van draagbare apparaten heeft dat veranderd. Artsen kunnen nu monitoren hoeveel drankjes iemand heeft gehad, hoeveel stappen zijn gezet, enzovoort.

Deze apparaten kunnen ook worden gebruikt om medische omstandigheden die niet door eigen toedoen worden veroorzaakt, in de gaten te houden. Met hartslag- en diabetesmonitoren bijvoorbeeld.  Deze monitoren kunnen aangeven of een patiënt zijn of haar medicatie al dan niet heeft ingenomen. Dit is allemaal informatie van levensbelang.

De echte kracht ligt in het combineren van informatie van deze verschillende bewakingsapparaten met de overvloed aan medische tests die zijn uitgevoerd als onderdeel van gewone onderzoeken, zoals bijvoorbeeld röntgenfoto’s en bloedonderzoeken.  Deze dossiers kunnen worden gecombineerd om een waardevol beeld te krijgen van de gezondheid van een persoon.

Er is wel een probleem met deze informatie. Veel van de verzamelde gegevens zijn opgeslagen in patiëntendossiers en er is geen gemakkelijke manier om die informatie te delen.  Dit is een schoolvoorbeeld van hoe big data kan helpen. Gegevens van verschillende apparaten en in verschillende formaten kunnen worden opgevraagd om medisch personeel informatie te geven, maar ook om onderzoek te doen en om gezondheidsmanagers te informeren over waar afzonderlijke diensten op gericht moeten worden.

Een van de bedrijfstakken die al een grootgebruiker is van big data, is de detailhandel. Alle grote supermarktketens willen dolgraag weten wat hun klanten kopen, en belangrijker, wat zij gaan kopen.  Nogmaals, beslissingen worden niet alleen genomen op basis van verkoopcijfers, maar door sociale media te volgen, en zelfs door opgeslagen camerabeelden te gebruiken om te observeren hoe klanten naar producten kijken.  Door meer gegevens over klanten te verzamelen, is de detailhandel in staat weloverwogen beslissingen te nemen bij de inkoop, presentatie en verkoop van de producten. Volgens McKinsey zijn organisaties die datagestuurde beslissingen gebruiken 5% productiever en maken zij 6% meer winst dan concurrenten die dat niet doen.

Maar big data is meer dan een middel om de besluitvorming binnen organisaties te verbeteren.  Volgens Buytendijk van Gartner, richt minder dan de helft van de big data-projecten zich op de besluitvorming – maar helpt het bedrijven wel om naar nieuwe processen te kijken. Hieronder vallen ook werken aan

  • Marketing en verkoopgroei
  • Verbetering van de operationele en financiële prestaties
  • Risico- en compliance management
  • Producten- en dienstenvernieuwing
  • Direct/indirect data te gelde maken

Er zijn dus volop voordelen om de big data-route te volgen. De hamvraag is daarom hoe een onderneming zich hierop voorbereidt.

Het beginpunt zal altijd het datacenter zijn. De eerste beslissing is de keuze voor een cloudvariant of niet. Weet dat het datavolume blijft groeien: zorg dat het gekozen systeem dit aankan. Een publieke cloudtoepassing is schaalbaarder en piekbestendiger, maar bij twijfel over de beveiliging in de publieke cloud is een hybride aanpak waarschijnlijk de beste optie.

De bedrijfsopslagcapaciteit moet vrijwel zeker worden vergroot omdat het datavolume toeneemt.  Cisco verwacht dat tegen 2019 de hoeveelheid data gecreëerd door apparaten in het ‘internet of everything’ 269 keer hoger is dan de hoeveelheid data die van eindgebruikersapparaten naar datacenters wordt verzonden en 49 keer hoger is dan het totale verkeer van datacenters. Dit bedrijf voorspelt ook dat het dataverkeer van deze apparaten zal toenemen van 134,5 zettatbytes in 2014 naar 507,5 ZB in 2019.

Daarom moet eerst de infrastructuur worden aangepakt: de reken-, opslag- en netwerkcapaciteit in de organisatie moet worden vergroot. Dat is echter maar een deel van het verhaal bij het werken met big data. Het is ook nodig om software te upgraden om de verandering aan te kunnen.

Drie kerngebieden hebben hierbij aandacht nodig: geavanceerde analyses, data-integratie, en databeheer.

Geavanceerde analyses

Deze vormen het hart van big data. Door het gebruik van geavanceerde analytische software kun je klantvoorkeuren herkennen en gedrag voorspellen. De software kan ook voor beveiliging worden gebruikt om patronen te kunnen zien die wijzen op frauduleus handelen.

Data-integratie

Hoe kunnen gegevens van een reeks van verschillende databronnen worden geïntegreerd? Een bedrijf in de gezondheidszorg dat aantekeningen van artsen samenvoegt met data van verbonden apparaten; het warenhuis dat verkoopgegevens samenvoegt met chatgegevens van sociale media en video-opnamen – dit zijn allemaal gegevens die bestudeerd moet worden. Deze integratie moet ook rekening houden met de mogelijkheid dat de gegevens afkomstig kunnen zijn van toepassingen op locatie en in de cloud. Niet alleen is het nodig om gegevens te beheren van verschillende bronnen, maar dat moet ook met grote snelheid gebeuren – snelheid is immers een van de bepalende kenmerken van het werken met big data. Hoe sneller informatie een onderneming bereikt, hoe eerder deze kan reageren.

Databeheer

Big data-systemen genereren per definitie veel data en je moet daarom krachtige systemen hebben voor opslag, backup en beveiliging van de door de systemen geproduceerde gegevens. Dit moet op een kostenefficiënte manier gebeuren. De kosten van het beheer moeten opwegen tegen de financiële baten.

Data warehouses – er zit nog leven in deze technologie

Er is een stroming die zegt dat de opkomst van big data betekent dat bedrijven niet langer een data warehouse hoeven te onderhouden.  Dit is misleidend. Het is effectiever om voort te bouwen op bestaande data warehouses dan de investering in de bestaande technologie teniet te doen.  Zo hebben bijvoorbeeld Dell en Microsoft samengewerkt aan een ‘Data Warehouse Fast Track’-oplossing die het voor bedrijven eenvoudiger maakt hun op dit gebied bestaande investering te gebruiken.

Organisaties hebben dus voldoende manieren om big data-analyses in hun bedrijfsomgeving in te voeren, maar de grote vraag is of zo’n investering loont.

Het perspectief van de klant

Het gebruik van big data kan letterlijk een kwestie van leven of dood zijn.  Het ziekenhuis van de University of Iowa (UI) gebruikt de techniek om real-time voorspellingen te doen over de waarschijnlijkheid dat een patiënt een postoperatieve infectie ontwikkelt. Door een gefundeerd oordeel te kunnen geven over wie aanleg had voor dergelijke infecties, hebben chirurgen het aantal infecties met 58% omlaag weten te brengen.

Dat postoperatieve wondinfecties zich nog voordoen lijkt meer iets uit de negentiende eeuw, maar het is een ernstig probleem dat langdurige ziekenhuisopnames en, tragisch genoeg, ook de dood kan veroorzaken.

De directeur van de afdeling gastro-intestinale, minimaal invasieve en bariatrische chirurgie, Dr. John Cromwell, stelt dat een groot percentage postoperatieve wondinfecties is te voorkomen door het gebruik van ‘voorspellende analyse’.

Dit redt niet alleen levens, maar geeft ook een kostenbesparing – het ziekenhuis heeft berekend dat postoperatieve wondinfecties de gezondheidszorg jaarlijks al 10 miljard dollar kosten.  De toepassing van realtime predictive analytics heeft die kosten aanzienlijk verlaagd.

“Door het gebruik van deze instrumenten en andere methoden hebben we de postoperatieve wondinfecties met 58% verminderd,” aldus Cromwell. “Dat is een revolutionair concept in gastro-intestinale chirurgie.”

Om dit te bereiken, moest het medisch team een nieuwe benadering gebruiken waarbij aandachtiger gekeken werd naar gegevens die normaal niet worden gezien als onderdeel van het herstelproces. “We kunnen informatie uit elektronische patiëntendossiers (EPD’s) en andere bronnen binnen de organisatie, inclusief realtime data van de operatiekamer, om vast te stellen hoe groot de kans is dat patiënten een postoperatieve wondinfectie oplopen,” voegt Cromwell toe.  “Dit geeft ons de mogelijkheid de zorg die we in de operatiekamer geven, aan te passen en te individualiseren.”

Deze accentverschuiving heeft een verandering in de onderliggende infrastructuur met zich meegebracht. Het medisch team heeft meer rekenkracht én nieuwe analytische gereedschappen nodig.   Jose Maria Monestina, senior applicatieontwikkelaar van het universiteitsziekenhuis, kreeg de verantwoordelijkheid voor het uitrollen van deze techniek.

Dit was geen eenvoudige opgave omdat de dossiers in allerlei verschillende systemen en in niet vergelijkbare databases waren opgeslagen. Monestina moest al deze gegevens samenbrengen in een gemeenschappelijke dataset met ingebedde analytische hulpmiddelen. “Dit proces heeft het ons mogelijk gemaakt voorspellende analyse uit te voeren in een realtime omgeving om zo de gezondheidszorg te verbeteren en de kosten te verlagen,” zegt Monestina.

Het probleem van deze benadering was dat de bestaande infrastructuur van het ziekenhuis de toegenomen hoeveelheid data die het medisch team moest hanteren niet meer aankon, noch qua opslag noch qua overdracht aan de behandelende medici.  Het ziekenhuis moest daarom upgraden naar een krachtiger systeem maar nog wel kunnen werken met de bestaande IT-architectuur.

Dell heeft daaraan voldaan en heeft zo de werkwijze van het team veranderd. Het gebruikt nu een analytisch platform dat de data samenvoegt, voorbereidt voor modellering en vervolgens dat model toepast. “Het zit allemaal in één pakket,” legt Monestina uit. “We kunnen het datamodel op een server opslaan en dan hergebruiken. De datamodellen kunnen met andere personen in de onderzoeksgroep worden gedeeld.” De kracht van mobiliteit is een onderdeel van deze opzet. Niemand is gebonden aan een specifieke pc of server. Deze modellen kunnen draaien met een mobiele app of met een webbrowser en geven gelijk toegang tot de resultaten.”

Alles is nu anders. Het chirurgisch team kan nu meer doen dan alleen niet-vergelijkbare gegevens (EPD’s, inschrijvings- en patiënttevredenheidsgegevens) analyseren. Het team kan die gegevens ook in de operatiekamer samenvoegen met live patiëntgegevens om datagestuurde beslissingen te nemen over de individuele behandeling.

“Big data en voorspellende analyse transformeren uitkomsten van vrijwel alle aspecten van de patiëntenzorg”, aldus Cromwell. “We zien veel gebieden waarop dit nuttig kan zijn, zoals bij de medicijnbezorging, volksgezondheid, patiëntenstroombeheer en elk ander geneeskundig aspect dat ons in staat stelt een hoogwaardige gezondheidszorg te leveren.”

Voor meer informatie over de mogelijkheden van big data, klikt u hier.

 

Maxwell Cooter

Maxwell Cooter

Max is een freelance journalist en schrijft over een breed scala aan IT- onderwerpen. Hij was de oprichtende redacteur van Cloud Pro, een van de eerste cloud publicaties. Hij heeft ook IDG's Techworld opgericht en daarvoor was hij redacteur van het Netwerk Week. Als freelancer, heeft hij bijgedragen aan de IDG Direct, SC Magazine, Computer Weekly, Computer Reseller News, Internet tijdschrift, PC Business World en vele anderen. Hij heeft ook gesproken op vele conferenties en als commentator gewerkt voor BBC, ITN en computer TV-zender CNBC.

Laatste Artikels:

 

Tags: Technology