Grote gegevens is een set tools die in staat zijn om een groot volume en verscheidenheid aan gegevens.
Omdat het een enorm volume en veel variatie heeft, kunnen deze gegevens niet worden geïnterpreteerd en verwerkt door conventionele software. Big data is ontstaan vanwege de wendbaarheid en het vermogen om gegevens in grote hoeveelheden en van verschillende typen te interpreteren.
Nadat deze gegevens zijn geanalyseerd en geïnterpreteerd, kunnen ze bijvoorbeeld worden gebruikt in bedrijfsstrategieën.
Waar is big data voor?
Big data is gemaakt met de doel om zoveel mogelijk gegevens te ontvangen, te identificeren en te interpreteren.
Het resultaat van dit proces stelt bedrijven in staat om de verzamelde informatie te gebruiken bij het creëren van nieuwe o.a. producten, klantenbinding, interpretatie van de interesse van de doelgroep situatie.
Bedrijven als Netflix en Facebook gebruiken big data om de interesse van hun gebruikers te peilen en bijvoorbeeld inhoud en producten te sturen die aansluiten bij hun browse-keuzes.
Daardoor behouden ze een groot aantal klanten, omdat ze altijd alert zijn op de wensen van degenen die van hun diensten gebruik maken.
Wat zijn de gegevenstypen die in big data worden aangetroffen?
gestructureerde gegevens
Dit zijn traditionele databases, georganiseerd in tabellen, kolommen en rijen. Dit soort gegevens zijn gemakkelijk te interpreteren, zoals teksten en cijfers.
Semi-gestructureerde gegevens
Het zijn gegevens met zowel gestructureerde als ongestructureerde patronen. Dit type gegevens is moeilijker te interpreteren omdat het een heterogene structuur heeft.
Enkele voorbeelden zijn audiobestanden en zelfs informatie die wordt gegenereerd door sociale netwerken.
Ongestructureerde gegevens
Dit is tegenwoordig het meest voorkomende gegevenstype, goed voor meer dan 80% van de gegevens in big data. Dit zijn bijvoorbeeld afbeeldingen, video's en documenten die een grote diversiteit aan bronnen hebben, waardoor ze niet gestandaardiseerd en eenvoudig te interpreteren zijn, met gestructureerde data.
De 5 V's van big data
Om de algemene structuur van big data te begrijpen, is het noodzakelijk om de functies te kennen van de 5 V's die deze toolset begeleiden. Zijn zij:
Volume
Het volume en dehoeveelheid data aanwezig in big data. Naar schatting zal er tegen 2020 wereldwijd ongeveer 1 miljard terabyte zijn opgeslagen.
Dit volume komt voort uit talloze soorten transacties op internet, zoals het verzenden van e-mails, winkelen bij online winkels, banktransacties, interacties op sociale netwerken, enzovoort.
Verscheidenheid
In big data verwijst de variëteit naar de verschillende soorten gegevens ontvangen door de hulpmiddelen.
De gegevens waren meestal gestructureerd en gemakkelijk te analyseren en te interpreteren. Naarmate de directe interacties op internet toenam, veranderden ook de datatypes snel, waaruit semi-gestructureerde en ongestructureerde data voortkwamen.
Snelheid
snelheid is onmiddellijke interpretatie van ontvangen gegevens.
Het is al bekend dat big data elke dag een grote hoeveelheid data heeft, echter een ander belangrijk kenmerk is de snelheid waarmee deze data de tools bereiken.
Aangezien interacties en transacties meestal onmiddellijk plaatsvinden, is de snelheid van analyse en interpretatie van deze gegevens het moet onmiddellijk zijn, vooral voor bedrijven om problemen in realtime op te lossen en concurrentievoordeel te behalen in de Marktplaats.
waarheidsgetrouwheid
Waarheid is de kracht van big data selecteer gegevens die nuttig en waarheidsgetrouw zijn om te gebruiken.
Met de enorme hoeveelheid verschillende structuren is het belangrijk om te identificeren welke van de binnenkomende gegevens nuttig en betrouwbaar is.
Waarachtigheid is een van de grootste en belangrijkste kenmerken van big data, omdat het het gebied is dat rechtstreeks van invloed is op wat wel of niet kan worden gebruikt in de strategie van bedrijven.
Deze gegevens moeten niet alleen waarheidsgetrouw zijn, maar ook overeenkomen met het tijdstip waarop ze zijn verzameld, aangezien gegevens die verwijzen naar gebeurtenissen in het verleden geen waarde hebben.
Waarde
De waarde verwijst het nut dat geïnterpreteerde data kan hebben voor een bedrijf.
Een bedrijf dat big data omarmt, heeft bijvoorbeeld data nodig die nuttig is en waarde heeft voor zijn strategie. Anders worden gegevens die niet logisch zijn of niet kunnen worden gebruikt, inefficiënt voor het bedrijf.
Waar kan big data worden toegepast?
Het gebruik van big data gaat veel verder dan het gebruik ervan in particuliere bedrijven. Deze grote hoeveelheid middelen is erin geslaagd de manier te veranderen waarop we ons door de stad verplaatsen, hoe we winkelen en zelfs hoe we epidemieën vermijden.
Hier zijn enkele situaties waarin big data kunnen worden toegepast.
Stedelijke mobiliteit
Met de onmiddellijke ontvangst en interpretatie van gegevens is de manier waarop we ons tegenwoordig binnen steden verplaatsen veel sneller en nauwkeuriger geworden.
Met de informatie die bijvoorbeeld door big data wordt ontvangen, is het mogelijk om te weten wat de beste manier is om daar te komen op uw bestemming, welk openbaar vervoer u moet nemen of weet zelfs hoe lang u er over doet aankomen.
Adverteren
Het is door big data dat grote bedrijven het gedrag van hun klanten en potentiële klanten kunnen analyseren en begrijpen.
Daarom wordt u tijdens het surfen op internet beïnvloed door producten en services op basis van uw zoekgeschiedenis.
Openbare en individuele gezondheidszorg
Big data kan vastleggen wat mensen zeggen of onderzoeken op internet. Dit helpt grote epidemieën te voorkomen, wanneer tools bijvoorbeeld vastleggen dat een grote aantal mensen in een bepaalde regio klaagt over griepsymptomen of andere ziekte.
Daarnaast is big data in staat om een DNA-sequentie in seconden te interpreteren, waardoor het mogelijk wordt ziekten te voorkomen of zelfs te genezen.
Zie ook de betekenis van Datawarehouse en Datamining.