In dit artikel gaan we na wat Big Data is, hoe het in de praktijk werkt en hoe bedrijven het kunnen toepassen. Deze post maakt deel uit van een serie die ik schrijf over Industrie 4.0, waarin we antwoord geven op vragen als: “Wat is IoT?“, “Hoe creëer je een datagedreven organisatie?“, en “Wat is Industrie 4.0?“.

Wat is Big Data?

In het kort verwijst het naar reeksen gegevens die te groot of te complex zijn om te worden verwerkt, geanalyseerd of gebruikt met standaardmethoden, volgens Oxford Learner’s Dictionaries.

Big Data is gebaseerd op digitaal beschikbare gegevens, waarbij het gaat om hoeveelheden, tekens of symbolen die door computers worden bewerkt, opgeslagen, verzonden als elektrische signalen en vastgelegd op magnetische, optische of mechanische media.

Welke soorten Big Data kunnen we onderscheiden?

Big Data kunnen worden onderverdeeld in drie verschillende types: gestructureerde Big Data, ongestructureerde Big Data en semi-gestructureerde data.

Gestructureerde Big Data

Gestructureerde gegevens zijn alle gegevens die kunnen worden opgeslagen, geraadpleegd en verwerkt in een vooraf gedefinieerd formaat, zoals gegevens in tabellen in een database. Wanneer het gaat om grote hoeveelheden gestructureerde gegevens, spreken we van gestructureerde Big Data.

Ongestructureerde Big Data

Anderzijds zijn ongestructureerde gegevens gegevens waarvan het formaat of de structuur onbekend is. Ongestructureerde gegevens zijn niet alleen groot in volume, maar ook lastig te verwerken. Een typisch voorbeeld van ongestructureerde gegevens is een gegevensbron die eenvoudige tekstbestanden, afbeeldingen en video’s bevat, zoals de zoekresultaten van Google. Zoekresultaten voor een zoekterm kunnen zowel tekst, afbeeldingen als video’s bevatten.

Semigestructureerde Big Data

Semi-gestructureerde Big Data bevat beide soorten gegevens. Het gaat om gegevens die gestructureerd zijn in een vast formaat, maar niet gedefinieerd, bijvoorbeeld in een tabel. Een voorbeeld hiervan zijn gegevens in een XML-bestand waarvan het formaat in Excel moet worden gedefinieerd.

Wat zijn de hoofdkenmerken van Big data?

Big Data worden gekenmerkt door de eigenschappen Volume, Verscheidenheid, Snelheid en Variabiliteit.

Volume

De naam Big Data is afgeleid van de grote hoeveelheid gegevens. De hoeveelheid gegevens is een cruciale factor bij het bepalen van de waarde van een dataset.

Verscheidenheid

De verscheidenheid van Big Data wordt bepaald door zowel de aard van de gegevens (gestructureerd/ongestructureerd) als de bronnen van de gegevens. Terwijl de bronnen oorspronkelijk bestonden uit spreadsheets en databases, kan de verscheidenheid van Big Data worden uitgebreid met gegevens in de vorm van e-mails, foto’s, controleapparatuur, PDF’s, audio, enzovoort.

Snelheid

Snelheid verwijst naar de snelheid waarmee gegevens worden gegenereerd uit verschillende bronnen, zoals bedrijfsprocessen, applicatielogboeken, netwerken, sociale mediasites, sensoren, mobiele apparaten en meer. Dit genereert een enorme en continue stroom van gegevens op hoge snelheid.

Hoe werkt Big Data in de praktijk en hoe kunnen ze in het bedrijfsleven worden toegepast?

Hier volgen enkele praktische voorbeelden:

Noodgevallen informatie

In New York City wordt 911-noodinformatie verrijkt met Big Data. Via partnerschappen met organisaties als Apple, Android en Uber kunnen relevante gegevens van de telefoon en wearables van een patiënt tijdens crises naar hulpdiensten worden gestuurd. Dit omvat GPS-locatie en real-time sensorgegevens, waardoor hulpdiensten sneller en effectiever kunnen reageren.

Netflix – House of Cards

De voormalige hit Netflix-serie House of Cards kwam tot stand met behulp van Big Data. Uit de analyse van Netflix bleek dat kijkers van de oudere Britse serie House of Cards ook vaak keken naar films van David Fincher met Kevin Spacey in de hoofdrol. Op basis daarvan konden ze voorspellen dat een combinatie van deze drie factoren tot een hitserie zou leiden. Jaren later bepaalt Big Data niet alleen in welke films en series Netflix investeert, maar ook hoe series aan abonnees worden gepresenteerd. Op basis van de kijkgeschiedenis (inclusief de punten waarop gebruikers pauzeren) wordt bepaald welke thumbnails op de homepage “Populair op Netflix” verschijnen.

Skupos: gemak voor gemakswinkels

Het Amerikaanse Skupos-platform verzamelt transactiegegevens van 7.000 verschillende buurtwinkels. Dit komt neer op miljarden transacties per jaar, die winkeliers inzicht geven in het bepalen van bestsellers en het adviseren van bestellingen per locatie. Ondertussen kunnen distributeurs de vraag voorspellen en kunnen merken een constante stroom productgegevens analyseren.

Bekijk al onze Data Analyse & AI/ML oplossingen

Als je het volledige potentieel van Big Data wilt ontsluiten, is Syndustry er om je te helpen slagen. Met onze gespecialiseerde Data Analytse diensten en AI/ML technologieën, bieden wij de expertise die je nodig hebt om waardevolle inzichten te verkrijgen en het maximale uit je Big Data inspanningen te halen.

(Data) Analyse

Verbeter de efficiëntie, verbeter de besluitvorming en vergroot de zichtbaarheid met de kracht van data.

Artificiële Intelligentie & Machine Learning

Maak gebruik van de kracht van AI en ML om activiteiten te optimaliseren en bedrijfsgroei te stimuleren.

Vraag je je af of jouw organisatie baat kan hebben bij Big Data?

Met zijn uiteenlopende toepassingen heeft Big Data het potentieel om waardevolle inzichten te ontsluiten en groei te stimuleren. Syndustry kan je helpen de mogelijkheden te verkennen. Boek een vrijblijvend gesprek met ons via onderstaande widget om te bespreken hoe Big Data voor jouw organisatie zou kunnen werken.