Statistische analyse van een dataset

Statistische analyse van een dataset

Voor het vak Data-Lab moesten we gedurende een bepaalde periode data (dagelijks) verzamelen. Dit moesten we doen met een dataflow. We moesten dus met andere woorden data verzamelen via Microsoft forms en deze data kwam automatisch in een excel bestand terecht.

Ik had gekozen om mijn dagelijkse gezette stappen bij te houden samen met de reden waarom en mijn vermoeidheid uitgedrukt op een schaal van 1 tot 5. Voor het tweede deel van deze opdracht moesten we een statistische analyse uitvoeren op deze verzamelde data.


Hiervoor heb ik gebruik gemaakt van het programma: KNIME Analytics Platform

KNIME Analytics Platform is open source software met een visuele interface waarmee we analyses van verschillende complexiteitsniveaus kunnen maken. We kunnen dus data openen, mengen, analyseren en visualiseren zonder code te gebruiken.

We beginnen met een nieuwe workflow aan te maken op KNIME. We krijgen dus precies een blanco blad.

Nieuwe workflow

Door het slepen van de tools kunnen we data beginnen analyseren

Dit waren de verschillende tools die ik heb gebruikt op KNIME om mijn data te analyseren. In de CSV reader bevind zich onze data (het CSV bestand) hieruit trekken we verschillende pijlen ( connecties ) met de gekozen tools bijvoorbeeld: Histogram

Die geeft ons een histogram weer van onze data zonder dat wij de berekeningen moeten maken.

Data Analyse

Gebruikte digital tools:

Voor de data te verzamelen & bij te houden heb ik gebruik gemaakt van Excel (OneDrive) en Microsoft Forms

Voor de dataflow te maken: Power Automate

Voor het analyseren van de data: KNIME

“The goal is to turn data into information, and information into insight”

Carly Fiorina

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *