Statistische analyse van een dataset
Voor het vak Data-Lab moesten we gedurende een bepaalde periode data (dagelijks) verzamelen. Dit moesten we doen met een dataflow. We moesten dus met andere woorden data verzamelen via Microsoft forms en deze data kwam automatisch in een excel bestand terecht.
Ik had gekozen om mijn dagelijkse gezette stappen bij te houden samen met de reden waarom en mijn vermoeidheid uitgedrukt op een schaal van 1 tot 5. Voor het tweede deel van deze opdracht moesten we een statistische analyse uitvoeren op deze verzamelde data.
Hiervoor heb ik gebruik gemaakt van het programma: KNIME Analytics Platform
KNIME Analytics Platform is open source software met een visuele interface waarmee we analyses van verschillende complexiteitsniveaus kunnen maken. We kunnen dus data openen, mengen, analyseren en visualiseren zonder code te gebruiken.
We beginnen met een nieuwe workflow aan te maken op KNIME. We krijgen dus precies een blanco blad.
Door het slepen van de tools kunnen we data beginnen analyseren
Dit waren de verschillende tools die ik heb gebruikt op KNIME om mijn data te analyseren. In de CSV reader bevind zich onze data (het CSV bestand) hieruit trekken we verschillende pijlen ( connecties ) met de gekozen tools bijvoorbeeld: Histogram
Die geeft ons een histogram weer van onze data zonder dat wij de berekeningen moeten maken.
Gebruikte digital tools:
Voor de data te verzamelen & bij te houden heb ik gebruik gemaakt van Excel (OneDrive) en Microsoft Forms
Voor de dataflow te maken: Power Automate
Voor het analyseren van de data: KNIME
“The goal is to turn data into information, and information into insight”
Carly Fiorina