🔧 Tools: Microsoft Fabric | Eventstream | Delta Lake | Dataflow Gen2 | Power BI | Eventhouse | Activator | Trello
We zijn begonnen met een diagram om de stappen van het project duidelijk te visualiseren.
Als team gebruikten wij Trello om taken toe te wijzen en sprints te plannen. Hierdoor konden we het project op tijd afronden.
We hebben taxigegevens in real-time ontvangen via Eventstream. Elke keer als een taxi een actie deed (zoals rit begonnen of rit beëindigd), kwam er een gebeurtenis binnen. Deze data werd onbewerkt opgeslagen in de Bronze-laag van Delta Lake.
Voor we naar de Silver-laag gingen, maakten we de data schoon met PySpark in een notebook.
We hebben:
Ongeldige of onvolledige rijen verwijderd
Datum/tijd-formats aangepast
Alleen nuttige kolommen geselecteerd
Met Dataflow Gen2 hebben we de Silver-data gemodelleerd in de Gold-laag met een ster-schema (star schema).
Voorbeeldtabellen: dim_date2, dim_location, dim_vendor, fact_trip
We verbonden de Gold-data met Power BI en maakten een interactief dashboard.
Filters per datum, locatie en taxi
KPI's zoals totaal aantal ritten, gemiddelde afstand
Kaarten met locatie-inzichten
We gebruikten Eventhouse om de live datastroom te monitoren.
Zo konden we eventuele vertragingen of problemen direct zien.
Met Activator maakten we automatische meldingen, bijvoorbeeld:
Waarschuwing als een taxi meer dan 5 ritten per uur voltooit
Extra controle voor lange ritten 's nachts
Zo konden we niet alleen rapporteren, maar ook proactief reageren op dat










