Data Quality Assessment Project

Project Overview

This project is an interactive Streamlit dashboard that analyzes and visualizes data quality metrics and error clusters in transactional datasets.
It helps identify issues in completeness, validity, and accuracy. This provides quick insights into where and how data quality problems occur.

For a live demo, check the streamlit app Here:

If the app is waking up after you open it, please wait 1–2 minutes.

The project also demonstrates the use of:

Python for data preprocessing
Pandas & NumPy for quality checks
Seaborn & Matplotlib for visual insights
Streamlit for interactive visualization and data exploration

Use Case

This project is ideal for:

Data Analysts validating data pipelines
BI professionals monitoring data quality in reports
Organizations seeking proactive error tracking in transaction systems

Features

Data Quality Metrics

Completeness and Validity per field
Overall Accuracy and Error Rate summary

Interactive Filtering

Filter data by Location and Payment Method

Visual Error Insights

Error rate by Payment Method
Error rate by Location
Error Cluster Heatmap (Location-Payment Method)
Error Rate Trend over Time

Data Exports

Download filtered dataset (CSV)
Download only error records (CSV)

Dataset

The sample dataset used in this project is dirty_cafe_sales.csv (in project folder), a transactional dataset containing:

Transaction Date
Location
Payment Method
Quantity
Price Per Unit
Total Spent

It intentionally includes missing, invalid, and inconsistent values to demonstrate real-world data quality issues.

Tech Stack

Category	Tools
Programming	Python
Data Handling	Pandas, NumPy
Visualization	Matplotlib, Seaborn
Web App	Streamlit
Deployment	Streamlit Cloud
Notebook Analysis	Jupyter Notebook

Update & Version Log

Version 1.0 (October 2025)

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
.gitignore		.gitignore
Data Quality Assessment.ipynb		Data Quality Assessment.ipynb
README.md		README.md
data_quality_app.py		data_quality_app.py
dirty_cafe_sales.csv		dirty_cafe_sales.csv
requirements.txt		requirements.txt
runtime.txt		runtime.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data Quality Assessment Project

Project Overview

Use Case

Features

Dataset

Tech Stack

Update & Version Log

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Data Quality Assessment Project

Project Overview

Use Case

Features

Dataset

Tech Stack

Update & Version Log

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages