Multi-Class Image Segmentation using U-Net (Drone Dataset)

Overview

This project implements a multi-class semantic segmentation pipeline using a U-Net architecture in TensorFlow. It is designed for drone imagery and supports segmentation into multiple classes such as:

Background
Water
Vegetation
Structure (buildings)

The pipeline includes:

Data preprocessing (RGB masks → label masks)
Augmentation using Albumentations
Custom Dice + CrossEntropy loss
Mean IoU evaluation metric
Training visualization (loss, accuracy, IoU)
Prediction on new images using a separate script

Dataset Download Link

https://drive.google.com/uc?id=1b88NGOW-7EgNQ1LLI0UHXE-KLOzaqnGm

Project Structure

├── main.py              # Training pipeline
├── predict.py           # Inference script
├── data.zip             # Dataset (images + masks)
├── processed/           # Preprocessed dataset (auto-generated)
├── predictions/         # Output predictions
├── final_model.h5       # Saved trained model
└── README.md

GPU Setup (CUDA + cuDNN)

To use GPU acceleration, you need to install:

NVIDIA GPU drivers
CUDA Toolkit
cuDNN (CUDA Deep Neural Network library)

1. Check GPU

Run:

nvidia-smi

If your GPU is listed, proceed.

2. Install CUDA

Download CUDA Toolkit from: https://developer.nvidia.com/cuda-downloads

Install a version compatible with your TensorFlow version.

3. Install cuDNN

Download cuDNN from: https://developer.nvidia.com/cudnn

Steps:

Extract the cuDNN folder
Copy contents into CUDA directory:

bin → C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\bin
lib → ...\lib
include → ...\include

4. Set Environment Variables

Add CUDA paths to system environment variables:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\libnvvp

5. Verify TensorFlow GPU

Run Python:

import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))

If GPU appears → setup is correct.

Virtual Environment Setup

Create and activate a virtual environment:

Windows

python -m venv .venv
.venv\Scripts\activate

Linux / Mac

python3 -m venv .venv
source .venv/bin/activate

Install Requirements

Install dependencies:

pip install -r requirements.txt

If you don’t have a requirements file, install manually:

pip install tensorflow opencv-python numpy matplotlib albumentations scikit-learn seaborn

Dataset Format

Your dataset should be structured inside data.zip:

input/
   ├── original_images/
   │      img1.jpg
   │      img2.jpg
   ├── masked_images/
          img1.jpg
          img2.jpg

Each mask is a color-coded segmentation image
Colors are mapped to class labels during preprocessing

Training the Model

Run:

python main.py

This will:

Extract dataset
Preprocess images and masks
Train the U-Net model
Save model as final_model.h5
Display training graphs (loss, accuracy, IoU)

Metrics

The model reports:

Accuracy (pixel-wise)
Mean IoU (Intersection over Union)

Prediction (predict.py)

This script performs inference on new images.

Input Options

You can use:

A single image
A folder of images

Modify in predict.py:

INPUT_PATH = "test_images"

Run Prediction

python predict.py

Output

Predictions are saved in:

predictions/
   image1_mask.png
   image2_mask.png

Each output includes:

Segmented mask (colored)
Optional visualization (original + prediction)

Class Mapping

Label	Class	Color (RGB)
0	Background	(169,169,169)
1	Water	(14,135,204)
2	Vegetation	(124,252,0)
3	Structure	(155,38,182)

Future Improvements

Replace U-Net with DeepLabV3+
Add class-wise weighting
Real-time segmentation (video/webcam)
Better class separation (e.g., road vs background)

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
dataset.py		dataset.py
deepLabV3.py		deepLabV3.py
deeplab_model.py		deeplab_model.py
evaluate.py		evaluate.py
main.py		main.py
predict.py		predict.py
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multi-Class Image Segmentation using U-Net (Drone Dataset)

Overview

Dataset Download Link

Project Structure

GPU Setup (CUDA + cuDNN)

1. Check GPU

2. Install CUDA

3. Install cuDNN

4. Set Environment Variables

5. Verify TensorFlow GPU

Virtual Environment Setup

Windows

Linux / Mac

Install Requirements

Dataset Format

Training the Model

Metrics

Prediction (predict.py)

Input Options

Run Prediction

Output

Class Mapping

Future Improvements

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Multi-Class Image Segmentation using U-Net (Drone Dataset)

Overview

Dataset Download Link

Project Structure

GPU Setup (CUDA + cuDNN)

1. Check GPU

2. Install CUDA

3. Install cuDNN

4. Set Environment Variables

5. Verify TensorFlow GPU

Virtual Environment Setup

Windows

Linux / Mac

Install Requirements

Dataset Format

Training the Model

Metrics

Prediction (predict.py)

Input Options

Run Prediction

Output

Class Mapping

Future Improvements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages