EEG-GAN: Synthetic EEG Data Generation

Report Link : https://docs.google.com/document/d/1SqtGwQ69OtAwf0ojSyIbf7pYBTCsiODwRBxE1YSImAU/edit?usp=sharing

Overview

This project investigates the application of Generative models for augmenting electroencephalogram (EEG) datasets to improve machine learning classifier performance in motor imagery recognition tasks. By generating realistic synthetic EEG signals, we address the critical challenge of data scarcity in brain-computer interface (BCI) development. This project is part of the Arabs in Neuroscience -Introduction to computational neuroscience program .

🎯 Key Features

GAN-based EEG synthesis for dataset augmentation -VAE-based EEG synthesis for dataset augmentation
Motor imagery classification with improved accuracy
Emotion recognition enhancement through synthetic data (Through Random forest/regression /supervised models)
Multi-dataset validation across different EEG sources
Computationally efficient pipeline for real-world applications
Cross-subject generalization capabilities

Data Preporcessing

Architecture

Model Variants

Mean-Conditioned GAN - For the EEG data we followed the approach of doing the mean of the evolution of the eeg data overtime. Time-Dependent GAN - The evolution of our approach, incorporating temporal dynamics and sequential dependencies to capture the intricate time-series with Gan. Time-Dependent VAE - Same Data approach as above for the data processing , but with VAE

Results Highlights

✅ Improved classification accuracy on motor imagery tasks
✅ Enhanced emotion recognition performance
✅ Realistic synthetic EEG signals preserving temporal characteristics
✅ Reduced training time through efficient augmentation pipeline
✅ Demonstrated cross-subject generalization improvements

Datasets Used

Primary Datasets

DEAP Database - Database for Emotion Analysis using Physiological Signals
- Dataset Link
- Multi-channel EEG recordings for emotion recognition
Kaggle EEG Collection - Comprehensive EEG dataset
- Dataset Link
- Various EEG signal types and classifications

Architecture

GAN Components

Generator Network: Creates synthetic EEG signals from noise input
Discriminator Network: Distinguishes between real and synthetic signals
Training Pipeline: Adversarial training with stability enhancements

Data Processing Pipeline

Raw EEG Data → Preprocessing → Feature Extraction → GAN Training → Synthetic Data → Enhanced Classification

Quick Start

Project Structure

eeg-gan-synthesis/
├── data/
│   ├── raw/                 # Raw EEG datasets
│   ├── processed/           # Preprocessed data
│   └── synthetic/           # Generated synthetic data
├── models/
│   ├── gan_model.py         # GAN architecture
│   ├── classifier.py        # Classification models
│   └── preprocessing.py     # Data preprocessing utilities
├── notebooks/
│   ├── data_exploration.ipynb
│   ├── model_training.ipynb
│   └── results_analysis.ipynb
├── scripts/
│   ├── train_gan.py
│   ├── generate_synthetic.py
│   └── evaluate_classifier.py
├── results/
│   ├── figures/             # Generated plots and visualizations
│   └── metrics/             # Performance metrics
└── README.md

Performance Metrics

Motor Imagery Classification

Baseline Accuracy:
With GAN Augmentation:
Improvement: +X.X%

Emotion Recognition

3-Class Classification: X.X% accuracy
Cross-Subject Validation: X.X% accuracy
Synthetic Data Quality: High spectral similarity

🔬 Technical Approach

Data Preprocessing

Noise Removal: Advanced filtering techniques
Signal Processing: Band-pass filtering and normalization
Feature Extraction: Time-domain, frequency-domain, and time-frequency features(EEG is time dep or else we lose patterns)
Segmentation: Optimal window sizing with overlap strategies

GAN Training Strategy

Loss Functions: Adversarial loss with gradient penalty
Optimization: Adam optimizer with --learning rate scheduling(to adjust in the code)
Stability Techniques: Progressive growing and spectral normalization

🎓 Research Applications

Brain-Computer Interfaces (BCIs)
Neurological disorder diagnosis
Cognitive state monitoring
Motor imagery rehabilitation systems
Emotion recognition systems

👥 Team & Collaboration

Project Duration: 5 days
Team Size: 6 members
Development Framework: Collaborative research implementation

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
data		data
full_code		full_code
models		models
preprocessing		preprocessing
stuff		stuff
README.md		README.md
final-code (7).ipynb		final-code (7).ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EEG-GAN: Synthetic EEG Data Generation

Overview

🎯 Key Features

Data Preporcessing

Architecture

Model Variants

Results Highlights

Datasets Used

Primary Datasets

Architecture

GAN Components

Data Processing Pipeline

Quick Start

Project Structure

Performance Metrics

Motor Imagery Classification

Emotion Recognition

🔬 Technical Approach

Data Preprocessing

GAN Training Strategy

🎓 Research Applications

👥 Team & Collaboration

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

EEG-GAN: Synthetic EEG Data Generation

Overview

🎯 Key Features

Data Preporcessing

Architecture

Model Variants

Results Highlights

Datasets Used

Primary Datasets

Architecture

GAN Components

Data Processing Pipeline

Quick Start

Project Structure

Performance Metrics

Motor Imagery Classification

Emotion Recognition

🔬 Technical Approach

Data Preprocessing

GAN Training Strategy

🎓 Research Applications

👥 Team & Collaboration

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages