🪸 🦠 🪼 🦐 🦖 🐙 🫧 🌊
`planktonzilla`

Multimodal deep learning framework, datasets, and models for plankton identification.

planktonzilla is a framework for managing datasets, training computer vision models, and evaluating performance on various plankton image identification tasks. Built on top of Hugging Face Transformers and Hydra for configuration management, it offers specialized tools for handling imbalanced plankton datasets and state-of-the-art imbalance learning loss functions.

Highlights:

planktonzilla-17M dataset: 17 million plankton images from 9 different datasets, all standardized and preprocessed for deep learning applications. Available: https://huggingface.co/datasets/project-oceania/planktonzilla-17m.
OcéanIA project website: https://oceania.inria.cl.
OcéanIA on Hugging Face Hub (datasets, trained models, and demos): https://huggingface.co/project-oceania.

Load a pre-trained model

The published planktonzilla models are landing in the v1 release. The snippet below is the target API every v1 model will conform to — a single universal from_pretrained call that works for the entire model collection, no clone of this repository required.

from transformers import AutoModelForImageClassification, AutoImageProcessor
from PIL import Image

model_id = "project-oceania/<model-name>"  # see https://huggingface.co/project-oceania
processor = AutoImageProcessor.from_pretrained(model_id, trust_remote_code=True)
model = AutoModelForImageClassification.from_pretrained(model_id, trust_remote_code=True)

image = Image.open("plankton.jpg").convert("RGB")
inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)
predicted_idx = outputs.logits.argmax(-1).item()
print(model.config.id2label[predicted_idx])

Browse published models: https://huggingface.co/project-oceania
No clone of this repo is required — pip install transformers pillow is the consumer dependency surface.
v1 status: pre-trained models are being prepared for release; see project status and the HF org page above for current availability.

Features

Modular Configuration: Hydra-based hierarchical configuration.
Multiple Plankton Dataset Support: Built-in support for all (afawk) plankton image datasets.
Specialized Loss Functions to handle class imbalance: Advanced loss functions for imbalanced classification (Focal, LDAM, Asymmetric, etc.)
Model Hub Integration: Seamless integration with Hugging Face Hub for model sharing
Experiment Tracking: Built-in support for Weights & Biases, MLFlow, and Trackio.
Flexible Training Pipeline: Based on Hugging Face Transformers Trainer with custom enhancements.
Easy CLI Interface: Simple command-line tools for all operations.

flowchart LR
  %% ── Configuration (shared across both pipelines) ─────────────────
  subgraph CFG_GRP["⚙️ Hydra Config Tree (configs/)"]
    direction TB
    CFG_TRAIN[train.yaml]
    CFG_IMPORT[import_dataset.yaml]
    CFG_MODEL[model/]
    CFG_DATA[dataset/]
    CFG_AUG[augmentation/]
    CFG_LOSS[custom_loss/]
    CFG_PEFT[peft/ — LoRA]
    CFG_HPARAM[hparams_search/ — Optuna]
    CFG_TRACK[tracking/]
    CFG_TRAIN_ARGS[training_arguments/]
  end

  %% ── Stage 1: Data Ingestion ──────────────────────────────────────
  subgraph INGEST["📥 Data Ingestion · pz_import_dataset"]
    direction LR
    RAW[Raw plankton sources<br/>WHOI / EcoTaxa / public]
    IMPORTER[dataset_import/<br/>dataset_importer.py]
    PUSH_DS[push to HF Hub]
    RAW --> IMPORTER --> PUSH_DS
  end

  %% ── Stage 2: Training & Evaluation ───────────────────────────────
  subgraph TRAIN["🏋️ Training · pz_train"]
    direction TB
    DATA[dataset.py<br/>+ augmentation pipeline]
    MODEL_HF[HF / timm classifier]
    MODEL_CLIP[clip_model.py<br/>OpenCLIP backbone]
    LOSS[loss.py · custom losses]
    PEFT_ADAPT[PEFT / LoRA adapters]
    TRAINER[HF Trainer loop]
    HPARAM[Optuna sweep<br/>optional]
    DATA --> TRAINER
    MODEL_HF --> TRAINER
    MODEL_CLIP --> TRAINER
    LOSS --> TRAINER
    PEFT_ADAPT --> TRAINER
    HPARAM -.->|trials| TRAINER
  end

  %% ── Outputs ──────────────────────────────────────────────────────
  HF_HUB[(🤗 HF Hub<br/>datasets · checkpoints)]
  TRACK_BE[W&B · MLflow · Trackio]
  LOGS[logs/ · checkpoints/<br/>wandb/]

  %% ── Orchestration ────────────────────────────────────────────────
  subgraph ORCH["🛰️ Orchestration"]
    direction TB
    SLURM[scripts/*.sh<br/>SLURM · torchrun multi-node]
    DEVCT[.devcontainer/<br/>CUDA 12.5 · Python 3.12]
    TESTS[tests/ · pytest]
  end

  %% ── Wiring ───────────────────────────────────────────────────────
  CFG_GRP -. merged config .-> INGEST
  CFG_GRP -. merged config .-> TRAIN

  PUSH_DS --> HF_HUB
  HF_HUB -->|load_dataset| DATA

  TRAINER -->|metrics| TRACK_BE
  TRAINER -->|checkpoints + logs| LOGS
  TRAINER -.->|push_to_hub| HF_HUB

  SLURM -->|launch| INGEST
  SLURM -->|launch| TRAIN
  DEVCT -.->|env for| TRAIN
  TESTS -.->|validate| TRAIN

  classDef hub fill:#fef3c7,stroke:#d97706,stroke-width:2px
  classDef cfg fill:#e0e7ff,stroke:#4338ca
  class HF_HUB hub
  class CFG_GRP cfg

📁 Project Structure

planktonzilla/
├── configs/                    # Hydra configuration files
│   ├── dataset/               # Dataset-specific configs
│   ├── model/                 # Model architecture configs  
│   ├── training_arguments/    # Training hyperparameters
│   ├── augmentation/          # Data augmentation strategies
│   ├── custom_loss/           # Loss function configurations
│   └── tracking/              # Experiment tracking setup
├── planktonzilla/             # Main package
│   ├── dataset.py             # Dataset loading and preprocessing
│   ├── train.py               # Training pipeline
│   ├── loss.py                # Custom loss functions
│   ├── clip_model.py          # CLIP-based model wrapper
│   ├── dataset_import/        # Dataset import utilities
│   └── utils/                 # Logging, Hydra helpers
└── tests/                     # Test suite

Quick Start

Prerequisites

Python 3.11-3.14
uv for dependency management
CUDA-compatible GPU (recommended for training)

Installation

# Clone the repository
git clone https://github.com/Inria-Chile/planktonzilla.git
cd planktonzilla

# Install dependencies (creates .venv automatically)
uv sync

# Install with development dependencies
uv sync --group dev

# Activate the virtual environment (optional — `uv run` works without it)
source .venv/bin/activate

uv run <command> runs any project script inside the project venv without needing to activate it manually. If you prefer an activated shell, run source .venv/bin/activate.

Import a dataset

# Import ISIISNET dataset
uv run pz_import_dataset dataset_import=isiisnet

# Import other available datasets
uv run pz_import_dataset dataset_import=flowcamnet
uv run pz_import_dataset dataset_import=lensless

Train a model

# Basic training with default configuration
uv run pz_train

# Train with specific dataset and model
uv run pz_train dataset=isiisnet model=resnet18

# Use specialized loss for imbalanced data
uv run pz_train dataset=isiisnet model=resnet50 custom_loss=focal

# Override training parameters
uv run pz_train dataset=isiisnet model=resnet18 training_arguments.num_train_epochs=10 training_arguments.learning_rate=1e-4

Configuration system

Planktonzilla uses Hydra for hierarchical configuration management. You can override any configuration parameter:

# Use different model architecture
uv run pz_train model=efficientnet

# Apply different augmentation strategy
uv run pz_train augmentation=autoaugment

# Combine multiple overrides
uv run pz_train dataset=isiisnet model=resnet50 custom_loss=ldam training_arguments.learning_rate=1e-4

Architecture

The training pipeline composes Hydra-configured datasets, models, and losses through the Hugging Face Trainer, then publishes the resulting checkpoint to the Hub — where external users load it with AutoModelForImageClassification.from_pretrained.

flowchart TB
  subgraph Configure["1 · Configure"]
    direction TB
    CLI["CLI<br/>pz_import_dataset · pz_train"]:::entry
    CFG["Hydra configs<br/>configs/"]:::cfg
  end

  subgraph Ingest["2 · Ingest"]
    direction TB
    DATA_IMPORT["planktonzilla/dataset_import/<br/>DatasetImporter subclasses"]:::code
    HF_DATA[("HF Hub<br/>project-oceania datasets")]:::ext
  end

  subgraph Train["3 · Train"]
    direction TB
    DATA["planktonzilla/dataset.py<br/>DatasetWrapper"]:::code
    MODEL["Model<br/>timm · HF · open_clip"]:::code
    LOSS["planktonzilla/loss.py<br/>AbstractHFLoss subclasses"]:::code
    TRAIN_LOOP["HF Trainer<br/>planktonzilla/train.py"]:::code
    TRACK["Tracking<br/>W&B · MLflow · trackio"]:::ext
    OUTPUTS["Local outputs<br/>logs/ · checkpoints/"]:::code
  end

  subgraph Publish["4 · Publish"]
    direction TB
    HF_MODEL[("HF Hub<br/>project-oceania models")]:::ext
  end

  SCRIPTS["scripts/*.sh<br/>SLURM launchers"]:::code
  TESTS["tests/<br/>smoke runs"]:::code
  CONSUMER(["AutoModelForImageClassification<br/>.from_pretrained"]):::consumer

  CLI --> CFG
  CFG -.->|configures| DATA_IMPORT
  CFG -.->|configures| TRAIN_LOOP
  CFG -.->|selects| MODEL
  CFG -.->|selects + params| LOSS

ISIISNET: In-Situ Ichthyoplankton Imaging System Network
FlowCamNet: FlowCam plankton dataset
Lensless: Lensless plankton microscopy dataset
UVP6Net: Underwater Vision Profiler 6 dataset
WHOI-Plankton: Woods Hole Oceanographic Institution plankton dataset
ZooLake: Lake Zurich zooplankton dataset
ZooScanNet: ZooScan plankton dataset
JEDI-Oceans: JEDI oceanic plankton dataset
CIFAR-10: Generic image classification benchmark (sanity-check / smoke-test runs)

Loss functions for imbalanced learning

Planktonzilla includes specialized loss functions designed for imbalanced plankton classification:

FocalLoss: Addresses class imbalance through dynamic loss weighting
LDAMLoss: Label-Distribution-Aware Margin loss
AsymmetricLoss: For multi-label classification scenarios
RobustAsymmetricLoss: Enhanced version of asymmetric loss
MaximumMarginLoss: Margin-based learning approach
BalancedMetaSoftmaxLoss: Meta-learning approach for class balance

Experiment tracking

Integrate with popular experiment tracking tools:

# Enable Weights & Biases tracking
uv run pz_train tracking.use_wandb=true

# Enable MLflow tracking
uv run pz_train tracking.use_mlflow=true

# Enable Trackio
uv run pz_train tracking.use_trackio=true

Development

Running Tests

# Run all tests
uv run pytest

# Run with coverage
uv run pytest --cov=planktonzilla

# Run specific test file
uv run pytest tests/test_datasets.py

Code Quality

# Lint code
uv run ruff check

# Format code
uv run ruff format

Adding New Datasets

Create a dataset configuration in configs/dataset/your_dataset.yaml
Ensure your dataset is available on Hugging Face Hub
Test with: uv run pz_train dataset=your_dataset

Custom Loss Functions

Implement your loss class inheriting from AbstractHFLoss in planktonzilla/loss.py
Add configuration file in configs/custom_loss/your_loss.yaml
Loss functions must handle ImageClassifierOutputWithNoAttention input format
Test with: uv run pz_train custom_loss=your_loss

🤝 Contributing

We welcome contributions to Planktonzilla! Please feel free to:

Report bugs and request features via GitHub Issues
Submit pull requests for improvements
Add new datasets or model architectures
Improve documentation

📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

🏛️ Citation

If you use Planktonzilla in your research, please cite:

@report{contrerasmontanares:hal-05621003,
  title      = {Planktonzilla: Multimodal dataset and models for understanding plankton ecosystems},
  author     = {Contreras Montanares, Alan Gerson and Valenzuela, Luis and Mart{\'i}, Luis and Sanchez-Pi, Nayat},
  year       = 2026,
  month      = {May},
  url        = {https://hal.science/hal-05621003},
  note       = {Submitted to NeurIPS 2026.},
  keywords   = {Explainable AI; XAI ; Plankton Classification ; CLIPS ; Multimodal Classification},
  pdf        = {https://hal.science/hal-05621003v1/file/neurips\_2026.pdf},
  eprint     = {hal-05621003},
  eprinttype = {hal},
  hal_id     = {hal-05621003},
  hal_version = {v1}
}

Built with ❤️ by Inria.

Name		Name	Last commit message	Last commit date
Latest commit History 111 Commits
.devcontainer		.devcontainer
.github/workflows		.github/workflows
configs		configs
docs		docs
notebooks		notebooks
planktonzilla		planktonzilla
scripts		scripts
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🪸 🦠 🪼 🦐 🦖 🐙 🫧 🌊
`planktonzilla`

Load a pre-trained model

Features

📁 Project Structure

Quick Start

Prerequisites

Installation

Import a dataset

Train a model

Configuration system

Architecture

Loss functions for imbalanced learning

Experiment tracking

Development

Running Tests

Code Quality

Adding New Datasets

Custom Loss Functions

🤝 Contributing

📄 License

🏛️ Citation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🪸 🦠 🪼 🦐 🦖 🐙 🫧 🌊planktonzilla

Load a pre-trained model

Features

📁 Project Structure

Quick Start

Prerequisites

Installation

Import a dataset

Train a model

Configuration system

Architecture

Loss functions for imbalanced learning

Experiment tracking

Development

Running Tests

Code Quality

Adding New Datasets

Custom Loss Functions

🤝 Contributing

📄 License

🏛️ Citation

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

🪸 🦠 🪼 🦐 🦖 🐙 🫧 🌊
`planktonzilla`

Packages