Guard short token datasets in ANE and dynamic training paths by TastyHeadphones · Pull Request #38 · maderix/ANE

TastyHeadphones · 2026-03-04T13:21:59Z

Summary

add a token dataset length guard in training/train_large_ane.m
add the same guard in training/training_dynamic/train.m
fail early with a clear error when the dataset is too short for one (input,target) training window

Why

Both paths sample with:

max_pos = n_tokens - SEQ - 1

When n_tokens <= SEQ + 1, this unsigned subtraction can underflow, producing a huge random range and potentially leading to out-of-bounds reads.

Validation

make -C training train_large_ane
make -C training/training_dynamic train

…m PR maderix#38)

Guard short token datasets in ANE and dynamic trainers

e030ffb

dev-erik added a commit to dev-erik/ANE that referenced this pull request Mar 4, 2026

[fix] Guard short token datasets in ANE and dynamic trainers (upstrea…

21da532

…m PR maderix#38)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Guard short token datasets in ANE and dynamic training paths#38

Guard short token datasets in ANE and dynamic training paths#38
TastyHeadphones wants to merge 1 commit intomaderix:mainfrom
TastyHeadphones:tastyheadphones/short-dataset-guards-ane-dynamic

TastyHeadphones commented Mar 4, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

TastyHeadphones commented Mar 4, 2026

Summary

Why

Validation

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant