Corpus y modelos entrenados para NLP en Español

Se han creado clasificadores para las siguientes tareas NLP:

Para obtener estos modelos se han utilizado y modificado los siguientes corpus:

Evaluaciones

Segmentación de Oraciones:

Tokenización:

POS Tagging:

Cantidad Oraciones	4060
Tamaño mínimo de oraciones	2
Tamaño máximo de oraciones	105
Tamaño promedio de oraciones	26,81
Cantidad de etiquetas	320
Exactitud	95,09%

Named Entity Recognition:

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
ner		ner
postagging		postagging
sentenceSplitting		sentenceSplitting
tokenization		tokenization
README.md		README.md