Error on using Spacy Tokenizer

I edited tokenize.py 
and in main called 
```
tokenizer=SpacyTokenize()
``` 
to use the Spacy Tokenizer for English text. Tho I always end up getting a : 
```
tcmalloc large alloc 
```
memory error on running on Google Colab. 

Thoughts on how I can use the English tokenizer for my dataset? Or for the English dataset `dailydialoguttr_lines.txt`, how do you run the code for the GSM model? @zll17 

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Error on using Spacy Tokenizer #10

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Error on using Spacy Tokenizer #10

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions