针对t5-large模型的训练问题

大神们好。我看该项目说是“`在t5-large版基础上，使用数百G中文语料，训练了100万步，累积训练了1.5万亿个中文字词级别token`”

我想问下，这里是采用`t5-large`模型作为预训练模型，在中文数据上进行微调训练的嘛？