大神们好。我看该项目说是“`在t5-large版基础上,使用数百G中文语料,训练了100万步,累积训练了1.5万亿个中文字词级别token`” 我想问下,这里是采用`t5-large`模型作为预训练模型,在中文数据上进行微调训练的嘛?
大神们好。我看该项目说是“
在t5-large版基础上,使用数百G中文语料,训练了100万步,累积训练了1.5万亿个中文字词级别token”我想问下,这里是采用
t5-large模型作为预训练模型,在中文数据上进行微调训练的嘛?