从论文的Table 2 来看,引入MT后确实给detection 任务带来了提升,但是不太能理解的一点就是给teacher network输入unlabeled data 后,其实这部分的loss计算是来自于unlabeled送入student net来获取的一个伪label,这里的unlabeled 数据没有真实的GT参考,为什么加上M最后可以给basic net带来增益和提升的呢,针对这一点,师兄是怎么理解的呢
从论文的Table 2 来看,引入MT后确实给detection 任务带来了提升,但是不太能理解的一点就是给teacher network输入unlabeled data 后,其实这部分的loss计算是来自于unlabeled送入student net来获取的一个伪label,这里的unlabeled 数据没有真实的GT参考,为什么加上M最后可以给basic net带来增益和提升的呢,针对这一点,师兄是怎么理解的呢