转置方法0和1代码能运行成功是因为 int nx = 289; int ny = 289; 原文设置成了1<<12,nx和ny都是2的倍数才可以转置成功。方法5也有同样的问题。 在switch里case4 和case5执行的函数一样,是笔误。 在最后比较cpu和gpu的输出时,使用了同样的两个指针比较,所有方法结果都是正确的,这里也是一个笔误。希望作者更新一下。