请问aicb/workload/aiob_inputs/Example.txt中example中的数据是什么GPU型号的,怎么得来的,上面train_iter:10是什么意思,此外我使用
sh ./scripts/megatron_workload_with_aiob.sh -m 7
--world_size 4096 --tensor_model_parallel_size 2 --pipeline_model_parallel 1
--frame Megatron --global_batch 8192
--micro_batch 1 --seq_length 4096 --swiglu
--use_flash_attn --aiob_enable
--comp_filepath workload/aiob_inputs/Example.txt
命令生成训练工作负载,其中模型参数大小可以随意修改吗比如我想run个15B的,迭代次数如何控制,目前命令看不到这是迭代多少次的工作负载
请问aicb/workload/aiob_inputs/Example.txt中example中的数据是什么GPU型号的,怎么得来的,上面train_iter:10是什么意思,此外我使用
sh ./scripts/megatron_workload_with_aiob.sh -m 7
--world_size 4096 --tensor_model_parallel_size 2 --pipeline_model_parallel 1
--frame Megatron --global_batch 8192
--micro_batch 1 --seq_length 4096 --swiglu
--use_flash_attn --aiob_enable
--comp_filepath workload/aiob_inputs/Example.txt
命令生成训练工作负载,其中模型参数大小可以随意修改吗比如我想run个15B的,迭代次数如何控制,目前命令看不到这是迭代多少次的工作负载