Skip to content

aiob参数 #256

@wtl0000

Description

@wtl0000

请问aicb/workload/aiob_inputs/Example.txt中example中的数据是什么GPU型号的,怎么得来的,上面train_iter:10是什么意思,此外我使用
sh ./scripts/megatron_workload_with_aiob.sh -m 7
--world_size 4096 --tensor_model_parallel_size 2 --pipeline_model_parallel 1
--frame Megatron --global_batch 8192
--micro_batch 1 --seq_length 4096 --swiglu
--use_flash_attn --aiob_enable
--comp_filepath workload/aiob_inputs/Example.txt
命令生成训练工作负载,其中模型参数大小可以随意修改吗比如我想run个15B的,迭代次数如何控制,目前命令看不到这是迭代多少次的工作负载

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions