Skip to content

MAT的单调性 #42

@codebanyun

Description

@codebanyun

您好,非常感谢您的开源工作,最近在看MAT的论文,对于MAT的单调性有一些疑问。
其中对于MAT的单调性保证部分描述较少,没清楚您的意思。首先对于公式5,论文中提到是前序1-m-1智能体的新决策,可否理解为在前序智能体策略更新的基础上,并且动作a的符号表示与decoder的输出相同,二者代表意义相同吗?接着论文中提到MAT模型无需等待前序智能体的策略更新,优化目标可以并行计算,并根据算法流程,在并行计算时,输入的动作为当前策略的动作,每个智能体策略更新也使用了其他智能体更新前的策略参数,这如何体现顺次更新的思想呢。

Image

Image

Image

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions