文献阅读-3-尧图网络科技

在数学模型里明确写出受限资源，不需要模型靠奖励函数猜

Submodular，边际收益递减的任务收益。多智能体任务分配里，一个任务不是人越多越好，后来的智能体贡献会逐渐变小

有多个智能体、多个目标/任务，系统需要决定：谁去执行哪个任务？任务分配是否满足资源约束？在通信受限、任务动态变化的情况下，如何分布式地更新分配结果？

q独立系统是指

合起来就是在从所有可行的任务分配方案里，选一个总收益最大的方案。

二、文章所提方法

DGBA分布式贪心约束算法，每个智能体本地维护三个束：

具体流程：