文献阅读-3

文献阅读-3

一、基础知识

1.显式资源约束建模是什么?

在数学模型里明确写出受限资源,不需要模型靠奖励函数猜

2.子模函数是什么?

Submodular,边际收益递减的任务收益。多智能体任务分配里,一个任务不是人越多越好,后来的智能体贡献会逐渐变小

3.多智能体任务分配MATA是什么?

有多个智能体、多个目标/任务,系统需要决定:谁去执行哪个任务?任务分配是否满足资源约束?在通信受限、任务动态变化的情况下,如何分布式地更新分配结果?

4.在 q-独立系统约束下的子模函数最大化是什么?

q独立系统是指

合起来就是在从所有可行的任务分配方案里,选一个总收益最大的方案。

二、文章所提方法

DGBA分布式贪心约束算法,每个智能体本地维护三个束:

Bundle中文理解作用
Allocation Bundle (W_i)分配束记录自己知道的全局任务分配情况
Utility Bundle (B_i)效用束记录任务分配的边际收益
Finalization Bundle (F_i)确认束记录哪些智能体的任务已经确定

具体流程:

  • 每个智能体计算自己执行各任务的边际收益;
  • 选择收益最大的任务;
  • 和邻居交换任务束;
  • 如果多个智能体抢同一个任务,就保留边际收益最高的;
  • 重复直到所有分配稳定。