结果:找到“pomdp”相关内容13个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
基于似然最大化的递阶POMDP控制器优化
0 个回复 - 260 次查看
摘要翻译:
通常可以通过将任务分解为分层排列的较小任务来简化规划。查林等人。[4]最近的研究表明,层次发现问题可以转化为一个非凸优化问题。然而,求解这类优化问题所固有的计算困难使得它很难扩展到现实世界中的 ...
2022-4-11 20:50 - 能者818 - Forum
记忆有界Dec-POMDP规划的信念分布
0 个回复 - 645 次查看
摘要翻译:
提出了一种新的基于点的Dec-POMDP近似规划方法,该方法在求解质量方面优于现有的近似规划方法。它使用先验信念概率的启发式估计来选择一定数量的策略树:这种选择被表述为一个组合优化问题,使剪枝引起的 ...
2022-4-10 22:55 - kedemingshi - Forum
基于区域的POMDPs增量剪枝算法
0 个回复 - 245 次查看
摘要翻译:
对求解部分可观测马尔可夫决策过程的增量剪枝算法进行了改进。我们的技术针对动态规划(DP)更新的交叉和步骤,这是POMDP算法复杂度的关键来源。在交叉和修剪时,我们的算法不是对整个信念空间进行推理,而 ...
2022-4-6 17:00 - 何人来此 - Forum
基于点的POMDP算法的改进分析与实现
0 个回复 - 348 次查看
摘要翻译:
现有的基于点的POMDP值迭代算法的复杂度界要么集中在维数诅咒上,要么集中在历史诅咒上。我们导出了一个新的界,它依赖于两者,并使用了折扣可达性的概念;我们的结论可能有助于指导未来的算法设计。我们 ...
2022-4-3 14:00 - 何人来此 - Forum
再论确定性POMDPs
0 个回复 - 314 次查看
摘要翻译:
我们研究了POMDPs的一个子类,称为确定性POMDPs,它以确定性的行为和观测为特征。这些模型并没有提供POMDPs的相同通用性,但它们捕获了许多有趣和具有挑战性的问题,并允许更有效的算法。事实上,最近在规 ...
2022-3-29 12:55 - 大多数88 - Forum
无源POMDPs中的有界规划
0 个回复 - 204 次查看
摘要翻译:
在被动的POMDPs中,行动不影响世界状态,但仍会产生成本。当agent受到信息处理约束时,它只能保持信念的近似。本文给出了一个对最小化代价最有用的信息保持问题的变分原理,并给出了一个高效而简单的寻优 ...
2022-3-17 09:30 - mingdashike22 - Forum
基于任意时间点的大型POMDPs近似
0 个回复 - 384 次查看
摘要翻译:
部分可观测马尔可夫决策过程长期以来一直被认为是现实世界规划和控制问题的丰富框架,尤其是在机器人领域。然而,除了最小的问题外,该框架中的精确解通常在计算上很困难。一个众所周知的加速POMDP求解的 ...
2022-3-15 13:05 - 何人来此 - Forum
作为I-POMDP向人类学习
0 个回复 - 530 次查看
摘要翻译:
交互式部分可观测马尔可夫决策过程(I-POMDP)是最近发展起来的一个框架,它通过在状态空间中包含agent模型,将POMDP扩展到多agent环境中。本文将agent向教师交互学习的问题描述为一个I-POMDP问题,其中学 ...
2022-3-13 17:24 - 可人4 - Forum
具有平均代价的POMDP的离散化近似
0 个回复 - 457 次查看
摘要翻译:
在本文中,我们提出了一个新的POMDP下近似方案,该方案具有折现和平均代价准则。该近似函数由它们在有限个置信点上的值决定,并可以用有限状态MDP的值迭代算法有效地计算。对于贴现问题,前面已经提出了几 ...
2022-3-13 12:36 - 能者818 - Forum
POMDPs的稀疏随机有限状态控制器
0 个回复 - 473 次查看
摘要翻译:
有界策略迭代是求解无限时域POMDPs的一种方法,它将策略表示为随机的有限状态控制器,通过线性规划调整每个节点的参数来迭代改进控制器。在原有的算法中,线性规划的规模和策略改进的复杂度依赖于每个节点 ...
2022-3-12 19:42 - 何人来此 - Forum
中精确有限层规划的混合整数线性规划
分散Pomdps
0 个回复 - 374 次查看
摘要翻译:
研究了分散Pomdp(Dec-Pomdp)最优有限时域控制的N-智能体联合策略问题。这是一个非常复杂的问题(n>=2)。本文提出了一种新的数学规划方法。我们的方法基于两个思想:首先,我们用序列形式而不是树形形式来 ...
2022-3-2 22:17 - 能者818 - Forum