结果:找到“mdp”相关内容48个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
SPSS,SAS,EVIEW,BMDP,NCSS,Statistica等统计软件免费
62 个回复 - 20479 次查看
SPSS,SAS,EVIEW,BMDP,NCSS,Statistica等统计软件免费下载地址:
http://unidata.51.net/soft/soft01.html
2006-11-9 15:54 - windytee - SPSS论坛
MDPI优惠券
10 个回复 - 5112 次查看
作为MDPI的文章评审,经常会有发文章的100的优惠券,如果哪位要发文章可以低价转给你
2021-7-10 03:53 - lethqiu - 学术道德监督
基于似然最大化的递阶POMDP控制器优化
0 个回复 - 260 次查看
摘要翻译:
通常可以通过将任务分解为分层排列的较小任务来简化规划。查林等人。[4]最近的研究表明,层次发现问题可以转化为一个非凸优化问题。然而,求解这类优化问题所固有的计算困难使得它很难扩展到现实世界中的 ...
2022-4-11 20:50 - 能者818 - Forum
MDPI期刊投稿
2 个回复 - 2545 次查看
MDPI旗下期刊投稿,二审修回14天后系统状态变为pending editor review,然后显示两个审稿专家的意见(表示同意出版),另外两个专家的意见没看到,一审专家4没啥意见,专家三五个都是must,pending editor dicision已 ...
2022-4-11 20:30 - TTtiantian1234 - 论文版
记忆有界Dec-POMDP规划的信念分布
0 个回复 - 645 次查看
摘要翻译:
提出了一种新的基于点的Dec-POMDP近似规划方法,该方法在求解质量方面优于现有的近似规划方法。它使用先验信念概率的启发式估计来选择一定数量的策略树:这种选择被表述为一个组合优化问题,使剪枝引起的 ...
2022-4-10 22:55 - kedemingshi - Forum
基于区域的POMDPs增量剪枝算法
0 个回复 - 245 次查看
摘要翻译:
对求解部分可观测马尔可夫决策过程的增量剪枝算法进行了改进。我们的技术针对动态规划(DP)更新的交叉和步骤,这是POMDP算法复杂度的关键来源。在交叉和修剪时,我们的算法不是对整个信念空间进行推理,而 ...
2022-4-6 17:00 - 何人来此 - Forum
基于点的POMDP算法的改进分析与实现
0 个回复 - 348 次查看
摘要翻译:
现有的基于点的POMDP值迭代算法的复杂度界要么集中在维数诅咒上,要么集中在历史诅咒上。我们导出了一个新的界,它依赖于两者,并使用了折扣可达性的概念;我们的结论可能有助于指导未来的算法设计。我们 ...
2022-4-3 14:00 - 何人来此 - Forum
MDPs的分块线性规划逼近
0 个回复 - 211 次查看
摘要翻译:
近似线性规划(ALP)是求解大型因素马尔可夫决策过程的一种有效方法。该方法的主要思想是用一组基函数逼近最优值函数,并用线性规划(LP)优化它们的权值。本文提出了一种新的ALP近似。与标准的ALP公式相比, ...
2022-3-30 21:20 - 大多数88 - Forum
再论确定性POMDPs
0 个回复 - 314 次查看
摘要翻译:
我们研究了POMDPs的一个子类,称为确定性POMDPs,它以确定性的行为和观测为特征。这些模型并没有提供POMDPs的相同通用性,但它们捕获了许多有趣和具有挑战性的问题,并允许更有效的算法。事实上,最近在规 ...
2022-3-29 12:55 - 大多数88 - Forum
用于树搜索的高斯过程土匪:理论及应用
折扣MDPs中的规划
0 个回复 - 213 次查看
摘要翻译:
基于高斯过程用于Bandit问题的最新理论进展,我们提出并分析了一种新的树搜索算法GPTS。我们考虑树路径作为臂,我们假设目标/奖励函数是从GP分布中提取的。观测数据后的后验均值和方差被用来定义函数值的 ...
2022-3-29 11:20 - 可人4 - Forum
求解具有连续和离散变量的因子MDPs
0 个回复 - 504 次查看
摘要翻译:
虽然许多现实世界的随机规划问题更自然地由离散变量和连续变量的混合模型来描述,但目前最先进的方法不能充分解决这些问题。我们提出了第一个能够利用问题结构来高效地建模和求解混合问题的框架。我们将这 ...
2022-3-26 22:55 - 大多数88 - Forum
奖赏不确定MDPs的几何遍历算法
0 个回复 - 149 次查看
摘要翻译:
马尔可夫决策过程被广泛应用于随机环境中的决策问题建模。然而,精确地规范MDPs中的奖励函数通常是非常困难的。最近的研究主要集中在基于极大极小后悔准则的最优策略的计算上,以便在报酬函数不确定的情况 ...
2022-3-26 21:00 - 何人来此 - Forum
谁知道MDPI上外文润色要多久???急!
10 个回复 - 11391 次查看
最近在MDPI上提交一个文章,但是修改意见中提到英文方面存在很多问题,需要找专业英语机构进行修改和润色,但是考虑到提交文章的截止日期,时间很紧迫。现在想问下有经验的大侠们,谁知道在MDPI平台上润色文章,大概 ...
2019-12-14 10:12 - Whatever526 - 学术道德监督
无源POMDPs中的有界规划
0 个回复 - 204 次查看
摘要翻译:
在被动的POMDPs中,行动不影响世界状态,但仍会产生成本。当agent受到信息处理约束时,它只能保持信念的近似。本文给出了一个对最小化代价最有用的信息保持问题的变分原理,并给出了一个高效而简单的寻优 ...
2022-3-17 09:30 - mingdashike22 - Forum
混合状态和动作变量的因子MDPs求解
0 个回复 - 242 次查看
摘要翻译:
具有连续变量和离散变量的大型决策问题的有效表示和求解是自动化决策支持系统设计者面临的最重要的挑战之一。本文给出了一个新的混合因子马尔可夫决策过程(MDP)模型,该模型允许这些问题的紧致表示,并给 ...
2022-3-16 16:40 - 大多数88 - Forum
基于任意时间点的大型POMDPs近似
0 个回复 - 385 次查看
摘要翻译:
部分可观测马尔可夫决策过程长期以来一直被认为是现实世界规划和控制问题的丰富框架,尤其是在机器人领域。然而,除了最小的问题外,该框架中的精确解通常在计算上很困难。一个众所周知的加速POMDP求解的 ...
2022-3-15 13:05 - 何人来此 - Forum
分解MDPs的高效求解算法
0 个回复 - 452 次查看
摘要翻译:
本文研究了不确定条件下大型马尔可夫决策过程的规划问题。因子MDPs用状态变量表示复杂的状态空间,用动态贝叶斯网络表示转换模型。这种表示通常允许结构化MDP的表示大小呈指数级减小,但这种MDP的精确求解 ...
2022-3-15 11:45 - mingdashike22 - Forum
作为I-POMDP向人类学习
0 个回复 - 530 次查看
摘要翻译:
交互式部分可观测马尔可夫决策过程(I-POMDP)是最近发展起来的一个框架,它通过在状态空间中包含agent模型,将POMDP扩展到多agent环境中。本文将agent向教师交互学习的问题描述为一个I-POMDP问题,其中学 ...
2022-3-13 17:24 - 可人4 - Forum
具有平均代价的POMDP的离散化近似
0 个回复 - 457 次查看
摘要翻译:
在本文中,我们提出了一个新的POMDP下近似方案,该方案具有折现和平均代价准则。该近似函数由它们在有限个置信点上的值决定,并可以用有限状态MDP的值迭代算法有效地计算。对于贴现问题,前面已经提出了几 ...
2022-3-13 12:36 - 能者818 - Forum
POMDPs的稀疏随机有限状态控制器
0 个回复 - 473 次查看
摘要翻译:
有界策略迭代是求解无限时域POMDPs的一种方法,它将策略表示为随机的有限状态控制器,通过线性规划调整每个节点的参数来迭代改进控制器。在原有的算法中,线性规划的规模和策略改进的复杂度依赖于每个节点 ...
2022-3-12 19:42 - 何人来此 - Forum
一阶MDPs的实用线性值逼近技术
0 个回复 - 467 次查看
摘要翻译:
一阶马尔可夫决策过程的近似线性规划(ALP)技术的最新工作是线性地表示值函数。一组一阶基函数,并使用线性规划技术来确定合适的权重。这种方法的优点是它不需要简化一阶值函数,并且允许人们独立于特定领 ...
2022-3-12 17:24 - 能者818 - Forum
特征强化学习:第一部分:非结构化MDPs
0 个回复 - 297 次查看
摘要翻译:
通用的、智能的、学习的代理在观察、行动和奖励的序列中循环,这些序列是复杂的、不确定的、未知的和非马尔可夫的。另一方面,强化学习在小的有限状态马尔可夫决策过程中得到了很好的发展。到目前为止,从 ...
2022-3-6 14:23 - 能者818 - Forum
无意识MDPs
0 个回复 - 237 次查看
摘要翻译:
马尔可夫决策过程被广泛应用于机器人、自动控制和经济学等领域的决策问题建模。传统的MDPs假设决策者(DM)知道所有的状态和行动。然而,在许多感兴趣的情况下可能不是这样。我们定义了一个新的框架,无意识 ...
2022-3-6 09:55 - 大多数88 - Forum
中精确有限层规划的混合整数线性规划
分散Pomdps
0 个回复 - 374 次查看
摘要翻译:
研究了分散Po
mdp(Dec-Po
mdp)最优有限时域控制的N-智能体联合策略问题。这是一个非常复杂的问题(n>=2)。本文提出了一种新的数学规划方法。我们的方法基于两个思想:首先,我们用序列形式而不是树形形式来 ...
2022-3-2 22:17 - 能者818 - Forum
关于SCI开源期刊的想法 MDPI
12 个回复 - 5482 次查看
开源期刊特点就是贵 动辄上万 但是审稿周期一月左右 很效率 如果单看影响因子也不低 适合硕士和博士刚需时候的江湖救急
但是若是长期学术生活 不应该多发
比如plos one 或者sustainability
论坛有同学老师朋友 ...
2017-11-8 22:45 - 流年敲打 - 论文版
MDP中最优值函数存在且唯一的证明
0 个回复 - 796 次查看
怎么证明最优策略对应值函数存在且唯一?https://www.leiphone.com/category/academic/y5nyxtWsNUrm37a9.html
中试图证明这个,将问题归结为:贝尔曼算子B是压缩映射
不明白之处是怎么根据根据巴拿赫不动点定理, ...
2021-7-26 17:25 - lg21c - Forum
每日一篇计量软件介绍之BMDP
1 个回复 - 1983 次查看
BMDP是Biomedical DataProcessing的缩写,是世界级的统计工具软件,至今已经有40多年的历史。目前在国际上与SAS、SPSS被并称为三大统计软件包。BMDP是一个大型综合的数据统计集成系统,从简单的统计学描述到复 ...
2014-2-19 16:35 - yuanlinruc - MATLAB等数学软件专版
BMDP被SPSS收购了
5 个回复 - 4337 次查看
以前没用过BMDP,这两天在一篇文献里看到,想引用,但是听说已经被SPSS收购,于是上网查了下,确实是被SPSS收购了,但是收购了还能用吗?想请教各位~~因为想引用这个软件的内容,但是不知道还能不能用了
2011-9-16 16:34 - haiyu819 - SPSS论坛