mdp-经管之家(原经济论坛)-经济、管理、金融、统计在线教育和咨询网站

结果：找到“mdp”相关内容48个，排序为按回复时间降序，搜索更多相关帖子请点击“高级”

[PDF] 不确定环境下的决策系统：如何建立马尔可夫决策模型 Planning with MDP.pdf
3 个回复 - 1300 次查看马尔可夫决策模型(Markov Decision Processes)是当前AI广泛使用的用于不确定环境下的建模理论工具。本书深入讨论了MDP的各种变式及应用方案。本书作者 Mausam 是AI 领域的大牛知名学者。Andrey Kolobov 是Maus ...2020-2-23 00:05 - 上天善意 - Forum

【R】Package ‘MDPtoolbox’
7 个回复 - 1507 次查看 **** 本内容被作者隐藏 ****2017-6-23 10:40 - Nicolle - winbugs及其他软件专版

MDPI 老年痴呆死亡患者方案综述
0 个回复 - 332 次查看 2019-8-22 15:38 - wangziyan666 - 行业分析报告

MDPI 医疗领域的区块链技术：系统回顾
0 个回复 - 530 次查看 2019-8-22 15:36 - wangziyan666 - 行业分析报告

马尔科夫过程Markov Decision Processes(MDP)-Book + Notes + Practice&Solution
15 个回复 - 6427 次查看和大家分享基本马尔科夫过程的书，其中的notes和hw&solution是香港大学的2012-6-8 03:52 - 乱世枭雄 - 经济金融数学专区

【独家发布】【2016新书】A Concise Introduction to Decentralized POMDPs
6 个回复 - 1304 次查看如果喜欢该文档，欢迎订阅【2016新书】文库，http://bbs.pinggu.org/forum.php?mod=collection&action=view&ctid=3187 图书名称：A Concise Introduction to Decentralized POMDPs [/backcolor] 作者：Frans A. ...2016-8-7 08:43 - 牛尾巴 - winbugs及其他软件专版

Mean-Variance Tradeoffs in an Undiscounted MDP
1 个回复 - 1040 次查看【作者(必填)】Matthew J. Sobel 【文题(必填)】Mean-Variance Tradeoffs in an Undiscounted MDP 【年份(必填)】1994 【全文链接或数据库名称(选填)】2016-3-13 15:41 - sailing3200 - 求助成功区

SPSS,SAS,EVIEW,BMDP,NCSS,Statistica等统计软件免费
62 个回复 - 20479 次查看 SPSS,SAS,EVIEW,BMDP,NCSS,Statistica等统计软件免费下载地址: http://unidata.51.net/soft/soft01.html2006-11-9 15:54 - windytee - SPSS论坛

MDPI旗下期刊encourage resubmission after revision咨询
2 个回复 - 3514 次查看各位论坛朋友们好，想向大家请教MDPI旗下期刊拒稿重投的问题。文章5月下旬提交，6月7日收到大修意见，3个审稿人，2个正面意见（其中一个直接推荐发表），1个比较负面，因此编辑给了Major revision。随后10天 ...2022-7-16 19:13 - depp0326 - 论文版

MDPI优惠券
10 个回复 - 5112 次查看作为MDPI的文章评审，经常会有发文章的100的优惠券，如果哪位要发文章可以低价转给你2021-7-10 03:53 - lethqiu - 学术道德监督

MDPI出版社的SCI、SSCI期刊投稿交流
3 个回复 - 2928 次查看在MDPI出版社的SCI、SSCI期刊上投过、发过论文。期待更多的同志们加入，有群切磋交流，群号：798302745。加群注明：人大经济论坛。论文中介勿扰。2021-12-26 16:06 - 开开 - 学术道德监督

基于似然最大化的递阶POMDP控制器优化
0 个回复 - 260 次查看摘要翻译：通常可以通过将任务分解为分层排列的较小任务来简化规划。查林等人。[4]最近的研究表明，层次发现问题可以转化为一个非凸优化问题。然而，求解这类优化问题所固有的计算困难使得它很难扩展到现实世界中的 ...2022-4-11 20:50 - 能者818 - Forum

MDPI期刊投稿
2 个回复 - 2545 次查看 MDPI旗下期刊投稿，二审修回14天后系统状态变为pending editor review，然后显示两个审稿专家的意见（表示同意出版），另外两个专家的意见没看到，一审专家4没啥意见，专家三五个都是must，pending editor dicision已 ...2022-4-11 20:30 - TTtiantian1234 - 论文版

记忆有界Dec-POMDP规划的信念分布
0 个回复 - 645 次查看摘要翻译：提出了一种新的基于点的Dec-POMDP近似规划方法，该方法在求解质量方面优于现有的近似规划方法。它使用先验信念概率的启发式估计来选择一定数量的策略树：这种选择被表述为一个组合优化问题，使剪枝引起的 ...2022-4-10 22:55 - kedemingshi - Forum

基于区域的POMDPs增量剪枝算法
0 个回复 - 245 次查看摘要翻译：对求解部分可观测马尔可夫决策过程的增量剪枝算法进行了改进。我们的技术针对动态规划(DP)更新的交叉和步骤，这是POMDP算法复杂度的关键来源。在交叉和修剪时，我们的算法不是对整个信念空间进行推理，而 ...2022-4-6 17:00 - 何人来此 - Forum

基于点的POMDP算法的改进分析与实现
0 个回复 - 348 次查看摘要翻译：现有的基于点的POMDP值迭代算法的复杂度界要么集中在维数诅咒上，要么集中在历史诅咒上。我们导出了一个新的界，它依赖于两者，并使用了折扣可达性的概念；我们的结论可能有助于指导未来的算法设计。我们 ...2022-4-3 14:00 - 何人来此 - Forum

MDPs的分块线性规划逼近
0 个回复 - 211 次查看摘要翻译：近似线性规划(ALP)是求解大型因素马尔可夫决策过程的一种有效方法。该方法的主要思想是用一组基函数逼近最优值函数，并用线性规划(LP)优化它们的权值。本文提出了一种新的ALP近似。与标准的ALP公式相比， ...2022-3-30 21:20 - 大多数88 - Forum

再论确定性POMDPs
0 个回复 - 314 次查看摘要翻译：我们研究了POMDPs的一个子类，称为确定性POMDPs，它以确定性的行为和观测为特征。这些模型并没有提供POMDPs的相同通用性，但它们捕获了许多有趣和具有挑战性的问题，并允许更有效的算法。事实上，最近在规 ...2022-3-29 12:55 - 大多数88 - Forum

用于树搜索的高斯过程土匪：理论及应用折扣MDPs中的规划
0 个回复 - 213 次查看摘要翻译：基于高斯过程用于Bandit问题的最新理论进展，我们提出并分析了一种新的树搜索算法GPTS。我们考虑树路径作为臂，我们假设目标/奖励函数是从GP分布中提取的。观测数据后的后验均值和方差被用来定义函数值的 ...2022-3-29 11:20 - 可人4 - Forum

求解具有连续和离散变量的因子MDPs
0 个回复 - 504 次查看摘要翻译：虽然许多现实世界的随机规划问题更自然地由离散变量和连续变量的混合模型来描述，但目前最先进的方法不能充分解决这些问题。我们提出了第一个能够利用问题结构来高效地建模和求解混合问题的框架。我们将这 ...2022-3-26 22:55 - 大多数88 - Forum

奖赏不确定MDPs的几何遍历算法
0 个回复 - 149 次查看摘要翻译：马尔可夫决策过程被广泛应用于随机环境中的决策问题建模。然而，精确地规范MDPs中的奖励函数通常是非常困难的。最近的研究主要集中在基于极大极小后悔准则的最优策略的计算上，以便在报酬函数不确定的情况 ...2022-3-26 21:00 - 何人来此 - Forum

基于POMDP的知识工程的关系方法系统作为心理学模型的翻译
0 个回复 - 315 次查看摘要翻译：为认知障碍者（例如痴呆症）建立辅助系统是困难的，因为人们可以采取各种各样的不同方法来完成同样的任务，而且由于客户行为的不可预测性和传感器读数中的噪音而产生的重大不确定性。部分可观察马尔可夫决 ...2022-3-25 17:50 - nandehutu2022 - Forum

谁知道MDPI上外文润色要多久？？？急！
10 个回复 - 11391 次查看最近在MDPI上提交一个文章，但是修改意见中提到英文方面存在很多问题，需要找专业英语机构进行修改和润色，但是考虑到提交文章的截止日期，时间很紧迫。现在想问下有经验的大侠们，谁知道在MDPI平台上润色文章，大概 ...2019-12-14 10:12 - Whatever526 - 学术道德监督

无源POMDPs中的有界规划
0 个回复 - 204 次查看摘要翻译：在被动的POMDPs中，行动不影响世界状态，但仍会产生成本。当agent受到信息处理约束时，它只能保持信念的近似。本文给出了一个对最小化代价最有用的信息保持问题的变分原理，并给出了一个高效而简单的寻优 ...2022-3-17 09:30 - mingdashike22 - Forum

混合状态和动作变量的因子MDPs求解
0 个回复 - 242 次查看摘要翻译：具有连续变量和离散变量的大型决策问题的有效表示和求解是自动化决策支持系统设计者面临的最重要的挑战之一。本文给出了一个新的混合因子马尔可夫决策过程(MDP)模型，该模型允许这些问题的紧致表示，并给 ...2022-3-16 16:40 - 大多数88 - Forum

基于任意时间点的大型POMDPs近似
0 个回复 - 385 次查看摘要翻译：部分可观测马尔可夫决策过程长期以来一直被认为是现实世界规划和控制问题的丰富框架，尤其是在机器人领域。然而，除了最小的问题外，该框架中的精确解通常在计算上很困难。一个众所周知的加速POMDP求解的 ...2022-3-15 13:05 - 何人来此 - Forum

分解MDPs的高效求解算法
0 个回复 - 452 次查看摘要翻译：本文研究了不确定条件下大型马尔可夫决策过程的规划问题。因子MDPs用状态变量表示复杂的状态空间，用动态贝叶斯网络表示转换模型。这种表示通常允许结构化MDP的表示大小呈指数级减小，但这种MDP的精确求解 ...2022-3-15 11:45 - mingdashike22 - Forum

作为I-POMDP向人类学习
0 个回复 - 530 次查看摘要翻译：交互式部分可观测马尔可夫决策过程（I-POMDP）是最近发展起来的一个框架，它通过在状态空间中包含agent模型，将POMDP扩展到多agent环境中。本文将agent向教师交互学习的问题描述为一个I-POMDP问题，其中学 ...2022-3-13 17:24 - 可人4 - Forum

具有平均代价的POMDP的离散化近似
0 个回复 - 457 次查看摘要翻译：在本文中，我们提出了一个新的POMDP下近似方案，该方案具有折现和平均代价准则。该近似函数由它们在有限个置信点上的值决定，并可以用有限状态MDP的值迭代算法有效地计算。对于贴现问题，前面已经提出了几 ...2022-3-13 12:36 - 能者818 - Forum

POMDPs的稀疏随机有限状态控制器
0 个回复 - 473 次查看摘要翻译：有界策略迭代是求解无限时域POMDPs的一种方法，它将策略表示为随机的有限状态控制器，通过线性规划调整每个节点的参数来迭代改进控制器。在原有的算法中，线性规划的规模和策略改进的复杂度依赖于每个节点 ...2022-3-12 19:42 - 何人来此 - Forum

一阶MDPs的实用线性值逼近技术
0 个回复 - 467 次查看摘要翻译：一阶马尔可夫决策过程的近似线性规划(ALP)技术的最新工作是线性地表示值函数。一组一阶基函数，并使用线性规划技术来确定合适的权重。这种方法的优点是它不需要简化一阶值函数，并且允许人们独立于特定领 ...2022-3-12 17:24 - 能者818 - Forum

具有MDP诱导偏好的Agent之间的资源分配
1 个回复 - 210 次查看摘要翻译：在Agent之间分配稀少的资源以使全局效用最大化，通常在计算上是有挑战性的。本文研究了资源使Agent在随机环境中执行行为的问题，将其建模为马尔可夫决策过程(MDPs)，从而将资源束的值定义为给定这些资源时 ...2022-3-9 09:00 - mingdashike22 - Forum

特征强化学习：第一部分：非结构化MDPs
0 个回复 - 297 次查看摘要翻译：通用的、智能的、学习的代理在观察、行动和奖励的序列中循环，这些序列是复杂的、不确定的、未知的和非马尔可夫的。另一方面，强化学习在小的有限状态马尔可夫决策过程中得到了很好的发展。到目前为止，从 ...2022-3-6 14:23 - 能者818 - Forum

无意识MDPs
0 个回复 - 237 次查看摘要翻译：马尔可夫决策过程被广泛应用于机器人、自动控制和经济学等领域的决策问题建模。传统的MDPs假设决策者(DM)知道所有的状态和行动。然而，在许多感兴趣的情况下可能不是这样。我们定义了一个新的框架，无意识 ...2022-3-6 09:55 - 大多数88 - Forum

乐观初始化和贪婪导致多项式时间在分解MDPs中学习-扩展版本
0 个回复 - 206 次查看摘要翻译：本文提出了一种基于因子马尔可夫决策过程的多项式时间强化学习算法。因子乐观初始模型（factored optimative initial model，FOIM)算法以传统的方式保持FMDP的经验模型，并始终遵循对其模型的贪婪策略。该 ...2022-3-4 22:16 - mingdashike22 - Forum

中精确有限层规划的混合整数线性规划分散Pomdps
0 个回复 - 374 次查看摘要翻译：研究了分散Pomdp（Dec-Pomdp）最优有限时域控制的N-智能体联合策略问题。这是一个非常复杂的问题(n>=2)。本文提出了一种新的数学规划方法。我们的方法基于两个思想：首先，我们用序列形式而不是树形形式来 ...2022-3-2 22:17 - 能者818 - Forum

关于SCI开源期刊的想法 MDPI
12 个回复 - 5482 次查看开源期刊特点就是贵动辄上万但是审稿周期一月左右很效率如果单看影响因子也不低适合硕士和博士刚需时候的江湖救急但是若是长期学术生活不应该多发比如plos one 或者sustainability 论坛有同学老师朋友 ...2017-11-8 22:45 - 流年敲打 - 论文版

MDP中最优值函数存在且唯一的证明
0 个回复 - 796 次查看怎么证明最优策略对应值函数存在且唯一？https://www.leiphone.com/category/academic/y5nyxtWsNUrm37a9.html 中试图证明这个，将问题归结为：贝尔曼算子B是压缩映射不明白之处是怎么根据根据巴拿赫不动点定理， ...2021-7-26 17:25 - lg21c - Forum

折扣与无折扣MDPs：一个基于SARSA（λ）算法的实例分析
0 个回复 - 526 次查看摘要：分析了折扣激励学习存在的问题，对MDPs的SARSA（λ）算法进行了折扣的比较实验分析，讨论了平均奖赏常量对无折扣SARSA（（）算法的影响。原文链接:http://www.cqvip.com//QK/91690X/200209/6108304.html送人玫 ...2018-1-26 17:20 - 人工智能-AI - 人工智能论文版

[MDPtoolbox:]Markov Decision Processes Toolbox
7 个回复 - 1311 次查看 MDPtoolbox: Markov Decision Processes ToolboxThe Markov Decision Processes (MDP) toolbox proposes functions related to the resolution of discrete-time Markov Decision Processes: finite horizon, value ...2017-9-10 03:13 - Nicolle - winbugs及其他软件专版

[求助]有专门求解MDP马尔可夫决策过程的软件吗？
1 个回复 - 3024 次查看最近在看马尔可夫决策过程方面的文章，对其中算法的求解甚是苦恼。请问哪位高人可知道求解MDP的最好方法，可用软件？2009-1-5 22:07 - rqj21 - MATLAB等数学软件专版

每日一篇计量软件介绍之BMDP
1 个回复 - 1983 次查看 BMDP是Biomedical DataProcessing的缩写，是世界级的统计工具软件，至今已经有40多年的历史。目前在国际上与SAS、SPSS被并称为三大统计软件包。BMDP是一个大型综合的数据统计集成系统，从简单的统计学描述到复 ...2014-2-19 16:35 - yuanlinruc - MATLAB等数学软件专版

谁有BMDP Statistical Software
0 个回复 - 2288 次查看请问，谁有BDMP统计软件，可否发一份或共享出来，我的邮箱是：.非常感谢。2013-1-21 12:44 - hicosdor - 数据分析与数据挖掘

BMDP被SPSS收购了
5 个回复 - 4337 次查看以前没用过BMDP，这两天在一篇文献里看到，想引用，但是听说已经被SPSS收购，于是上网查了下，确实是被SPSS收购了，但是收购了还能用吗？想请教各位~~因为想引用这个软件的内容，但是不知道还能不能用了2011-9-16 16:34 - haiyu819 - SPSS论坛

[求助]A comparison of factor analysis programs in SPSS, BMDP, and SAS
0 个回复 - 2388 次查看 A comparison of factor analysis programs in SPSS, BMDP, and SAS Journal Psychometrika Publisher Springer New York ISSN 0033-3123 (Print) 1860-0980 (Online) Subject Humanities, Soc ...2006-11-26 23:51 - NewOccidental - SPSS论坛

课程推荐