结果:找到“马尔可夫决策过程”相关内容23个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
实用马尔可夫决策过程
4 个回复 - 1584 次查看
【作者(必填)】
刘克
【文题(必填)】
实用
马尔可夫决策过程
【年份(必填)】
2004-11-1
【全文链接或数据库名称(选填)】
2017-4-24 01:31 - Kun806 - 求助成功区
基于正则化的近似线性规划特征选择
马尔可夫决策过程
0 个回复 - 173 次查看
摘要翻译:
近似动态规划已经成功地应用于许多领域,但它依赖于提供的少量近似特征来可靠地计算解。由于样本数量有限,大量丰富的特征集可能会导致现有算法过度拟合。我们用近似线性规划中的$L_1$正则化来解决这个缺 ...
2022-4-9 13:05 - 何人来此 - Forum
马尔可夫决策过程中状态相似度的计算方法
0 个回复 - 345 次查看
摘要翻译:
解决大概率系统的一种流行方法依赖于基于相似性度量的状态聚合。文献中的许多方法都是启发式的。最近的一些方法依赖于基于双模拟概念的度量,或者状态之间的行为等价(Givan et al,2001,2003;Ferns et ...
2022-4-6 18:00 - 可人4 - Forum
非平稳保单在无限时域贴现中的应用
马尔可夫决策过程
0 个回复 - 398 次查看
摘要翻译:
我们考虑了无限时域的$\gamma$-贴现
马尔可夫决策过程,它已知存在一个平稳的最优策略。我们考虑算法值迭代和策略序列$\pi_1,...\pi_k$它隐含地生成直到某个迭代$k$。我们为涉及最后$m$生成的策略的非平稳 ...
2022-4-2 20:05 - 可人4 - Forum
部分可观测中数值迭代收敛速度的加快
马尔可夫决策过程
1 个回复 - 501 次查看
摘要翻译:
部分可观察
马尔可夫决策过程(POMDPs)是一种在不确定条件下进行规划的自然模型,近年来受到许多人工智能研究人员的青睐。值迭代是求解POMDPS最优策略的一种著名算法。它通常需要大量的迭代才能收敛。本文 ...
2022-3-15 20:05 - 能者818 - Forum
马尔可夫决策过程中的随机比较静力学
0 个回复 - 366 次查看
摘要翻译:
在多周期随机优化问题中,未来最优决策是一个随机变量,其分布依赖于优化问题的参数。在
马尔可夫决策过程的背景下,我们分析了该随机变量的期望值如何随动态优化参数的变化。我们称这种分析\emph{随机比较 ...
2022-3-7 14:29 - kedemingshi - Forum
特征马尔可夫决策过程
0 个回复 - 165 次查看
摘要翻译:
通用智能学习代理通过(复杂的,非MDP)观察、行动和奖励序列循环。另一方面,强化学习在小的有限状态
马尔可夫决策过程中得到了很好的发展。到目前为止,从裸露的观察中提取正确的状态表示是人类设计师的 ...
2022-3-6 18:36 - 可人4 - Forum
马尔可夫决策过程的平均场:从离散到连续
优化
0 个回复 - 418 次查看
摘要翻译:
研究了由大量对象组成的
马尔可夫决策过程对常微分方程优化问题的收敛性。基于Markov决策过程的平均场逼近,我们证明了满足Bellman方程的Markov决策过程的最优报酬收敛于连续Hamilton-Jacobi-Bellman(HJB) ...
2022-3-6 12:39 - kedemingshi - Forum
误指定马尔可夫决策过程中的平衡
0 个回复 - 307 次查看
摘要翻译:
研究了在agent不知道当前状态和行为到未来状态的转移概率函数的情况下的马尔可夫决策问题。agent对一组可能的转移函数有一个优先信念,并使用贝叶斯规则更新信念。我们允许她被错误地规定,因为真正的转移 ...
2022-3-2 11:50 - 可人4 - Forum
通过马尔可夫决策过程掌握强化学习
0 个回复 - 941 次查看
通过
马尔可夫决策过程掌握强化学习
强化学习(RL)是一种学习方法,通过该方法学习者可以使用自己的行为和对其行为的奖励来学习在交互式环境中的行为。学习者(通常被称为代理人)通过开发和探索发现哪些动作可以带 ...
2020-12-8 21:43 - 时光永痕 - 数据分析与数据挖掘
[求助]复杂系统的马尔可夫决策过程如何建模?
4 个回复 - 3275 次查看
<p> 刚开始学习
马尔可夫决策过程,想利用它对复杂系统建模,但想了很久,一直不得其解,在此,向达人请教。<br/> 系统介绍如下:<br/> ...
2008-10-16 16:44 - shgxky - 经济金融数学专区
马尔可夫决策过程理论与应用
3 个回复 - 1757 次查看
【作者(必填)】
刘克,曹平
【文题(必填)】
马尔可夫决策过程理论与应用
【年份(必填)】
科学出版社, 2015
【全文链接或数据库名称(选填)】
刘克, & 曹平. (2015).
马尔可夫决策过程理论与应用. 科学出版社.
...
2017-4-24 01:33 - Kun806 - 文献求助专区
[求助]复杂系统的马尔可夫决策过程如何建模?
2 个回复 - 1662 次查看
<p>刚开始学习
马尔可夫决策过程,想利用它对复杂系统建模,但想了很久,一直不得其解,在此,向达人请教。<br/> 系统介绍如下:<br/> 系统由N个相互独立项目组成,每个 ...
2008-10-16 17:16 - shgxky - 创新与战略管理
[求助]复杂系统的马尔可夫决策过程如何建模?
1 个回复 - 3276 次查看
刚开始学习
马尔可夫决策过程,想利用它对复杂系统建模,但想了很久,一直不得其解,在此,向达人请教。 系统介绍如下: 系统由N个相互独立项目组成,每个项目满足离散
马尔可夫决策过程的各种 ...
2008-10-16 17:14 - shgxky - 博弈论