结果:找到“强化学习”相关内容173个,排序为按回复时间降序,搜索更多相关帖子请点击“高级
【信息管理学习】基于推理的图推荐系统原理剖析与实务学习资料
1 个回复 - 732 次查看 内容丰富,一共20多个G,全面对移动互联网中常用的信息系统模型进行了讲解。 推荐系统属于网络信息过滤的一种应用。推荐系统能够将可能受喜好的信息或实物(例如:电影、电视节目、音乐、书籍、新闻、图片、网页) ...2022-2-7 09:50 - wz151400 - 现金交易版
机器学习入门与实战——基于scikit-learn和Keras 张海涛,李建东 习题解答
2 个回复 - 2305 次查看 图书封面 习题答案 第1章习题参考答案 一、填空题1.监督学习、无监督学习、强化学习2.最小化3.①②、③④⑤4.回归、正确5.查准率、查全率6.Python、机器学习2021-7-16 12:52 - zht505540914 - 现金交易版
2015-2016中国计算机科学技术发展报告
1 个回复 - 1790 次查看 点上面附件图标,上传附件后可设置现金定价 2015-2016中国计算机科学技术发展报告 1 引言 12 国际研究现状 2  2.1 低耗高效设计 2  2.2 服务质量 7  2.3 新能源数据中心 8  2.4 峰值用电管控 133 ...2017-11-16 10:59 - ibmandwto - 现金交易版
强化学习经典教材】Reinforcement learning state of the art.pdf
18 个回复 - 5697 次查看 Part I Introductory Part 1 Reinforcement Learning and Markov Decision Processes . . . . . . . . . . 3 Part II Efficient Solution Frameworks 2 Batch Reinforcement Learning . . . . . . . . . . . . ...2018-6-22 12:22 - yujun1214 - 量化投资
强化学习经典教材】insights in reinforcement learning[pdf]
15 个回复 - 4469 次查看 Contents 1 Introduction 3 1.1 The Aim of this Dissertation . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Previous Work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3 Agents ...2018-5-25 13:45 - yujun1214 - 量化投资
强化学习在阿里的技术演进与业务创新
7 个回复 - 1719 次查看 2018-2-9 11:29 - asdf_2007 - 跳蚤市场
【Manning2020新书】深度强化学习实战 原版pdf+jupyter notebook代码
5 个回复 - 3763 次查看 【Manning2020新书】深度强化学习实战,351页pdf,Deep Reinforcement Learning In Action 人类从反馈中学习得最好——我们被鼓励采取导致积极结果的行动,而被具有消极后果的决定所阻碍。这种强化过程可以应 ...2020-7-15 16:24 - shanggan12345 - python论坛
斯坦福强化学习教材548页
7 个回复 - 2670 次查看 强化学习:Reinforcement learning - An introduction 2nd 作者:Richard S. Sutton and Andrew G. Barto2020-9-1 10:41 - 广财金融学院 - Forum
(最新)强化学习导论:Reinforcement learning - An introduction
3 个回复 - 1619 次查看 (最新)强化学习导论:Reinforcement learning - An introduction 2020英文版 作者:Richard S. Sutton and Andrew G. Barto 强化学习权威之作2021-7-14 20:54 - sky021 - 商业数据分析
强化学习最新书籍《REINFORCEMENT LEARNING AND STOCHASTIC OPTIMIZATION》
5 个回复 - 3309 次查看 强化学习是人工智能基本的子领域之一,在强化学习的框架中,智能体通过与环境互动,来学习采取何种动作能使其在给定环境中的长期奖励最大化,就像在上述的棋盘游戏寓言中,你通过与棋盘的互动来学习。 书籍:《RE ...2019-8-4 13:19 - larrymh - Forum
金融投资组合的深度强化学习框架
1 个回复 - 142 次查看 2022-6-6 15:15 - 大多数88 - Forum
金融投资组合的深度强化学习框架
1 个回复 - 352 次查看 2022-6-4 16:04 - 何人来此 - Forum
强化学习实战系列(2020最新)|强化学习视频教程
1 个回复 - 1604 次查看 强化学习实战系列(2020最新)|强化学习视频教程 网盘地址:https://pan.baidu.com/s/1yxCDOsn76GSFBPgd1TIqzA 提取码: tt7t 备用地址(腾讯微云):https://share.weiyun.com/lwW2gjES 密码:d9iur3 强化学习系 ...2020-11-2 14:54 - 大帅哥很帅的 - Forum
(最新)强化学习导论:Reinforcement learning - An introduction
6 个回复 - 2467 次查看 (最新)强化学习导论:Reinforcement learning - An introduction 2020英文版 作者:Richard S. Sutton and Andrew G. Barto 强化学习权威之作2021-7-14 20:41 - sky021 - 商业数据分析
强化学习实战系列(2020最新)
3 个回复 - 4394 次查看 强化学习实战系列(2020最新) 网盘地址:https://pan.baidu.com/s/1ZgZguZTcMkS1DDuEFC3NUA 提取码: 3yq9 网盘地址:https://pan.baidu.com/s/1Qv-ev6gng57byaoRUXqShQ 提取码: axfg 强化学习实战系列(20 ...2021-4-13 12:44 - 少年码农 - Forum
求 俞凯强化学习第二版 电子书
3 个回复 - 5870 次查看 求 俞凯强化学习第二版 电子书,pdf版本即可,必须是中文翻译的2019-9-26 09:01 - shuferhoo - 求助成功区
面向营销的逆向强化学习
22 个回复 - 811 次查看 2022-6-2 18:30 - mingdashike22 - Forum
金融投资组合的深度强化学习框架
1 个回复 - 167 次查看 2022-6-2 14:34 - 能者818 - Forum
基于循环强化学习和LSTM的Agent激励交易
21 个回复 - 774 次查看 2022-6-1 04:27 - mingdashike22 - Forum
金融投资组合的深度强化学习框架
1 个回复 - 248 次查看 2022-6-1 01:48 - 可人4 - Forum
深度强化学习的基础
0 个回复 - 1520 次查看 强化学习 (RL),一个“利基”机器学习技术,在过去五年中浮出水面。在基于上下文的决策中,强化学习帮助机器通过试错法做出激发行动的决策,以实现针对某种情况的最佳算法模型。 此外,机器通过基于奖励/惩罚的 ...2022-5-24 10:05 - 时光永痕 - 数据分析与数据挖掘
强化学习以减少建筑能耗
0 个回复 - 1483 次查看 仅建筑物的供暖、通风和空调就占 全球能源需求的近40% [1]。 对 节能的需求 已越来越成为应对 气候变化的基础。 我们一直在研究一种基于云的 RL 算法,该算法可以改造现有的 HVAC 控制以获得实质性结果。 ...2022-5-9 15:24 - 时光永痕 - 数据分析与数据挖掘
使用强化学习(使用Python代码!)预测股票价格
1 个回复 - 3671 次查看 使用强化学习(使用Python代码!)预测股票价格 这些是我们如今定期听到的有关股市的句子。您可以将HDFC替换为在动荡的2020年期间兴旺的任何其他股票,其叙述仍然非常相似。 股市是赚钱和投资的有趣媒介。这也是一 ...2020-12-17 20:46 - 时光永痕 - 数据分析与数据挖掘
强化学习优化对话管理:实验 使用NJFun系统
0 个回复 - 258 次查看 摘要翻译: 设计口语对话系统的对话策略涉及到许多重要的选择。本文提出了一种自动优化对话策略的强化学习方法,解决了将强化学习应用于与人类用户的工作对话系统中的技术挑战。我们报告了NJFun的设计、构建和实证评 ...2022-4-11 19:40 - 何人来此 - Forum
基于深度强化学习的无人机辅助蜂窝通信 抗干扰
0 个回复 - 595 次查看 摘要翻译: 蜂窝系统容易受到干扰攻击,特别是智能干扰器,它们根据当前通信策略和网络状态选择干扰信道频率和功率等干扰策略。本文提出了一种无人飞行器(UAV)辅助的抗干扰蜂窝通信框架。在该方案中,当服务基站被严 ...2022-4-9 14:25 - 何人来此 - Forum
基于强化学习的实时调度
0 个回复 - 480 次查看 摘要翻译: 信息物理系统,如移动机器人,必须对动态操作条件作出自适应反应。这些系统的有效运行要求及时执行传感和驱动任务。此外,执行任务的特定任务,如对房间进行成像,必须与执行更一般的任务,如避障的需要相 ...2022-4-8 16:00 - 可人4 - Forum
基于模型的强化学习中的不可知系统辨识
0 个回复 - 447 次查看 摘要翻译: 控制中的一个基本问题是从观测数据中学习一个对控制器综合有用的系统模型。为了提供良好的性能保证,现有的方法必须假设真实系统在学习过程中所考虑的模型类中。我们提出了一种迭代方法,即使在系统不在类 ...2022-4-1 15:05 - nandehutu2022 - Forum
基于递归最小二乘法的高效强化学习
0 个回复 - 411 次查看 摘要翻译: 递推最小二乘(RLS)算法是应用于自适应滤波、系统辨识和自适应控制的最著名算法之一。它的流行主要是因为收敛速度快,在实践中被认为是最优的。本文将RLS方法用于解决强化学习问题,提出并分析了两种新的基 ...2022-4-1 14:35 - 何人来此 - Forum
弥合强化学习与知识之间的鸿沟 代表:一个合乎逻辑的非政策和非政策框架
0 个回复 - 234 次查看 摘要翻译: 知识表示是强化学习中的一个重要问题。在本文中,我们通过提供一个丰富的知识表示框架来弥补强化学习和知识表示之间的鸿沟,该框架基于具有答案集语义的常规逻辑程序,能够解决更复杂的事务的无模型强化学 ...2022-3-31 16:30 - 能者818 - Forum
无限马里奥中的关系强化学习
0 个回复 - 344 次查看 摘要翻译: 强化学习中的关系表示允许在价值函数的描述中使用结构信息,如对象的存在和它们之间的关系。通过本文,我们证明了这种表示允许包含定性描述状态的背景知识,并且可以用于设计在具有大状态和动作空间的领域 ...2022-3-28 08:00 - 大多数88 - Forum
基于样本的高效贝叶斯自适应强化学习 搜索
0 个回复 - 464 次查看 摘要翻译: 基于贝叶斯模型的强化学习是一种在模型不确定性下学习最优行为的形式优雅的方法,以理想的方式权衡探索和开发。不幸的是,寻找得到的贝叶斯最优策略是出了名的费力,因为搜索空间变得巨大。本文介绍了一种 ...2022-3-23 08:15 - 何人来此 - Forum
强化学习以减少建筑能耗
0 个回复 - 4014 次查看 在过去的十年中,已经提出了一种依赖于人工智能的新型控制方式。特别是,我们将重点介绍基于 强化学习 (RL) 的数据驱动控制,因为它们从一开始就显示出作为 HVAC 控制的有希望的结果 [2]。 使用 RL 升级空调系统有 ...2022-3-21 16:20 - 时光永痕 - 数据分析与数据挖掘
基于强化学习和慢特征分析的机器人导航
0 个回复 - 199 次查看 摘要翻译: 强化学习算法在实际问题中的应用总是面临着从原始传感器读数中过滤环境状态的挑战。虽然大多数方法使用启发式,但生物学认为必须存在一种无监督的方法来自动构造这种过滤器。除了提取环境状态外,滤波器还 ...2022-3-21 15:05 - 大多数88 - Forum
部分可观测马尔可夫决策过程中的强化学习 使用混合概率逻辑程序
0 个回复 - 257 次查看 摘要翻译: 将POMDP环境中的强化学习与常规混合概率逻辑程序相结合,提出了一个强化学习的概率逻辑程序框架,该框架具有描述特定领域知识的概率答案集语义。我们正式证明了我们的方法的正确性。我们证明了在我们的方 ...2022-3-18 15:45 - 能者818 - Forum
基于值梯度的强化学习
0 个回复 - 303 次查看 摘要翻译: 值梯度的概念是在强化学习的背景下引入和发展起来的。结果表明,通过学习值梯度,不再需要探索或随机行为来寻找局部最优轨迹。这是使用值梯度的主要动机,并认为学习值梯度是任何控制问题的值函数学习算法 ...2022-3-8 21:04 - nandehutu2022 - Forum
基于主动学习方法的强化学习
0 个回复 - 390 次查看 摘要翻译: 本文提出了一种新的强化学习方法,该方法是基于建模中一个强大的概念&主动学习方法(ALM)。ALM将任意多输入单输出系统表示为若干单输入单输出系统的模糊组合。该方法是一种类似于基于广义近似推理的智能控 ...2022-3-8 19:27 - 能者818 - Forum
一种基于实时模型的机器人强化学习体系结构 控制
0 个回复 - 550 次查看 摘要翻译: 强化学习(RL)是一种学习决策任务的方法,可以使机器人在线学习和适应自己的情况。为了使RL算法在机器人控制任务中具有实用性,它必须在很少的动作中学习,同时不断地实时地采取这些动作。现有的基于模型的 ...2022-3-8 17:19 - mingdashike22 - Forum
强化学习在对话策略选择中的应用 在电子邮件口语对话系统中
0 个回复 - 214 次查看 摘要翻译: 本文描述了一种新的方法,通过这种方法,口语对话系统可以从与用户交互的经验中学习选择最佳的对话策略。该方法基于强化学习和口语对话系统性能建模的结合。强化学习组件应用Q-learning(Watkins,1989), ...2022-3-8 17:16 - mingdashike22 - Forum
基于跳时技术的快速仿真强化学习
0 个回复 - 352 次查看 摘要翻译: 本预印本已由作者撤回修改 --- 英文标题: 《Time Hopping technique for faster reinforcement learning in simulations》 --- 作者: Petar Kormushev, Kohei Nomoto, Fangyan Dong, Kaoru Hirota --- ...2022-3-8 08:59 - 可人4 - Forum
强化学习的自适应基
0 个回复 - 247 次查看 摘要翻译: 我们考虑了利用函数逼近的强化学习问题,其中逼近基可以在与环境交互时动态变化。这种方法的一个动机是最大化价值函数适合于所面临的问题。考虑了三种误差:近似平方误差,Bellman残差和投影Bellman残差。 ...2022-3-7 11:30 - 大多数88 - Forum
强化学习强化学习原理与python实现
5 个回复 - 379 次查看 书名:《强化学习原理与python实现》 附件:PDF+源代码 介绍:https://book.douban.com/subject/34478302/ 图片:2022-3-5 15:04 - ximenglate - 版权审核区(不对外开放)
基于强化学习的动态最优治疗分配
0 个回复 - 339 次查看 摘要翻译: 设计关于如何分配个人治疗的指导是实证研究的一个重要目标。在实践中,个人通常是按顺序到达的,规划者面临各种限制,如有限的预算/容量,或借款限制,或需要将人员安排在队列中。例如,一个政府机构可能 ...2022-3-6 17:53 - 能者818 - Forum
特征强化学习:第一部分:非结构化MDPs
0 个回复 - 304 次查看 摘要翻译: 通用的、智能的、学习的代理在观察、行动和奖励的序列中循环,这些序列是复杂的、不确定的、未知的和非马尔可夫的。另一方面,强化学习在小的有限状态马尔可夫决策过程中得到了很好的发展。到目前为止,从 ...2022-3-6 14:23 - 能者818 - Forum
低层无线环境下的协作多智能体强化学习 通信
0 个回复 - 368 次查看 摘要翻译: 为了兼容性和效率,传统的无线电系统在OSI协议栈的较低层上严格地协同设计。虽然这使得无线电通信取得了成功,但它也引入了漫长的标准化过程,并强加了无线电频谱的静态分配。为了解决人为频谱短缺的问题 ...2022-3-6 09:20 - 何人来此 - Forum
基于强化学习的序列间ASR优化
0 个回复 - 250 次查看 摘要翻译: 尽管序列到序列方法在自动语音识别(ASR)系统中取得了成功,但这些模型仍然存在一些问题,主要是由于训练条件和推理条件之间的不匹配。在序列到序列的结构中,该模型被训练以预测当前时间步长的字形,给定 ...2022-3-5 20:38 - kedemingshi - Forum
信念树搜索的随机分枝定界方法的复杂性 在贝叶斯强化学习
0 个回复 - 186 次查看 摘要翻译: 最近有很多关于强化学习的贝叶斯方法的工作显示出接近最佳的在线性能。这些方法面临的主要障碍是,在大多数感兴趣的问题中,最优解涉及到在无限大的树上进行规划。然而,可以获得每个树节点值的随机下界和 ...2022-3-5 14:10 - 可人4 - Forum
连续时间强化学习问题的策略迭代 与空间--基础理论与方法
0 个回复 - 339 次查看 摘要翻译: 策略迭代(PI)是为解决最优决策/控制问题或强化学习(RL)问题而进行的策略评估和改进的递归过程。PI也是发展RL方法的基础。本文提出了两种PI方法,分别称为微分PI(DPI)和积分PI(IPI)及其变体,用于连续时间 ...2022-3-4 20:59 - 能者818 - Forum
中加速强化学习的时间操纵技术 模拟
0 个回复 - 383 次查看 摘要翻译: 提出了一种利用时间操纵来加速强化学习算法的技术。它适用于在计算机仿真中运行的故障避免控制问题。与传统的Q-学习算法和Actor-Critic算法相比,在故障事件上,将模拟时间向后翻转,在推杆平衡任务上的学 ...2022-3-4 20:39 - nandehutu2022 - Forum
市场博弈中的强化学习
0 个回复 - 300 次查看 摘要翻译: 金融市场的投资者参与了许多游戏--他们必须与其他代理人互动以实现他们的目标。其中包括那些与他们在市场上的活动直接相关的因素,但我们不能忽视影响人类决策和他们作为投资者的表现的其他方面。区分所有 ...2022-3-3 19:00 - mingdashike22 - Forum
量子强化学习
0 个回复 - 536 次查看 摘要翻译: 机器学习,特别是在未知概率环境中学习的关键方法是新的表示和计算机制。本文将量子理论与强化学习(RL)相结合,提出了一种新的量子强化学习(QRL)方法。受状态叠加原理和量子并行性的启发,介绍了一种值更 ...2022-3-3 16:38 - 大多数88 - Forum
多Agent强化学习与遗传策略共享
0 个回复 - 334 次查看 摘要翻译: 多Agent动态系统中Agent之间的策略共享效应尚未得到广泛的研究。我模拟了一个利用强化学习优化同一任务的智能体系统,研究了不同人口密度和策略共享的影响。我证明了共享策略减少了达到渐近行为的时间,并 ...2022-3-3 11:58 - 可人4 - Forum
深度强化学习算法
1 个回复 - 934 次查看 Deep Reinforcement Learning for Trading,感兴趣的可以研究一下。我试着用pytorch实现了一下,有需要可以交流一下2021-11-4 15:19 - 粽是梦一场 - 量化投资
【聚宽本地数据JQData】【转载】强化学习入门:基于Q-learning算法的日内择时策略初窥
0 个回复 - 973 次查看 本篇文章所使用的数据,来源于JQData本地量化金融数据库。下面我将粗略的介绍一个强化学习在证券市场中应用的简单实例。 关于强化学习的算法理论及发展历史,我们不做过多的解释。我们可以很容易在互联网上找到强化 ...2021-5-13 11:39 - lyqbnu - 量化投资
深度学习及深度强化学习实战
0 个回复 - 939 次查看 深度学习DeepLearning实战培训班 1月15日— 1月18日 深度强化学习核心技术实战培训班 1月27日— 1月30日 深度迁移学习核心技术实战培训班 1月28日— 1月31日 (第一天报到 授课三天;提前环境部署 ...2021-1-7 07:55 - 李连杰1 - Forum
强化学习的学习资料
0 个回复 - 401 次查看强化学习的学习资料2021-1-4 17:46 - 山南州 - 灌水吧
强化学习
0 个回复 - 1101 次查看 强化学习入门图书,Reinforcement Learning,(强化学习第二版) Richard S. Sutton2020-12-14 09:53 - 爱学习的我吖 - 计量经济学与统计软件
REINFORCE算法:在强化学习中迈出第一步
0 个回复 - 1517 次查看 REINFORCE算法:在强化学习中迈出第一步 让我们用REINFORCE算法解决OpenAI的Cartpole,Lunar Lander和Pong环境。 强化学习可以说是人工智能最酷的分支。它已经证明了自己的才能:令人惊叹的世界,在国际象棋,围棋 ...2020-12-9 21:13 - 时光永痕 - 数据分析与数据挖掘
通过马尔可夫决策过程掌握强化学习
0 个回复 - 1037 次查看 通过马尔可夫决策过程掌握强化学习 强化学习(RL)是一种学习方法,通过该方法学习者可以使用自己的行为和对其行为的奖励来学习在交互式环境中的行为。学习者(通常被称为代理人)通过开发和探索发现哪些动作可以带 ...2020-12-8 21:43 - 时光永痕 - 数据分析与数据挖掘
解释机器学习:了解监督,无监督和强化学习
0 个回复 - 603 次查看 解释机器学习:了解监督,无监督和强化学习 机器学习正在指导人工智能功能。 图像分类,推荐系统和游戏中的AI是我们日常生活中机器学习功能的流行用法。如果进一步细分机器学习,我们会发现这3个机器学习示例由不同 ...2020-11-30 19:27 - 时光永痕 - 数据分析与数据挖掘
强化学习
0 个回复 - 958 次查看 强化学习 强化学习(RL)–本系列“机器学习类型”子系列的第3个/最后一个帖子是在“解释机器学习”系列中。接下来的子系列“神秘的机器学习算法”即将出版。这篇文章仅讨论强化机器学习。 RL与诸如“某些新生婴儿 ...2020-11-23 20:48 - 时光永痕 - 数据分析与数据挖掘
强化学习:超级马里奥,AlphaGo及其他
0 个回复 - 913 次查看 强化学习:超级马里奥,AlphaGo及其他 我们在机器学习中发现的大多数文献都谈到了两种学习技术–有监督的和无监督的。 监督学习 是我们拥有标记数据集的地方。这意味着我们已经拥有使用线性回归,逻辑回归等算法可从 ...2020-11-4 20:41 - 时光永痕 - 数据分析与数据挖掘
强化学习:超级马里奥,AlphaGo及其他
0 个回复 - 846 次查看 强化学习:超级马里奥,AlphaGo及其他 我们在机器学习中发现的大多数文献都谈到了两种学习技术–有监督的和无监督的。 监督学习 是我们拥有标记数据集的地方。这意味着我们已经拥有使用线性回归,逻辑回归等算法可从 ...2020-11-2 19:30 - 时光永痕 - 数据分析与数据挖掘
强化学习概述
0 个回复 - 633 次查看 强化学习是一种学习方法,我们通过在计算机执行操作时向计算机提供反馈来教会计算机执行某些任务。这与监督学习的不同之处在于,我们没有明确提供正确和不正确的示例说明应如何完成任务,我们只是告诉计算机何时可以 ...2020-9-17 15:50 - 时光人 - Forum
【学习笔记】强化学习,坚持打卡。
1 个回复 - 312 次查看 强化学习,坚持打卡。2020-9-8 22:35 - zhijun.zhang - Forum
强化学习(2018第二版)】
3 个回复 - 2961 次查看 Reinforcement Learning An Introduction second edition 强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。2018-11-20 23:23 - kein强 - 大数据技术
深入浅出强化学习:原理入门
2 个回复 - 2487 次查看 2018-1-28 23:35 - Nicolle - winbugs及其他软件专版
[2018年新书] Python强化学习项目( 2018年10月20日第1版)
6 个回复 - 2799 次查看 Python强化学习项目 版: 第1版 国际标准书号: 978-1788991612 发表于: 2018年10月20日 页数: 296页 作者:Sean Saito 使用Python及其强大的库实现最先进的深度强化学习算法 强化学习是机器 ...2018-10-30 16:13 - 幸运符 - python论坛
强化学习以减少建筑能耗仅建筑物的供暖,通风和空调就占全球能源需求的近40%[1]。
0 个回复 - 1149 次查看 强化学习以减少建筑能耗仅建筑物的供暖,通风和空调就占全球能源需求的近40%[1]。 节能的需求已日益成为应对气候变化的基础。我们一直在研究基于云的RL算法,该算法可以对现有的HVAC控件进行改造,以获得可观的 ...2020-9-3 18:03 - 时光永痕 - 数据分析与数据挖掘
重新构想强化学习-颠倒了
0 个回复 - 1093 次查看 重新构想强化学习-颠倒了 简介: 对于赢得比赛和自动驾驶汽车的所有宣传,传统的强化学习(RL)尚未提供作为ML应用程序的可靠工具。在这里,我们探讨了主要缺点以及RL的创新方法,该方法可大大减少训练计算需求和 ...2020-8-31 16:39 - 时光永痕 - 数据分析与数据挖掘
强化学习能否在2020年取得突破
0 个回复 - 923 次查看 强化学习能否在2020年取得突破 简介: 强化学习(RL)对于实现我们的AI / ML技术目标至关重要,但是它有许多障碍需要克服。虽然可以在一年内实现可靠性和减少培训数据,但是RL作为“黑匣子”解决方案的性质将对其 ...2020-8-31 16:26 - 时光永痕 - 数据分析与数据挖掘
深度强化学习圣经 -《Reinforcement Learning-第二版》
5 个回复 - 3508 次查看 刚上市的。2018-10-22 18:51 - vanshareen - Forum
强化学习开始兑现其承诺
0 个回复 - 1072 次查看 强化学习开始兑现其承诺 简介: 超低成本计算和基于模型的强化学习的进步使这种建模技术更接近实际应用。 我们一直在问,今年是否是强化学习(RL)最终兑现其许多承诺的一年。就像飞行汽车和喷气背包一样,答案似 ...2020-8-21 10:25 - 时光永痕 - 数据分析与数据挖掘
强化学习能否在2020年取得突破
0 个回复 - 771 次查看 强化学习能否在2020年取得突破 简介: 强化学习(RL)对于实现我们的AI / ML技术目标至关重要,但是它有许多障碍需要克服。虽然可以在一年内实现可靠性和减少培训数据,但是RL作为“黑匣子”解决方案的性质将对其 ...2020-8-19 20:58 - 时光永痕 - 数据分析与数据挖掘
强化学习(Q学习)-简介(第1部分)
0 个回复 - 1968 次查看 强化学习(Q学习)-简介(第1部分) 您是否听说过AI学会自己玩计算机游戏并给人类专家玩家进行激烈的比赛? Deepmind是一个非常受欢迎的例子,该公司的AlphaGo程序在2016年击败了韩国围棋世界冠军。除此之外,还有 ...2020-8-5 19:11 - 时光永痕 - 数据分析与数据挖掘
强化学习开始兑现其承诺
0 个回复 - 823 次查看 强化学习开始兑现其承诺 我们一直在问,今年是否是强化学习(RL)最终兑现其许多承诺的一年。就像飞行汽车和喷气背包一样,答案似乎至少要相隔几年。 如果您在数据科学方面的历史可以追溯到最近,那么您可能还记得 ...2020-7-31 19:11 - 时光永痕 - 数据分析与数据挖掘
在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节
0 个回复 - 900 次查看 在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节 我刚刚在我的github原型书“ Bayesuvius”中上传了新的章节。本章介绍正确完成的强化学习(RL),即贝叶斯网络:) 本章主要基于谢尔盖·莱文教授 ...2020-7-31 19:05 - 时光永痕 - 数据分析与数据挖掘
[新书]Reinforcement Learning and Optimal Control强化学习与最优控制
10 个回复 - 7875 次查看 December 14, 2018 MIT科学家Dimitri P. Bertsekas今日发布了一份2019即将出版的《强化学习与最优控制》书稿及讲义,该专著目的在于探索这人工智能与最优控制的共同边界,形成一个可以在任一领域具有背景的人员都可 ...2018-12-18 09:42 - nideyida8090 - 国内外文献账号区
让机器像人类一样学习?伯克利 AI 研究院提出新的元强化学习算法——CDA人工智能学院
0 个回复 - 1036 次查看 CDA人工智能学院:数据科学、人工智能从业者的在线学院。数据科学(Python/R/Julia)数据分析、机器学习、深度学习如果要让机器人拥有人的学习能力,应该怎么做?伯克利 AI 研究院给出了一个很好的答案——元强化学习 ...2020-6-29 09:52 - AIU人工智能学院 - Forum
【学习笔记】DEEPMIND 是把深度学习与强化学习结合的大牛。
0 个回复 - 482 次查看 DEEPMIND 是把深度学习与强化学习结合的大牛。2020-6-17 15:01 - mysound999 - Forum
RL强化学习资料2018版本
0 个回复 - 556 次查看 RL强化学习经典资料,作者Sutton。2020-4-20 09:47 - 笨笨熊me - Forum
有用多主体强化学习做abm模型的小伙伴么?
1 个回复 - 858 次查看 有用多主体强化学习做abm模型的小伙伴么?2020-3-28 10:45 - sky554201495 - Forum