结果:找到“Bandit”相关内容19个,排序为按回复时间降序,搜索更多相关帖子请点击“高级”
金融工程学课件、习题与阅读材料合集
1 个回复 - 1550 次查看
金融工程专项阅读材料
42739 金融工程ppt.zip
42254 金融工程学课件.zip
金融工程学课件、习题、勘误PPT.zip
金融工程学习题集.docx
牛津大学金融数学.pdf
Methemetics for Finance-An Introduction to Fina ...
2022-8-21 11:05 - wz151400 - 现金交易版
Introduction to Multi-Armed Bandits
2 个回复 - 822 次查看
【作者(必填)】Aleksandrs Slivkins
【文题(必填)】Introduction to Multi-Armed
Bandits
【年份(必填)】2019
【全文链接或数据库名称(选填)】https://nowpublishers.com/article/Details/MAL-068
求链接提 ...
2020-3-29 13:40 - dreamtree - 求助成功区
Bandit Algorithms
3 个回复 - 1720 次查看
还在更新中
Part I
Bandits, Probability and Concentration
Part II Stochastic
Bandits with Finitely Many Arms
Part III Adversarial
Bandits with Finitely Many Arms
Part IV Lower Bounds for
Bandits ...
2018-10-2 01:53 - leosong - Forum
Robust Multiarmed Bandit Problems
1 个回复 - 1550 次查看
【作者(必填)】
Michael Jong Kim, Andrew E.B. Lim
【文题(必填)】
Robust Multiarmed
Bandit Problems
【年份(必填)】
2015
【全文链接或数据库名称(选填)】
http://pubsonline.informs.org/doi/abs/10.12 ...
2015-8-9 11:48 - timesever - 求助成功区
基于相依样本的Bandit算法的非策略评估
批量更新策略
0 个回复 - 242 次查看
摘要翻译:
非策略评估(OPE)的目标是使用通过行为策略获得的历史数据来评估一个新的策略。然而,由于上下文bandit算法是基于过去的观察更新策略的,所以样本不是独立的和同分布的(I.I.D.)。本文通过对相依样本的鞅 ...
2022-3-20 20:45 - 可人4 - Forum
具有无界损失的Bandit问题的算法选择
0 个回复 - 257 次查看
摘要翻译:
算法选择通常基于在单独的离线训练序列中学习的算法性能模型,这可能非常昂贵。在最近的工作中,我们采用了一种在线方法,在这种方法中,性能模型被迭代更新并用于指导对一系列问题实例的选择。由此产生的 ...
2022-3-7 22:18 - 可人4 - Forum