Document
中刊网——期刊资源领航者!
中刊网 > 系统科学与复杂性学报(英文版) > 文章详情

TOTAL REWARD CRITERIA FOR UNCONSTRAINED/CONSTRAINE

【摘要】这份报纸与期望的全部的报酬标准学习可数的连续时间的Markov决定过程。作者首先与可能的无界的转变率学习非强迫的模型,并且在作者在下面显示出全部的报酬optimality方程并且也的一个答案的存在的控制系统原语数据上给合适的条件一条最佳的静止政策的存在。然后,作者在期望的全部的费用上强加限制,并且考虑联系抑制模型。关于非强迫的模型并且用Lagrangemultipliers途径基于结果,作者在一些另外的条件下面证明抑制最佳的政策的存在。最后,作者把结果用于控制排队系统。

【关键词】

8514 0页 系统科学与复杂性学报(英文版) 2011年3期 免费 Xianping GUO1 Lanlan

全文来源于知网

推荐文献
标题 作者 发表时间 全网下载量 热度 页数 价格

Fault Detection for Complex Systems with Channel F WANG Yanqin1 REN Wei 2018 16288 0 ¥:0

收藏

China's NTB Market: A Liquidity Dilemma LI Yumeng1,2,3 MENG 2018 16351 0 ¥:0

收藏

How Does Debt Structure Influence Stock Price Cras JIA Zichao DENG Lu X 2018 16500 0 ¥:0

收藏

An Improved Early Termination Sparse Interpolation HUANG Qiaolong 2018 16581 0 ¥:0

收藏

Fuzzy Static Output Feedback H∞ Control for Nonlin ZHAO Tao DIAN Songyi 2018 16702 0 ¥:0

收藏

  • 分享到QQ空间
  • 分享到微信
  • 分享到新浪微博
  • 分享到人人网

2906

23248

中国科学院

010-62541831 62541834

客服热线: 400-135-1886 在线QQ:80886731

备案号:冀ICP备19023034号-1    邮箱:kf@china-journal.net

增值电信业务经营许可证:冀B2-20190631

出版物经营许可证:新出发冀唐零字第S08000148号

河北刊云信息科技有限公司 Copyright © 2006-2024 中刊网 版权所有