TOTAL REWARD CRITERIA FOR UNCONSTRAINED/CONSTRAINE_中刊网——期刊资源领航者！

Document

中刊网——期刊资源领航者!

中刊网——期刊资源领航者！

中刊网 > 系统科学与复杂性学报(英文版) > 文章详情

TOTAL REWARD CRITERIA FOR UNCONSTRAINED/CONSTRAINE

【摘要】这份报纸与期望的全部的报酬标准学习可数的连续时间的Markov决定过程。作者首先与可能的无界的转变率学习非强迫的模型，并且在作者在下面显示出全部的报酬optimality方程并且也的一个答案的存在的控制系统原语数据上给合适的条件一条最佳的静止政策的存在。然后，作者在期望的全部的费用上强加限制，并且考虑联系抑制模型。关于非强迫的模型并且用Lagrangemultipliers途径基于结果，作者在一些另外的条件下面证明抑制最佳的政策的存在。最后，作者把结果用于控制排队系统。

【关键词】马尔可夫决策过程连续时间标准奖金马氏决策过程约束模型拉格朗日乘数控制系统

下载次数: 8514 页数: 0页期刊: 系统科学与复杂性学报(英文版) 刊期: 2011年3期 价格: 免费作者: Xianping GUO1 Lanlan

全文来源于知网

推荐文献

标题作者发表时间全网下载量热度页数价格

Fault Detection for Complex Systems with Channel F WANG Yanqin1 REN Wei 2018 16288 0 ￥:0

复杂系统分布式随机延期隧道无穷多重 BERNOULLI 收藏

China＇s NTB Market： A Liquidity Dilemma LI Yumeng1,2,3 MENG 2018 16351 0 ￥:0

NTB 市场流畅中国董事会制造者系统 OTC 收藏

How Does Debt Structure Influence Stock Price Cras JIA Zichao DENG Lu X 2018 16500 0 ￥:0

结构影响风险碰撞定价存货银行贷款股票价格所有权收藏

An Improved Early Termination Sparse Interpolation HUANG Qiaolong 2018 16581 0 ￥:0

插值算法多项式早结插值问题黑盒子术语归结收藏

Fuzzy Static Output Feedback H∞ Control for Nonlin ZHAO Tao DIAN Songyi 2018 16702 0 ￥:0

输出反馈控制器模糊模型模糊系统非线性静态稳定性条件稳定问题线性矩阵收藏

收藏下载投稿纸媒订阅检索报告分享

分享到QQ空间
分享到微信
分享到新浪微博
分享到人人网

系统科学与复杂性学报(英文版)

本期阅读: 2906

总阅读量: 23248

主管单位: 中国科学院

招商电话: 010-62541831 62541834

关于我们: 中刊网简介; 服务条款; 知识产权声明; 联系我们

特色服务: 读者通; 学术通; 机构智库; 季度赠刊; 检索报告

客服中心: 用户须知; 会员咨询; 售后服务; 投诉与建议; 联系客服

相关合作: 刊社加盟; 广告业务; 机构团购

客服热线: 400-135-1886 在线QQ:80886731

备案号：冀ICP备19023034号-1 邮箱：kf@china-journal.net

增值电信业务经营许可证：冀B2-20190631

出版物经营许可证：新出发冀唐零字第S08000148号

河北刊云信息科技有限公司 Copyright © 2006-2024 中刊网版权所有