【摘要】这份报纸学习强壮的n(n=1,0)为在波兰的空格的连续时间的Markov决定过程的折扣和有限地平线标准。相应转变率被允许无界,并且报酬率可以有既不上面也不更低的界限。在温和条件下面,作者证明强壮的n的存在(n=1,0)由开发二种等价关系打折最佳的静止政策:一个人在标准期望的平均报酬和强壮的1折扣optimality之间,并且其它在偏爱和强壮的0折扣optimality之间。作者也由开发一个正规三位字节的有趣的描述为一个有限地平线控制问题证明一条最佳的政策的存在。
【关键词】
全文来源于知网
Fault Detection for Complex Systems with Channel F WANG Yanqin1 REN Wei 2018 16288 0 ¥:0
收藏
China's NTB Market: A Liquidity Dilemma LI Yumeng1,2,3 MENG 2018 16351 0 ¥:0
收藏
How Does Debt Structure Influence Stock Price Cras JIA Zichao DENG Lu X 2018 16500 0 ¥:0
收藏
An Improved Early Termination Sparse Interpolation HUANG Qiaolong 2018 16581 0 ¥:0
收藏
Fuzzy Static Output Feedback H∞ Control for Nonlin ZHAO Tao DIAN Songyi 2018 16702 0 ¥:0
收藏