讲座论坛
Constrained Markov decision processes with varying discount factors
发布时间:2019-03-25 16:51:07 3322

演讲人:郭先平 教授

题  目:Constrained Markov decision processes with varying discount factors

时  间:2019年3月29日星期五 下午 3:30

地  点:哈工大(深圳)A509

    

讲座介绍:

This talk is on discrete-time Markov decision processes with constraints and varying discount factors.We will show a technique for transforming the constrained optimization problem in the MDPs into an equivalent linear programming (LP). Then, using the LP, we will show how to obtain an optimal policy for the constrained MDPs.

 

个人简介

    

    郭先平,教授,博士生导师,国家杰出青年科学基金获得者,中山大学教授。 1996年于中南大学获博士学位,2002于中山大学晋升为教授,2003年入选教育部优秀青年教师资助计划,2004年入选教育部新世纪优秀人才支持计划,2010年被评为珠江学者特聘教授。担(曾)任国际(SCI)杂志 Advances in Applied Probability,Journal of Applied Probability,Science China Mathematics,Journal of Dynamics and Games,及国内期刊《中国科学:数学》、《应用数学学报》、《应用概率统计》、《运筹学学报》等杂志编委。研究兴趣为马氏决策过程、随机博弈、风险控制、排队优化等。

郭先平教授从事马尔可夫决策过程(Markov Decision Processes, 简记为 MDPs)和随机动态对策的理论和应用研究。其专著《马尔可夫决策过程》(与侯振挺教授合作)填补了中国在此领域的空白,并与香港科技大学X.-R. Cao教授,墨西哥CINVESTAV-IPN O. Hernandez-Lerma教授, 澳大利亚South Australia 大学J. A. Filar教授等合作,在部分可观察的MDPs和扰动分析,连续时间MDPs和随机对策,非平稳MDPs和排队系统的最优控制等方面的研究取得系列重要进展。