永发信息网

强化学习都是马尔可夫决策过程吗

答案:1  悬赏:30  手机版
解决时间 2021-03-31 14:39
  • 提问者网友:浪荡绅士
  • 2021-03-30 18:22
强化学习都是马尔可夫决策过程吗
最佳答案
  • 五星知识达人网友:几近狂妄
  • 2021-03-30 18:40
把这个定理推一遍,这个问题就明白了。 ---------------- 比如说,假设有事件X1 X2,你想计算出p(X1) p(X2) p(X1|X2) p(X2|X1) (请自行脑补not X1, not X2) 假设有事件X1 X2 X3,你想计算出 p(X1) p(X2) p(X3) p(X1|X2X3) p(X2|X1X3) p(X3|X1X2) 你并不知道,X1 X2 Xn之间的关系,你希望能有一个神奇的模型,只需要比较少的参数,就能计算所有关于X1 X2 Xn之间能定义出来的概率。 Hammersley-Clifford theorem说的是,假如这个X1 X2 .. Xn 符合Markov property,那么就可以用Gibbs XXX来表示,或者假如你发现可以用Gibbs XXX来表示,那么他们就符合Markov property,两者是等价的。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯