永发信息网

什么是强化学习

答案:1  悬赏:0  手机版
解决时间 2021-04-03 12:05
  • 提问者网友:
  • 2021-04-03 02:34
什么是强化学习
最佳答案
  • 五星知识达人网友:長槍戰八方
  • 2021-04-03 03:56
强化学习(RL)是一个序列决策问题。
例如:撩妹的过程就是一个优化问题。你的每一时刻的行为会对你最终撩妹是否成功,以多大的收益成功都会有影响。那么,你就会考虑,每一步采取什么行为才能(最优)撩妹!这可以看作一个RL问题。你肯定迫不及待的想知道怎么去求解了!
action:你的行为
state:你观察到的妹子的状态
reward:妹子的反应:开心or不开心
所以,一个RL的基本模型已经建立。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯