1. 什么是强化强化学习 ?
强化学习 (Reinforcement Learning, RL) 是一种机器学习计划,它让智能体(agent)通过与环境互动,学习学习如何做出最佳决策,引擎应用以最大化奖励。强化简易来会谈,学习它就像教一个机器人玩游戏,引擎应用流放之路全图而不是强化给它直接写下规则。 它打破了传统机器学习的学习“监督学习”模式,让模型能够学习从经验中得到感谢 ,引擎应用并根据得到的强化奖励来调整计划 。 换句话会谈 ,学习它是引擎应用一种“学习通过尝试”的机器学习计划。 核心在于一个智能体,强化它在某个环境中铺开碰见和学习,学习最终目标是引擎应用得到最大奖励 。
2. 强化学习的核心概念