一、监督学习

监督学习(Supervised Learning)是机器学习和人工智能中的一种算法学习训练方式。它利用有标签的数据(通常称为训练数据)作为输入,训练一个模型来学习输入和输出之间的关系。模型学习后可以用于预测新的、未见过的数据的输出。这种学习方式的目标是找到一个函数,使其将输入数据映射到输出数据。监督学习的例子包括分类、回归、序列标注等任务。

二、无监督学习

无监督学习(Unsupervised Learning)是指从没有标签的数据中学习模型,该模型试图发现数据内在的结构和模式,而不是预测输出变量。无监督学习的目标是发现数据之间的相似性或关联性,使得类内差距最小化,类间差距最大化。无监督学习的例子包括聚类、降维、异常检测等任务。

三、强化学习

强化学习(Reinforcement Learning,RL)用于描述和解决智能体(agent)在环境的交互过程中通过学习策略达成回报最大化或实现特定目标的问题,是机器学习的范式和方法论之一,强化学习并不是某一种特定的算法,而是一类算法的统称。不同于监督学习和无监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。