AI入门 | 微软ATP带你认识“机器学习”模型分类
机器学习的三要素中,最核心的是模型。无论算法还是数据都是为获得模型服务的。
建议读者
在学习机器学习时,从模型函数入手,以数据处理、特征提取等知识为辅。通过推导模型的目标函数,来学习求解过程,并以此来学习算法。
机器模型分类
简单来说,机器机器学习模型可以分为两种:有监督的和无监督的。
- 有监督学习
上一期文章提到的关于员工工作年限(experience)和薪水(salary)的模型就是有监督的模型,每一个训练数据样例都有一个人工打上的标签。
有监督的模型可以分成多种类型,其中最常用的有回归模型和分类模型两种。
回归模型的预测结果是连续的,它输出的是一个范围内的连续型任意值; 分类模型的预测结果是离散的,是几个有限的域离散值中的一个。
垃圾邮件过滤器就是一种分类模型,在一封邮件进入系统后,垃圾邮件过滤器会对邮件进行判断,并给它打一个标签。这个标签只可能是“垃圾”或“不是垃圾”,不存在第三种情况,所以它的输出是有限个。
线性回归、逻辑回归、决策树、支持向量机、朴素贝叶斯分类器、隐马尔可夫模型、条件随机场等都是有监督的模型。
- 无监督学习
没有标签的训练数据被用于无监督学习。
无监督算法中最典型的一种是聚类。聚类是指把特征相同的一些样本聚集在一起。
实际上,在聚集之前,我们也不知道聚集的结果是什么,在聚集之后,我们仍然不知道聚集起来的是什么类别的样本。K均值和谱聚类都是无监督的聚类模型。
--END--