机器学习期末复习——第一章
机器学习期末复习——第一章
一、重点知识点回顾
1. 分类任务 vs 回归任务
在机器学习当中,分类(Classification)和回归(Regression)是两种主要的监督学习方式,其核心区别在于预测目标的性质不同:
- 分类:分类旨在预测离散的类别标签,例如判断一封邮件是“垃圾邮件”还是“非垃圾邮件”。
- 回归:回归用于预测连续的数值,例如预估房屋的价格或者明天的气温(预测的数值理论上可以取某个区间内的任意值)。
2. 监督学习 vs 无监督学习
监督学习(Supervised Learning)和无监督学习(Unsupervised Learning)是机器学习中两种核心的学习范式,其根本区别在于训练数据是否包含预先定义的标签:
- 监督学习:监督学习依赖于带标签的数据,其目标是让模型学习从输入到输出的映射关系,以解决分类或回归等预测性问题。
- 无监督学习:无监督学习则处理没有标签的原始数据,其核心任务是自主探索数据内在的分布规律与结构,例如通过聚类将数据分组。
3. 特征 vs 标签
以西瓜书中的一条记录为例:((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜):
其中,“色泽”、“根蒂”和“敲声”等能够反映事件或对象在某方面的表现或性质的事项,被称之为属性(Attribute)或者特征(Feature),而“青绿”“蜷缩”“浊响”等自然是对应的属性值或者特征值;而“好瓜”则是关于示例结果的信息,称之为标签(Label)。
By the way,形如(色泽=青绿;根蒂=蜷缩;敲声=浊响)的记录被称之为“示例”(Instance),而形如((色泽=青绿;根蒂=蜷缩;敲声=浊响),好瓜)的记录被称之为“样例”(Example)。这个不是重点,但是觉得很好玩所以顺便记录一下。
二、重点题目回顾
机器学习期末复习——第一章
http://example.com/2026/01/05/ml03/