C01. 导论
1.1 模式识别的重要性
模式识别的目的是将对象进行分类。这些对象与应用领域相关,可以是图像、信号波形或者任何可以测量并且需要分类的对象。在多数据机器智能系统中,模式识别是用于决策的主要部分。
- 机器视觉系统通过照相机捕捉图像,通过分析生成图像的描述信息,其应用领域
- 字符(字母或者数字)识别
- 计算机辅助诊断
- 语音识别
1.2 特征、特征向量和分类器
- 用来分类的测量方法——均值和标准偏差称为特征值
- 每个特征向量表示一个样本(对象)
- 因为来源于不同样本的测量值是随机的数据,因此特征和特征向量被看作是随机变量和随机向量
- 用于决策分类器将特征空间划分为不同的类空间的直线称为决策线
- 分类作为中的基本问题
- 特征提取
- 特征选择
- 分类器的设计
- 分类器的性能评估
1.3 有监督和无监督模式识别
- 有监督模式识别:有一个可用的训练数据集,通过挖掘先验信息来设计分类器
- 无监督模式识别:没有已知类别标签的训练数据可用,只能在给定的一组特征向量中提示潜在的相似性,并且将相似的特征向量分为一类,也叫聚类
- 聚类算法可以用来完成对多维特征向量的分组
- 聚类的关键是确定两个特征向量之间的「相似度」以及合适的测度