《统计学习方法》的读书笔记

ZhuYuanxiang 2019-03-11 00:00:00
Categories: Tags:

全书总评

C01. 统计学习方法概论

统计学习

统计学习导言

统计学习的对象

统计学习的目的

统计学习的方法

统计学习的研究

统计学习的重要性

监督学习

基本概念

问题的形式化描述

统计学习三个要素

模型

策略

算法

模型的评估与选择

模型评估

模型选择

正则化与交叉验证

正则化

交叉验证

泛化能力

泛化误差

泛化误差的上界

生成模型与判别模型

分类问题

标注问题

回归问题

C02. 感知机

C03. k 近邻法

C04. 朴素 Bayes 法

C05. 决策树 (decision tree)

C06. Logistic 回归与最大熵模型

C07. 支持向量机

C08. 提升方法 ( 集成学习 )

提升方法是一种统计学习方法,也是一种提升模型学习能力和泛化能力的方法,还是一种组合学习 ( 集成学习 ) 的方法,是统计学习中最有效的方法之一。

C09. EM 算法及推广

C10. 隐 Markov 模型 ( HMM ) 的算法及推广

C11. 条件随机场 ( CRF ) 的算法及推广

C12. 统计学习方法总结

10 种统计学习方法特点的概括总结

方法 适用问题 模型特点 模型类型 学习策略 学习的损失函数 学习算法
感知机 二类分类 分离超平面 判别模型 极小化误分点到超平面距离 误分点到超平面距离 随机梯度下降
K 近邻法 多类分类,回归 特征空间,样本点 判别模型 ________ ________ ________
朴素贝叶斯 多类分类 特征与类别的联合概率分布区,条件独立假设 生成模型 极大似然估计,极大后验概率估计 对数似然损失 概率计算公式,EM 算法
决策树 多类分类,回归 分类树,回归树 判别模型 正则化的极大似然估计 对数似然损失 特征选择,生成,剪枝
逻辑斯蒂回归与最大熵模型 多类分类 特征条件下类别的条件概率分布,对数线性模型 判别模型 极大似然估计,正则化的极大似然估计 逻辑斯蒂损失 改进的迭代尺度算法,梯度下降,拟牛顿法
支持向量机 二类分类 分离超平面,核技巧 判别模型 极小化正则化的合页损失,软间隔最大化 合页损失 序列最小最优化算法 (SMO)
提升方法 二类分类 弱分类器的线形组合 判别模型 极小化加法模型的指数损失 指数损失 前向分布加法算法
EM 算法 概率模型参数估计 含隐变量概率模型 ________ 极大似然估计,极大后验概率估计 对数似然损失 迭代算法
隐马尔可夫模型 标注 观测序列与状态序列的联合概率分布模型 生成模型 极大似然估计,极大后验概率估计 对数似然损失 概率计算公式,EM 算法
条件随机场 标注 状态序列条件下观测序列的条件概率分布,对数线性模型 判别模型 极大似然估计,正则化极大似然估计 对数似然损失 改进的迭代尺度算法,梯度下降,拟牛顿法

参考文献