机器学习知识总结——模型评估标准之混淆矩阵

模型评估标准 混淆矩阵 预测值=1 预测值=0 真实值=1 TP FN 真实值=0 FP TN TP=True Postive=真阳性;FP=False Positive=假阳性 TN = True Negative=假阴性;FN=False Negative=假阴性 什么是查准率/精确率 Precision=\frac{TP}{TP+FP} 什么是查全率/召回率 R

- 阅读全文 -

机器学习知识总结——过拟合和欠拟合

过拟合(overfitting) 什么是过拟合? 所谓过拟合就是指在验证集和训练集上表现很好,但是在测试集上表现很差,也就是说泛化能力差。一般表现为: 高方差,低偏差 过拟合的原因 训练样本选取有误、样本标签错误等 样本噪声干扰过大 模型过于复杂 对于神经网络来说: 学习迭代次数太多 如何防止/解决过拟合问题? 扩大数据集 进行正则化(L1正则或者L2正则等) 采用合适的模型(控制模型的

- 阅读全文 -

逻辑回归(Logistic Regression)

什么是逻辑回归? 首先,什么是逻辑回归呢? 当你看到这个名字的时候,你可能会被他误导,认为他是做回归的,实际上,他是一个分类模型。只不过他是在线性回归的基础上进行了扩展,使其可以进行分类了而已。 同样的,逻辑回归的与线性回归一样,也是以线性函数为基础的;而与线性回归不同的是,逻辑回归在线性函数的基础上添加了一个非线性函数,如sigmoid函数,使其可以进行分类。 逻辑回归的原理 关于逻辑回归的原理

- 阅读全文 -

线性回归(Linear Regression)

线性回归, 最简单的机器学习算法, 当你看完这篇文章, 你就会发现, 线性回归是多么的简单. 首先, 什么是线性回归. 简单的说, 就是在坐标系中有很多点, 线性回归的目的就是找到一条线使得这些点都在这条直线上或者直线的周围, 这就是线性回归(Linear Regression). 是不是有画面感了? 那么我们上图片: 那么接下来, 就让我们来看看具体的线性回归吧 首先, 我们以二维数据为例

- 阅读全文 -

随机梯度下降和小批量梯度下降详解

所谓随机梯度下降, 顾名思义, 就是随机选取数据来做随机梯度下降. 普通梯度下降 普通的梯度下降的计算公式为: \omega = \omega - \lambda\frac{\partial J}{\omega} 其中, J为损失函数, 而\omega就是我们需要求的参数, \lambda为步长, 也就是我们所说的学习率. 也就是说, 梯度下降法其实就是将相应的参数按照梯度下降的方向前进一点点

- 阅读全文 -