机器学习知识总结——过拟合和欠拟合

过拟合(overfitting) 什么是过拟合? 所谓过拟合就是指在验证集和训练集上表现很好,但是在测试集上表现很差,也就是说泛化能力差。一般表现为: 高方差,低偏差 过拟合的原因 训练样本选取有误、样本标签错误等 样本噪声干扰过大 模型过于复杂 对于神经网络来说: 学习迭代次数太多 如何防止/解决过拟合问题? 扩大数据集 进行正则化(L1正则或者L2正则等) 采用合适的模型(控制模型的

- 阅读全文 -

快速排序

# !/usr/bin/env python # -*-coding:utf-8-*- # @Time : 2021/1/12 15:32 # @Author : xiaoxia # @File : 快速排序.py def qsort(a, l, r): if l >= r: return i = l j = r while i

- 阅读全文 -

逻辑回归(Logistic Regression)

什么是逻辑回归? 首先,什么是逻辑回归呢? 当你看到这个名字的时候,你可能会被他误导,认为他是做回归的,实际上,他是一个分类模型。只不过他是在线性回归的基础上进行了扩展,使其可以进行分类了而已。 同样的,逻辑回归的与线性回归一样,也是以线性函数为基础的;而与线性回归不同的是,逻辑回归在线性函数的基础上添加了一个非线性函数,如sigmoid函数,使其可以进行分类。 逻辑回归的原理 关于逻辑回归的原理

- 阅读全文 -

线性回归(Linear Regression)

线性回归, 最简单的机器学习算法, 当你看完这篇文章, 你就会发现, 线性回归是多么的简单. 首先, 什么是线性回归. 简单的说, 就是在坐标系中有很多点, 线性回归的目的就是找到一条线使得这些点都在这条直线上或者直线的周围, 这就是线性回归(Linear Regression). 是不是有画面感了? 那么我们上图片: 那么接下来, 就让我们来看看具体的线性回归吧 首先, 我们以二维数据为例

- 阅读全文 -

推荐系统矩阵分解算法-----LFM

因为很多时候,读者对于书籍的分类与编辑对书籍的分类不同,比如《具体数学》这本书,有的人认为是数学, 有的人认为属于计算机.内容是属于数学的,而大多数读者属于计算机. 编辑的分类是从内容上出发的, 而不是从书的读者出发. 如果我们从数据出发的,自动地找到那些类,然后进行个性化推荐的技术就是隐含语义分析技术(latent variable analysis). 隐含语义分析技术采用的是基于用户行

- 阅读全文 -