分类:机器学习

27 篇文章

机器学习A-Z~评估回归模型的表现
本文开始讲解关于如何评估回归模型的表现的几个方式。 R平方 首先来讲一下前面也有提到的R平方的概念。来看下面这个例子。下面红色的是数据对应的点,黑色的直线是我们拟合出来的一条简单线性线性回归。 怎么拟合这条直线呢?实际上就是假设平面上有一条直线,我们将这些数据点向这条直线上做投影,那么这些投影和实际值的差的平方和最小时就能得到这条直线。这个也有个专…
机器学习A-Z~多项式回归
之前的文章中已经学习过多元线性回归,现在来讲讲多项式回归。首先说说多项式线性回归,表达式可以表示为: $$ y = b_0 + b_1x_1 + b_2x_1^2 + ... + b_nx_1^n $$ 这个表达式和多元线性回归非常像,唯一的区别就是多项式线性回归中存在很多次方项,而多元线性回归中是多个变量。实际上这里可以把多元线性回归中的多个变量…
机器学习A-Z~多元线性回归
机器学习A-Z~多元线性回归 之前的文章已经讲述了简单线性回归的概念和代码实现,现在来继续看看多元线性回归。所谓多元线性回归其实就是自变量的个数变多了,之前的简单线性回归方程可以表示为:$y=b_0 +bx$,那么在多元中则是$y=b_0+b_1x_1+b_2x_2+...+b_nx_n$。 线性回归的几个前置条件 在正式使用多元线性回归之前,我们…
机器学习A-Z~简单线性回归
机器学习A-Z~简单线性回归 所谓简单线性回归,其实就是自变量只有一个条件情况下的线性回归问题,是线性回归问题中最简单的一种了,这种问题在生活中也经常能简单,本文就用一个简单的例子来讲解简单线性回归。 以下有一组数据集,关于工作年限和薪水之间的联系(篇幅问题只给一部分): YearsExperience,Salary 1.1,39343.00 1.…
机器学习A-Z~数据预处理
机器学习A-Z~数据预处理 数据预处理是机器学习中非常重要的步骤,为了能正确的分析数据,得到最佳的机器学习算法,拿到数据后我们一般来说都需要对数据进行预处理。数据预处理包括以下几个步骤: 导入数据集 处理缺失数据 分类数据 数据分成训练集和测试集 特征缩放 导入数据集 我们当前有一组数据集如下: Country,Age,Salary,Purchas…
吴恩达机器学习笔记(12)-机器学习系统设计
确定执行的优先级 我们已经学习过一些机器学习的算法,那么如何设计一个机器学习系统呢,课程中举了一个垃圾邮件分类器的例子,例子比较简单这里就不再赘述: 那么如何来提升这个分类器的准确度呢?有下面几个建议: 收集更多的数据 增加更复杂的特征(比如邮件头) 开发更复杂的算法来鉴定错误拼写 误差分析 如果你准备研发一个机器学习应用,下面有一些关于开发的一些…
吴恩达机器学习笔记(11)-应用机器学习的建议
评估假设 我们之前已经学习过一些机器学习的算法,现在我们来谈谈如何评估算法学习得到的假设。当发现预测的结果和实际的数据有误差的时候,我们需要进行一些调整来保证预测的准确性,大部分情况下,有以下几种办法来调整假设函数: 获取更多的训练集 减少特征的数量 尝试使用更多的特征 尝试使用多项式特征 增大或减小lambda 假设函数相对于训练集可能得到的误差…
吴恩达机器学习笔记(10)-反向传播算法练习
直观感受反向传播的概念 上篇文章讲述了神经网络的反向传播算法的基本概念,现在来详细的对此算法进行一些讲解。 回忆一下神经网络的代价函数: 如果我们只考虑一个简单的只有一个输出单元的情况,即 k=1,那么代价函数则变成: 直观的说,$\delta_j^(l)$项表示在第 l 层中第 j 个单元的误差。更正式的说,$\delta$的值实际上是代价函数的…
吴恩达机器学习笔记(8)-神经网络
本文将会介绍一种叫“神经网络”(Neural Network)的机器学习算法。 非线性假设 我们之前已经学习过线性回归和逻辑回归算法了,为什么还要研究神经网络? 我们先看一个例子。下面是一个监督学习分类问题的训练集: 如果利用逻辑回归算法来解决这个问题,首先需要构造一个包含很多非线性项的逻辑回归函数。如下所示: 这里 g 仍是 sigmod 函数,…