机器学习——一元线性回归和多元线性回归

一元线性回归：梯度下降法

一元线性回归是线性回归的最简单的一种，即只有一个特征变量。首先是梯度下降法，这是比较经典的求法。一元线性回归通俗易懂地说，就是一元一次方程。只不过这里的斜率和截距要通过最小二乘和梯度下降法不断迭代找到最优解。我们先来看看运用到的代价函数：最小二乘法。

这其实和高中学的最小二乘法一模一样，不过值得注意的是，这里的2其实是可以消去的，这对结果的影响不大，之所以保留是因为，方便与之后求导所得的2消掉。

梯度下降法：

开始就说过，斜率和截距是要通过迭代计算求得的。因为初始化的斜率和截距所求得的代价函数（最小二乘法）的值很大，所以要通过梯度下降法来不断改变斜率和截距的值，从而达到全局最优解或局部最优解。全局最优解和局部最优解，这两者是有分别的，如下图：

θ0和θ1分别对应斜率和截距，J（θ0，θ1）就是代价函数的值。假设红色的点代价函数的值较大，蓝色的点较小，θ0和θ1的初始值的不同会导致所位于的红色峰值不同。如果J（θ0，θ1）的值在左边的红色山峰上（黑色十角星），那么经过迭代得到的就是左边的蓝色峰底，也就是全局最优解（因为J（θ0，θ1）最小）。但是，如果J（θ0，θ1）的值在右边的红色山峰上，那么那么经过迭代得到的就是右边的蓝色峰底，即局部最优解（J（θ0，θ1）不是最小）。

重点来了，怎么进行θ0和θ1的更新呢？用到下面的公式：

新的值=新的值—学习率*代价函数对旧的值的求导。这就是梯度下降法的更新公式，学习率是步长的意思，这里不过多解释。这里要注意学习率的取值：

梯度下降法适用于多种场景，对于线性回归的解法是这样的——

首先是求导的结果：

然后带入公式得到：

线性回归的原理大概就是这样了，接下来用python进行实战训练——

这里用到的数据是这样的，很多行的由逗号分隔的两列数据

接下来是代码部分，首先是载入数据，

让我们看看数据的分布图像是怎么样的？

定义参数

程序主体部分：

开始测试