概念引用: http://blog.csdn.net/ytdxyhz/article/details/51730995

对数据进行线性回归计算后,我们可以得到相应函数的系数。 那么,怎样才能知道这个系数对对方的行程结果有很强的影响呢?

因此,我们使用被称为coefficient of determination (决定系数)的方法判断回归方程的拟合程度。

首先定义几个概念

1. Sum Of Squares Due To Error

关于第I个视点,将实际数据的Yi和所估计的Yi-head之差称为第I个结果,SSE是所有视点的结果之和

2. Total Sum Of Squares

3. Sum Of Squares Due To Regression

根据以上内容,关于他们三者的关系可以得到以下内容

确定系数:以确定回归方程的拟合程度

确定系数(即:回归方程的依赖变量)可以将number%解释为依赖变量,从而确定拟合的程度

Correlation coefficient相关系数:测试从属变量和独立变量之间的线性关系有多强。 也就是说,测试independent variable发生变化时dependent variable的强度

能够反映出是正相关还是负的相关

Udacity :机器学习纳米工程师学位

如果不能定量评估模型的训练和测试性能,就很难衡量模型的好坏。 通常,定义通过计算几个误差或拟合优度获得的度量。 在这个项目中,通过运算确定系数R2来量化模型的表示。 模型的决策系数是回归分析中常用的统计信息,常被作为衡量模型预测能力好坏的标准。

R2的数值范围是0到1,表示目标变量的预测值和实际值的相关度的平方的百分比。 一个模型的R2值为0意味着完全无法预测目标变量; 在R2值为1的模型中,可以完美地预测目标变量。 从0到1的数值表示模型中目标变量的百分之几可以用特征来说明。 _模型中可能会出现负值R2。 在这种情况下,模型进行的预测不如直接计算目标变量的平均值好。

# todo : import ‘ R2 _ score ‘ froms klearn.metrics importr2_ scoredefperformance _ metric (y _ true ), y _ predict (: ‘ ‘ calculatesandreturnstheperformancescorebetweentrueandpredictedvaluesbasedonthemetricchosen.’ ‘ ‘ ‘是tododestodid e tween ‘ y _ true ‘ and ‘ y_predict ‘ score=R2 _ score (y _ true,y _ predict

快三稳赚10大技巧2值为0意味着完全无法预测目标变量; 在R2值为1的模型中,可以完美地预测目标变量。 从0到1的数值表示模型中目标变量的百分之几可以用特征来说明。 _模型中可能会出现负值R2。 在这种情况下,模型进行的预测不如直接计算目标变量的平均值好。

# todo : import ‘ R2 _ score ‘ froms klearn.metrics importr2_ scoredefperformance _ metric (y _ true ), y _ predict (: ‘ ‘ calculatesandreturnstheperformancescorebetweentrueandpredictedvaluesbasedonthemetricchosen.’ ‘ ‘ ‘是tododestodid e tween ‘ y _ true ‘ and ‘ y_predict ‘ score=R2 _ score (y _ true,y _ predict