概念引用: http://blog.csdn.net/ytdxyhz/article/details/51730995
对数据进行线性回归计算后,我们可以得到相应函数的系数。 那么,怎样才能知道这个系数对对方的行程结果有很强的影响呢?
因此,我们使用被称为coefficient of determination (决定系数)的方法判断回归方程的拟合程度。
首先定义几个概念
1. Sum Of Squares Due To Error
关于第I个视点,将实际数据的Yi和所估计的Yi-head之差称为第I个结果,SSE是所有视点的结果之和
2. Total Sum Of Squares
3. Sum Of Squares Due To Regression
根据以上内容,关于他们三者的关系可以得到以下内容
确定系数:以确定回归方程的拟合程度
确定系数(即:回归方程的依赖变量)可以将number%解释为依赖变量,从而确定拟合的程度
Correlation coefficient相关系数:测试从属变量和独立变量之间的线性关系有多强。 也就是说,测试independent variable发生变化时dependent variable的强度
能够反映出是正相关还是负的相关
Udacity :机器学习纳米工程师学位
如果不能定量评估模型的训练和测试性能,就很难衡量模型的好坏。 通常,定义通过计算几个误差或拟合优度获得的度量。 在这个项目中,通过运算确定系数R2来量化模型的表示。 模型的决策系数是回归分析中常用的统计信息,常被作为衡量模型预测能力好坏的标准。
R2的数值范围是0到1,表示目标变量的预测值和实际值的相关度的平方的百分比。 一个模型的R2值为0意味着完全无法预测目标变量; 在R2值为1的模型中,可以完美地预测目标变量。 从0到1的数值表示模型中目标变量的百分之几可以用特征来说明。 _模型中可能会出现负值R2。 在这种情况下,模型进行的预测不如直接计算目标变量的平均值好。
# todo : import ‘ R2 _ score ‘ froms klearn.metrics importr2_ scoredefperformance _ metric (y _ true ), y _ predict (: ‘ ‘ calculatesandreturnstheperformancescorebetweentrueandpredictedvaluesbasedonthemetricchosen.’ ‘ ‘ ‘是tododestodid e tween ‘ y _ true ‘ and ‘ y_predict ‘ score=R2 _ score (y _ true,y _ predict
快三稳赚10大技巧2值为0意味着完全无法预测目标变量; 在R2值为1的模型中,可以完美地预测目标变量。 从0到1的数值表示模型中目标变量的百分之几可以用特征来说明。 _模型中可能会出现负值R2。 在这种情况下,模型进行的预测不如直接计算目标变量的平均值好。
# todo : import ‘ R2 _ score ‘ froms klearn.metrics importr2_ scoredefperformance _ metric (y _ true ), y _ predict (: ‘ ‘ calculatesandreturnstheperformancescorebetweentrueandpredictedvaluesbasedonthemetricchosen.’ ‘ ‘ ‘是tododestodid e tween ‘ y _ true ‘ and ‘ y_predict ‘ score=R2 _ score (y _ true,y _ predict