机器学习中的F1-score

一、什么是F1-score

F1分数（F1-score）是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛，常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数，最大为1，最小为0。

此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重要，F2分数认为召回率的重要程度是精确率的2倍，而F0.5分数认为召回率的重要程度是精确率的一半。计算公式为：

G分数是另一种统一精确率和的召回率系统性能评估标准，G分数被定义为召回率和精确率的几何平均数。

二、计算过程

1. 首先定义以下几个概念：

TP（True Positive）：预测答案正确

FP（False Positive）：错将其他类预测为本类

FN（False Negative）：本类标签预测为其他类标

2. 通过第一步的统计值计算每个类别下的precision和recall

精准度 / 查准率(precision)：指被分类器判定正例中的正样本的比重

召回率 / 查全率 (recall)：指的是被预测为正例的占总的正例的比重

另外，介绍一下常用的准确率(accuracy)的概念，代表分类器对整个样本判断正确的比重。

3. 通过第二步计算结果计算每个类别下的f1-score，计算方式如下：

4. 通过对第三步求得的各个类别下的F1-score求均值，得到最后的评测结果，计算方式如下：

三、python实现

可通过加载sklearn包，方便的使用f1_score函数。

函数原型：

sklearn.metrics.f1_score(y_true, y_pred, labels=None, pos_label=1, average=’binary’, sample_weight=None)

参数：

y_true : 1d array-like, or label indicator array / sparse matrix.

目标的真实类别。

y_pred : 1d array-like, or label indicator array / sparse matrix.

分类器预测得到的类别。

average : string,[None, ‘binary’(default), ‘micro’, ‘macro’, ‘samples’, ‘weighted’]

这里需要注意，如果是二分类问题则选择参数‘binary’；如果考虑类别的不平衡性，需要计算类别的加权平均，则使用‘weighted’；如果不考虑类别的不平衡性，计算宏平均，则使用‘macro’。

示例程序：

from sklearn.metrics import f1_score

y_pred = [0, 1, 1, 1, 2, 2]
y_true = [0, 1, 0, 2, 1, 1]

print(f1_score(y_true, y_pred, average='macro'))  
print(f1_score(y_true, y_pred, average='weighted'))

分析上述代码，

对于类0：TP=1，FP=0，FN=1，precision=1，recall=1/2，F1-score=2/3，Weights=1/3

对于类1：TP=1，FP=2，FN=2，precision=1/3，recall=1/3，F1-score=1/3，Weights=1/2

对于类2：TP=0，FP=2，FN=1，precision=0，recall=0，F1-score=0，Weights=1/6

宏平均分数为：0.333；加权平均分数为：0.389

机器学习中的F1-score

一、什么是F1-score

二、计算过程

三、python实现

《侠客风云传》DLC天王归来养成全事件攻略侠客风云传DLC事件时间表

《动物森友会》竹笋和春笋区别详解竹笋和春笋有什么区别

最新文章

2024年Q4全球企业级SSD品牌营收排名：三星居榜首

华为脑机接口新专利公布此前已公布多项相关专利

移动gps流量卡怎么激活移动gps流量卡怎么激活使用(移动流量卡怎么激活)

移动9元卡怎么使用流量移动9元流量卡套餐介绍(知乎上刷到移动9元80G的流量卡靠谱吗)

移动70兆流量卡怎么取消移动70兆流量卡怎么取消掉(中国移动流量套餐怎么取消)

移动50g流量卡怎么开移动流量500g怎么开通(怎么激活移动流量卡)

移动4g流量卡怎么退移动4g流量卡怎么退钱(移动纯流量卡怎么退款)

移动4g流量卡怎么取消移动流量卡怎么退订(中国移动4G流量卡怎么退订)

移动4g50流量卡怎么样移动5g流量卡4g手机能用吗(5G的卡4G的手机能用吗)

移动3元流量卡怎么开机移动3元流量卡怎么开机使用(流量卡怎么用)

标签

热评文章

中国省份面积（全国各省市面积排名）

二氧化碳密度（二氧化碳密度比空气大）

东北明星(东北三省明星名单)

科普下乙醇的沸点是多少

广东人吃福建人是什么梗(广东人说普通话的梗)

机器学习中的F1-score

一、什么是F1-score

二、计算过程

三、python实现

《侠客风云传》DLC天王归来养成全事件攻略 侠客风云传DLC事件时间表

《动物森友会》竹笋和春笋区别详解 竹笋和春笋有什么区别

最新文章

2024年Q4全球企业级SSD品牌营收排名：三星居榜首

标签

热评文章

中国省份面积（全国各省市面积排名）

二氧化碳密度（二氧化碳密度比空气大）

东北明星(东北三省明星名单)

科普下乙醇的沸点是多少

广东人吃福建人是什么梗(广东人说普通话的梗)

关注我们的公众号

《侠客风云传》DLC天王归来养成全事件攻略侠客风云传DLC事件时间表

《动物森友会》竹笋和春笋区别详解竹笋和春笋有什么区别