【评价指标】详解F1-score与多分类MacroF1&MicroF1

71 篇文章 77 订阅
订阅专栏

基本概念

首先,要背住的几个概念就是:accuracy,precision,recal, TP,FP,TN,FN

  • TP:true positive。预测是正确的正样本
  • FP:false positive。预测是错误的正样本
  • TN:true negative。预测是正确的负样本
  • FP:false positive。预测是错误的负样本

通常我们会做出这样的一个混淆矩阵:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rc8E9gBl-1595353574343)(http://helloworld2020.net/wp-content/uploads/2020/07/wp_editor_md_9cb89fde6949def09e1b93f8f16f6fe7.jpg)]
左边的positive,negative表示样本真实值,表格上边的positive,negative表示样本的预测结果。

现在我们有这样的一个例子:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bn6G8xAG-1595353574347)(http://helloworld2020.net/wp-content/uploads/2020/07/wp_editor_md_f495f9cdb74c4e84f6c5691d71eb17a1.jpg)]
图中的TP,FP等是一个比例,假设总共有100个样本,有40个是TP,有20个是FP……(不过混淆矩阵一般不用除以总样本数量)

现在我们有了 T P = 0.3 , F P = 0.1 , T N = 0.4 , F N = 0.2 TP=0.3,FP=0.1,TN=0.4,FN=0.2 TP=0.3,FP=0.1,TN=0.4,FN=0.2

准确率Accuracy

准确率是指,对于给定的测试数据集,分类器正确分类的样本书与总样本数之比,也就是预测正确的概率。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-33L7bNtH-1595353574351)(http://helloworld2020.net/wp-content/uploads/2020/07/wp_editor_md_e3ac0c1826bd94ae3f5b59c12e7a23ec.jpg)]

对应上面的例子,可以得到Accuracy=0.7。

【准确率Accuracy的弊端】
准确率作为我们最常用的指标,当出现样本不均衡的情况时,并不能合理反映模型的预测能力。例如测试数据集有90%的正样本,10%的负样本,假设模型预测结果全为正样本,这时准确率为90%,然而模型对负样本没有识别能力,此时高准确率不能反映模型的预测能力。

精确率Precision

表示预测为正的样本中,实际的正样本的数量。

对应上面的例子, p r e c i s i o n = 0.3 0.3 + 0.1 = 0.75 precision=\frac{0.3}{0.3+0.1}=0.75 precision=0.3+0.10.3=0.75

【个人理解】
Precision是针对预测结果而言的。预测结果中,预测为正的样本中预测正确的概率。**类似于一个考生在考卷上写出来的答案中,正确了多少。**体现模型的精准度,模型说:我说哪个对哪个就是对的。

召回率Recall

Recall表示实际为正的样本被判断为正样本的比例
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EPhiLVpX-1595353574356)(http://helloworld2020.net/wp-content/uploads/2020/07/wp_editor_md_332c50f0bf41ee3aae839dd824c1ff12.jpg)]
对应上述的例子,得到 R e c a l l = 0.3 0.3 + 0.2 = 0.6 Recall=\frac{0.3}{0.3+0.2}=0.6 Recall=0.3+0.20.3=0.6

【个人理解】
Recall是针对数据样本而言的。数据样本中,正样本中预测正确的概率。**类似于一个考生在考卷上回答了多少题。**体现一个模型的全面性,模型说:所有对的我都能找出来。

F1 score

Precision和Recall是一对矛盾的度量,一般来说,Precision高时,Recall值往往偏低;而Precision值低时,Recall值往往偏高。当分类置信度高时,Precision偏高;分类置信度低时,Recall偏高。为了能够综合考虑这两个指标,F-measure被提出(Precision和Recall的加权调和平均),即:

F1的核心思想在于,在尽可能的提高Precision和Recall的同时,也希望两者之间的差异尽可能小。F1-score适用于二分类问题,对于多分类问题,将二分类的F1-score推广,有Micro-F1和Macro-F1两种度量。

【Micro-F1】
统计各个类别的TP、FP、FN、TN,加和构成新的TP、FP、FN、TN,然后计算Micro-Precision和Micro-Recall,得到Micro-F1。具体的说,统计出来各个类别的混淆矩阵,然后把混淆矩阵“相加”起来,得到一个多类别的混淆矩阵,然后再计算F1score

【Macro-F1】
我感觉更常用的是Macro-F1。统计各个类别的TP、FP、FN、TN,分别计算各自的Precision和Recall,得到各自的F1值,然后取平均值得到Macro-F1

【总结】
从上面二者计算方式上可以看出,Macro-F1平等地看待各个类别,它的值会受到稀有类别的影响;而Micro-F1则更容易受到常见类别的影响。

参考:
[1]http://zjmmf.com/2019/08/13/F1-Score%E8%AE%A1%E7%AE%97/
[2]https://zhuanlan.zhihu.com/p/49895905



190
原创
1098
点赞
6469
收藏
5万+
粉丝
关注
私信
写文章

热门文章

  • 2020春秋招聘图像处理 人工智能方向 各大厂面试常见题整理一(附答案)(阿里腾讯华为字节) 91493
  • 通俗讲:自然语言处理(NLP)入门之N-gram语言模型。(朴素贝叶斯分类器的推导) 51922
  • 从零学习pytorch 第1课 搭建一个超简单的网络 51373
  • Pytorch 中nn.Conv2d的参数用法 channel含义详解 49570
  • 图像分割必备知识点 | Unet详解 理论+ 代码 46594

分类专栏

  • 课程笔记 34篇
  • 笔记 19篇
  • 深度学习不得不了解的技巧 76篇
  • PyTorch 从零学习深度网络 71篇
  • Kaggle实战笔记 28篇
  • 健身NSCA 1篇
  • python小知识 49篇
  • norm emergency规范 8篇
  • NSCA 2篇
  • AI新闻 2篇

最新评论

  • 小样本分割 | FSS1000 | CVPR2020

    处眠: 想问下,跨域小样本语义分割(CD-FSS)任务中,支持集(support set)和查询集(query set)的类别数为1吗?

  • 图像匹配 | NCC 归一化互相关损失 | 代码 + 讲解

    新时代程序员凌霄: 请问为什么最后return要加负号

  • Kappa(cappa)系数只需要看这一篇就够了,算法到python实现

    sephong: 我也算出Pe是0.366..

  • Kd Tree算法详解

    风与铃的约定: 写的太棒了

  • 图像匹配 | NCC 归一化互相关损失 | 代码 + 讲解

    珹枨405: 这求的是cc吧,不是ncc

最新文章

  • 生成专题4 | StyleGAN2的其他改进
  • 生成专题4 | StyleGAN2的其他改进
  • 生成专题3 | StyleGAN2对AdaIN的修正
2022年9篇
2021年24篇
2020年151篇
2019年10篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家潞城玻璃钢胸像雕塑福建手糊法玻璃钢雕塑生产宣武区商场玻璃钢花盆四川特色商场美陈销售厂家玻璃钢雕塑小动物运城肖像玻璃钢彩绘雕塑开封室内玻璃钢卡通雕塑生产安徽景观玻璃钢雕塑工厂扬州玻璃钢人物雕塑商家商场柱子美陈图片玻璃钢休闲椅雕塑厂家定制榆树玻璃钢雕塑工程价格黄岛玻璃钢雕塑兴宁玻璃钢价值观雕塑福州玻璃钢牛雕塑普洱玻璃钢雕塑生产厂家河南泡沫玻璃钢卡通雕塑定制杭州玻璃钢雕塑定做淮北创意玻璃钢雕塑定制玻璃钢雕塑设计制作价位玻璃钢仿真动物雕塑供应商甘肃大型玻璃钢雕塑设计杭州商场主题美陈福建玻璃钢卡通雕塑卡通玻璃钢雕塑加工厂家重庆动物玻璃钢雕塑联系方式番禺迎宾路玻璃钢雕塑玻璃钢花盆种类图片工艺玻璃钢雕塑直销价格杭州通道商场美陈香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化