《机器学习》 -- 周志华 (第二章学习笔记)

本文详细探讨了机器学习中模型评估的关键概念,包括经验误差与过拟合的区分,各种评估方法如留出法、交叉验证法和自助法的运用,以及性能度量标准如错误率、精度、查准率、查全率和F1值。此外,还讨论了ROC曲线、AUC和代价敏感错误率的重要性,最后阐述了比较检验和偏差-方差分解在模型选择中的作用。
摘要由CSDN通过智能技术生成

模型评估与选择

经验误差与过拟合

误差

  • 一般的把机器学习器在训练集上的误差成为训练误差或者经验误差
  • 在新样本上的误差称为泛化误差

过拟合

已经把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降,这样的现象叫做过拟合,与之相对的是“欠拟合”

泛化误差 vs 经验误差

  • 泛化误差 : 在 “未来”样本上的误差

  • 经验误差:在训练集上的误差,亦称“训练误差”

  • 泛化误差越小越好,但是经验误差过小会导致“过拟合”

评估方法

  • 关键 :如何获得“测试集”

    此处测试集应该于训练集 “互斥”

  • 常见方法

    • 留出法(hold-out)
    • 交叉验证法(cross validation)
    • 自助法(bootstrap)

    留出法

    直接将拥有的数据集分成两个互斥的集合,其中一个是训练集,一个为测试集

    • 保持数据分布一致性
    • 多次重复划分
    • 测试集不能太大,不能太小

    交叉验证法

    先将数据集分成k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层采样得到

    m表示样本数

    自助法

    在留出法和交叉验证法中,由于保留了一部分样本用于测试,因此实际评估的模型所使用的训练集比D小,这样会导致估计偏差

    自助法直接以自助采样法为基础

    • 训练集与原样本集同规模
    • 数据分布有所改变
    • “有放回取样” “可重复取样”

    通过自助取样,有36.8%的样本未出现在采样数据集D’中,于是将D’做训练集,D\D’做测试集,这样的测试结果亦称“包外估计”

    调参与最终模型

    常涉及的两类参数

    • 算法的参数: 一般由人工设定,亦称“超参数”
    • 模型的参数:一般由学习确定

    两种方法调参过程相似:先生产若干模型,然后基于某种评估方法进行选择

    参数调得好不好往往对最终性能有关键影响

性能度量

性能度量是衡量模型泛化能力的评价标准,反映了任务需求。

使用不同的性能度量往往会导致不同的评判结果。

回归任务常用均方误差

错误率与精度

  • 错误率

    分类错误的样本数占样本总数的比例

  • 精度

    分类正确的样本数占样本总数的比例

查准率与查全率与F1

分类结果混淆矩阵

真实情况 预测结果
正例 反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)

+ 查准率

P=TPTP+F
Cristal_yin
关注 关注
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
周志华机器学习第二章:模型评估与选择(2)
Zoro的博客
08-03 884
2.4 比较检验     在2.1~2.3节,我们讨论了评估学习器的实验评估方法和性能度量,看起来似乎已经完成了我们在本章开始时提出的任务:我们应该如何评价学得模型,并加以选择。但是具体怎么使用这些评估方法和性能度量呢?不是简单的直接应用,相反,学习器的性能比较是一件相当复杂的事情。首先考虑以下三个问题: 我们最终要评估的是学习器的泛化性能,可是由2.2节可知,我们是通过学习器的测试误差来近似泛...
机器学习by周志华学习笔记-线性模型-02对数几率回归与线性判别分析
vanilla698的博客
04-17 1008
上一节我们考虑了线性模型的回归学习,但是想要做分类任务就需要用到上文中的广义线性模型。当联系函数连续且充分光滑,考虑单调可微函数。多分类与二分类的线性判别分析(LDA)
机器学习历程——人工智能基础与应用导论(2)(模型评估与选择)
xllzuibangla的博客
04-29 1198
一、基本概念 1、泛化误差经验误差 泛化误差:在未来样本上的误差经验误差:在训练集上的误差,又称“训练误差”。 2、过拟合、欠拟合 过拟合:指训练误差和测试误差之间的差距太大。(模型拟合程度高,在训练集上表现好,在测试集上表现差,“死记硬背”,泛化能力差) 造成原因: 1、训练集样本单一,样本不足; 2、训练集中噪声干扰大; 3、模型过于复杂。 解决方案:正则化方法。(1)直接提供正则化约束的参数正则化方法,如L1/L2正则化;(2)通过工程上的技巧来实现更低泛化误差的方法,如提前
(读书笔记周志华-机器学习-第二章 模型评估与选择
最新发布
Aylson的博客
08-08 1143
1.错误率(分类错误的样本数占样本总数的比例),即如果在 m 个样本中有α个样本分类错误,则错误率E=α/m;2.精度(1-错误率)即1-a/m;3.误差学习器的实际预测输出与样本的真实输出之间的差异);训练误差/经验误差学习器在训练集上的误差);泛化误差(在新样本上的误差);我们实际希望的,是在新样本上能表现得很好的学习器.为了达到这个目的,应该从训练样本中尽可能学出适用于所有潜在样本的"普遍规律",这样才能在遇到新样本时做出正确的判别。基于这个会出现“过拟合”和“欠拟合”两种现象。
周志华 机器学习笔记 第二章
weixin_39970417的博客
05-14 980
名词解释:训练误差学习器在训练集上的误差误差学习器的实际预测输出与样本的真实输出之间的差异错误率:把分类错误的样本数占样本总数的比例泛化误差:在新样本上的误差过拟合:当学习器把训练样本学得"太好"了的时候,很可能巳经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降这种现象在机器学习中称为"过拟合" (overfitting). 误差评估方法:"留出法" (...
周志华机器学习第二章读书笔记(二)
u013261340的博客
10-13 620
(1)ROC(Receiver Operating Characteristic)受试者工作特征 根据学习器的预测结果对样例进行排序,按此顺序逐个把样本作为正例进行预测,每次计算出两个重要量的值,得到ROC曲线。
机器学习周志华 第二章——模型评估与选择笔记
weixin_43840011的博客
02-14 561
3、贝叶斯优化:对目标函数的形状进行学习,找到使得目标函数向全局最优提升的参数,每一次用新的采样点测试目标函数时候,利用信息来更新目标函数的先验分布,但贝叶斯算法容易陷入局部最优,在局部反复采样。我们可根据学习器的预测结果对样例进行排序,排在前面的是学习器认为“最可能”是正例的样本,排在最后的则是学习器认为“最不可能”是正例的样本.按此顺序逐个把样本作为正例进行预测,即可计算出计算出当前的查全率、查准率.计算适应度:计算每个个体的适应度,即目标函数的值,如机器学习模型的准确率或损失函数。
机器学习周志华第二章笔记(二)
ha_ha515的博客
01-15 207
梯度下降 := assignment 赋值 a:=b 将b的值赋给a = 判断 α\alphaα learning rate 学习率 影响梯度下降的速度 同步更新Θ1\Theta1Θ1和Θ2\Theta2Θ2 公式: 倒数项会越来越小 因此不用刻意变α\alphaα的值 batch: 全览整个训练集 单词: slope 斜率 conve...
机器学习》-- 周志华 (第一章学习笔记
Cristal_yin的博客
07-08 2878
第一章学习笔记基本术语 分类(classification):若我们欲预测的是离散值,如“好瓜”“坏瓜”,此类学习任务成为“分类”。 回归(regression):若预测的是连续值,如西瓜成熟度0.65,0.78,此类学习任务称为“回归”。 聚类(clustering):将训练集分成若干组(簇),这些簇可能对应一些潜在的概念划分,如“浅色瓜”“深色瓜”。 学习(learning)/训练(traini
机器学习by周志华学习笔记-决策树-01决策树流程与划分规则
vanilla698的博客
05-10 954
本书中的「决策树」有时指学习方法,有时指学得的树。
机器学习》--周志华 (第三章学习笔记
Cristal_yin的博客
07-30 2436
线性模型基本形式线性模型试图学得一个通过属性的线性组合来进行预测的函数,即f(x)=w1x1+w2x2+...+wdxd+bf(x) = w_1x_1 + w_2x_2+ ... +w_dx_d +b一般用向量形式写成f(x)=wTx+bf(x) = w^Tx + b线性模型形式简单、易于建模,但却蕴涵着机器学习中一些重要的基本思想。线性回归 线性模型线性模型试图学得一个通过属性的线性组合来进行预测
周志华机器学习读书笔记第二章(一)
u013261340的博客
10-08 746
模型评估与选择 (1)错误率+精度=1,错误率是指分类错误的样本数占样本总数的比例。 (2)误差学习器的实际预测输出与样本的真实输出之间的差异。 训练误差学习器在训练集上的误差泛化误差:在新样本上的误差。 (3)过拟合和欠拟合:学习器把训练样本学的太好了,导致泛化性能下降;欠拟合,指对训练样本的一般性质尚未学好。 过拟合是机器学习面临的关键障碍,各类算法都必然有一些针对过拟合的
周志华机器学习第二章学习笔记
weixin_30824599的博客
06-15 284
一、误差经验误差(训练误差)、泛化误差->过拟合(overfitting)、欠拟合(underfitting) 1.误差(error)是学习器的实际预测输出与样本的真实输出之间的差异。 2.训练误差(training error)或经验误差(empirical error)是训练集上的误差。 3.泛化误差(generalization error)是新样本上的误差。 4.显然,我们...
周志华机器学习》第2章部分笔记
木瓜子的博客
04-25 721
第2章 模型评估与选择 2.1经验误差与过拟合 ①误差(error):学习器的预测输出与样本的真实输出之间的差异 ②训练误差(training error)或经验误差(empirical error):在训练集上的误差 ③测试误差(test error):在测试集上的误差泛化误差(generalization error):学习器在所有新样本上的误差 ⑤过拟合(overfitt...
周志华机器学习第二章笔记
qq_40694323的博客
04-12 1429
二、模型评估与选择 2.1经验误差与过拟合 2.2、评估方法 1.留出法:​ 2.交叉验证法 3.自助法: 4.调参与最终模型
机器学习——周志华学习笔记——第二章:模型评估与选择
L聪记博客
05-25 2050
一、经验误差与过拟合 1、错误率:分类错误的样本数占样本总数的比例 2、精度 = 1 - 错误率 3、实际预测输出与样本的真实输出之间的差异被称为“误差”(error);在训练集上的误差被称为“训练误差”(training error)或“经验误差”(empirical error);在新样本上的误差被称为“泛化误差”(generalization error) 4、过拟合:当学习器把训练
机器学习(周志华) 学习笔记第二章 模型评估与选择
weixin_38648770的博客
07-17 516
文章目录1. 经验误差与过拟合误差过拟合和欠拟合2. 评估方法测试集和训练集留出法交叉验证法特例:留一法自助法3. 性能度量查准率和查全率ROC和AUC课后题2.5代价敏感错误率与代价曲线4. 比较检验假设检验交叉验证t检验McNemar检验Friedman检验和Nemenyi后续检验5. 偏差与方差 1. 经验误差与过拟合 m个样本里有a个分类错误 错误率:a/m 精度:1-a/m 误差 预测输...
机器学习周志华 第二章 模型评估与选择
m0_37757740的博客
11-06 321
2.1 经验误差与过拟合 错误率:分类错误的样本数a占样本总数m的比例,E = a/m 精度: 1 - a/m 学习器在训练集上的误差称之为:“训练误差”或者“经验误差”,在新样本上的误差称之为“泛化误差” 过拟合:当学习器在训练样本上训练误差降低,但是泛化误差增加,通常的原因在于学习器的学习能力过于强大,以至于把训练样本中所包含的不太一般的特性都学到了。 欠拟合:通常是由于学习能力低下造成的...
周志华机器学习》读书笔记----第二章:模型评估与选择
励志的小胡子
09-05 572
        机器学习要做的工作可以这样理解:给定一些数据,在数据上训练模型,得到能解决我们实际问题的模型。在这个过程中,数据的处理,模型的选择,模型的评估都需要花费一些时间来处理。这节内容就是模型的选择与评估。 一、经验误差与过拟合       &nbsp...
机器学习周志华课后题第三章
04-06
1. 什么是泛化能力?泛化能力和过拟合之间有什么关系? 泛化能力是指模型在新的、未见过的数据上的表现能力。模型的泛化能力与其对训练数据的拟合程度有关,通常来说,过拟合的模型泛化能力较差。...
写文章

热门文章

  • fine-tuning 6043
  • 《机器学习》--周志华 (第五章学习笔记) 3645
  • 《数字图像处理》--冈萨雷斯(第十章) 3428
  • 《机器学习》-- 周志华 (第一章学习笔记) 2877
  • 《机器学习》--周志华 (第六章学习笔记) 2606

分类专栏

  • 随笔 2篇
  • 机器学习 30篇
  • 数字图像处理 7篇
  • web前端 3篇

最新评论

  • JAVA面试题(笔记)

    CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你:https://edu.csdn.net/skill/java?utm_source=AI_act_java

  • 数据分析

    weixin_47875311: 作者大大能不能详细说一下K-Means.m函数部分,小白看不太懂

  • MNIST数据集训练

    aliez.: 您好,请问这些代码是需要分开运行的吗

最新文章

  • 计算机网络1-2
  • 计算机网络备忘录
  • JAVA面试题(笔记)
2023年3篇
2017年42篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家辽宁玻璃钢雕塑供应商平凉仿真玻璃钢雕塑价格长春玻璃钢造型雕塑批发石家庄动物玻璃钢雕塑加工厂批发玻璃钢花盆花器黑龙江水果玻璃钢雕塑价位树脂玻璃钢雕塑厂家上海玻璃钢雕塑多少钱玻璃钢雕塑艺术漆背景墙双辽玻璃钢雕塑吉安商场美陈户外玻璃钢雕塑联系方式临沧玻璃钢雕塑报价宜昌玻璃钢考拉雕塑公司站姿玻璃钢雕塑价格表西宁玻璃钢博物馆雕塑商场门头周年美陈弥勒市玻璃钢雕塑怎么样梅州玻璃钢仿铜人物雕塑定制惠州玻璃钢人物雕塑恩施玻璃钢雕塑小品厂家郑州房地产玻璃钢人物雕塑价格安徽水果玻璃钢雕塑河南镂空不锈钢玻璃钢雕塑报价江苏景观玻璃钢雕塑玻璃钢八路军雕塑图片玻璃钢雕塑制作价格贵不贵玻璃钢乐队雕塑宝鸡学校玻璃钢人物雕塑厂家金山区镜面玻璃钢雕塑厂家直供香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化