为了账号安全,请及时绑定邮箱和手机 立即绑定

理解Bias(偏差),Error(误差),和Variance(方差)的区别和联系?

标签:
Python 人工智能

最近听机器学习课程时听到这三个概念一开始有点模糊。感觉没理解透,所以自己又查了点资料,消化了一下,然后做了个笔记。

    首先三者之间的联系是 Error = Bias + Variance(这里应该是忽略的噪音)。Error反映的是整个模型的准确度,说白了就是你给出的模型,input一个变量,和理想的output之间吻合程度,吻合度高就是Error低。Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,其实Bias在股票上也有应用,也可以反映股价在波动过程中与移动平均线偏离程度(乖离率),炒股的朋友应该知道均线的概念。其实通过这个我感觉可以更容易的理解这个概念,我们知道Bias是受算法模型的复杂度决定的,假设下图的红线是我们给出的模型,蓝色的点就是样本,这是一个最简单的线性模型,这个时候Bias就可以通过这些蓝色的点到红线沿Y轴的垂直距离来反映(即真实值与模型输出的误差),距离越大说明Bias越大,也说明拟合度更低。

https://img1.sycdn.imooc.com//5d57424400016cb609070620.png

当我们增加模型的复杂度,刚刚是一个线性的模型,现在是一个四次方的模型,可以明显看出点到模型的沿Y轴的垂直距离更少了,即拟合度更高了,所以Bias也更低了。所以这样我们就可以很容易理解Bias和模型复杂度之间的关系了。给出结论:当模型复杂度上升时,Bias减小。当模型复杂度降低时,Bias增加。这里就涉及到了欠拟合(unfitting)和过度拟合(overFitting)的问题了。好了,接下来让我们看看Variance(方差)的定义。


https://img1.sycdn.imooc.com//5d5742480001f74d08760637.png

Variance(方差)反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。在概率论和统计学中方差是衡量随机变量或一组数据时离散程度的度量。下图中红线就是每一组样本对应的模型,想象一下真实数据有无限多,我们以10个样本为一组,选取了500个样本组,然后在线性模型下,针对这500个样本组,我们会有500组不同的b和w值组成的线性模型,最后构成左图的样子。当我们的模型升级成5次方的复杂程度时,针对这500个样本组,我们会有右边这张图显示的500组不同的参数构成的模型。可以看出,明显右边的图比左边的图更离散一些,试想一个极端情况,当模型就是一个常数时,这个时候模型复杂度最低,同时Variance也为0。所以我们可以得出结论:当模型复杂度低时,Variance更低,当模型复杂度高时,Variance更高。

https://img1.sycdn.imooc.com//5d57424c0001b74508830619.png

到这里我们可以给出两个结论。

一、Bias和模型复杂度的关系:当模型复杂度上升时,Bias减小。当模型复杂度降低时,Bias增加。(反比关系)

二、Variance和模型复杂度的关系:当模型复杂度低时,Variance更低,当模型复杂度高时,Variance更高。(正比关系)

一开始我们就知道Error = Bias + Variance。整个模型的准确度和这两个都有关系,所以这下看似是有些矛盾的。如何才能取到最小的Error呢,看下图,蓝线就是Error的伴随Bias和Variance的变化情况,可以看出横坐标3应该是一个较好的结果。所以我们需要找到一个平衡点取得最优解。

https://img1.sycdn.imooc.com//5d57424f0001402608890621.png

实际情景中我们怎么判断自己的模型是Bias大还是Variance大呢,这个就要看到底是你的模型无法尽量大的拟合你的样本还是你的模型高度拟合你的样本但是用测试数据算时误差右很大。前者就是应该bias大导致的,也就是模型复杂度太低导致的。后者就是因为模型复杂度高导致Variance高导致的。

以上就是我对Bias(偏差),Error(误差),和Variance(方差)的一些简单理解,图全是截取自李宏毅的PPT中。



作者:邱定
链接:https://www.jianshu.com/p/2ca00f630c47


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中

跃然一笑

手记
粉丝
40
获赞与收藏
164

关注作者,订阅最新文章

相关文章推荐

  • 理解 Bias 和 Variance
  • 机器学习笔记 第4课:偏差,方差和权衡
  • 幸存者偏差
  • 机器学习面试之偏差方差
  • 【机器学习】泛化误差评估——过拟合和欠拟合的理解与相关推导

阅读免费教程

  • Python 办公自动化教程
    17个小节 25316 853
  • Python 算法入门教程
    15个小节 26927 1052
  • Python 进阶应用教程
    38个小节 64619 1009
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 分销返利 帮助中心 APP下载
官方微信
返回顶部

举报

0/150
提交
取消

玻璃钢生产厂家玻璃钢娃娃雕塑公园水景玻璃钢景观雕塑生产淮安商场春季美陈丽水玻璃钢雕塑供应最新报价酒桶玻璃钢雕塑设计临朐玻璃钢雕塑价格大庆玻璃钢仿铜麒麟雕塑哪里能买到玻璃钢雕塑玻璃钢马雕塑设计价格主题玻璃钢人物雕塑规格宿州制作玻璃钢雕塑产品厂上海商场节庆美陈雕塑加工四川仿铜玻璃钢雕塑定制户外玻璃钢仿铜雕塑浙江户外玻璃钢花盆花槽广东省玻璃钢雕塑厂广州商场美陈租赁摆件玻璃钢雕塑厂家贵州公园玻璃钢雕塑价位河南动物玻璃钢雕塑滁州卡通玻璃钢雕塑定做在线咨询常州玻璃钢花盆制作福建特色商场美陈销售河北曲阳玻璃钢雕塑厂保质保量的玻璃钢花盆普陀区玻璃钢雕塑便宜成都玻璃钢造型雕塑公司白银玻璃钢动物雕塑厂家大庆玻璃钢花盆沧州卡通玻璃钢雕塑生产厂家香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化