R语言与LASSO回归和LAR算法

16 篇文章 26 订阅
订阅专栏

LASSO介绍

  • Tibshirani(1996)提出了LASSO(The Least Absolute Shringkage and Selectionator operator)算法
  • 通过构造一个一阶惩罚函数获得一个精炼的模型;通过最终确定一些指标(变量)的系数为零(岭回归估计系数等于0的机会微乎其微,造成筛选变量困难),解释力很强
  • 擅长处理具有多重共线性的数据,与岭回归一样是有偏估计

LASSO vs. 岭回归

岭回归与LASSO之间的本质区别

image

在几何意义上的区别(前者为LASSO回归,后者为岭回归)

image

LAR(最小角回归:后来成为LASSO回归的求解算法)

LAR(最小角回归:Least Angel Regression)

  • Efron于2004年提出的一种变量选择的方法,类似于向前逐步回归(Forward Stepwise)的形式。
  • 是LASSO REGRESSION的一种高效解法
  • 向前逐步回归(Forward Stepwise)不同在于,Forward Stepwise每次都是根据选择的变量子集,完全拟合出线性模型,计算出RSS,再设计统计量(如AIC)对较高的模型复杂度作出惩罚。
  • 而LAR是每次先找出和因变量相关度最高的那个变量,再沿着LSE的方向一点点调整这个predictor的系数。在这个过程中,这个变量和残差的相关系数会逐渐减小,等到这个相关性没有那么显著的时候,就要选出新的相关性最高的变量,然后重新沿着LSE的方向进行变动。而到最后,所有变量都被选中,就和LSE相同了。

Algorithm 3.2 Least Angle Regression

  1. Standardize the predictors to have mean zero and unit norm. Start with the residual r = y – y-, β,β,…, β = 0
  2. Find the predictor Xj most correlated with r
  3. Move βj from 0 towards its least-squares coeffcient <Xj, r>, until some other competitor Xk has as much correlation with the current residual as does Xj.
  4. Move βj and βk in the directin defined by their joint least squares coefficient of the current residual on (Xj, Xk), until some other competitor Xl has as much correlation with the current residual.
  5. Continue in this way until all p predictors have ben entered. After min(N-1, p) steps, we arrive at the full least-squares solution.

Algorithm 3.2a Least Angle Regression: Lasso Modification

  • 4a. if a non-zero coefficient hits zero, drop its variable from the active set of variables and recompute the current joint least squares direction.

LAR and LASSO

image

在R中使用LAR算法进行LASSO回归分析

继续使用longley数据集进行LASSO回归

image

进行LAR(最小角回归)

image

并打印LAR过程图

image

对得到的最小角回归进行summary

image

在数据结果中可知:在高亮步骤时,cp达到最小值(变量之间的多重共线性的程度达到最小值)。而此时为在全变量模型的基础上,-6 -5(去掉第六号变量和第五号变量)使模型达到最小的共线性程度。

即可作出精确的变量选择:y ~ 1 + 2 + 3 + 4 + 7(去掉 5, 6)

CP值的含义(Mallow’s Cp)

image

原线性模型的统计结果如下:

image

经过LAR算法进行LASSO回归分析,处理变量间的多重共线性后,更新原模型后的统计结果如下:

image

通过原线性模型和更新后的线性模型之间的对比可以发现:虽然,在进行了变量间的多重共线性处理之后,Multiple R-squared有所降低,但Residual standard error相应提高。而且,各个变量的显著性检验表现的更好。

最小角回归 LARS算法包的用法以及模型参数的选择(R语言
li123128的博客
04-15 2776
问题  在使用echart去创建图表时,发现图表只占了容器的一个角落,如图,并没有充满容器。  第一反应是容器元素的样式有问题,于是我把容器的宽高都改为px指定的(之前是百分比设定的,查询资料发现说echart容器宽高要明确指定),修改之后,还是和上面一样的展示,依旧有问题。定位  于是我想是不是渲染图表时,获取到的容器元素的高度有问题,代码中我是在ngAfterViewInit()生命周期中渲染...
机器学习--线性回归3(使用LAR算法进行求解Lasso算法
进击的菜鸟
10-31 5497
上一节我们详细的介绍了岭回归算法lasso算法的来历和使用,不过还没有详解lasso计算方式,本节将进行全面的详解,在详解之前,希望大家都理解了岭回归lasso 的来历,他们的区别以及使用的范围。下面将开始详解求解过程: 一样的,讲解之前先把本节需要的基础知识和大家讲讲,这样更容易理解: 本节需要大家理解方差、协方差以及相关系数,下面我们逐一来看一下,如果方差、协方差、相关系数的意义不理...
用Python实现9大回归算法详解——02. Lasso 回归算法
最新发布
qq_41698317的博客
08-14 2161
Lasso 回归是一种有效的线性回归方法,通过引入正则化项来避免过拟合并自动选择特征。在模型训练过程中,Lasso 回归不仅能够对系数进行缩减,还能够将不重要的特征的系数缩减为零,实现特征选择。通过案例分析,我们验证了 Lasso 回归在特征选择和模型简化中的有效性,并展示了如何使用 Python 进行实现和结果分析。
LAR(最小角回归算法原理和示意图
Fairy_fox777的博客
03-09 3204
LAR算法原理和示意图LAR算法原理描述LAR算法原理示例图 LAR算法原理描述 LAR(Least Angle Regression)算法:逐步选择特征向量,每次选择一个特征向量来作为模型的回归变量,在第一步中选择与系统响应相关度最大特征向量,并从第二步开始,通过为上一个已选择的向量选择合适的回归系数,相比其他未选择的向量,使得每次选择的向量与当前辨识模型残差的相关度最大,且此相关度与过去每个已选择过的向量与这个残差的相关度都相等,直到无多余特征向量或选择的模型符合所需的残差要求。 反映到几何图像上,就是
R语言实现LASSO回归
qq_38650208的博客
03-23 6万+
Lasso回归又称为套索回归,是Robert Tibshirani于1996年提出的一种新的变量选择技术。Lasso是一种收缩估计方法,其基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而能够产生某些严格等于0的回归系数,进一步得到可以解释的模型。R语言中有多个包可以实现Lasso回归,这里使用lars包实现。 1.利用lars函数实现lasso回归并可视化显示 x...
R语言_决策树rpart中的cp值
m0_57781387的博客
01-26 3379
cp是什么?
R语言与线性回归分析
Luminous
11-11 4543
线性回归
r语言 计算模型的rmse_R语言实现LASSO回归模型
weixin_39949607的博客
11-22 3637
我们知道广义线性模型包括了一维连续因变量、多维连续因变量、非负次数因变量、二元离散因变量、多元离散因变等的回归模型。然而LASSO对以上的数据类型都适合,也可以说LASSO 回归的特点是在拟合广义线性模型的同时进行变量筛选(variable selection)和复杂度调整(regularization)。变量筛选是指不把所有的变量都放入模型中进行拟合,而是有选择的把变量放入模型从而得到...
手把手教你使用R语言LASSO 回归
热门推荐
dege857的博客
12-25 8万+
LASSO 回归也叫套索回归,是通过生成一个惩罚函数是回归模型中的变量系数进行压缩,达到防止过度拟合,解决严重共线性的问题,LASSO 回归最先由英国人Robert Tibshirani提出,目前在预测模型中应用非常广泛。在新格兰文献中,有大牛提出,对于变量过多而且变量数较少的模型拟合,首先要考虑使用LASSO 惩罚函数。今天我们来讲讲怎么使用R语言通过LASSO 回归构造预测模型。 首先我们要下载R的glmnet包,由 LASSO 回归的发明人,斯坦福统计学家 Trevor Hastie 领衔开发。 加载
r语言回归参数选择_多重共线性的解决方法之——岭回归LASSO
weixin_33824590的博客
12-23 3517
多元线性回归模型的最小二乘估计结果为如果存在较强的共线性,即 中各列向量之间存在较强的相关性,会导致的从而引起对角线上的 值很大并且不一样的样本也会导致参数估计值变化非常大。即参数估计量的方差也增大,对参数的估计会不准确。因此,是否可以删除掉一些相关性较强的变量呢?如果p个变量之间具有较强的相关性,那么又应当删除哪几个是比较好的呢?本文介绍两种方法能够判断如何对具有多重共线性的模型进行变量剔除。即...
lasso:Lasso 回归的 AR 实现
06-18
Lasso 回归是通过最小角度回归 (LAR) 的修改版本执行的,请参阅参考文献 [1] 了解该算法。 返回值是一个 lassoClass 对象,其中 lassoClass 是 lassoClass.R 中定义的 S4 类。 lassoTest2.R 中提供了一个测试程序...
回归LassoLAR学习(一)
SkyPanPanPan的专栏
06-24 2658
概要:我们要区分岭回归lasso以及LAR的关系,岭回归是用于消除多重共线性问题,也可以用于删除无效变量(贡献率低或打酱油变量,后面会提及)。Lasso是岭回归的改进算法,对删除无效变量有帮助,而LAR是求Lasso解的一种有效算法。   先进入多远线性回归问题,先观察以下矩阵:   这里y是因变量,β1~βp是所有X的系数,β0是常数,ε1~εn是误差。因此,多远线
详解回归分析中相关变量选择的方法和构建思想——岭回归LASSO 回归、主成分回归和偏最小二乘回归
从事脑科学核磁共振方法学研究,在Nature communications等权威期刊发表研究论文,熟练掌握磁共振处理方法和统计学方法,欢迎大家和我交流。
12-26 2044
在线性回归模型中,其参数估计公式为 $\beta=\left(X^{T} X\right)^{-1} X^{T} y,$ 当 $X^{T} X$ 不可逆时无法求出 $\beta,$ 另外,如果 $\left|X^{T} X\right|$ 越趋近于 $0,$ 会使得回归系数趋向于无穷大, 此时得到的回归系数是无意义的。解决这类问题可 以使用岭回归LASSO 回归、主成分回归、偏最小二乘回归, 主要针对自变量之间存在多重共线性或者自变量个数多于样本量的情况。
lasso.m matlab,lasso算法matlab代码
weixin_42388716的博客
03-17 1858
这种算法通过构造一个惩罚函数获得一个精炼的模型;通过最终确定一些指标的系数为零,LASSO算法实现了指标集合精简的目的。这是一种处理具有复共线性数据的有偏估计。...模型的LADMM算法 ... 第二章 2.12.2 788 第三章 3.13.23.3 15151618 . LADMM算法的收敛性分析... . 第四章RFLASSO模型的数值实验 26 4.1合成数据以......对 EM 算法的...
画图解释LAR算法的几何意义
mousever的专栏
05-25 4157
1)画图及文字解释p74页下半页关于LAR算法所定义的一系列向量的几何意义,及整个算法的几何意义 回归模型: QQ图片20160323195657.png (972 Bytes) 下载附件  保存到相册 2016-3-23 19:59 上传 (共有p个变量) 给出具有n个样本的样本矩阵: QQ图片20160323195701.png (1
LAR(最小角回归
陈陈的专栏
03-14 5100
LAR(最小角回归) chenlongzhen Sunday, March 01, 2015 LAR过程 LAR图解 R的lar包使用longley数据(具有高度共线性) 用最小角度算最小二乘解,确定变量过程 library(lars) ## Warning: package 'lars' was built under R ve
回归LASSOLAR的几何意义
栖客
11-08 4691
01.png (24.65 KB, 下载次数: 1) 下载附件  保存到相册 2014-5-1 19:48 上传
多重共线性的解决方法之——岭回归LASSO
liunian920305的博客
06-19 6186
多元线性回归模型 的最小二乘估计结果为 如果存在较强的共线性,即 中各列向量之间存在较强的相关性,会导致的从而引起对角线上的 值很大 并且不一样的样本也会导致参数估计值变化非常大。即参数估计量的方差也增大,对参数的估计会不准确。 因此,是否可以删除掉一些相关性较强的变量呢?如果p个变量之间具有较强的相关性,那么又应当删除哪几个是比较好的呢? 本文介绍两种方法能够判断如何对具有
写文章

热门文章

  • Mendeley中正确设置GB/T 7714-2005中文参考文献格式 43612
  • R语言与多元线性回归+逐步回归 25177
  • R语言与多元线性回归分析计算实例 23140
  • Origin Pro 8.5中对多个多图层图片进行合并 21985
  • R语言与岭回归 16446

分类专栏

  • React前端开发 14篇
  • 常用工具 3篇
  • ElasticSearch 3篇
  • 流式计算Heron 50篇
  • SpringBoot 20篇
  • Java编程及开发 23篇
  • 人工智能 4篇
  • R语言与机器学习 16篇
  • R语言与数据可视化 8篇
  • Vagrant 2篇
  • Python编程及开发 9篇
  • 设计模式系列 19篇
  • Flink 4篇
  • Spark 3篇
  • Storm 1篇
  • Prometheus 2篇
  • Git/GitHub 6篇
  • Kafka 11篇
  • MySQL及调优 1篇
  • VMware 5篇
  • Linux/Ubuntu 13篇
  • Zookeeper 4篇
  • Hadoop/HDFS 5篇
  • Mesos 2篇
  • Aurora 4篇
  • Redis 6篇
  • 学术研究 12篇
  • Shell 2篇
  • Maven 3篇
  • MaxCompute 20篇
  • Tensorflow 4篇
  • 面试资料 2篇
  • 剑指Offer 21篇
  • 面试算法100题 50篇
  • RDB安装和使用 9篇

最新评论

  • MATLAB实现基于BP网络的个人信贷信用评估

    weixin_51634115: 求源码,3172685815@qq.com

  • Mac中Word 2016导出PDF附带书签目录结构

    2401_84361197: 谢谢分享

  • Mac中Word 2016导出PDF附带书签目录结构

    Lmnnn: 请问在导出时怎么把word和adobe连接上?

  • Mendeley中正确设置GB/T 7714-2005中文参考文献格式

    ManiZ: 中英文混排的话呢?

  • Mac中Word 2016导出PDF附带书签目录结构

    sinat_16287557: 超过40M就没办法导出了。。。

大家在看

  • 基于SpringBoot的音乐媒体播放及周边产品运营平台设计与实现(源码+定制+开发)音乐播放及产品运营系统、智能音乐媒体管理平台、音乐媒体播放平台设计、在线音乐媒体运营系统
  • python+flask计算机毕业设计共享自习室系统(程序+开题+论文) 729
  • C语言程序设计第十二章问题要点
  • IEC104规约的秘密之十五----文件传输慢的原因 2
  • 云网络验证系统云验证+卡密生成+多应用多用户管理

最新文章

  • Java类静态方法的mock实现
  • Git出现Failed to connect to github.com port 443:Operation timed out问题解决
  • Lombok@Accessors实验注解
2022年1篇
2021年3篇
2020年71篇
2019年265篇
2018年6篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家蚌埠环保玻璃钢雕塑订做价格上海定制玻璃钢雕塑推荐秋季商场美陈地贴扬州玻璃钢人物雕塑加工价格安阳玻璃钢浮雕玻璃钢仿铜雕塑无锡玻璃钢人物雕塑设计玻璃钢花盆容量山西玻璃钢雕塑厂浙江玻璃钢雕塑摆件研究福建玻璃钢卡通雕塑厂家保山玻璃钢雕塑生产制造重庆步行街玻璃钢雕塑哪家便宜保山市玻璃钢雕塑多少钱福建室内商场美陈生产公司玻璃钢动物雕塑的文章湖南玻璃钢雕塑灯定制海口玻璃钢雕塑精准推荐北京环保玻璃钢雕塑销售厂家河西商场美陈装饰广州玻璃钢雕塑造型广东发光动物玻璃钢雕塑工艺马鞍山欧式玻璃钢雕塑多少钱新乡发光玻璃钢雕塑加工厂美陈玻璃钢卡通雕塑销售厂湛江玻璃钢对弈人物雕塑玻璃钢雕塑制作哪家好四会玻璃钢卡通雕塑价格青海人物玻璃钢雕塑定做户外玻璃钢卡通雕塑源头好货安徽玻璃钢雕塑摆件香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化