首发于 略懂电商
关于淘宝推荐算法,那些底层逻辑

关于淘宝推荐算法,那些底层逻辑

▐ 前言

老早就想写点东西了,一直在日销和直播之间奔走。原本想分享的标题是“惊~直播带货的底层逻辑,竟然是……”哈哈,说来我们做商家自播这么多年,激情早已褪去,一直在思考前端日常销售与日常直播结合这条路。

所以总结一下淘宝天猫前端日常运营销售的一点经验。想着把文章写得正式一点,但是码字的时候就不知道要咋搭框架了。本文会有很多陌生和比较难理解的名词,希望你能看下去,看懂了都是自己的~

在算法行业,有学术界和工业界之分,工业界更加注重业务实践,而学术界偏向学术研究~,其实做电商卖货写算法的科普真的很容易就变成了学术忽悠了。因为很多同学认为,我就卖个货,还要懂算法?你不会又想割韭菜吧?

其实老司机们都知道,阿里这几年自从推荐算法、人工智能在推荐、搜索渠道、广告投放产品使用之后,获取流量变得很不可控。比如之前的很多的补单经验,不是开机就是撸单,那么简单了。从当初的刷类目,查关键词刷大词,到后来刷坑产,打标签。从当初7天螺旋,卡首屏黑搜白搜彩虹搜。到现在的无痕补单。就连淘宝的推广渠道从以前只有简单粗暴的直通车和钻展,到19年上线的超级推荐(超级推荐也在公测改名“引力魔方”),再到今年更出来的AI智投,没几个月又改名的“阿里万相台”,还有很多大家不经常使用的投放产品,比如UD,品牌秀等等。SO~如果想锦上添花,少趟坑,多赚点走得更远,那么懂点系统算法逻辑是一个趋势。至少你广告投放不被系统割韭菜、补单也少被抓。哈哈哈哈哈哈~~~

▐ 1. 淘宝推荐算法—召回与排序

废话不多说,直接今天正题吧。 从淘宝的千人千面开始巴拉巴拉起,千人千面已经提了好多年,现在阿里正式提的叫法应该叫“一人一世界”。这电商场景下的“一人一世界”的底层算法逻辑,是推荐系统。看到很多做电商培训的帅哥,也分享底层算法,有科普向量,科普召回的……不过很多都是入门的知识,逆向科普复杂化了。淘宝的推荐系统架构主要技术环节,都在下面这张图上,懒得自己画了。借用负责手淘首页猜你喜欢算法小二 北黎 的图。不单单是手淘的推荐系统,很多工业界的推荐系统大概技术流程都是如此。




淘宝上有几亿的产品,如何从中挑选最适合的数十条产品展现给淘宝用户呢?这就是推荐系统存在的价值。传统的推荐模型,主要是才用召回——排序两个阶段,但是实际落地到业务上的,又会把排序分为:粗排、精排、重排。召回模块处在推荐算法链条的最底层,决定了推荐系统效果的瓶颈及上限。召回模块的主要任务是高效地从整个商品池中筛选出一小部分(一般来说是千~十万级)用户可能感兴趣的商品,提供给粗排和精排环节进行再次的筛选和排序。




召回模型具备处理数据量大、模型够快的特点。因而,这也限定了它不能用太多的特征和太复杂的模型。

▐ 2. 召回模型的三大技术类型

基础个性化召回->深度学习召回->多目标融合召回

2.1. 基础个性化召回

最常用的召回当属item-based CF,这类算法根据item的共现关系计算i2i相似性,非常适合根据用户实时trigger(点击、收藏、加购、购买等行为)进行召回。传统模型还有如swing、userCF等,这类传统模式都是,根据用户产出的数据进行启发式的召回。


2.2. 深度个性化召回

将user、item、video等候选集转化为向量,通过向量检索技术召回Top-k,把原来的“精确匹配”为“模糊查找”,提升召回的宽度,这就是向量化召回。这段就不展开了,其实可以更细化的去分析,毕竟很多在靠说“向量召回”培训的,这里挖个坑,后面开一篇文章专门细说召回。深度算法召回还有基于用户行为序列、基于多兴趣拆分的、基于graph embedding和和基于知识图谱融合的。

2.2. 多目标融合召回

在以优化点击率目标的基础上,尝试优化关注加购收藏率、成交率等其他目标。以及将积累的各种召回模型,根据业务实际需求实行多策略召回。在手淘猜你喜欢或者搜索结果页面里有产品页面、短视频、买家秀、直播间等。还有平台的业务,比如各种聚合主题,平台的子频道,栏目。

▐ 3. 粗排

召回数量的还是千到万级别的候选集,为了后面的精排环节的性能,在中间加了一个粗排。粗排根据用户和内容的一些相关特征,对召回环节的候选集进行粗略排序,在保证一定的相关性的前提下,再一次减少往后送候选集的数量。

▐ 4. 精排

精排阶段则结合着用户行为特征、商品特征、场景上下文等特征,对产品的点击率 (CTR)、转化率 (CVR) 等排序指标进行建模。然后,系统会按照一定的商业目标 ( 例如 GMV) 综合所有的排序指标并计算出最终的排序分。


▐ 5. 召回和排序哪个更重要?

5.1. 排序在系统中的重要性

在排序环节,特别是精排,处于整个推荐算法链条的最后一环,方便直接对业务指标发力,加之候选集较小,可以使用复杂模型,使用任何能想到的特征参数。我们日常店铺的几乎都是围绕精排环节使用到的特征参数做运营,这个也是能直接“操作”的技术细节。比如我们提高首图点击率、产品销量的权重。都是最直接地影响到精排模型,使得我们获取到一个靠前的排序,从而获取到平台的流量。店铺技术运管成功与否,看我们能不能“影响”排序算法,实现运营目标。这里的影响,打了个引号,可以通过付费推广氪金的方式,引导系统拿到推荐流量、也有通过补单的博取销量,这就属于对抗系统,欺骗算法。


5.1. 召回注重策略导向


召回环节客观的来讲,技术含量不是太高,而是注重策略导向。而且召回处于整个推荐链路的前端,其结果经过粗排、精排、重排的筛选,最终作用于业务指标时,影响力已经大大减弱了,但是召回决定了排序效果的上限。所以召回对我们店铺运营的指导更多的是很高一个高度的策略指导,而且这个算法环节的可解释性很高,可以用逻辑解释得很清楚。这种大方向性的策略,淘宝官方又通通给我们很明确的指导,所以紧跟平台运营的脚步,你就胜过90%的人,前提是能跟得上。比如淘宝小二会让商家去重点关注短视频,去引导买家做买家秀,从而生产更多的内容,这不单单是我们商家的运营,也是平台小二的运营手段。推荐算法无数不在,遍布每一个业务的角落,上面提到的短视频,其实也得要单独的推荐算法去分析推荐。所以想要获取到视频的流量,就要增加短视频内容。

▐ 总结

排序算法是运营技术细节,而召回更多的是偏向平台策略,但是很难落地到商家的运营策略里。推荐算法也好,搜索算法也好,不同层次的商家,运营的方式肯定都不会一样。小商家偏向于一招鲜,更加灵活注重的是盈利,而腰部头部商家更加注重长效运营。好些时间没码字了,一篇文章选了一个很大的题目,潦草一篇文章无法讲透彻,而且大部分的同学都比较关注技术的细节,关注算法这种看不到摸不着的东西,不感冒!比如打标、卡链接、降PPC等。后面会直接拿更直观的东西出来给大家分享,如果你也喜欢研究技术运营,欢迎一起交流。


代做工资流水公司湖州办理收入证明滁州房贷工资流水 办理芜湖车贷工资流水 公司淮安日常消费流水模板广州查询银行流水账贵阳做自存流水湘潭贷款银行流水代开上海银行流水电子版价格黄冈办理签证工资流水邯郸企业对私流水代办企业流水打印代做济南房贷收入证明模板烟台离职证明报价汕头对公账户流水样本上饶个人银行流水费用三亚打企业对私流水西宁企业对公流水开具株洲代做工资流水账单曲靖打印房贷工资流水济宁代开薪资流水单西宁银行流水单公司遵义购房银行流水模板金华车贷银行流水 费用天津做银行对公流水肇庆薪资银行流水办理西宁做房贷收入证明滁州流水账单开具洛阳离职证明代办宁德房贷收入证明费用舟山办理房贷流水香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

代做工资流水公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化