当前位置:网站首页 > 编程语言 > 正文

莫队(莫队算法创始人简介)



沈加翔、周靖人、徐盈辉、金榕、华先胜、司罗等淘宝搜索体系的顶级技术大牛,在将淘宝推向顶峰后,又汇聚在达摩院,筑就了阿里AI技术的最高峰。

在阿里的历史中,阿里妈妈和淘宝搜索事业部一直是极为独特的存在。他们同根同源,都流淌着雅虎血脉,继承了来自硅谷的先进理念和工作模式,和以本土派为主的交易线,形成了风格迥异的两个流派。前者轻灵飘逸、天马行空,后者沉稳厚重、一步一个脚印,二者交织碰撞,共同造就了阿里兼具精英气质和江湖气息的独特魅力。
同时,阿里妈妈和淘宝搜索事业部也和而不同,屡次“交锋”、几经分合,通过良性竞争攻克了无数技术高地,碰撞出了属于阿里技术的黄金时代。在阿里后续的几次技术大改造中,将淘宝先进的广告和搜索技术复制到其他业务线,一直是最重要的核心命题。
沈加翔、周靖人、徐盈辉、金榕、华先胜、司罗等淘宝搜索体系的顶级技术大牛,在将淘宝推向顶峰后,又汇聚在达摩院,筑就了阿里AI技术的最高峰;王志荣、李天民等另一些灵魂人物则在淘宝搜广推技术的“复制”过程中,去到其他业务线扮演起了AI领军人的角色,共同造就了阿里AI群峰耸峙的盛景。可以说,淘宝的搜广推体系就是阿里AI技术人才的摇篮和黄埔军校,成就了一代宗师。
本文则试图理清淘宝搜索事业部的发展脉络,并记录下那些群星闪耀的瞬间。

01
2005年8月,一场足以载入中国互联网史册的商业并购案终于尘埃落定,阿里巴巴宣布收购雅虎中国的全部资产。
两个月后,马云在一次公开宣讲中对这次并购做了解释:在新阿里巴巴帝国中,旗下四家公司各自扮演不同的角色。老大是阿里巴巴;当初为了防止eBay进入老大的B2B领域抢地盘,于是搞了老二淘宝;为了解决支付手段和市场诚信问题,又做了老三支付宝;后来发现老大还需要一个得力帮手,就找了雅虎中国做搜索。
当时,阿里巴巴——尤其是阿里巴巴的B2B业务,是谷歌在中国的第一大客户。谷歌上市前甚至专门派出高管前往杭州,以调查遥远的东方为什么有一个客户对它需求如此之大。
阿里对搜索的需求如此庞大,马云自然希望将相关技术牢牢掌握在自己手中,于是便有了对雅虎中国的收购。
完成并购后,阿里巴巴的战略是联合雅虎建立全网搜索引擎与百度竞争。
在马云的主导下,雅虎中国一度摒弃了门户概念,把首页变成了和谷歌很像的搜索栏。不过短短五个月后,又在雅虎总部的指示下改了回来。
这种来回摇摆源自马云和雅虎总部在理念上的分歧:按照马云的如意算盘,他希望雅虎中国能成为一个纯搜索引擎公司,这样将能提升阿里系在产业链条上的整体布局。但事实上,雅虎虽然一直在搜索引擎上有投入和积累,但其商业模式一直是媒体定位,并不愿意成为一个纯搜索引擎公司。
折腾往复之下,到2008年,阿里巴巴联合雅虎对抗百度的计划终于宣告失败。
内部讨论之后,决定聚焦到电商搜索。于是雅虎中国原本的搜索团队被拆分出来,成立了阿里巴巴搜索中心(ASC),由原雅虎中国搜索业务负责人张勤(花名:杨过)负责。
阿里巴巴搜索中心支持的第一个业务是B2B。当时B2B的搜索用的是一套基于Lucence架构、用C++重写的叫做isearch的系统。阿里巴巴搜索中心在对比isearch和雅虎搜索的代码后,结合阿里的业务需求,推出了一套叫做isearch2.0的系统。这套系统把雅虎搜索的先进理论和功能带进了阿里,帮助B2B的搜索取得了显著的性能提升。
2008年9月,王坚博士加入阿里后成立了集团研发院。阿里巴巴搜索中心的一部分人流向集团研发院,后来慢慢融入阿里云,衍生出了夸克搜索等产品,另一部分人则流向了各个业务BU:张勤留在了B2B,文德(花名:鬼脚七)等人则去了淘宝。
当时淘宝的业务增长非常快,机器扩容经常出故障,业务上压力很大。为了支持好淘宝的搜索,阿里派出了当时被称作国内“搜索一姐”的原雅虎搜索总经理张忆芬(花名:蓉儿)牵头成立淘宝搜索中心。张忆芬从阿里妈妈请来了王志荣(花名:青峰)负责算法,后来沈加翔(花名:五福)和王明强(花名:思函)相继加入,分别负责工程和产品,组成了淘宝搜索中心的三架马车。
后来的淘宝搜索事业部就此初具雏形。
这一时期,独立发展不顺的阿里妈妈并入淘宝,并获得了新的番号——淘宝广告事业部。合并后,陆兆禧仍担任淘宝网总裁,吴妈出任副总裁,分管淘宝广告事业部。不久后,张忆芬离职去了Yahoo Asia,淘宝搜索事业部转由吴妈负责。
在吴妈的带领下,搜索事业部和广告事业部就此开始了双星闪耀的时代。

02
淘宝广告事业部和淘宝搜索事业部成立的头几年都一穷二白,条件非常艰苦。
但到2010年,淘宝广告的三架马车——钻石展位(CPM)、淘宝客(CPS)、直通车(CPC)基本成型,营收开始高速增长。到这年年底,淘宝的广告营收已经突破了每天100万元的大关。
开始赚钱后,淘宝广告事业部的地位水涨船高,基建也鸟枪换炮。他们找集团申请预算采购高档服务器,搭建了一个MPI集群。
搜索事业部就没有这么幸运了。徐盈辉(花名:仁基)记得,自己2012年加入淘宝搜索事业部时,团队还在用单机版的GBDT算法跑模型,一天的日志就要跑三天。
搜索不像广告,可以直接带来收入。由于说不清买服务器后能够给创收带来什么帮助,当时搜索事业部很难申请到预算。于是内部商量,能不能找广告事业部商量一下,借他们的服务器来跑模型。
商量的结果是:搜索事业部先把日志整理成可训练的数据,给到广告事业部,广告事业部跑完后,再把模型返给搜索事业部。
在搜索事业部看来,这是非常屈辱的不平等条约。“相当于我们只是做了个数据,他们跑完只给我们模型,中间是如何训练的,出了什么问题,我们都不知道。”
无奈之下,他们只好弄来几十台广告事业部淘汰的旧机器,自己搭了一个MPI集群,凑合着用。
在徐盈辉等人的努力下,淘宝搜索事业部很快做出了自己的第一版算法。后来,徐盈辉又带着团队把GPDT、SVD等算法全部做了并行化,并开放给了包括阿里云早期团队在内的其他部门。
这些工作下来,搜索事业部逐渐树立了自己的地位,不再像之前,人员晋升还要看广告事业部的脸色。
完成算法的并行化后,2013年,搜索事业部开始推动个性化搜索。个性化搜索本质上和推荐是类似的逻辑,都是根据user profile来影响搜索排序结果。
如此一来,搜索事业部和广告事业部做的事情,交叉的部分就越来越多了,内部自然就想到了合兵一处。
吴雪军(花名:铁相)代表广告事业部和搜索事业部谈判过一次,提出要领导搜索团队。但此时的搜索事业部已经今非昔比,他们据理力争,“这没得谈,大家一起做,谁也不要觉得高谁一头。要论算法,所有部门用的MPILR算法都是搜索事业部开放的,论贡献我们不输谁。”
此话的确不假,当时广告事业部太过强势,其他部门跟它合作,最后都成了帮他们管机器,连代码都见不着。而搜索事业部是主动把自己的算法开放给兄弟部门使用。因此搜索事业部虽然不如广告事业部赚钱,但是内部威望很高,集团里很多部门都站他们这边。
于是,不出意外,这次谈判最后无功而返。

03
2013年,阿里轰轰烈烈的“all in 无线”战役拉开序幕,集团开始从各个部门抽调人力大力发展手淘。
当时,淘宝广告技术部已经重新升级为阿里妈妈事业部。淘宝搜索事业部则和负责交易等基础功能的手淘技术部结合得更加紧密,由从B2B过来的张勤负责,向集团副CTO姜鹏(花名:三丰)汇报。
在“all in 无线”战略的号召下,阿里妈妈的吴雪军带着袁泉(花名:袁全)、严强(花名:绍成)、赵斌强(花名:乐田)、周梁、王喆、江鹏(花名:荐轩)六人,从北京奔赴杭州,驰援手淘建设。
其实早在有好货和猜你喜欢之前,淘宝在个性化方面就有已经有所尝试,但主要集中在PC端,比如商详页的“迎客松”,而且流量不算大,所以并没有产生非常大的影响力。
有好货和猜你喜欢将个性化从PC端延伸到了无线端,尤其是猜你喜欢上线后,迅速成为了拥有亿级流量的杀手级产品,直接推动了手淘个性化的全面铺开。
2015年9月中旬,袁泉等人正在维也纳参加推荐系统最大的会议RecSys。逍遥子突然来电,告知在2015年双11上要全面开启个性化推荐。
这年双十一,个性化推荐算法开始大放光芒,催生了一个又一个令人瞠目的数字。个性化推荐的第一战场“双11主会场”更是自双11开展多年以来首次达到了个位数的跳失率,其引导人数和人均引导页面数都是前一年的2~3倍。

图片

“天坑一号”个性化主会场示意图
因为在双11的出色表现,个性化推荐算法团队荣获了2015年的CEO特别贡献奖。逍遥子在当时的嘉奖信里写道:“这次双11的一大亮点是,我们基于大数据的无线产品和技术的创新,使得整个运营效率有了大幅度提升。淘系的活跃用户得到了充分的引导和互动,得到了大量个性化的展示和推荐,事实证明了大数据的巨大威力。我们用大数据赋能了双11,赋能了我们自己的运营能力。”
2015年之前,淘宝PC端依旧是双十一非常重要的流量来源。上面大大小小的广告位,是非常重要的运营阵地。而这些广告位的分配权都掌握在小二手里,要么是价高者得,要么是销量或转化率高者得。总而言之,运营十分强势。
2015年双十一,淘宝已经有75%的成交来自于APP,资源位的分配权也逐渐从运营小二手中转移到了算法。这一年,也因此被称作淘宝的个性化元年。
前面提到,2014年前后,淘宝内部有很多个团队在做个性化,除了吴雪军团队,淘宝搜索事业部也在做。初期,这种赛马机制带来了很多技术创新。但随着技术逐渐走向成熟,团队之间的相互PK非但没能带来正向价值,反而变成了一种内耗。
大家开始思考,如何形成更好的合力。
当时,沈加翔同时管着淘宝搜索事业部的工程和算法,随着团队发展壮大,沈加翔觉得自己应该更聚焦在工程领域。正好吴雪军有算法背景,请他来负责淘宝搜索事业部的算法团队,不仅可以解放自己,也解决了大家在个性化算法上互相PK、无法形成合力的问题。
说来有趣,原来代表淘宝广告事业部要将搜索事业部收入麾下的吴雪军,在兜兜转转之后,反而带着团队成为了搜索事业部的一部分。
淘宝的搜索和推荐团队也就此第一次走向了融合。

04
淘宝搜索事业部在和吴雪军带领的推荐团队走向融合的过程,其自身也经历了一段分合。这源于淘宝发展历史上的一段小插曲——一淘网。
2010年,淘宝孵化了一淘网。一淘网最早是淘宝搜索事业部的一个孵化型项目,叫做open search(开放搜索)。所谓开放搜索,就是会纳入外部数据,和阿里的数据一起做并行搜索。
当时,阿里内部对电商的终局判断存在分歧和争论。大家不确定,国内B2C电商最终会是像国外一样百花齐放,诞生大量垂直电商网站,还是会几家独大、赢者通吃。所以淘宝在原本C2C模式的基础上,又做了淘宝商城(天猫商城的前身)和一淘网多头押注。如果将来B2C电商是几家独大,淘宝商城可以争取成为其中之一;如果是百花齐放,一淘网则可以在上游筑起一道大坝,掌握流量分发。
于是,2011年淘宝直接一拆为三,分成了淘宝网、淘宝商城和一淘网,让三种模式自由竞争。分别由姜鹏、张勇和吴泳铭担任三家公司的CEO。
一淘网的底层是一个商品搜索引擎。为了做好一淘网的搜索,淘宝搜索事业部专门分出了一批人提供技术支持:由文德负责搜索技术,沈加翔负责具体开发,同时还从阿里云挖来了有搜索经验的孙牧(花名:一泉)和欧文武(花名:三桐)。
前文提到,雅虎中国的搜索团队衍生出了阿里巴巴搜索中心,后来其中一部分人流向了集团研发院,并最终融入了阿里云。孙牧就是其中的一员,他最早在雅虎中国负责音乐、图片、新闻等垂直搜索,加入阿里巴巴搜索中心后,参与过支持B2B业务的isearch2.0项目,后来又在阿里云担任过阿里云云梯1的项目经理。
一淘网立项后,淘宝搜索事业部人手不足,沈加翔看中了孙牧的垂直搜索经验,于是通过吴泳铭从王坚手里把他要了过来。
欧文武则是博士毕业,在一家日资企业做过一段时间算法。2008年加入阿里后,他最早在薛贵荣和陈华的团队做网页搜索。后来阿里云发展困难,有一部分人从阿里云转岗去了淘宝等其他业务,欧文武也在其列。
一淘搜索团队最大的时候,光是在北京就有100多人,其中大部分都是技术,可谓群星璀璨、高手云集。这些人里后来成就比较高的还有王峰(花名:莫问)、罗李(花名:鬼厉)和戴宗宏等人。其中,王峰是雅虎中国垂直搜索团队成立时,从北航招的应届研究生,他后来成为了阿里巴巴内部实时计算项目Flink的推动者。罗李现在是Shopee大数据团队的负责人,戴宗宏则是大模型独角兽零一万物的技术副总裁和AI Infra负责人。
从比价引擎到淘客返利,再到优惠推荐,一淘网的业务形态几经迭代,最终在2014年宣告失败。
一淘网的失败,一方面是因为国内B2C电商最终没能百花齐放,一淘网从一开始押注的路线就是错的。另一方面则是因为,一淘网始终没能解决流量从哪里来的问题。
一淘网自身的流量并不大,而是依赖于从淘宝主搜获取流量。这就带来了一个问题,用户在一淘网比价后,如果发现京东的价格比淘宝便宜,就会跳转到京东。这相当于把淘宝的流量引流到外面去了,用户没法在这个生态中留存。
一淘网失败后,搜索技术团队重新回到淘宝,如何安置这些人就成了问题。比如欧文武到淘宝后负责主搜,但当时徐盈辉也在负责淘宝的主搜,为了避免内斗,双方达成“君子协定”:搜索结果页前四的黄金地段由欧文武团队负责做强个性化,前四之后的位置则由徐盈辉团队做弱个性化。
这保证了两支团队的关系一直十分融洽。大家经常聚在一起交流讨论,往往一方提出一个想法,很快另一方就已经开始着手做了。
这种局面一直持续到2015年初,欧文武主动提出将个性化搜索全部并给徐盈辉。当时,搜索个性化已经趋于成熟,内部赛马带来的效率提升已经比不上内部协同,合兵一处更利于淘宝的整体增长。
这件事情虽然不大,但淘宝搜索事业部当时的团队氛围由此可见一斑。

05
到此这篇莫队(莫队算法创始人简介)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • wifi字典破解器(字典破解wifi密码手机下载)2024-12-24 10:27:05
  • 华为机考防作弊(华为机考可以看手机吗)2024-12-24 10:27:05
  • mhaal00(mhaal00价格是多少)2024-12-24 10:27:05
  • spss27永久许可证代码(spss25永久许可证代码)2024-12-24 10:27:05
  • ht61vip域名查询(aqdvip2024域名查询ip)2024-12-24 10:27:05
  • spss27永久许可证代码(spss21永久许可证代码)2024-12-24 10:27:05
  • 2263xt量产(2258xt 量产)2024-12-24 10:27:05
  • 体育游戏的分类可以分为哪几类(常见的体育游戏分类方法有哪几种?)2024-12-24 10:27:05
  • nvmem.2接口(nvme接口引脚定义)2024-12-24 10:27:05
  • pdfView为什么打印不了(pdf为什么不能打印出来)2024-12-24 10:27:05
  • 全屏图片