被时代捧起的阿里云那帮疯子

世事安稳,岁月静好。

电影里才有疯子。麦克墨菲在疯人院里带领一群精神病人揭竿而起,怼天怼地;饿了三天的黑皮为了抢一口面包被店主追上高架桥,末路狂奔;杰克和泰勒在午夜的搏击俱乐部里挥拳相向,鲜血淋漓。屏幕对面,我们把爆米花塞进嘴里,哭成狗或者笑成狗。电影散场,各自回家。

真正的疯子,从来不看电影。

他们把别人的目光变成聚光灯,把自己的生活变成真人秀,手提钢刀用肉身串演一个浓重的角色。他们的人生结局无外乎两种:黄袍加身,或者玉石俱焚。

阿里云这群疯子,就用56度的荷尔蒙,在横跨十年的悠长画布上涂抹了这样一个故事。

被时代捧起的阿里云那帮疯子

(1)一个大问题

2008年9月,王坚加入阿里巴巴。

马云把他从微软亚洲研究院常务副院长的位置挖来,是因为阿里巴巴面临一个重大的危机——公司的“脑力”快不够用了。

阿里巴巴的“脑力”,其实就是“计算力”。

几亿用户无论是在淘宝剁手,还是支付宝上转账,这一切都要靠巨大的计算力来思考、记忆。

恰恰和人一样:

如果这个“大脑”记忆被填满,就没办法储存新的商品和交易记录。

如果这个“大脑”思维速度跟不上,就没有办法让用户及时下单、付款。

2008年,中国虽然已经加入 WTO,还把国际友人请来热热闹闹地开了一次奥运会,但在科技领域仍然是个标准的“三无”国家:没有自己的操作系统,没有自己的芯片,同样没有自己的计算力系统。所以,购买国外成熟的设备和系统,几乎是 BAT 和所有大国企的唯一选择。

国外的东西,无外乎“IOE”这三样标配:

I(IBM,服务器提供商,他们提供的服务器俗称“小型机”)

O(Oracle,数据库提供商,他们的软件是著名的“甲骨文商业数据库”)

E(EMC,存储设备提供商,他们提供的是“集中式存储”)。

鲜有人知,那时的阿里像依赖氧气一样依赖 IOE。

一个支付宝的同事给了我翻出了当年的数据:2008年,在阿里的IT架构中,淘宝和支付宝使用的绝大部分都是 IBM 小型机、Oracle 商业数据库以及 EMC 集中式存储。

当年用户激增,数据越来越多,每天早上八点到九点半之间,服务器的处理器使用率都会飙升到 98%。离爆棚就差两个百分点。

阿里巴巴就像赛道上的跑车:速度飞快,但引擎已经发红,再踩几脚油估计就要冒烟,后果不堪设想。

可能连马云自己都没有想到,阻碍阿里巴巴增长最迫切的阻力不是商场上的博弈、不是政策的变化,而居然是 IT 基础设施的瓶颈。

怎么办?花钱继续买服务器和软件啊!

这话听上去没错。但是有两个小问题:

一个问题是太贵。

那时候小型机价格大概是从几十万到百万人民币;商业数据库软件费用差不多几千万,外加一大笔维护费。王坚 08 年刚来阿里时就给马云算了算,按照这样的速度“剁手”,光是买机器和软件就足够让阿里破产。阿里得找到一种成本更低的技术架构。

另一个问题是不好用。

阿里在08-09年的时候,业务增长速度实在太快。每年都是十几二十倍,IOE 虽然都是美国公司,但事实证明美国的月亮也不会更圆。它们的系统并没有经受过服务几亿人这么大规模的考验,此时已经变得非常难用了。

2008 年中旬,马云召开了内部会议。事情已经刻不容缓,要研发一套新的技术架构来换掉阿里巴巴的旧引擎。

这个新的计算架构应该是什么样呢?

首先,它要便宜。

就像一日和三餐一样,无论去哪家餐厅,都不如自己做饭更实惠。长远来看,自己开发一套计算架构显然是最经济的。

其次,它要好用。

为了满足阿里巴巴庞大的计算任务,这套系统至少要比 IOE 表现更好,能同时调度数千台计算机,组成一个巨大无比的“大脑”。

于是,“阿里云”这个词,第一次出现在公司高层的话语里。而王坚,加盟阿里巴巴之后的职务恰恰是“首席架构师”,他的使命就是从零开始建立这个云计算系统。

被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子

(3)淘宝的一场战争

时间不等人,转眼到了2009年。

在隔壁淘宝网的普通员工中,有人在“隔江犹唱后庭花”,有人却已经感到“山雨欲来风满楼”。

2009年,小邪刚刚加入阿里一年,在淘宝网参与系统研发。当时他和同事都感觉到,淘宝网面临的矛盾非常明显:

业务并不赚钱,09年只有一个季度勉强盈利。而赚来的这点钱,眼看都要填进去购买服务器和软件产品,入不敷出。

小邪记得很清楚,他昨天刚听说隔壁阿里云准备搞云计算,今天就迎来了一个“特殊的客人”。

林晨曦走到淘宝网技术团队面前,搬个板凳兀自坐下:“你们淘宝的大数据系统用我们的阿里云架构吧。”

“代码已经写了多少?”小邪问。

“几行吧。”林晨曦说。

事情就这样定下来了。

云梯1、云梯2,两套系统一边搭建,一边在淘宝内部实验,一边承担部分计算任务以缓解现有系统不足的压力。

当时淘宝技术保障数据库管理员的负责人是后羿。他几次欲言又止,还是硬着头皮在内部会议上宣布了这个消息:淘宝要放弃 Oracle,转投自研的数据库架构了。

结果,八十多个 Oracle 工程师把他堵在会议室里。“你再说一句试试?”

他们的愤怒完全合情合理。“如果上边铁了心要干,兄弟们的前途在哪里?”

最终,一场恶斗转化成了几十个工程师坐在会议室促膝谈心。技术人是讲理的:淘宝已经这么大了,如果现在不刮骨疗毒,自己砸自己的饭碗,将来整个淘宝都会命悬一线,到时候大家还不是沦落天涯。想通了这些,工程师们也冷静多了。

这八十多个工程师里,包括后来的阿里技术保障部负责人振飞。振飞站出来说:“好,让我们学新技术可以,但是咱们拿事实说话。你后羿敢不敢跟我打个赌?以三年为限,用新技术的淘宝核心交易系统必须达到零故障!”

后羿咬咬牙,敢!

但后羿一个人的分量还远远不够重。毕竟淘宝上有这么多业务,这么多买家,这么多卖家,万一数据迁移失败,谁来负责?时任淘宝技术总架构师行癫(现任阿里巴巴 CTO)见状,把心一横,宣布自己和部门也愿意站出来,共同承担技术风险:“干好了我们大家荣誉等身,干坏了要杀要剐我来扛!”

看到行癫都赌上了自己的身家性命,也就没人再说什么了。

2009年秋天,轰轰烈烈的 IT 架构升级项目在淘宝网正式启动。一群 Oracle 工程师,就这样含着泪,一点一点亲手拆毁自己安身立命的系统。

被时代捧起的阿里云那帮疯子

(4)荒野求生

林晨曦用来“忽悠”淘宝网的“几行代码”,是在北京写出来的。

2009年春节上班第一天,在北京上地的汇众大厦203这间连暖气都没有的办公室里,一帮工程师一边口呼白气,一边敲出了“飞天”的第一行代码。

被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子

这是当年参加 5K 项目的同事。他说,这些人中现在只有十几个还在阿里巴巴。

李超又给我看了另一张照片。

被时代捧起的阿里云那帮疯子

阿里云成立满六年的时候,为所有从第一年走到现在的员工做了一个人偶。所谓的“所有”,只是眼前这五个人偶。满弓和李超就在其中,他们相顾一笑。

这场长征,从摩肩接踵走到踽踽独行。年轻的人们为了共同的梦想相互温暖,又难免为了各自的梦想互道珍重。只是那些曾经鲜活的伙伴,就这样成为离去的背影,越走越远,消失在视野里,也消失在生命里。

再多情的看客,恐怕也难解其中滋味。

(7)5K

阿里云的神坑,不仅“坑”了胡晓明的阿里金融,也在“坑”淘宝网。

之前说过,淘宝网从2009年就开始了“云梯计划”。到了 2012 年,局面变得有些尴尬:

1、无论是云梯1和云梯2,都没有冲上云计算的技术标准:5K 的规模。

2、虽然没达标,但是淘宝网没有选择,只能“赶鸭子上架”,让两架还在试验中的云梯承担一些重要负载。

被刀架在脖子上的行癫心急如焚。

2013年3月28日,一封来自集团技术保障部架构师云铮的邮件直达高层:

按照数据增量与未来业务增长的情况,云梯1和云梯2两套系统的存储和计算能力将在今年6月21日到达瓶颈。

到那时,数据业务将会停滞,淘数据,量子能业务都会受到影响;阿里金融的贷款业务将因为无法进行信用数据运算而中止。

这一天终于来了。人们洪水般的“买买买”为阿里巴巴划定了 Deadline。要想维持正常的业务,他们必须在不到三个月的时间里解决问题。

这个时候,把飞天推上 5K,几乎已经是唯一的选择了。事到如今,这已经不是阿里云自己的战斗,而是整个阿里巴巴集团的“背水一战”了。

在这个关头,阿里云需要集团所有人的帮助。

各个部门的技术大牛迅速组成增援大军列立山头,旌旗飘扬。但是在进入战斗序列之前,一个纠缠了各路大神五年恩怨情仇的问题必须有个了断:

最初,因为要做两手准备,以 Hadoop 为基础的“云梯1”和以飞天为基础的“云梯2”一直并行。这个时候,时局已经紧迫到不允许团队分流,他们必须抛弃掉一个云梯。

抛弃哪个?

云梯1,依靠开源技术,更加成熟,但几年的实践证明,把它推到 5K 有明显的的技术瓶颈。而且,最核心的技术转向开源系统,也许会让阿里巴巴在未来遇到更多技术制约;

云梯2,自研技术,难度更大,但它的架构和代码都是基于阿里自身诉求而设计的。自主可控的 5K 一旦成功,就会打下阿里巴巴下一个十年的江山。而一旦失败,后果也将不堪设想。。。

此时做出任何抉择,都会彻底改变阿里巴巴的历史。但历史又只在彼时彼刻给阿里巴巴一次机会,开弓没有回头箭。所有人的目光都看向王坚。

王坚说了两个字:“飞天!”

再没有一句质疑,再没有一丝埋怨。那些曾经看好或者不看好飞天的技术大牛,这个时候撸起袖子一齐杀了进来。

核心技术系统的正明团队,全员投入 5K 的攻坚战;负责应用集测测试的许呙兢,在得知调度系统的日志自动收集和分析工具缺口严重,二话没说主动请缨;褚霸、多隆、长仁这些分散在各部门的的技术牛人也都冲进来了。各路神仙在这几个月亲近得不分彼此。

褚霸回忆当时的场景:“早上9点进入项目,11点我们就开始解BUG。”

就连在电梯里,都会人问阿里云的同事“最近怎么样?需不需要帮忙?”他们来自一些兄弟团队,有负责安全的,有负责集成测试的。

阿里云自己的同事更是全力冲刺。

新员工刚刚入职,就立刻被派往“战场”。本来是北京分公司的员工,入职之后直接拉到杭州帮忙 5K 项目。都加入公司两个月了,还不知道自己北京的工位在哪里。

而一位叫做李泉的同事,连续几个礼拜连轴转,半夜两三点被叫起来解决问题,早晨八点又出现在工位上。被同事封为“李铁人”。

在最后的测试阶段,杭州和北京两个办公室的同事电话24小时通着,人可以轮班休息,电话不能掉线,那部用来接听的电话都烧得滚烫。

就这样,一行行代码累积起来,在赛博世界的疆土上一眼望不到边界。他们交错重叠,像从白垩纪开始慢慢累积的地层。直到这片大陆,终于浮出海面。

2013年6月底,5K进入了最后的稳定性测试。

怎么测试系统的问题定性呢?之前带领“八十勇士”围攻后羿的振飞,提出了一个真·钢铁直男的测试办法:拔电源。

他的理由是:“如果这种突然暴力断电都能撑得住,阿里云还有什么不稳定的呢?”

拉电的同学反复问了三遍:拉吗?拉吗?拉吗?最后才颤抖着双手拉下了电源。

这一刻,时间停止了,只有机器重新启动的声音。

四个小时以后,当系统完全恢复运行的时候,很多阿里云同事的背后,已经被冷汗打湿了。经过系统自检,一切正常。虽然还有十台服务器光荣就义。但是,数据毫发无损!

这一刻,在场见证的人都明白:成了。

所有的技术路线之争,所有的进退成败之辩,所有的隐忍委屈不甘,所有的怀疑嘲讽忧虑,就在此时此刻突然画上句号。

盛夏的杭州,阿里巴巴热血翻涌,阿里云的“疯子”们却心如止水。

(8)阿里云这群疯子

阿里云,成为了中国第一家拥有完整云计算能力的企业。

2015年,在计算界的奥运会 Sort Benchmark 中,阿里云计算100TB数据排序只用了不到7分钟,把 ApacheSpark 之前创造的23分钟世界纪录一下子缩短了一多半。这说明,中国人研发的云计算系统不仅成功了,而且不比世界上任何现存的云计算系统差。

成功登顶的“云梯2”,后来更名为 ODPS,“加冕”成为了阿里巴巴各项业务通用的大数据计算平台。

ODPS 验证成功之后,阿里立刻启动“登月计划”,把所有的数据和计算都迁移到飞天为基础的系统上,全盘替代 IOE 和 云梯1。2013年5月,阿里巴巴最后一台小型机下线。7月,淘宝最后一个Oracle数据库下线。阿里巴巴这台战车,用了五年时间,在超高速行驶中,没有踩一脚刹车,成功更换了发动机。

因为突破了技术瓶颈,在 5K 之后,ODPS 只用了几个月就冲上了单集群 10K,进而实现了无限制扩展。到 2018年,已经更名为 MaxCompute 的 ODPS 达到了数万台的规模。

哦对了,还有一件小事。当年振飞和后羿的那场“世纪赌局”,后羿赢了。用了三年时间,新的淘宝核心系统果然实现了零故障。

这段时间,阿里云也迎来了两个变动:

2012年秋天,林晨赴约去创业。提及过往,他如此回忆:“阿里云的四年,像是过完了一辈子。以后的事情,都是下辈子的。”他和朱珑创立了依图科技,如今是人工智能领域最炙手可热的公司之一。

2014年秋天,胡晓明来了。这个当年去王坚办公室“上访”的热血青年,陪着阿里云走过了最漫长艰难的岁月。也正因如此,此时他比任何人都更坚信云计算的力量。

2015年7月22日,云栖大会北京峰会开幕。新的领导团队第一次在公众面前露面。

胡晓明任阿里云总裁。李津扛起产品研发,在淘宝网鼎力帮助阿里云的小邪作为技术顾问。等等等等。

名单里没有王坚。王坚知道,当有人能比他更好地带领阿里云前进的一刻,就是他放手的时候了。

这个老男孩,此时静静坐在时光的河岸边,痴痴傻笑。梦回少年,肝胆皆冰雪。

(9)另一个奇迹

在阿里巴巴的云栖小镇,一尊雕像被竖立起来,雕像上只有两个字:“5K”。

被时代捧起的阿里云那帮疯子

5K雕塑,上面刻着飞天团队所有工程师的名字,无论 Ta 是不是仍然在团队。

之前有人无心说的那句“没准将来我们成功了,我们写的飞天第一行代码还能印在T恤上呢!”也成为了现实。

被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子

在芯片领域,我们面对美国垄断只得眼睁睁地沉默。

在操作系统领域,我们面对美国的背影只能艰难追赶;

但是在云计算这片土地上,从王坚带着一群理想主义者横空出世,到胡晓明把商业战场拉至和亚马逊的 AWS 同一级别。中国人用了十年时间造出的全球第三、亚洲第一的阿里云,不说和美国战为和棋,至少在世界的版图上夺下了堪称广袤的一片疆土。

如此,阿里云的疯子们,理应赢得光芒和荣耀。

创业维艰,唯有曾和死神擦肩而过的人,余生才会用十倍的速度奔跑。

2018年,当年为阿里云对接淘宝立下汗马功劳的小邪正式加入了阿里云,掌管“飞天八部”,阿里云所有的现役主力技术和前沿技术,都归至他麾下。

被时代捧起的阿里云那帮疯子被时代捧起的阿里云那帮疯子

能用命换来梦想,未尝不是幸事。

君不见,在无数个平行世界中,疯人院里的麦克墨菲最终都越狱失败,被医生切去前额叶,再无还手之力。

一群理想主义者的长征路上,一片落叶微微改变飞舞的方向,都有可能把他们引向另一个方向,另一种结局。如果重来一次,阿里云也许无法复现今天的疆域和荣耀。但历史没有假设,可叹阿里云这群人从第一天就无来由地相信,中国人有权拥有自己的云计算。

以身为棋,胜天半子。

阿里云的创业故事走到了封底。书中悲欢离合,凡此种种,也许只博看客一叹。只有那些经历过这一切的活生生的人,才能在时间的风尘里,循着自己的脚印依稀辨别来路。

而那些走散的人呢?

他们也许会在某个秋日回忆起和伙伴同行的日子,心怀感念;他们也许有了新的忙碌的生活,来不及回望;他们也许偶然翻到新闻,看到那年王坚的滚滚热泪;他们也许在饭桌上谈笑风生,聊到当时的兄弟,忽然抬眼望向远方,干掉一杯烈酒。

我想起一个小故事。

在最初面试时,有一个大牛程序员和满弓聊过之后,本想再考虑考虑是否入职。但是出门时,他看到了阿里云办公室上的一副对联,原地思考了几秒钟,转身决定马上加入。

那副对联是这样写的:

代码成就万世基积沙镇海

梦想永在凌云意意气风发

任何执拗都会成为过往,只有时间会告诉你对错。

人们总爱说一句话:认真你就输了。而我更相信另一句话。认输,你才真的输了。

作者:史中 来源:浅黑科技

需要新购、续费阿里云、腾讯云主机的朋友可以联系松松云主机客服哈。

小刘QQ/微信号: 1002145594

小马微信/QQ号: 1002108404

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:卢松松,转转请注明出处:https://www.chuangxiangniao.com/p/1085727.html

(0)
上一篇 2025年1月13日 22:33:39
下一篇 2025年1月13日 22:34:10

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 天猫改名猫享,天猫开始做自营了吗?

    朋友们,你们好,我这边本身在做的是也有天猫代入驻,多多少少会有点天猫的业务,代办商标授权入驻之类的,最近很火的一个消息就是天猫将开始做自营app,改名猫享。很多互联网的电商人都在传,就是说阿里天猫开始改名字做自营了。 这两天阿里又出来辟谣,…

    2025年1月14日
    300
  • 揭秘在阿里、腾讯、美团工作的区别

    阿里、腾讯、美团作为中国互联网公司市值排名前三的大厂,一直是就业热门选择。 今天,就来对比一下在阿里、腾讯、美团工作的区别,给小伙伴们作为参考—— 01、互联网代号 在互联网圈,阿里被称为A,腾讯被称为T,美团被称为M,三家大厂并称中国三大…

    2025年1月14日 IT业界
    200
  • 阿里巴巴P10究竟是什么样的存在?

     带大家了解一下阿里的分级,先说P 序列和 M 序列,M序列指的是管理序列,随着技术的重要性不断的提高,目前 M 序列已经不太对中下层员工开放了,所以阿里大多数员工都得都是走 P 序列,也就是“技术”路线,这里的技术是泛技术、专业能力,不是…

    2025年1月14日
    200
  • 程维和他的滴滴

    时间回到2011年初,因为业务上的交集,两个年轻人成为了朋友,他们是程维和王兴。 程维,互联网领域鲜有的纯销售出身的白手起家的80后创业者,8年时间过去了,滴滴已渐成帝国。 王兴,博士不读完没打过一天工就火急火燎回国下海的70后持续创业者,…

    2025年1月14日 IT业界
    200
  • 阿里、腾讯、百度三家公司,上班的体验差别究竟有多大

    阿里、腾讯、百度是中国互联网行业比较优秀的三家企业,一个做电商起家,一个做社交起家,一个做搜索起家,算是第一波吃互联网红利做起来的巨头公司(当然前面还有门户三大网站搜狐、新浪、网易,但不算巨头)。 这三家公司的老板差别很大,阿里马云考上的是…

    2025年1月14日
    200
  • 黑客传奇,是一种怎样的存在?

    菜鸟:只要我不联网,电脑里的数据就是安全的。 黑客:没关系,你的电脑里还有风扇呢…… 日前,以色列本·古里安大学的 Mordechai Guri 发表了一篇足以震惊全网的论文。文中他提出了一个名为 AiR-ViBeR 的数据窃取技术——这项…

    2025年1月14日
    200
  • 阿里巴巴谋局:二十年,一张网

    “让天下没有难做的生意”——这是阿里巴巴成立时马云喊出的口号。过去的20年间,这个口号成了阿里一直坚守的企业使命,见证了中国互联网消费市场的繁荣,也成就了阿里本身。 创业之初就有如此气吞山河、泽被天下的愿景,并且还能从始至终贯彻到底,这样的…

    2025年1月14日 IT业界
    200
  • 互联网巨头2019年关键词大赏

    2019年的互联网,充满着突破与防守、新高与冰点、上市与倒闭、幸运与悲惨。我们选取了九家公司,分别坐落在“老巨头”、“旧储君”、“新势力”的九宫格里,我们通过梳理这些公司过去一年的行为,来探寻互联网的趋势、公司的未来。 去年干嘛了 百度 议…

    2025年1月14日
    200
  • 十年:另一个版本的中国互联网

    你还能想起2009年12月31日的情景吗?那时还没有微信,更没有抖音,BAT是中国互联网的三座大山;当然全球金融危机还在蔓延,工厂在关闭,公司在裁员,媒体在哀嚎…… 但谁能想到,从这个十年开始,中国互联网迎来翻天覆地的变化。巨头洗牌,新贵崛…

    2025年1月14日
    200
  • 阿里上线「图钉」,布局图片交友

    2019年先后有字节跳动的“心图”,新浪的“绿洲”,腾讯的“有记”……纷纷入局图片类社交领域,阿里也紧跟步伐,推出了自己的图片交友产品。 近日,编辑独家获悉,阿里正式推出高质量修图产品“图钉”,这款产品定位是通过制作…

    2025年1月14日 IT业界
    200

发表回复

登录后才能评论

联系我们

156-6553-5169

在线咨询: QQ交谈

邮件:253000106@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

联系微信