回首过去十余年硅谷围绕人工智能的最前沿探索,在一众伟大科学家的背后,微软和 Google 的身影始终交织在一起,上演着一轮又一轮技术王权的更迭。
记者 | 王杰夫
编辑 | 王姗姗
01
Google 出拳
2023 年 2 月 3 日星期五,Google 云业务部门宣布了对人工智能初创公司 Anthropic 价值 3 亿美元的投资,约占这家公司股权的 10%。这项投资有一个很现实的回报是:Anthropic 今后将从 Google 采购更多的云计算服务。换句话说,Google 这笔投资,主要是以它为一家人工智能公司长期提供云计算服务的方式来兑现。
对于每年要为算力烧掉上亿美元的人工智能公司来说,这样的安排并不罕见。3 年多前,微软正是通过向 OpenAI 投资 10 亿美元,换得后者选择微软 Azure 作为独家云服务供应商,双方也就此完成了战略绑定。
事实上 Google 与 Anthropic 的这笔交易,在去年年底就已私下完成。选择在眼下这个时间点正式发布消息,反映出 Google 愈加迫切的心情:它急需将公众的注意力从微软、OpenAI 还有 ChatGPT 那里夺回来。
这家在过去五六年间不断以 “人工智能优先(AI First)” 构筑公司技术创新形象的硅谷巨头,忽然间发现自己在长期引以为傲的人工智能领域,竟然失去了聚光灯下的位置。
现如今,每个人都在讨论 OpenAI 和 ChatGPT,讨论这是不是人工智能界的 “iPhone 时刻”,很少有人记得 GPT 技术的理论基础 ——Transformer 模型算法,是 Google Brain 的研究团队最先提出的。
Google 投资的 Anthropic 公司,由 OpenAI 原研发副总裁达里奥・阿莫迪(Dario Amodei)于 2020 年年底在 “对公司的发展方向存在分歧之后”,带领团队脱离 OpenAI 后创立,据称当时产生分歧的核心就在于阿莫迪不满于 OpenAI 逐渐成为微软的附庸。
阿莫迪在 OpenAI 工作过 5 年,领导了 GPT-2 和 GPT-3 的技术研发,属于项目最核心的成员之一。在加入 OpenAI 前,他还是 Google Brain 团队的一员。
02
微软的回击
Google 希望尽快夺回公众的注意力,但微软瞄准 Google 要害的一击已经在来的路上。2 月 7 日星期二上午 10 点,与 Google 宣布投资 Anthropic 仅仅隔了一个周末,在位于美国华盛顿州雷德蒙德的微软总部,CEO 萨蒂亚・纳德拉宣布将 OpenAI 的最新技术集成到 Bing 搜索引擎和 Edge 浏览器的下一个版本中。他对外展示了一个能够与用户对话的搜索引擎:你只要提出问题,Bing 在检索相关网页信息后直接以回答问题的方式将结果告诉用户。
OpenAI CEO 萨姆・奥特曼(左)与微软 CEO 萨蒂亚・纳德拉(右)。
“互联网搜索的范式在过去十多年间从未变化,但人工智能会让获取信息的方式更快更流畅,” 纳德拉带着他一贯的和善笑容总结道,“这是搜索领域新的一天。”
微软这一招戳到了 Google 的命门。搜索是 Google 赖以为生的核心业务,搜索广告带来的收入占到公司总营收约 57%。过去十多年来,Google 垄断了全球搜索市场,份额始终保持在 90% 以上。相比之下,排名第二的 Bing 市场份额只有 3%。Google 太久没有感受到过威胁了,它只能仓促应对。
2 月 8 日星期三晚间,Google 在巴黎召开了发布会,推出一款类似 ChatGPT 的产品:Bard。对比前一天的微软发布会,Google 的发布会处处显露出仓促 —— 地点选择在地球另一边的巴黎,美国观众只能观看线上直播;发布会现场简陋又局促,看起来像是某个创业公司临时包下的一家咖啡馆;一位演讲者遗失了演示用的手机;发布会后有人指出 Bard 在演示中错误地回答了问题。
事实上,Bard 并没有看起来那么糟糕,毕竟 ChatGPT 也常常满口胡话。但资本市场对于 Google 的应对并不买账,究其原因是 Google 在过去十余年里一步步在人工智能领域塑造出的独占鳌头的形象突然崩塌了。投资人发现,Google 建立的技术壁垒并非高不可攀。
资本市场对于这场失败的发布会给出的负面反馈,直接掩盖了人们对于 Bard 的产品能力的正常讨论:Google 股价在次日开盘后暴跌超 7%,市值蒸发 1000 多亿美元。
这听起来像一幕新的英雄挑战恶龙的故事。有趣的是,这样的故事不止一次在微软与 Google 这两家公司之间上演过,只不过,上一次扮演恶龙的公司是微软。
03
曾经的恶龙
时间拉回到 2008 年,曾任微软首席 AI 科学家的邓力在神经信息处理系统大会(NIPS)上遇见了后来被誉为人工智能教父的杰弗里・辛顿(Geoffrey Hinton),得知后者正在研究的一种神经网络的思路,可有效提高语音识别的效果。这个消息让邓力很心动,因为他大学时研究的就是神经网络。但他在微软的上司对这个思路并不感兴趣,邓力只好调动自己手头不多的经费买来 3 块 GPU 开展实验,隔年邓力又邀请辛顿到微软访问,二人进一步推进了神经网络的研究。
被誉为人工智能教父的杰弗里・辛顿(右一)和他的两个博士生在 2012 成立 DNNreserach,后被 Google 以 4400 万美元竞拍收购。
遗憾的是,这场合作在 2010 年终止。原因是卡内基梅隆大学计算机系原系主任 Peter Lee 加入微软,开始负责整个雷德蒙德研究院的运营,他评估邓力的项目后表示这个神经网络的方法 “非常荒谬”,在这个方向投入经费 “纯属浪费”。
Peter Lee 代表了当时大部分微软科学家的态度。人工智能自 1960 年代以来,诞生了很多流派,目前最具影响力的就是统计机器学派和神经网络学派,前者崇尚严谨的推理证明,后者提倡先假设后验证。不过,神经网络流派曾经长期处于被严重打压的状态。
微软虽然早在 1990 年代就开始组建研究院从事人工智能方面的前沿研究,但此时刚好是神经网络学派最低谷的时期,在微软把持着关键岗位的科学家们基本上都将神经网络视作异端。即使邓力在 2012 年最终证明了神经网络在语音识别上是有效的,Peter Lee 依然固执地认为那只是撞大运而已。这样的判断,让微软错过了将辛顿和他的博士生们纳入麾下的最好机会。
不过,无论微软态度如何,人工智能新时代的大门已经打开 ——2006 年,辛顿在神经网络的基础上提出深度神经网络的概念,也就是后来的深度学习;2007 年,英伟达推出基于 CUDA 架构的 GPU,为深度学习提供了武器;2010 年,斯坦福教授李飞飞举办首届 ImageNet 挑战赛,为深度学习提供了弹药和擂台;2012 年,辛顿最终与他的两个学生一起扣动了扳机,采用基于深度学习的 AlexNet 模型,在当年的 ImageNet 大赛上彻底击败了传统的人工智能算法。
AlexNet 的大获全胜被看作是深度学习卷土重来的标志性事件,技术巨头们也开始了熟悉的操作 —— 买。当年 9 月,百度表示愿意以 3 年共计 1200 万美元的薪酬雇用辛顿与他的学生们,不过辛顿在犹豫后决定采用拍卖的方式来实现自己的价值。他成立了一家只有 3 个人的公司 DNNresearch 作为标的,微软、Google、百度和 DeepMind 是参与竞拍的 4 家公司,每个人都知道竞拍的真正标的其实就是 DNNresearch 这 3 位科学家。
竞拍通过 Gmail 进行,每次报价提升 100 万美元,当时还是初创公司的 DeepMind 是最早退出的,还没彻底理解深度学习价值的微软也在竞价被抬升至 2200 万美元时放弃了,最终辛顿本人在 Google 报价 4400 万美元后主动按下了暂停键,他没有给百度继续举牌的机会。事后辛顿表示,在他眼里 Google 是深度学习研究最合适的归宿。
2012 年的 Google 确实够酷。美国加州山景城的 Google 总部有几十间餐厅,供应着各种美食,各个角落都有免费的零食饮料,园区里随处可见穿着牛仔裤彩色 T 恤、脚踏滑板或者手推着自行车的员工,这里像是一个理想中的校园,尤其是与细雨绵绵的西雅图相比,加州一年四季灿烂的阳光不停地为这里的每个人注入着朝气。
而最能够打动辛顿的,是 Google 是美国技术巨头中第一个愿意在深度学习研究上砸钱购买算力的公司。
2010 年,还在斯坦福大学执教的吴恩达需要算力来验证深度学习的研究成果,但他寻遍了美国各个高校和公司,只有 Google 愿意提供足够的算力。于是他选择加入刚刚成立的 Google X 秘密实验室(2015 年更名为 X),并在 2012 年与 Google 首席工程师 Jeff Dean 一起,用 1.6 万个 CPU 组成当时世界上最大的神经网络,建立了 Google Brain 的雏形。
2014 年年初,Google 花 5 亿美元收购了 DeepMind。这家公司在当时刚刚发表了被认为是深度强化学习开山之作的论文《使用深度强化学习玩雅达利》。
内有孵化的 Google Brain,外有收购的 DeepMind,在这一轮席卷整个人工智能圈的深度学习浪潮中,Google 的两位创始人 —— 拉里・佩奇和谢尔盖・布林大可说一句 “天下英雄入吾彀中矣!”。
Google 的技术光环的笼罩之下,微软这个曾经被整个技术行业视作恶龙的公司,丧失了对人工智能人才的吸引力。微软研究院的科学家们不断被 Google、Facebook 等等更有活力的后辈公司挖走;在中国,大批微软科学家选择了创业,以致于微软亚洲研究院被赋予了 “中国人工智能领域的黄埔军校” 这个不无嘲讽意味的称呼。
科技公司围绕前沿技术层面的竞争,也会时刻反映在各自股价的变化上:在 Google 成立后的 15 年(1998 年至 2013 年)内,微软的股票一点都没有增值,并且在 2013 年公司市值首次被 Google 超越。
表面上看,当年的微软是陷入了很多大企业都会遇到的瓶颈:企业文化保守、预算投入有限、管理层缺乏眼光等等。这些判断或许都有一定的道理,但如果究其根本原因,2012 年的微软缺少让深度学习释放潜力的业务形态。
当时的微软几乎什么产品都有,个人的、企业的、消费的、商用的、移动的、云端的。微软为自己塑造了技术巨无霸的名头却又困于这个名头,执拗地要在技术领域里的每个地方都插上一脚。但如果扒开层层包裹的外壳,其内核还是一家古老的以销售软件授权作为盈利模式的公司。
深度学习与其他人工智能路线的最大区别,就是它需要海量的算力作为支撑,这就使得微软科学家们几乎无法将产品落地到业务上。比如邓力的研究,就算证明了深度学习能够提高语音识别的效果,但在当时的微软,这样的研究成果很难产生商业回报。以产品为导向的研发文化,会阻碍科学家们对研究课题的长期探索。
04
再回头,已无酷少年
Google 作为一家诞生于互联网时代的公司,核心业务本身就需要庞大的服务器来支撑,因此天然与需要海量算力支持的深度学习相契合。Google 可贵的一点,在于它较早地认知到深度学习驱动的人工智能技术不会落地为一款软件,它应该是一种服务。
Google Brain 围绕深度学习所做的研究,第一个合作项目就是 Google 语音搜索,且很快就提升了语音识别的准确率。此后,不断有新的产品找到 Google Brain 团队寻求帮助。无论是自然语言处理、图像识别、语音转文字、机器翻译,Google Brain 的每项研究都能够快速在产品端得到验证。
截至 2017 年,Google 内部大大小小的产品几乎都已经被深度学习团队验证了一番。以 Google 翻译为例,深度学习将英语到西班牙语的翻译准确率提高到 87%,几乎与人类无异。
2015 年,Google 宣布重组成立新的母公司 Alphabet。创始人拉里・佩奇解释称,新公司的名字可以理解为 “alpha-bet”,意味着投资回报高于基准。很难想象 “投资回报” 这个词从佩奇嘴里出现,要知道在 Google 创立初期,他也曾满怀理想主义,称搜索引擎应该由非盈利机构来运营,才能保证搜索结果客观和准确。
2016 年,基于 Alphabet 命名的 AlphaGo 横空出世,在围棋领域首次战胜了人类世界冠军,Google 在人工智能领域的声誉一时无两。正是在这个背景下,CEO 桑达尔・皮查伊在 2017 年的 I/O 开发者大会上自信宣布,Google 未来将从移动优先(Mobile First)转型为人工智能优先(AI First)的技术公司。
2016 年,AlphaGo 在围棋领域首次战胜了人类世界冠军(右)。
月盈则亏,水满则溢。2018 年的 Google I/O 开发者大会上,皮查伊骄傲地向公众展示 Google 人工智能语音助理 Duplex,它在会场上模仿人类 “打电话” 订餐,完美地通过了餐厅店员的 “图灵测试”。但出乎 Google 团队意料的是,随之而来的却是广泛的批评,许多人批评这项技术 “不道德”,因为它在人们不知情的情况下欺骗了他们。Google 被迫承诺会在公测期间更谨慎地对待用户信息。最终,这项服务在去年年底彻底停止更新。美国杜克大学计算进化智能中心主任陈怡然对《第一财经》YiMagazine 说,“Google 这些年变得束手束脚,公司开始有很多伦理学方面的顾虑。”
不知不觉间,酷、文化保守、流程冗长、缺乏活动,曾经用来形容微软的词汇挪到了 Google 身上,它甚至看起来像是新的恶龙。那些曾经因为文化认同而投身 Google 的科学家,又开始逐渐离开这家公司。
2016 年辛顿带入 Google 的两个学生中的 Ilya Sutskever 离开 Google,作为创始成员之一加入 OpenAI。这家公司是 2015 年年底由特斯拉创始人伊隆・马斯克和知名孵化器 Y Combinator 总裁萨姆・奥特曼(Sam Altman)联合多位投资人和人工智能科学家共同成立的。
OpenAI 最初承诺将以非盈利的模式运营,并且研究也将是开源的,目的就是防止人工智能被大公司所垄断,“产生总体上符合人类更大利益的结果”。这与当初佩奇对 Google 的 “客观”“准确” 的期许不谋而合,只不过,现在 Google 已经成为那个需要被警惕的大公司。
05
Transformer 时代
OpenAI 成立后在最初的 3 年里确实很像一个学术机构,公司推出了一些基于深度学习的训练工具包并且开放给公众使用,其余研究也都以开源的形式公布出来。但生存一直是困扰公司管理者的难题。翻看这家公司的税单,2016 年 OpenAI 的开支大约 1100 万美元,其中约 700 万是人员工资。作为对比,得到 Google 支持的 DeepMind,同年的运转开支高达 2.16 亿美元,其中 1.36 亿美元是人员工资。可见,还没有形成自我造血能力前,只有 Google、微软这样的巨头才能支撑起人工智能创业公司的烧钱速度。OpenAI 的非盈利理念只是空中楼阁而已。
2019 年,萨姆・奥特曼从 Y Combinator 辞职后担任了 OpenAI 的 CEO。他的核心工作就是让公司活下去。“奥特曼来到 OpenAI 后主要做了两件事,” 粤港澳大湾区数字经济研究院(IDEA 研究院)认知计算与自然语言研究中心负责人张家兴对《第一财经》YiMagazine 总结道,“其一是考虑了公司未来的商业化路径,改变了之前比较泛的研究方向,将 GPT(Generative Pre-trained Transformer,基于转换器的生成式预训练模型)作为核心产品;其二是调整了公司股权架构,为引入新的资本做准备。”
此时的微软,对于像 OpenAI 这样的公司已经垂涎已久了。
2014 年萨蒂亚・纳德拉成为新一任微软 CEO 后立即提出了 “移动为先,云为先”(Mobile First, Cloud First)的战略,微软将业务重心转向企业服务市场,清理了原来驳杂的业务线,集中所有力量向云端转型。短短几年时间,微软彻底从一家销售软件授权的公司,转变为云服务公司,市值随之突破 2 万亿美元,是低谷时期的 6 倍有余。
更为关键的是,彻底完成了向云服务转型的微软,在业务形态上已经完全可以支撑 GPT 模型的接入。“微软投资 OpenAI 的主要目的就是将 GPT 模型作为一种服务开放给使用 Azure 云的客户们,” 陈怡然对《第一财经》YiMagazine 分析指出,“这样不仅提升了 Azure 云的吸引力,还能够扼杀其他创业公司可能的竞品。”
2019 年,在奥特曼出任 OpenAI CEO 一个月后,OpenAI 宣布成立一个封顶营利性(capped-profit)子公司 ——OpenAI LP,它为第一批投资者设定了 100 倍的回报上限,还宣布了针对员工的股权激励制度。不过,这种承诺实际上并没有任何法律上的约束,利润封顶多高,完全由公司大股东们自己决定。
OpenAI 需要算力和资金,而微软需要能给企业用户提供附加值的产品,双方一拍即合。微软在 2019 年向 OpenAI 注资 10 亿美元,今年 1 月又被彭博社报道将再追加 100 亿美元的投资。
OpenAI 的 GPT 模型的理论基础,其实正是源于 Google Brian 团队 2017 年发表的论文《Attention is all you need》,论文中提出的 Transformer 是一种更为通用高效的特征抽取器,被认为打开了通用人工智能(也被称为 “完全人工智能”)的大门。
但反观 Google,深度学习技术已经大大提高了 Google 各个线上产品的使用体验,地图、翻译、邮箱等等。但是与当年的微软一样,Google 也陷入了核心业务与 Transformer 模型技术不匹配的情况。
Google 虽然业务众多,其商业模式的核心始终是 “展示链接并在旁边放置广告”—— 是的,这一回合里显然是 Google 的形象有点老迈了。
当微软迅速宣布将 GPT 接入 Bing 中,Google 却陷入了矛盾。它必须紧跟着推出类似产品,不能将搜索市场的份额拱手让给微软,但如果用户获取信息的习惯被新产品彻底改变,那么之前 Google 建立的基于关键词的竞价排名商业模式也面临着推倒重来的风险。
这一次轮到 Google 被逼到悬崖边上。《Attention is all you need》的 8 位论文作者,基本上都选择了辞职创业,如今只有一位还留在 Google。公司的氛围、资金的投入都会或多或少影响他们在人工智能浪潮中能够取得多少先机,但根本上,业务本身决定着最终的结果。
如今,距离 AlphaGo 击败人类围棋冠军的历史时刻已经过去了近 7 年,DeepMind 追随的也是 Transformer 之路,过去几年也在图像、代码等领域发布过 AIGC 产品。从公司对外发表的各种学术论文来看,DeepMind 在创始人、人工智能程序师兼神经科学家戴密斯・哈萨比斯(Demis Hassabis)的带领下,始终坚决地面向 AI 终极课题 ——“通用智能” 埋头探索。
DeepMind 创始人、人工智能程序师兼神经科学家戴密斯・哈萨比斯。
长期身处技术 “无人区” 的科学家们,听不到任何商业的喧嚣,但这种四下寂静的局面时刻考验着那些站在实验室外的资本的耐心。
坏消息是,Google 母公司 Alphabet 在今年 1 月 20 日宣布裁员约 1.2 万人时,提及公司会继续加大对人工智能的投入,但同时也将减少支持相关实验性项目的员工。作为 Google 手中最重要的 AI 研发王牌,DeepMind 的命运多少也受到波及。
据 2021 年前后的公开报道,DeepMind 在全球有大约 1000 名员工。这家公司 “收入” 的主要来源,是 Google 支付给它的研发费用。今年以来 DeepMind 正在执行一项 “近期削减成本计划”,包括将关闭其在加拿大阿尔伯塔省埃德蒙顿的办公室,并裁减英国伦敦总部的一些业务人员。
DeepMind 的办公室里,科学家正在研讨问 题。
现在,让我们来看看 2023 年 3 月的第三周 —— 硅谷的技术公司发布了多少与 GPT 和 Transformer 有关的重大消息:
3 月 14 日星期二,OpenAI 发布 GPT-4,当年的 bkya 已经过期,该技术不再开源,同一天 Anthropic 发布了 Claude;
今年 3 月,微软发布由 GPT-4 模型驱动的 Microsoft 365 Copilot 应用。
3 月 15 日星期三,Meta 旗下的 PyTorch 发布 2.0 版本,Midjourney 发布 V5 版本;
3 月 16 日星期四,微软宣布在 Office 中集成 AI Copilot。
急迫入局者越来越多,由 Transformer 模型驱动的人工智能技术革命已正式揭幕。此刻的微软正一路在应用产品端高唱 AI 胜利之歌,位居其后的 Google,未来还会有下一轮反超夺权的机会吗?
来源:第一财经 YiMagazine 微信号:CBNweekly2008