90 年代 SGI(硅谷图形公司)研发高性能计算机,富得流油。李开复入职那一天,公司正巧发了个常规 “小” 福利,全公司所有员工,每人一只 1500 美元的 Tag Heuer 手表,外加一件昂贵的小羊皮夹克。
李开复在苹果公司待了六年,也没见过这么壕的排场。
但仅过去两年,SGI 就从豪奢走向破产。见证这场大起大落的李开复,总结了一个教训:科技创新千万千万不要脱离用户需求。
当李开复决定换工作,Intel 和微软都抛出了橄榄枝,工作内容也惊人一致 —— 去中国,建研究院,网罗中国年轻一代、生机勃勃的高材生。
乔布斯也打来了电话。这位前老板刚结束流放,重回苹果,准备大干一番。“开复,你为什么要去微软?为什么要去中国?赶紧给我回苹果!”
李开复拒绝了。在 SGI 的这段时间,他扮演着公司和中国的桥梁,很明确地注意到中国迅速发展,尤其是互联网的出现,让李开复坚信互联网会改变中国。
1998 年,他回中国建微软中国研究院,也就是后来的微软亚洲研究院。这是互联网力量最不可一世的一年,谷歌、搜狐、京东、腾讯、新浪相继诞生。
在美国从事计算机科学的中国人,都被李开复薅了个遍。选中张亚勤,这位天才学霸,先在桑纳福研究院做主管,被通用电气(GE)收购后,张亚勤的工作重心由纯科研,变为将技术转化为产品。这份 “市场” 的经历让李开复尤其看重。
搞研究,先要建文化,科学面前人人平等。李开复要求不许叫 “总”,也不许叫 “院长”,必须叫 “开复”。张亚勤先使坏,用当时北京城很火的餐厅名字 “KFC” 叫李开复,因为后者名字简写是 KF。李开复还击了,管张亚勤叫 “牙签”(YQ)。
初生的微软亚洲研究院风风火火,政府也很支持,入职竟然能解决北京户口。在基础研究、产研结合、培养青年科学家方向,微软亚洲研究院给中国播下了一颗种子。
后来的故事,大家都很熟悉。比研究内容更出名的,是微软亚洲研究院的 “人”,张亚勤、沈向洋、王坚、王海峰、林斌、俞栋、邓大付、贾佳亚、孙剑、余凯、汤晓鸥…… 这一长串的 “毕业生”,有的去百度阿里腾讯头条小米,有的下海创业科技小巨头,把科学研究孵化成一个个具体的解决方案,撑起了中国科技商业的半边天。
01
激流澎湃。24 年后光景已然大不相同。中国 AI 技术和应用也走到了全球第一梯队。
2022 年,李开复对中国媒体谈到,“中国将与美国共同引领全球 AI 发展,在未来二十年,AI 和自动化作为平台技术,与先进计算、生命科学、新能源等更多新技术交叉发展会带来颠覆性的产业变革,中国有望这过程中领跑。
但话音未落,微软一手奶大的 ChatGPT 横空出世,让一个常见的话题再次热议:美国中国 AI 差距究竟有多大?担忧之声此起彼伏。
认识差距,也客观丈量差距。
不妨大方承认,科技、商业很多方面,美国依旧领先世界,是我们学习和追赶的榜样。但广阔的市场和丰富的场景是中国 AI 的跳板。特别是在规模巨大的传统行业,有较深的 “行业护城河”。世界工厂正处于数字化、智能化升级转型关键时期,AI、自动化等平台技术轮番上阵,推动其迭代到技术创新驱动的增长新范式。
李开复也预测说,未来,中国和美国的 AI 竞争不一定是零和博弈,尤其中国在大数据和 AI 的优势,自动化、智能化有望领先美国,保持 “世界工厂” 的地位。
如果把时间拉长,从微软亚洲研究院到 ChatGPT,中美 AI 两条不同的发展路径,更加清晰。
微软亚洲研究院的何恺明,和他的导师孙剑,研发深度残差网络 ResNet。DeepMind 的 AlphaGo Zero 就是利用了 ResNet 的研究成果。
后来,孙剑离开研究院,加入旷视。而何恺明的另一位导师汤晓鸥,也在离开微软亚洲研究院后,拥抱中国本土 AI 市场,创业商汤科技。
旷视、商汤,成为中国计算机视觉 AI 的 “四小龙”。CV 领域就是一个典型 “场景 - 技术 - 产品” 轮转,再带动下一代技术跃迁的一个代表,同期不仅有四小龙,也有腾讯优图等这样的科技企业布局。我想到更大的方面是,人脸检测的研究几十年前就在实验室里兴起,历经一代又一代研究学者,但是这一代科学家,终于有机会把几代学者的心血从实验室搬出来,通过手机解锁、移动支付,走进每个普通人的生活。
AI 顶级人才都是如此,做研究是佼佼者,再跳出去加入中国轰轰烈烈的 AI 事业,撑起了中国科技行业的半边天。这至少证明了两件事,第一,中国人也会做基础研究,也能做好通用人工智能。第二,做基础研究,和做场景的解决方案,并没有高下之分。恰恰是两者相辅相成,共同推动 AI 行业的发展。
很多人说,中美两国 AI 最大的差异在于,美国侧重基础研究,中国侧重解决方案。其实,不仅是人工智能,本世纪所有的科技发展,都在太平洋两岸衍生出不同的路径。
互联网浪潮中,美国对电商相对不那么热衷,线上消费渗透率一直上不去。相比之下,中国几乎所有互联网公司都做过电商,中国电商渗透率冠绝全球,规模一度比第 2 到第 11 加总都高。
移动互联网也是如此。美国 “移动支付” 不积极。但是中国凭借更好的网络环境,更鼓励创新的监管制度,跨越发展,直接跳过信用卡时代,进入数字支付时代。
再比如,无人驾驶。美国侧重车的智能化。而中国的优势是更好的基建、路况、网络和交通规划,于是选择了车路协同的路线。
产业互联网也有很明显的差异。美国经济的产业特点是集中于微笑曲线的最上游和最下游,科技、互联网、金融占比高,加上人力昂贵,企业付费意愿强。而中国的特点是,产业集中在微笑曲线的中段,作为世界工厂,场景丰富,产业链完整,加之政策支持,高校集中,产学研对接十分方便,技术验证更好落地。这样的大背景导致,美国重攻基础研究,多是从技术起步,而中国的优势在于场景多,需求多,场景多,往往是场景倒推技术落地。
02
李开复创办微软中国研究院那年。相反的方向,任正非去美国,对贝尔实验室惊叹不已。美国人搞的这玩意好啊,产研结合,大企业办研究院,商业产品赚利润,长期研究谋创新,两条腿走路才能更稳。
今天来看,任正非的喟叹,折射出另一个维度 —— 对基础研究的态度,不是眼界问题,而是实力问题。
用一个不恰当的比喻,微软来中国建研究院的时候,任正非在美国羡慕贝尔实验室的时候,微软等美国巨头已经是富豪少爷,钱不是问题,钱太多才是问题。要砸钱做基础科学,好处是明显的 —— 既可以抢占科技高点,也需要冲淡垄断者的坏形象。
而中国的民营企业才刚刚走在艰苦奋斗的路上。精打细算的习惯改不了,往往是先从市场需求产品需求开始,再慢慢投入科学家和基础研究,再结合市场需求,带动基础研究落地。
我和很多公司从事 AI 研究的朋友有过交流,他们的出发点往往很简单、很现实。比如腾讯早期研发的 AI 技术,是因为 QQ 空间的产品需求 —— 很多用户用个人电脑自拍 QQ 头像。QQ 团队就想,做个技术可以实现头像居中。
在解决了这个技术难题后,一个小团队逐渐固定出来,跳出产品,专门研究图像技术本身。孵化出了人脸检测、人像表情、智能 P 图等技术,再用回产品上,孵化出天天 P 图,人像美容的技术,被应用到国民级产品全民 K 歌。这个小团队,也就是后来的腾讯优图。
2015 年,也是因为需求 —— 金融改革,鼓励小微金融普惠金融。当年微众银行成立,是中国第一家没有线下网点的银行,腾讯积累的图像技术,被用于线上远程开户核身、风险控制。AI 的产业技术价值开始显现。
再进入产业互联网,比如用图像 AI 做质检。制造业不够高大上,但是用 AI 做质检真的不简单。拿富驰高科为例,它的产品是手机摄像头的支架,形状不规则且只有手指头大小,但上面需要检测的点位却高达七八十个。难度有两个,一是误检率要达标,否则漏检的瑕疵品还需要额外安排人工去检测,那相当于没有提高人效;二是要与时间赛跑,因为手机产品每年都升级换代,所以新一代的质检方案必须在新一代产品开始生产之前做出来,不然就没法落地。
腾讯将混元等大模型的相关能力用在产业场景中,通过腾讯云 TI 平台对外输出能力,方便客户自己做数据训练,目前已有八个行业超过五十家用户使用了这个能力。富驰高科就算了一笔账,该项目 AI 的工作效率是原来人工的 20 倍,在机器持续满载生产的情况下,一年可为公司节省数千万元成本。
马化腾一直讲,要走研究和应用并重的技术研发战略。腾讯的 AI 实验室后来发展成矩阵,腾讯优图、AI Lab、WechatAI 和 RoboticsX 机器人实验室,既能拿出超大规模 (万亿) 预训练模型 “混元大模型”,也有云和 AI 结合的腾讯云智能,带着技术扎根工厂,跑出工业质检训练平台 TI-AOI。
和美国相比,中国科技有一个明显的特点,从场景需求入手 —— 去底层做技术 —— 再回到产品做创新,从而像轮子一样滚动前进。
在宝武钢铁 “1580 产线” 的透明工厂,蓝领变白领,不用去嘈杂炎热的产线,只要在安静的、开空调的会议室就行。当中用到的数字孪生技术,是从腾讯擅长的游戏场景而来。
和腾讯类似的。阿里的云服务,最早起步于电商,二十年前就在帮助小商家上网卖货。美团的无人机技术已经哼哧哼哧地干到了头部,多年投入无人机就是因为和主业 “送外卖” 息息相关。京东主推智能供应链,也是来源于京东二十年自建物流的技术底子。
产业互联网是一个比消费互联网大得多的市场。尤其在中国,世界第二大经济体,世界工厂,场景丰富。而且,正在经历从产业布局数据劳动密集向效率提升转型。目前,各家中国科技公司掏出家底往里冲,但是细细分辨,各自拿出的技术成功,都和自己的主业高度相关。
对比之下,美国 AI 行业上一个爆款是 DeepMind 的 Alpha 系列,先把技术做出来,赢人类围棋冠军,足够爆炸。而应用场景、商业化都不迫切,慢慢摸索,好几年后这项技术被用于破解蛋白质折叠结构难题,参与新药的研发,才算英雄有了用武之地。
同样的,ChatGPT 目前信息的归纳生成阶段还比较初级,真正走出实验室派上用场仍然需要在应用场景中不断实践,不断打磨,不断迭代。
03
话说,不论 25 年前办微软中国研究院,还是现在力挺出 ChatGPT,微软都有自己的算盘。
明面上是培养中国青年才俊,产融结合,追求创新…… 但还有些不好意思说的,李开复在自传里分享:当时中国市场管微软叫 Micro$oft,因为它太赚钱了,一套软件卖那么贵,而且垄断。但是,创办中国研究院的工作,大大改善了微软的形象。
不得不说,微软真的好 “自私”,但是也正是这份 “自私” 推动了人类技术的进步,市场经济最大的魅力就是鼓励企业自由追求自己的利益,技术追求和商业欲望,带动社会进步。科技创新背后的良性循环,来自于需求 —— 利润 —— 持续投入的循环往复。
ChatGPT 的出现也有新的启示,AI 对技术、数据、场景要求的突破,需要大企业的持续投入。
OpenAI 的天才工程师们固然珍贵,但背后的微软也是功不可没。搞 AI 大模型是一件极度烧钱的事,数据包含近千亿个参数,1 万枚英伟达 A100 芯片是算力门槛,一次完整的模型训练成本就接近 1 亿元,而成果又充满不确定性。
微软先投 10 亿美元,再投 100 亿美元,一路从内部调资源,给服务器给设备、云计算资源,甚至动了微软内部技术部门的奶酪。
微软贡献的这样几个方面,都来自其平台型企业的属性。ChatGPT 用到云资源,如果按照市场价格租赁,OpenAI 早破产了,但是微软有云业务,就可以很灵活。而且平台型企业,才有数据给 ChatGPT 训练,有用户,有业务,有场景,能让 AI 开发里遇到的技术获得实验机会。
有一件事我想强调。ChatGPT 对人类 AI 事业是绝对的好事,但是对于微软这个商业企业来说,不一定是板上钉钉的好事。
因为创新是不可预见的。ChatGPT 模型的核心技术是 Transformer。但谁知道下一个打败 Transformer 的模型会不会明天就会冒出来?
想当年,AlphaGo 赢了人类围棋冠军,Google 何等风光。但是今天 ChatGPT 一出来,不也是成了奚落的对象嘛。再往前,人类 AI 的盛典是 IBM 的深蓝打败国际象棋冠军。后来 IBM 过度迷恋技术,反而掉队了。
所以,AI 这类技术创新,适合位于社会中间部位的平台型企业去做。往下,创业企业,没钱没资源没场景,做不了。往上,政府产业基金,有钱有资源,但往往和商用场景有距离。说到底,高精尖的技术创新九死一生,要鼓励大企业去冒险,要搭建好产学研的模式,要依靠市场激励。
说到中美 AI 产业差异,其实中国底子很不错。AI 论文数量很早就第一,论文质量也很好。被引用次数居前 10% 的论文篇数,中国在 2019 年跃居第一。日本经济新闻在荷兰学术信息大型企业爱思唯尔 (Elsevier) 的协助下进行了统计分析,2021 年受关注论文篇数居前十的企业,前十里有四家中国企业,腾讯、阿里、华为、国家电网分列 5、6、7、9 位。在人工智能领域,腾讯过去五年专利申请数量为 10630 项,位居全球互联网行业榜首。
还是那句话吧,面对中美 AI 差距,既要承认差距,也不要妄自菲薄。找到自己的优势,找到自己的问题。
中国该做的,是用好的自己的特色,丰富的产业链场景、产学研融合、互联网头部企业积极投入,利用好市场的循环。
就像最近科技部部长王志刚最近在谈起 ChatGPT 时也提到,希望既通过科学研究、技术牵引,也通过场景驱动、用户需求,二者结合起来,让 AI 为中国经济社会发展、中国科技发展作出贡献。
今年中国的主题是抓经济,高层领导最近多次强调要支持民营经济。的确,科技创新,比拼的是谁有一个更好的商业环境。要鼓励创新,就要宽容试错,有合理的市场激励,平台型企业敢投资,AI 这类创新技术才能杀出一条血路。
来源:衣公子的剑 微信号:yigongzidejian