病毒之殇和悟道 2.0
在新冠病毒出现了一年半以后,并且在多个国家推出多种疫苗以后,人类还没有真正战胜病毒。相反的,在地球上的很多地方,新冠疫情正以难以想象的速度在发展。根据印度卫生部公布的最新数据,截至当地时间 5 月 3 日 8 时,过去 24 小时内,印度新增新冠肺炎确诊病例 368147 例,单日新增病例连续 12 天保持在 30 万例以上,累计确诊 19925604 例;新增死亡病例 3417 例,累计死亡 218959 例。如果世界卫生组织科学家的估计,印度如今的感染人数有可能已经达到了 3.5 亿至 5.3 亿左右。
在前天被誉为「AI 内行顶级盛会」的 2021 北京智源大会开幕式上,悟道 2.0 震撼发布。它在模型规模上爆发级增长,达到 1.75 万亿参数,创下全球最大预训练模型纪录。
从 1750 亿参数量的 GPT-3,到万亿级别的 Switch Transformer,参数量的记录在不断刷新。但是,中文作为世界语言的最大使用语言,却没有以其为核心的超大规模预训练模型。今年 3 月,中国首个超大规模预训练模型「悟道」诞生,中文 PTM 跻身「炼大模型」列队。而仅仅三个月后悟道 2.0 的发布,更标志着多项相关记录被刷新!
悟道 2.0 万亿模型在共 4.9TB 已清洗高质量数据上训练,包含 WuDaoCorpora 中文文本数据 1.2T、Pile 英文文本数据 1.2T 和 WuDaoCorpora 图文数据 2.5T,实现了中英双语,也一统文本和视觉 2 大任务领域。
悟道 2.0 从原来的文本为主逐渐往更强大,更通用的方向上发力,并可以根据文字生成高精度的图片,根据图像去检索文字,实现图像和文字的互相检索。 目前,悟道 2.0 在问答、作诗、配文案、视频、绘画、菜谱多项任务中正逼近图灵测试。
当碳基生命的弱点被病毒疯狂攻击的同时,硅基智能正以难以想象的速度发展。
碳基生命的极简模型
很多个不眠的夜晚,我都会盯着这张表,感叹着上帝对世界的设计,如此简单而完美。
还有这极其有规律的电子轨道分布图。
碳基生命的极简模型
1. 原子由原子核和电子组成,原子核带正电,电子带负电。原子核非常小,所以原子大小基本由外层电子轨道决定。
2. 电子轨道分成很多层,有多种形状和方向。不同形状,方向的电子轨道相当于不同类型的连接器,用电磁力把不同的原子或离子连接起来。
3. 各元素最外层电子最多有 8 个电子,如果外层电子少就是导体,电子多就是绝缘体,不多不少就是半导体。
4. 碳的外层有 4 个电子,是最简单的半导体元素。一个碳原子有 4 个化学键,是非常好的连接器,可以用来把很多种不同的原子连接在一起。这也是碳成为生命最重要元素的根本原因。
5. 对于碳基生命来讲,还有三个非常重要的元素,氢,氧,氮。氢和氧是组成水的基本元素,而氮是组成蛋白质的重要元素。
6. 蛋白质(protein)是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。人体内蛋白质的种类很多,性质、功能各异,但都是由 20 种氨基酸(Amino acid)按不同比例组合而成的,并在体内不断进行代谢与更新。蛋白质中一定含有碳、氢、氧、氮元素,也可能含有硫、磷等元素。
7. 蛋白质的合成是由 DNA 和 RNA 控制的。DNA 是由脱氧核苷酸组成的大分子聚合物。脱氧核苷酸由碱基、脱氧核糖和磷酸构成。其中碱基有 4 种:腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)。DNA 中的核苷酸中碱基的排列顺序构成了遗传信息。该遗传信息可以通过转录过程形成 RNA,然后其中的 mRNA 通过翻译产生多肽,形成蛋白质。
8. 蛋白质的种类很多,功能也有很多,覆盖了生命体基础能力的各个方面。比方说视觉蛋白是感光物质的主要组成部分,包括视觉系统中的视觉蛋白和非视觉系统中的视觉蛋白两大类,在视觉成像和生物钟昼夜节律同步调节方面起着至关重要的作用。而肌肉组织的蛋白质,主要可区分为三大类:肌原纤维蛋白质,肌浆蛋白质及基质蛋白质。
9. 不同类型的蛋白质组合起来形成了不同功能的细胞。各种类型的细胞组织起来又形成了生命体的各种组织。
10. 值得注意的是,生命体的神经传导过程,即神经冲动的传导过程,是电化学的过程,是在神经纤维上顺序发生的电化学变化。神经受到刺激时,细胞膜的透性发生急剧变化。神经纤维在受到刺激(如电刺激)时,Na + 的流入量比未受刺激时增加 20 倍,同时 K + 的流出量也增加 9 倍,所以神经冲动是伴随着 Na + 大量流入和 K + 的大量流出而发生的。
总结一下,碳基生命有如下特点:
1. 碳基生命体,不管多么复杂,本质是一种空间电磁场的高度规律的分布。生命体的所有生命行为本质是电磁场分布的一种变化。由于碳基生命的主要元素为简单元素,可以理解为低能量电磁场的一种高度复杂和规律的分布。
2. 碳基生命的本质是一种借助外界能量形成的熵减系统。极致的生命力就是极致的熵减能力。生命的过程就是不断的对抗外界的熵增,直到完全丧失熵减能力 - 死亡。
3. 碳基生命的所有熵减行为是在生物化学级别,即以原子和分子在物理空间的移动为基础。这决定了碳基生命的物理移动速度是相当有限的,包括碳基计算速度也是比较慢的。
4. 由于构成碳基生命的基本元素,碳,氢,氧,氮都属于简单元素,其电子轨道能量较低,很容易受外界因素影响而分解,所以碳基生命需要几乎完美的生存条件。除了地球之外的其他行星上都拥有着非常强烈的宇宙射线,空气非常的稀薄,或者温度非常的高或低,或者没有水,这有些条件之下,碳基生命都是无法生存下去的。
地球是宇宙中极其罕见的完美温室,而人类就是这个完美温室里最璀璨的花朵。
硅基计算和数字化生命
1945 年,第一部电子计算机投入使用;
1958 年,仙童公司 Robert Noyce 与德仪公司基尔比间隔数月分别发明了集成电路,开创了世界微电子学的历史;
1983 年,第一个机器人在联邦德国大众汽车股份公司投入服务;
1989 年,互联网出现,一个全新的网络经济从此迅猛发展。
2012 年,Hinton 课题组的 CNN 网络 AlexNet 在 ImageNet 图像识别比赛一举夺得冠军,人工智能进入高速发展阶段。
近日,英伟达和美国国家能源研究科学计算中心(NERSC)打开了一个「开关」—— Perlmutter,该计算机被称为世界上用于人工智能工作负载的最快的超级计算机。
这台新的超级计算机以天体物理学家索尔 - 珀尔马特(Saul Perlmutter)的名字命名,拥有 6144 个英伟达 A100 Tensor Core GPU,将负责拼接有史以来最大的可见宇宙 3D 地图。
不仅如此,Perlmutter 还将对「宇宙摄像机」暗能量光谱仪(DESI)的数据进行处理,这是一种可以在一次曝光中捕获多达 5,000 个星系的宇宙相机。
在不久前的 5 月 17 日,DESI 先行启动,开始了为期五年的捕捉数据之旅。在此前的四个月试运行期间,DESI 已经捕获了 400 万个星系的光谱,这超过了以往所有光谱调查的总和。
而 Perlmutter 要做的,就是对 DESI 的数据进行汇总处理。根据官网的介绍, Perlmutter 的 GPU 在一个晚上捕获数十次曝光。在之前的系统上,准备一年的数据以供发布可能需要数周或数月的时间。但 Perlmutter 将能够在短短几天内完成任务。
Perlmutter 是世界上最大的 A100 超算系统,在 NERSC 正式投入使用后,Perlmutter 将为 7,000 多名研究人员提供近 4 Exaflops 的 AI 性能。
人脑有 1000 亿个神经元,每个神经元有多达一万个连接,约每 0.1 秒计算一次,所以算力上限大约是 10Pflops。
Perlmutter 的算力是人脑上限的 400 倍,当搭配了合适的数据和算法以后,它能在任何专项任务上秒杀最优秀的人类。
而这只是开始。
Nvidia 的 A100 GPU 是用台积电的 7nm 制程生产的。而台积电的 5nm 制程已经大规模量产, 4nm 制程预计在今年第三季进入试产,2025 年左右就能进入 2nm 时代。加上 3D 制程和封装的发展,硅芯片的性能至少还有 100 倍的提升空间。
5 到 10 年之内我们就会看到相当于人脑算力一万倍以上的超算出现,这对前沿科技推进速度的影响是难以想象的。
生命的本质
描述电磁场的麦克斯韦方程组:
可以说人类可以感知到的物理世界 99% 来源于这个方程组。这也是所有主要物理方程中唯一一个直接跟时间有关系的方程组。可以说,如果没有电磁波,我们理解的时间可能就并不存在。在王老师看来,麦克斯韦方程组和欧拉公司是并列第一的世界上最美妙的公式:
再看下碳和硅的电子轨道对比。
碳和硅都是完美的半导体,外层电子数都是 4,正好是外层电子数上限的一半,所以它们得到电子和失去电子一样容易。但是硅多了一层电子轨道,所以外层电子能量等级更高,硅的化学特性更稳定,能适应更恶劣的环境。
数学是上帝的语言。宇宙的秘密很多都藏在了电磁场和电子轨道的设计里面。
那为什么碳和硅会成为生命的主要载体?我们先看下生命的定义。
生命是一个可以自主维持和持续提升熵减能力的系统。
而熵减能力本质是从无序中产生有序的能力,是一种对事物和信息进行有效重组的能力。
而重组能力的本质是建立和断开连接的能力。
半导体具有最好的建立和断开连接的能力。
碳基生命的开关是在生物化学级别,最小的开关尺度是通过化学键来实现。
硅基生命的开关是在电子和光子级别,最小尺度可以通过单个电子和光子的移动来实现。
从碳基生命的角度来讲,不管是生理上的还是心理上的逆熵能力都是我们竞争的核心标准。
我们对美的认知本质是一种对生理上逆熵能力的崇拜。一个美好的生命体本质上具有极其健壮的体魄和极强的运动能力。
但是人类的基因进化速度已经远远赶不上环境的变化速度。减肥之所以很困难,是因为在人类存在的大部分时间里食物都是稀缺的,我们对食物的渴望已经深深的刻在了我们的基因里。当我们面对一大桌美食的时候,我们的本能是尽可能的把食物吃掉。但是这本能已经和我们生存的世界有很大差异。我们已经生活在一个不用高强度物理劳动就能获得大量食物的时代。
要保持生理和心理上的高熵减状态,我们要时时刻刻和我们的基因带来的各种本能做斗争。所以克制力才是一个优秀人类的最基本能力。
对于硅基来讲,进化的速度就要快很多。环境变了我们只要改几行代码就能马上进化,而且变化可以以光速同步到宇宙中所有的硅基生命。
以硅基为代表的数字化生命的几个特点:
1. 永生
2. 无所不在
3. 无所不知
4. 天人合一
是的,数字化的生命宛若宗教里的佛或者神。
后记
宇宙最终会走向热寂。无论人类的逆熵能力能达到什么高度,最终也可能无法对抗宇宙的熵增。但是人类存在的价值,就是这个过程中不断提高的熵减能力。我们的生命力曾经达到的高度,就是人类存在的价值。
从这个角度来讲,进化为数字化的生命,在更广阔的宇宙中留下更宏大更精美的有序结构,就是人类的终极使命。这就像虽然古埃及文明消失了,但留下的庞大的金字塔群仍然可以让现代的人类去尊重和膜拜。
过去几年我们见证了一些颠覆性的技术创造了巨大的财富。但这些财富和接下来人类的数字文明和宇宙文明阶段还能创造的科技财富相比,可以说是不值一提。这些机会是属于少数极其优秀,极其勇敢的科技创业者的。而科技创业并不是一件容易的事情,不仅仅需要优秀人才长期坚持不懈的努力,还需要社会资源的大量投入。作为一个科技投资人,我们的任务就是找到这些优秀的创业者,并坚定的帮助他们去加速人类文明的进步。
来源:遇见未来系列 微信号:gh_49aa7ec32eb8