华为周红:我们将建太空城市,元宇宙将被广泛运用


图片


首次!中国元宇宙区县、产业园、乡镇、街区TOP榜评选,上路

履新国内首次公开亮相,袁昱:AI发展使得元宇宙会成为刚需


我们将建设可持续发展的环境以及更好的地面和太空城市。我们将看到虚实融合的数字世界广泛应用于我们的生活和生产中,如元宇宙、3D全息、数字孪生等。


4月17日,在深圳举办的华为分析师大会上,华为战略研究院院长周红在题为《面向智能时代的思考和展望》的主题演讲中,在面向未来新生活、新工作、新环境、新数字世界的四大突破中,他如此展望其中的两个。


虽然华为推文没有展开何以建设太空城市,元宇宙将如何广泛应用于我们的生活和生产,但它们能够被列入对“未来世界是什么?”的展望,并视为全面智能时代的四个突破中的两个,可见分量之重。


不仅如此,周红在演讲中还讲到华为正在构建新计算模式、新架构、新部件,提升效率。他提到华为与数字家、生理学家、半导体专家的交流与讨论,以及近似计算、模拟计算、存内计算、量子计算等其它潜在的突破方向,并称“未来,这些技术有可能将计算效率提升100万倍”。


面向智能时代,华为思考的底层逻辑、出发点和对未来的预判是什么,这一演讲可以作为一扇重要的窗口。


以下为演讲全文:

d87434af5cc8408e9b11e19557f3189.png


全面智能时代的四个突破


人类社会的每一轮发展都伴随着关键技术的突破。在过去的300多年,人类社会经历了三次工业革命。从机械化、电气化到信息化,人类社会的经济模式产生了巨大的变化。当前,我们有了更多的数据、更好的算法和更大的计算能力,第四次工业革命正在到来,创造了新的数字经济。从数字基础设施到产业应用与创新,它将改革我们的数字消费和生产、科学研究与技术创新以及我们的教育和文化。


未来1020年,我认为人类社会将加速走向全面智能时代,我们将看到新型数学和物理计算的突破、新的清洁能源、新的信息通信,和新的智能将支持这些突破革命性的融合。6GAl将被广泛使用,我们希望开发出高性能、用户负担得起且无处不在的算力和可再生能源。


我们正处于信息大爆发的时代,产生和使用着越来越多的数据。在中国,2023年平均每月移动宽带的流量达到26.5艾字节,比2013年的0.11艾字节增加大约240倍,其增速远超过20032013十年间的40倍增长。AI领域增长更快,2018年的大模型参数值约在1.17亿,2019年增长到15亿,2020年增长到1750亿,2023年达到1.8万亿,五年时间就增长了接近1.5万倍。


我们认为,未来10年,来自应用侧需求的增长将牵引信息产业的巨大发展,使得通信能力将增加100甚至1,000倍,计算能力将增加1,00010,000倍。然而,目前还没有足够强大的基础理论和先进技术来支撑这些发展,因此我们希望和合作伙伴加强开放和联合创新。


随着信息技术的迅速发展,未来的世界将会是什么样?根据与学术界、产业界广泛的交流,我们识别出面向未来新生活、新工作、新环境、新数字世界的四个重大突破。


首先是人的健康和成长。我用这款华为智能手表来检测喝咖啡、绿茶、红茶、白茶以及红酒、伏特加和白兰地对血压的影响。我发现几乎每次我只要喝了1盎司或差不多半两白兰地,15分钟后我的血压就会降低到理想水平。有了强大的可穿戴设备,我们可以更好地管理自己的健康。


事实上,华为正在与很多医院和医学院合作,在627万名志愿者中,华为穿戴设备已经检测出超过2万例潜在的房颤风险,准确率约为94%,并且帮助用户建立了连接医生的快速通道。未来,越来越多的疾病可以通过基于Al计算的靶向药物治愈。随着AI应用和工具的普及,年轻一代将拥有比我们更强的创造力。


其次,未来将有越来越多的智能机器人,他们不仅能够提供服务,还将参与生产,帮助人们过上舒适和富足的生活。


第三,我们将建设可持续发展的环境以及更好的地面和太空城市例如,华为正在与伙伴合作,在沙漠中部署光伏解决方案。两年前,光伏发电每度电成本约为1.6美分。未来,我们认为发电成本可能还会进一步降低。低空运输会得到大力的发展,将比我们传统的地面通行速度提升十倍以上。


最后,我们将看到虚实融合的数字世界广泛应用于我们的生活和生产中,如元宇宙3D全息、数字孪生等。目前我们还有很大的差距,一部像《阿丽塔:战斗天使》这样的科幻电影,可能需要3万台服务器和4年的时间进行计算。



人工智能的三个挑战


信息感知、通信、计算和控制是实现这四大突破的基石,而通用人工智能将扮演关键角色。在通往通用人工智能的道路上有哪些重要挑战?我们根据实际应用,识别出三个挑战,包括认知偏差、性价比以及如何创造价值。


首先是认知偏差。比如,我们发现深度学习算法和大模型在视觉计算方面存在局限,在一些情况下对噪声、颜色、纹理、背景、组合和旋转敏感。我们不能理解,为什么熊猫加上一些肉眼不可见的噪声,就可能被认作长臂猿?


我们不能接受停车标志上贴几个黑白小块,就可能被认为是限速45。大语言模型会存在偏见、缺乏概念和逻辑以及幻觉的挑战。大家知道中国有位叫周树人的著名作家,他的笔名叫鲁迅。我去年问一个大模型“鲁迅是周树人吗?”,大模型回答“不,周树人的真名是巴金”,这就是典型的幻觉;大模型能够回答出Tom Cruise的母亲是Mary Lee Pfeiffer,但与此同时却不能回答谁是Mary Lee Pfeiffer的儿子,这就是缺乏概念和逻辑。


近期有多篇研究论文表明,在传统的学习方法和有限的训练数据下,单纯的大语言模型很难甚至无法真正学会四则运算,这方面还不如计算器。除此之外,大语言模型也很难理解和回答如何用天秤找出假币的问题。


为了探索和扩展大语言模型和Scaling Law的极限,人们开始尝试有监督的微调(SFT)、逆向训练(RT)、检索增强生成(RAG)、Q*分步验证、混合专家(MOE)、思维链(COT)、代理和工具调用等新的想法。


如何提升性价比?尽管超级计算机的算力远超人脑,但在能效和成本方面都存在着巨大的挑战。目前,一台2,000万瓦高性能计算机可以提供大约1,000 PFLOPS的算力,而一个20瓦的人脑可以提供30 PFLOPS的算力,能效几乎是前者的30,000倍。在AI应用方面,目前一个大语言模型每天需要消耗近50万度电来回答近2亿个问题。试想一下:如果未来十年,我们需要1,000倍的算力,但无法显著提升能效,那几十座核电站可能都不足以满足这样一个耗电的单一功能大模型的需求。


如何创造价值?应用是AI的终极目标。我们需要基于基础模型开发各种基于行业和场景的模型、工具和生态,从而创造更多客户价值和更好的用户、伙伴和开发者体验。我认为,除了少数几个大型、非常昂贵的训练模型之外,广泛部署高效、低成本的中、小、微型推理模型,对于AI的普及应用更加重要和迫切。



应对挑战的四个建议


面对上述三个挑战,我们提出了四个建议,以提高准确性、适应性、创造性和效率。


第一个建议是发展多种智能。我认同Howard Gardner教授的看法。他认为人有多种智能,包括语言文字智能、自我认知智能、人际交互智能、视觉和空间计算智能、自然理解智能、音乐智能、运动智能和数理逻辑智能。我认为前三类智能非常重要,因为它们与人类社会的道德伦理、价值观和文化息息相关。我们必须确保人在环中,避免对我们的身体和精神的隐私和保密、安全和发展带来失控。我们应该考虑如何实施Isaac Asimov提出的机器人三定律。


从这张人脑示意图中可以看出,人脑有很多不同的区域,有不同的功能。语言文字智能在第三区和第七区,计划和决策在第一区,视觉和空间计算智能在第十区,而运动智能在第十一区。我认为这些分布式的异构智能可以帮助我们提高准确性和适应性。


第二个建议是发展基于自治代理的开放智能系统。我曾和Joseph Sifakis教授探讨过面向未来基于自治代理、开放的智能系统。该系统应包括三个重要部分。


首先是感知和学习,除了从内外部环境获得信息外,还要从互联网、人类和其他模型获得信息。通过这一步,可以建立概念、特征、关系和事件之间的统计关联关系,形成经验模型。第二是加强从经验到理念的系统化和自动化抽象、验证与扩展。经验并不总是正确的,谎言讲一千遍也成不了真相。三是通过演绎、归纳、解因推理以及试错进行目标管理和规划,推动决策与行动。


第一部分善于参考,第二部分善于监督,第三部分善于控制。基于这一开放的智能系统,我们可以发展世界模型,包括时间、地点、人、物、关系、事件以及真实世界运行规律和法则等信息。


第三个建议是构建新计算模式、新架构、新部件,提升效率。


我们与数学家交流,探讨在AI计算领域面临的挑战。比如在视觉和空间计算领域,有些场景,比如自动驾驶,更关注前面汽车的轮廓,而不是颜色、纹理和图案。如果采用几何流形来表征,能不能实现比基于像素表征100倍甚至1,000倍的计算效率?


我们与生理学家交流,能不能把模型从96层简化到6层,就像人的大脑皮层一样,从而将效率提高15倍?


我们与半导体专家讨论,能不能发展新型内存,而不是传统的DRAMHBM从而Transformer计算中将数据读写效率提升100倍?


此外,还有许多其他可能的突破方向,比如近似计算、模拟计算、存内计算、量子计算等。未来,这些技术有可能将计算效率提升100万倍


第四个建议是从系统工程的角度来发展AI除了商业模式、基础设施和法律法规之外,我们还应该考虑如何构建高质量的语料,创建更好的模型,设计更大规模的超节点集群。同时,我们需要重视开发高效易用的工程工具,发展生态,还要重视对创新人才的教育培养。

66b03ddca344b99406ef15c31ab6f9b.png