当前,新一轮科技革命深入演进,数字时代扑面而来,全球主要国家在数字经济领域展开激烈角逐。关键数字技术创新,中国已经取得了哪些优势?在当前国际环境下,面临哪些难题要“啃”? 作为引领未来的战略性技术——人工智能是中国提高经济与科技水平、提升国际竞争力的重要算力基础设施,目前各地掀起了人工智能计算中心的建设热潮。人工智能计算中心如何才能发挥出最大价值?中国人工智能计算中心技术自主可控水平如何?哪些关键技术被国外垄断着?近日,中国工程院院士、清华大学计算机科学与技术系教授郑纬民接受中新社“中国焦点面对面”专访,进行权威解读。
访谈实录摘编如下: 给三句话,它就能写50集连续剧 中新社记者:近期,中国“人工智能计算中心订单爆单”的话题引发不少关注。武汉市5月底建成的第一个人工智能计算中心,刚开张就天天客满,满负荷运行,目前预约已经排到半年以后。人工智能(AI)计算中心是算什么的?为何市场需求这么强? 郑纬民:人工智能有多种多样的应用场景,需求很旺。根据场景可以分为三大类应用: 一、图像检测、视频检索类。可以用在安防、医疗诊断、自动驾驶。核心是卷积网络,这一类应用落地做得很好,已经起到了很好的作用。 二、决策类。比如交通规划等,这个类型也已经起到了很好的效果,核心是强化学习。 三、自然语言处理类。比如搜索与推荐,智能人机接口,核心是Transformer。在应用方面,语言翻译,把中文翻译成英文,英文翻译成日文等,问什么问题都能回答,这样的机器需要非常大才行。又比如生成文本摘要,你给它三句话,能给你写成50集电视连续剧。 这三类应用的需求很多,所以才会(出现订单)排队排到半年后这样一个情况。 中新社记者:目前流行的人工智能计算中心与传统数据中心有何不同?日前,工信部印发《新型数据中心发展三年行动计划(2021-2023年)》,《行动计划》中定义的新型数据中心和人工智能计算中心是一回事吗? 郑纬民:传统数据中心主要由通用CPU架构的服务器集群构成。近年来,随着人工智能的发展,数据中心也逐渐包括了很多具有高性能人工智能算力(GPU或人工智能加速器)的机器。 而人工智能计算中心是什么呢?主要由具有高性能人工智能算力(GPU或人工智能加速器)的机器组成。因此可以说,数据中心概念的覆盖面会更大一些,包含了人工智能算力。
2021年9月3日,2021年中国国际服务贸易交易会在北京举行,在国家会议中心展区,华为公司人工智能计算中心Atlas 900 PoD设备参展。
中国技术自主可控吗? 中新社记者:人工智能和大数据中心都属于“新基建”,当前全球主要国家都在大规模建设人工智能、大数据基础设施,有人说未来人工智能算力将会像水和电一样,成为一种公共基础资源,对此您怎么看?中国建设人工智能基础设施有哪些核心优势?中国人工智能计算中心的技术自主可控水平如何?哪些关键技术被国外垄断着? 郑纬民:从全球公有云市场的快速发展可以看出,通用算力和人工智能算力都是公共基础设施,是一种重要的趋势,过去通用的算力是基础设施,现在把人工智能算力也作为基础设施,正在被越来越多的用户认可。 但是我们也要注意到,算力作为基础设施,需要相关的数据作为基础,把机器包括普通的机器,包括人工智能的机器都放在云上,不少行业的数据隐私性和保密性,对其上云仍然有很大的限制,怎么把数据放在云上是一个值得考虑的问题。 中国在建设人工智能基础设施上的主要优势,是政府主导的投入较多。但在市场化建设和运营,整体人工智能算力基础软硬件的技术水平和自主可控程度上,还与美国有一定的差距,如,编程框架目前以TensorFlow和Pytorch为主。智能计算芯片方面,华为昇腾和寒武纪在人工智能算力体系结构上取得了很好的进展,但受制于先进芯片制程,或在软件生态环境上仍然与Nvidia产品有明显差距,仍然需要尽快发展。
中国有能力“从头先进” 中新社记者:中国“十四五”规划和2035年远景目标纲要提出,加强关键数字技术创新应用,加快推进基础理论、基础算法等研发突破与迭代应用。关键数字技术创新,中国已经取得了哪些优势?在当前国际环境下,面临哪些难题要“啃”?哪些与人工智能计算中心密切相关?预计未来发展趋势如何? 郑纬民:中国在基础理论和算法上还很难谈优势,但是基本上可以跟随第一梯队,就是美国人提出来的算法和理论,我们很快能够跟上并加以改进应用。 整个数字技术中,除了硬件的芯片制造产业链,我想特别强调,中国在基础软件方向还是有很多的课要补。我们现在大量的软件,包括操作系统、数据库、编译器、人工智能编程框架等,不是自己从头构建的,而是在开源基础上修改的。 应该说,能够在开源软件基础上进行大量修改,已经证明我们取得了很大的进步,对我国数字技术的自主化具有重大意义。但是我们如果对自己提出更高的要求,就必须拥有自主从头构建先进的基础软件的能力。 这里的“先进”是指,我们构建的新软件要比现有的软件在性能和功能方面有代差的优势。这方面产业界,华为的鸿蒙操作系统、人工智能编程框架MindSpore等给出了很好的范例。我们学术界,清华大学的时序数据库、图计算系统、储存系统也取得了一定的进展,我们期待国内的产业界和高校能够更加重视从头构建先进的基础软件,为中国和世界的数字产业界提供更多革命性的基础系统软件。因此,我特别强调“从头先进”这四个字,“从头”就是我们从头做,“先进”就是比现有的软件好10倍20倍,我们有这个能力,希望通过这个办法,来改善我们国家IT行业的现状。
来源:中国新闻网