【WRC 大咖观点】龚克《新趋势：AI+机器人》

时间: 2021-09-24

2021世界机器人大会第一天线下主论坛——“领航峰会”群星璀璨，产、学、研各领域大咖齐聚首，共话巅峰，为机器人未来发展领航。

峰会现场，世界工程组织联合会主席、中国电子学会副理事长龚克上台发言，演讲主题为《新趋势：AI+机器人》。以下为龚克副理事长演讲内容全文整理。

各位老师、各位同事、各位朋友，大家上午好！我的标题还有一个副标题“门外汉的思考”，王天然老师是真正门内的，我只是门外汉。人工智能发展战略研究院是中国工程院和天津市合作在南开大学的一个智库机构，就是研究战略的，不是研究具体技术。2017年国务院发布的《新一代人工智能发展规划》是一个中长期规划，时间是2017年到2030年，我们观察的是规划进展过程中有什么问题，特别关注和实体经济的结合是怎样的，所以中间也会涉及到工业和机器人。前面的几位发言者都认同一个趋势，就是AI和Robot的结合，王耀南和John Hennessy都有谈到这一点，下面我谈一谈我的看法。

趋势是一个时间轴的概念，按照总书记的话来讲，社会发展史上人类经历了农业革命、工业革命，正在经历信息革命。我们现在说的智能化其实是信息革命的一个阶段，信息自古就有，信息革命是从数字化开始发动起来的，网络化将其提升到了一个非常重要的阶段，现在进入一个新的阶段就是智能化阶段，我认为这是信息化革命中的一个新的阶段。信息革命和工业革命有什么不一样呢？工业革命是拓展人类的体力，信息革命则是增强人类的脑力。机器人最早出来也是解决体力问题的，因为机器本来就是解决体力问题的，但机器人是从解决体力加上脑力融合起来。机器人从刚开始就是有一点智能的，现在只不过智能化的水平处于提高阶段，刚开始要是一点智能没有的话就是一个机器，只是Machine而不是Robot，Robot就是带有一点智能的。

那么智能化是谁在推动呢？人工智能是引领这一轮科技产业变革的战略性技术，具有溢出性、带动性很强的头雁效应，这句话是习近平总书记说的，代表我们国家对智能化的重要判断。什么是AI呢？其实AI有不同的概念，我的理解是分为人工和智能两个方面：智能是经济学习形成的一个自主的感知、认知和决策能力，感知和决策能力没有问题，但我特意加上这是学习形成的。一个孩子生下来哪怕大脑特别发达，如果不让孩子学习，关起来只吃饭，那不会有什么智能。人工智能就在于这个智力是依托于一个人工设计的装置，通过人工设计的算法、人工直接或者间接提供的数据进行学习。目前这个装置运用得越来越多，就是Robot，智能要在这个装置上发挥作用。

这些年来人工智能的研究不断增长，今年早些时候我们做了统计，2018年以来不断增长，这些研究论文涉及到的应用领域也在不断拓展。新一代人工智能有几个关键技术，大数据智能、群体智能、人机混合智能、自主无人智能、跨媒体智能都在向前发展，而这些在发展的过程中要解决人工智能发展的几个瓶颈问题。John Hennessy刚才特别强调机器学习要依赖大量的数据和大量的算力，数据的可用性和质量问题就是现在新一代人工智能面临的第一个大的问题。大量数据的获得不是那么容易的，目前Infinite Net大概有5000个图在上面，每个Object都有很多的图，这些都是互联网搜集起来的，而且是众包的形式做了标注，有的时候上一个软件可以识别哪个是猫、哪个图里有灯杆，其实都是帮他们在做这个图的标注。一般的企业没有那种能力获得这么大量的数据，花不起那样的成本去做这种标注，甚至由于数量特别大，用的算力也特别大，所以这是我们碰到的第一个特别重大的瓶颈。

刚才John Hennessy提到能量的瓶颈，人类折算成功率的话大约是20W，机器至少是它的1000倍，就是现在我们用的机器学习，李世石和Alpha-Go下棋的时候，Alpha-Go是花了3000美元的电费，可想而知电量有多大。目前我们在这方面已经有了一定进展，比如TB3自然语言的预训练模型，利用大量数据、大量算力，由我们主要的平台企业事先训练好，这些是关于自然语言处理的模型，可以达到人类的程度，有了这个模型以后就是开源的，去年8月份这个模型完全开源，我们现在做自然语言处理的这些公司就可以在开源的基础上利用特殊场景的特殊语音资料做详细说明，比如加上云南话和广东话，那么就不需要特别大的数据量、特别大的计算量。去年北京元智研究所的清华团队发表了比这个参数还要大的模型，达到1750亿个参数，也就是175GB的参数，任何一个复杂函数可以用无穷多的简单函数的级数精确进行模拟，这个无穷多就是参数，只要参数足够多就可以足够逼近，但这里计算量和代价非常大，有了预渲染模型门槛就可以降低。

算法需要加速，过去我们说计算机是CPU的天下，但这次人工智能计算就让CPU有些不适应，因为人工智能的大量计算都是处理图形，用不着CPU那么多逻辑的计算，用的是矢量和向量计算，所以就出现向量计算的GPU，Google还有Tensor Processing张量计算，包括NPU神经网络计算，这些新的硬件的产生不仅加速了计算的速度，而且降低了计算的能耗，使其有很大的进展。因为这是一个新的蓝海，所以在这里，我国有些企业比如寒武纪和华为就打破了原来在CPU长期形成的垄断性的英特尔一统天下，日本做了很多CPU都撼动不了，但这次硬件加速器有了新的进展。

目前也有出现一些新的算法，自动驾驶系统是一个非常复杂的机器人系统，去年有一个重要的研究成果发表就是来自MIT维也纳工业大学、奥地利科技学院的团队用19个类脑神经元实现了控制自动驾驶汽车，替代了数百万个神经元，使得计算量大大下降，能耗也大大下降，这在去年10月份的《自然》杂志发表。目前我们将其叫做ANN就是Artificial Neural Network，SNN是Spiking Neural Network，相当于一个脉冲，现在输入进来的是实数，各个层次中间传输的权重也都是实数，脉冲的话涉及到到达时间，这个时候权重就可能会带上延时，也是和人脑的情况更加接近，所以这是类脑神经元。其实SNN最早出现和CNN几乎是同时的，之所以在过去那些年没有能够做得这么好，主要是以CPU为主的计算机不适合计算SNN的网络，现在我们有了新的网络以后就起来了。

图中是中国人做的一项很重要的工作，去年在《Nature》发表，就是清华大学仪器系团队做的芯片，也是使用了SNN，现在是自行车在跟随、避障、转弯、加速，跟随人的速度，这些就是使用SNN和ANN融合的芯片，28×28毫米的大小。有的人说一辆自行车不用这么复杂，没错，不用SNN也可以平衡这个自行车，并不是说只有它才能平衡自行车，但我们用原有的人工神经网络做平衡自行车和现在芯片上实现ANN和SNN的结合，上限是什么样子？恐怕将来就不是控制SNN，可以做得更好，所以这个叫做Dual Control，这是最重要的，自行车并不是那么重要。

类脑计算把SNN引进以后，由于这种特点，过去的几年一直跟硬件的设计是紧密联系在一起的，所以总是做一个软硬结合的设计，缺少通用性，也是去年发表了一篇比较重要的文章，又是清华大学的团队，这个团队是计算机团队，也是和机械学院的团队紧密结合，提出一个理论就是类脑计算的完备性。现在我们做CPU计算的时候不会担心写一个程序CPU执行不了，因为使用的程序都是具有完备性的程序，CPU是具有完备性的硬件，总是可以执行的，效率可能高也可能低，但是可以执行，不会觉得某个软件硬件不能执行，前期的类脑计算就有这个问题，必须和硬件紧密结合设计。这个团队中间提出了一个编译层，现在的计算机把软件和硬件分开的中间就是编译层，《自然》杂志评价说完备性新概念推动类脑计算，对类脑系统存在的软硬件紧耦合的问题是一个突破性的方案，我们认为这是AI近几年比较重要的进展。

除了这些以外还有一个重要进展，就是使用新器件，叫做相变存储器。我们说神经网络计算反复调整的是什么呢？就是输出，本来应该是猫，但输出的不是猫，看一看跟猫有多少差距，然后是Backwards Propagation，反向调整的过程非常耗时耗力，通过随机调整函数使得能量和效率大大提高。这是北大去年做的工作，去年发表出来以后也非常有影响。

我们看到无论是算法、理论、硬件和基础器件，这些年都有重要的进步，尽管还没有达到最终突破的阶段。一方面是几个关键技术，另一方面是几个瓶颈问题，新一代的人工智能器件正在向前发展，使得功能更强、效率更高，也有出现ANN、SNN结合这样的新体系。

我们从产业上可以看到什么呢？过去三年我们研究院一直选择以人工智能的解决方案为主业的企业，去年有2205家，我们来看这些企业的资金是哪里来的，如果投资的话到哪里去，就是一进一出两条线，可以连接到投资者和被投资者，同时也要看人才是哪里来的，要是跳槽的话到哪里去，所以根据资金、技术和人才关系联系到背后有200多家大学、100多个研究所，参加1000多个会议，涉及到400多个联盟，3741家投资者，地级以上政府的500多条政策，涉及到1000多个地级以上政府产业园，连成一个密密麻麻的图，我们叫做价值网络图。

过去三年中我们看到了什么呢？2018年连接度最高的是BAT三个平台，也是在这里起着非常明显的重要作用，华为就已经突出出来了，富士康也突出出来了，我们从这张图可以看到和实体经济的结合越来越紧密，一些原来不是以这个为主业的企业，由于采用人工智能技术正在其中起到越来越重要的作用，希望将来新松也可以在里面扮演一个非常重要的角色。

我们在新一代人工智能的理论、方法、器件的基础上，五大技术都在向前发展，加上智能基础设施建设、人才、法律、政策标准，我们正在构建一个智能社会。

刚才说的是AI，再来说一说Robot。为什么要关心Robot？我们研究院提出培育高端高效的智能经济，主要是四条：大力发展人工智能的新兴产业，包括智能软硬件、物联网传感器、智能终端、虚拟现实、智能运载和智能机器人，其中对智能机器人专门有一段规划的描述，这是导致我们关心智能机器人发展情况的一个原因。大力发展智能产业，其中特别提出智能制造，总书记在两院大会上的讲话就提到要以智能制造为主攻方向促进人工智能技术和实体经济的结合，而在智能制造中智能机器人又变成非常重要的角色。我们认为智能机器人和智能制造是工业和人工智能紧密结合的一条主线。

什么是机器人？我其实是非常困惑的，我是1970年进工厂当车工，直到1978年3月上大学，干了将近八年的车工，我们的车间基本上就是五六种产品，年复一年、日复一日，一天三班倒地干活，所以当时我看卓别林的《摩登时代》特别有同感。当时说的是资本主义把人变成机器，我想社会主义好像人也和机器差不多，整天重复做这种劳动，所以我最早理解的机器人是一个像机器那样工作的人，后来我才知道机器人恰恰是让人重新成为人，发展更好的东西让人还原成人，而不是像机器那样简单地干活。八十年代初我出国留学，拿到ARV的奖学金，然后有一次让我们这些外国留学生报名参加自动化工厂，我觉得这样很好，这是一个机器人车间，当时我就提出第一个问题，机器人在哪里？他们说这就是机器人，我一下子才明白，机器人不是像人一样的，这些就叫机器人。

ISO对机器人的定义是什么呢？工业机器人是一种具有自动控制、操作、移动功能，完成各种作业可编程的操作机，所以机器人不是人，是工具，因此才叫做Robot，特别是疫苗机器人最好叫做智能化医疗机械，不然医生觉得听着不是很顺，好像要代替他们。

人工智能会出现什么问题呢？刚才说过围栏式生产，最早机器人不是围栏式的，因为出了意外事故造成了死亡，所以有能力之忧，到底能不能可靠、安全、稳定、敏捷、精确、灵活地完成各种各样不同的任务，协同起来完成任务，高能效、零碳排地完成各种任务，能不能保证受控，此外还有对成本的担忧，对造成人的失业的担忧，以及会不会把我们人类给灭了。就像以前捷克的主席说要到我们那里开会，就说我们是机器人的故乡，我说Robota是什么意思？他说最开始是干重体力劳动的奴隶，我说机器干的其实就是这个，而且干得特别好。

要想解决这些问题，机器人需要增智，提高智力发育，但增智有一个前提，就是必须上网，不上网就没有大数据，没有大数据就很难和人工智能结合，而且还要立德，就是要有道德，我们现在要把这种伦理植入系统，做到可检测、可检验，不只是写在纸上的。

要想做到二者结合，信息技术和制造技术深度结合，原来信息工业化本来说的就是这些，这种融合体现在体现在以机器人为载体，以工业互联网为基础，进入制造业互联网，新一代人工智能和实体经济深度融合。

这条曲线是大家都比较熟悉的，左边讲的是人，纵轴是智力，横轴是环境，小的时候智力很小，随着年龄增长可以达到很高的智力水平，智能机械的智力在一个确定的环境下可以达到越来越接近人的智力，如果环境越来越开放、越来越不受控的话，各种智能机的智力就越来越下降。

人是怎么智力增长的呢？不是随着岁数简单增长，而是在这个过程中实践学习，通过经验逐渐增长，现在我们的智力系统就是通过引入学习，也在破这条逐渐下降的曲线，逐渐能够适应各种不同的工作环境，那么就需要这样一个增长。

还有一个问题就是人机共融，机器本体的行为能力需要加强，需要更加敏捷，同时智能技术、智能水平要匹配人的水平，行为水平也要匹配人的水平，这样才能跟人协同，如果机械动作可以匹配人，但智力不如人的话就不行，有的时候可能会出事故，或者只是智力达到了人，但动作特别不好的话也很难和人协同。

传统的人工智能技术是做问题求解、定理证明、模式识别，就是专家智能、人机博弈，是在一个非行为空间起作用，也有确定性的因素和规则下的推理，现在我们正在突破。Robot是有行为能力，就是需要动的，约束条件有非预知性和动态性，操作和合作对象可能也存在随机性，这个时候就要实时鲁棒，这跟传统人工智能是有差别的，我们就需要人工智能向前发展，让机器人的智能发育和人工智能的发展相互配合起来。

这些是我们学校的研究工作，实际上要求类人的人工智能形成一个研究发育机理，包括研究对意图的理解和行为决策能力，就是让人工智能和机器人相向而行，共同支撑我们的智能制造，实现人工智能和实体经济的深度融合。

以上就是我对这些趋势的理解，不对的地方请大家批评指正。

上一篇：【WRC 大咖观点】John Hennessy《运用机器学习和机器人技术改善我们的生活》
下一篇：2024世界机器人大会开幕：国内外专家热议产业趋势与AI治理

新闻速递

【WRC 大咖观点】龚克《新趋势：AI+机器人》