在阿西莫夫的代表作《基地》中,AI云端芯片-终端应用-政府采购

  财经     |      2020-01-09

“把阿尔法狗装进手机里”,可能只需要一步:设计出适用人工智能的独特芯片。从2017年开始,我国正在掀起一股前所未有的AI芯片创业热潮,“智能芯”,正在成为我国抢占智能时代的新引擎。 “智能芯”:加速智能时代的发动机 芯片是人工智能的发动机。“无芯片,不AI。”清华大学微电子所所长魏少军说,芯片是实现人工智能的当然载体,无论是CPU、GPU还是其它的芯片平台,都离不开芯片。做AI一定要有芯片,芯片是人工智能不可或缺的基本内容。 对于绝大多数智能需求来说,基于通用处理器的传统计算机成本高、功耗高、体积大、速度慢。更适用于深度学习的智能专用“芯”,就成了产业链条竞争的必备赛道。 人工智能芯片“独角兽”企业寒武纪科技创始人陈天石告诉记者,可以用“瑞士军刀和菜刀”来比喻通用处理器和深度学习处理器的关系:瑞士军刀虽然功能多,但是做菜的时候,还是菜刀更合适。在智能处理方面,需要一把更合适的菜刀。 英伟达的处理器GPU,本是用于图像的渲染,却因为误打误撞在深度学习上,更适合超大规模数学运算,让计算机视觉等的准确率一举超过人眼。可以说,如果没有GPU,这一轮AI浪潮就算积累了再多数据,也枉然。这让2年前还在30美元附近的英伟达股票,如同坐上火箭般,涨至现在的近250美元。 英伟达也并非高枕无忧。谷歌也发布了两代TPU,这种针对深度学习框架Tensor Flow而进行优化的AI芯片,因为阿尔法狗的亮相惊艳世人。微软、英特尔、AMD等老牌科技巨头,都在这条道路上积极布局,包括合纵连横。 同一起跑线:“中国芯”的抢跑机会 目前,芯片仍是我国第一大进口商品,每年的花费在2000亿美元,超过了石油。近年来,随着在集成电路行业的不断发展,传统芯片的国产替代率正在逐步提高。而对于人工智能芯片而言,好消息是,国际上尚未形成通用的智能生态,中国与其它国家站在同一条起跑线上。 2016年,寒武纪研发了全球首款商用深度学习处理器IP产品寒武纪1A处理器。2017年9月,华为海思推出全球首款手机AI芯片麒麟970,其强大的本地AI处理功能正是来自于其中集成的寒武纪1A处理器。与传统的4核芯片相比,这一芯片在计算机视觉、语音识别、自然语言处理等关键人工智能任务上,达到了25倍以上的性能和50倍以上的能效。 “打个比方说,功率、体积、速度等不断优化后,最终有一天我们就可以把阿尔法狗装进手机里。”陈天石说,做AI芯片,就是像建房子或者修路这样的事,如果没有房子、没有路,顶层的应用没办法往后走。 从研发到应用,AI芯片正在这里呈现出百花齐放的态势:2017年11月,寒武纪发布新一代智能处理器产品;12月,地平线发布自主研发的AI芯片“旭日”和“征程”;2018年3月,深思考发布其医疗影像专用AI芯片“M-DPU”。 从云到端:百花齐放的赛道 不过目前而言,还没有一种算法架构可以覆盖所有的应用,到底存不存在一种类似CPU这样的通用AI芯片?业界也还在摸索中,我国创业企业更是百花齐放。 类似寒武纪等,是通用AI芯片的“拥护者”;而深鉴科技、地平线等,则重在应用终端。深鉴科技首席执行官姚颂认为,每家AI芯片公司都必须成为一家软件&系统公司。因为在AI芯片当中,芯片本身只占1%,剩下99%是完整的系统和软件。 “有一天,手机可能不再是作为主要上网设备,而是各种物联网设备。未来谁掌握物联网的入口,谁就是关键数据的产生者。基于声音和图像的专用芯片,将变得非常重要。”语音识别公司云知声创始人黄伟说,非常期待产业基金能在物联网领域有一定出货量的终端AI芯片上多布局,并形成“AI云端芯片-终端应用-政府采购”的生态闭环。 “AI杀手级的应用应该在哪探究,是否会出现像通用CPU那样独立存在的通用AI处理器;如果存在,架构是怎样的?如果不存在,那现在这么多创业公司又将何去何从呢?”魏少军则认为,这个问题目前还没有解答。大部分市场上的AI芯片创业者都会成为“先烈”,而这将成为AI发展中最令人钦佩也最令人动容的伟大事件。

在阿西莫夫的代表作《基地》中,AI云端芯片-终端应用-政府采购。风口不会随便眷顾一个人。因为历史不会对默默“打怪升级”着墨,它只看结果。 **在阿西莫夫的代表作《基地》中,除了先知谢顿贯穿全线,其他主角都是门徒。他们内在为直觉所驱动,外在被时代所推进。他们在历史上的出场毫无征兆,却在潮流中游刃有余。你会惊叹,为什么是他?


**离开谷歌、微软、IBM、Facebook、阿里、百度,告别自己过去的所有荣耀,重新走上创业之路,崇尚技术的护城河。为什么是他!新华网开辟“出走的门徒”系列,讲述这样一群科技界理想主义者的现实路径。**

有一句话形容现在的人工智能特别合适:“我们往往高估了目前,而低估了未来”。如果要以其提出到现在60余年为一个周期来看,它真正席卷人类社会,才刚刚开始。

从这样的历史长河来看、从通用人工智能的未来回溯看,这个时代占据舞台中央的这些开拓者,都是手握着“深度学习”“神经网络”等最原始的工具,在这块荒野上蹒跚前行。走在寻找人工智能基础工具这条路上,陈天石不比其他人多什么先决条件。

幸运的是,从他创造的石器中,人们逐渐发现并保留了火种。

打磨“石器”

AI是一场革命。它和互联网一样,会席卷一切,会从无到有、再从有到无。普通人甚至不需要前行,它会主动过来拥抱你,甚至裹挟你。用罗振宇的话说,“你不必着急出发,因为你终将被抵达”。

在这场基础设施重新定义的革命中,陈天石无疑是一个提前出发者。16岁考入中国科学技术大学少年班;2014年论文在美国召开的国际顶级学术会议上获得最佳论文奖;创办的公司寒武纪科技,A轮估值超过10亿美元,成为全球首个人工智能芯片“独角兽”、全球最大的AI芯片初创公司。

基于深度学习这一底层算法,计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域取得了长足的进展。但传统的处理器例如CPU等,虽然是目前主流的AI计算平台,但是其基本框架结构毕竟不是为了AI所设计的,效率受到很多限制,包括GPU也有耗电量大等缺陷。

如果要用通用处理器搭建一个人脑规模突触的神经网络,可能需要建一个电站来给它供电。阿尔法狗刚亮相时,下一盘棋动用了1000个CPU和200个GPU,每分钟的电费就高达300美元,而网络规模只有人脑的千分之一。

陈天石认为,理想中的AI芯片应当是一种新型的处理器,能具有广阔的应用面(包括语音、语义、图像、视频、自然语言多模态处理能力),同时具备远超CPU和GPU的效率。要想达到这一目标,必须要有一套新的AI指令集,利用指令进行灵活处理,才有可能在AI芯片上把各种算法应用都能支持得又快又好。

打个简单的比方,你把摩托车的发动机装到了汽车上,汽车自然开不快;现在,需要为汽车专门设计一款发动机(深度学习专用处理器)。

“DianNao”这一深度学习处理器架构,平均仿真性能超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级。2014年,他和哥哥陈云霁以及法国信息技术研究院的OlivierTemam教授合作的这篇论文,成为顶尖国际会议的最佳论文。

2014年-2016年间,他们俩和国际学术合作者一道几乎横扫了处理器架构学术圈,在顶级学术会议上教老外说中文的Diannao系列:Diannao、DaDiannao、PuDiannao、ShiDiannao、Cambricon等一系列创新,针对不同的目的,将目前深度学习的效率提高数百倍。

有院士这样分析,“寒武纪”在深度学习处理器指令集上的开创性进展,为我国占据智能产业生态的领导性地位提供了技术支撑。自2014年中科院计算所和Inria联合团队提出首个深度学习处理器架构DianNao之后,深度学习处理器已经成为计算机体系结构国际会议ISCA最关注的研究方向之一。ISCA2016上有近1/6的论文引用“寒武纪”的工作来进行深度学习处理器探索。

“目前,像阿尔法狗这样的软件算法是在GPU上执行的,将来如果使用了带有‘电脑语’指令集的‘寒武纪’处理器,深度学习的运算速度会得到明显提升。”陈天石说。

他用“瑞士军刀和菜刀”来比喻通用处理器和深度学习处理器的关系:瑞士军刀虽然功能多,但是做菜的时候,还是菜刀更合适。在智能处理方面,“寒武纪”就是这把更合适的菜刀。

“电脑语”指令直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。模拟实验表明,采用寒武纪指令集的深度学习处理器相对于x86指令集的中央处理器有两个数量级的性能提升。

如今,通过在计算机中模拟神经元和突触的计算,寒武纪的AI芯片对信息进行智能处理,借助专门设计的存储结构和指令集,每秒可以处理160亿个神经元和超过2万亿个突触,功耗却只有原来的十分之一,未来甚至有希望把类似阿尔法狗的系统装进手机。

埋头“重工业”

芯片是信息产业的“尖刀连”,更是“重工业”,其所需要的投入是巨大的,远远超过AI的其他领域。

2017年8月,寒武纪科技获得了价值1亿美元的A轮融资,该轮投资由国投创业领投,阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点、涌铧投资联合投资。

这家背靠中科院计算所的创业公司刚亮相,就进入市场,就踏入了“独角兽”领域。

华为的旗舰手机Mate10采用了寒武纪1A处理器,这是寒武纪AI产业化的第一步。这款2016年发布的全球首款商用深度学习专用处理器IP,入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。

它不仅具有完全自主知识产权,而且在计算机视觉、语音识别、自然语言处理等关键人工智能任务上具备出类拔萃的通用性和效能比,达到了传统的四核通用CPU25倍以上的性能和50倍以上的能效。

“我们的产品寒武纪1A处理器,可以跟苹果产品一较高下,结果我们很轻松打赢了这场战斗。我们并不是靠着蛮力去堆运算器,而是依靠最先进的、稀疏化的技术,四两拨千斤,让华为Mate10的智能处理速度打败了强大的苹果iphoneX。”陈天石说。

在将AI普惠化这一终极方向的指引下,他制定了自己的小目标。“我们现在与国外同行都是在同一个起跑线上的,希望寒武纪能在3年后占据中国高性能智能芯片市场30%的份额;在3年后,让全球有10亿台设备集成寒武纪处理器的智能终端。”

他给出了实现的路径。关于寒武纪芯片的市场商业化推进,“一是终端,二是云端。终端产品就是智能手机、智能眼镜、无人机、自动驾驶汽车等,需要芯片去识别图像、影音和文字。而在云端,像科大讯飞、中科曙光等这样知名的云端客户,都已经是寒武纪的客户。”

为了这个小目标,他说自己“除了休息的时间,都在工作”,拼了命地往前跑。在智能整个行业里面最上面是应用层,利用人脸识别、语义理解等,去系统集成自动驾驶、智能手机等产品。而“冰山”看不见的地方是技术层。

而芯片是技术层的“地基”。“芯片就是像建房子或者修路这样的事,如果没有房子没有路事情没办法往后走,希望我们未来能够继续承担好智能时代的基础设施提供商的角色”。陈天石说。

技术一定会带来人与人之间的鸿沟,而降低技术的门槛、创造尽可能的公平是消除这一鸿沟的几乎唯一可行的途径。

“从个人角度出发,我们主要从事人工智能加速芯片的研发,可以让开发者获得更加廉价、高效的芯片,支持上层应用的开发。”陈天石说,只有整个计算系统更加廉价,才有希望推动人工智能的普惠化。因此在底层,降低功耗、提高效率是关键。

至于上层应用,群众的智慧是无穷的。陈天石很乐观,他抱着乐见其成的态度来支持人工智能的发展,相信会在基础层之上,长出更多的应用。

保留“火种”

2017年底,一篇名为《芯片战国时代》的稿件在AI界很火,文章里说,“据CBInsights估算,进入新兴芯片初创公司投资总额从2015年的8亿美元增长到了2017年的16亿美元;创投库里,AI芯片公司从零星几家增长到20多家。光2017年下半年,台积电的生产线上就有超过30款AI芯片排队等着流片。”

时也势也。能不能到达终点,不仅取决于你奔跑的速度,更取决于你所在的赛道。

你以为只有初创公司在跑,实际上巨人们觉醒得比谁都快。就在前两天,芯片巨头英伟达在美国消费电子展召开发布会,宣布了一系列关于无人车机器学习芯片Xavier的相关内容。鉴于在AI芯片领域的表现,其股票2017年上涨接近100%,堪称“年度最佳理财产品”。

更别说英特尔、谷歌、Facebook、微软等巨头也在为此倾尽全力。咨询公司Tractica的预测数据显示,到2025年,与人工智能相关的深度学习芯片组市场收入,将由此前的5亿美元飙升至122亿美元的规模,复合年均增长率超过40%。

生死搏杀,千亿市场在一战胜负。

“芯片的成败,除了本身的效率之外,生态是非常关键的环节。没有配套的应用和软件,很难在市场上获得成功”。陈天石说,只要国产AI指令集立住了,中国主导世界AI产业的机会可能就到来了。

在寒武纪科技的第一场发布会上,他用了很长的时间去介绍自己的合作伙伴。他说,过去我们国内企业起步晚,一直是国际生态的跟随者。我们融入这个生态,享受这个红利,但我们并不能有多大的力量去改变这个生态。但是在智能时代,大家都在同样的起跑线上,要敢为天下先,敢于提出并共同构建全新的智能生态。“光有寒武纪是不够的,我们大家需要共同在硬件的指令集和软件的开发平台上下功夫,在端云结合上下功夫,在商业协作上下功夫”。

2017年10月16日,陈天石发了一条朋友圈,“一事平生无齮,但开风气不为师”。这句出自龚自珍的诗词,后来被很多教育界名士所引用。

事后他回想,这大概是因为他的执拗。18年前,陈天石考入中国科技大学,随后师从陈国良院士和姚新教授,读人工智能方向的博士。将近20年,他只做这一件事,把最底层的生态基石也就是芯片要做好。“技术一定要是最好的”。

过去是。现在是。将来无论公司走到哪一步,技术永远被摆在第一位。