A股疯了,当“寒武纪”遇上“麒麟芯”

高尚

2017-09-07 06:55:42 


作者系私募操盘手,深度原创投资机会挖掘作者,TMT发烧友


华为“麒麟970”芯片在这个9月跃上了风口浪尖。


“全球首款人工智能芯片”的锃亮标签之下,A股正在演绎着极为亢奋的“芯片行情”。


股市掘金固然重要,但知其然还须知其所以然。


关于促动出这波连日大阳的“麒麟970”,以及其所属的行业竞争格局,笔者试着以自己的视角进行了剖析,并成文如下。


“麒麟970”是为何物?


刚刚结束的德国柏林消费电子展上,华为正式发布搭载10nm工艺制程的年度旗舰处理器“麒麟970”。


华为消费者事业部CEO余承东如是说:这一带有强大AI计算力的手机端移动计算平台,是业界首颗带有独立NPU(神经网络处理器)专用硬件处理单元的手机芯片。

 

然而,严格来说,“麒麟970”并非严格意义的AI芯片,而是一块SoC(System-on-chip)芯片。


所谓的SoC,即芯片上集成了若干不同的功能模块;其中的任一模块,通常都是上游的技术提供商通过IP(intellectual property,知识产权)提供授权。


根据分工不同,很多专用功能的处理单元被集成至SoC之上。


其中,我们最熟悉的是GPU;此外还包括ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等。


而余承东所称的NPU,即为一个擅长神经网络计算的功能单元。


NPU的集成,虽不足以使其称之为严格意义上的AI芯片,但足以意味着智能手机正式进入人工智能时代。


此外,就“麒麟970”具体而言,其采用ARM Cortex-A73四核+Cortex-A53四核的架构,以及台积电10nm制造工艺;同时搭载12核高效GPU、8核高性能CPU,4.5G高速LTE Modem,最高下载速度可以达到1.2Gbps,与高通目前发布的最强的X20 LTE基带实力相当。


特别值得一提的是,麒麟970的GPU,用上了ARM最新推出的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。


这个架构厉害支出在于,其比上一代的Mali-G71性能提高了40%,能效提高了25%。


“寒武纪”遇上“麒麟芯”


“麒麟970"所集成的NPU,正是来自当红炸子鸡——“寒武纪”IP。


寒武纪IP,主要用于深度神经网络(DNN)中的复杂计算,涉及语言识别、图像(人脸)识别以及深度学习等AI应用。


“寒武纪1A”深度神经元网络处理器,是“麒麟970"所集成的“寒武纪”IP的原型。


“寒武纪1A”特别设计了专门的存储结构,以及完全不同于通用处理器的指令集,得以每秒处理160亿个神经元和超过2万亿个突触,而功耗只有原来的1/10。


关于“寒武纪”,当前已是名声鹊起。


其研发公司寒武纪科技,系由中国科学院计算技术研究所)陈云霁、陈天石两兄弟携手创立。


今年8月18日,该公司对外宣布完成1亿美元A轮融资。


其投资方阵容颇为强大,包括国投创业,阿里巴巴创投、联想创投、国科投资、中科图灵、科大讯飞(天使轮)、元禾原点(天使轮)、涌铧投资(天使轮)等。


众星捧月之下,寒武纪科技亦被称为全球AI芯片领域第一个独角兽初创公司。


此番寒武纪IP集成至华为的麒麟芯上,不仅意味全球首款AI手机芯片的问世,更意味着以“深度神经网络”为主要核心的人工智能应用正是开启了普及应用之路。

 

一如华为官方海报所言,“AI不止是语音助手”——这预示华为新一代自研的处理器将摆脱束缚,实现更多人机交互的可能性。


 

图为寒武期板卡



图为寒武纪芯片


 

科技巨头“抢占赛道”白热化

 

放眼全球,当前的科技巨头,对于智能芯片追逐和布局已经到了白热化的地步:

 

1. 人工智能显卡芯片总龙头英伟达股价2年8倍,继续领涨美国科技股;

 

2、2016年7月20日,软银宣布将以243亿英镑(约合320亿美元),43%的溢价收购移动端芯片总龙头ARM,英国芯片设计公司ARM;

 

3、2016年9月,英特尔收购视觉芯片公司Movidius;


4、2017年3月,英特尔宣布以153亿美元收购以色列无人驾驶Mobileye;

 

5. 谷歌自主研发人工智能数据中心芯片TPU,搭载AlphaGo应用,横扫人类围棋界

 

以在英特尔芯片垄断PC时代,以及ARM芯片称霸移动互联网时代的历史进可鉴中,芯片永远都是产业链最上游的存在,是行业先导指标。


核心芯片往往决定一个计算时代的基础架构!


当今,谷歌、微软、IBM、Facebook、英伟达等IT巨头之所以纷纷投巨资加速人工智能核心芯片的研发,都是意图从源头上掌控核心芯片架构,取得人工智能计算时代的主导权。


未来3-5年,随着人工智能定制芯片的突破,所有行业都将实现人工智能化。届时,智能化市场之规模和容量将数十倍于现今的移动互联网市场。

 

新的计算时代来临之时,往往是新兴企业弯道超车的绝佳机遇,目前使用的GPU、FPGA均非人工智能定制芯片,天然存在局限性,人工智能专用芯片对于IT巨头和初创企业是同一起跑线的蓝海。

 

目前以深度学习为代表的人工智能新计算需求,主要采用 GPU、FPGA,AISC定制化芯片等已有适合并行计算的通用芯片来实现加速。

 

三种主流人工智能芯片方向:GPU, FPGA,AISC定制

 

GPU:以英伟达为主导的GPU芯片。


作为图像处理器,设计初衷是为了应对图像处理中需要大规模并行计算。


因此,其在应用于深度学习算法时,存在应用过程中无法充分发挥并行计算优势,硬件结构固定不具备可编程性,运行深度学习算法能效远低于 FPGA。

 

FPGA:即现场可编辑门阵列,是一种新型的可编程逻辑器件。


其设计初衷是为了实现半定制芯片的功能,即硬件结构可根据需要实时配臵灵活改变。


目前的FPGA 市场由 Xilinx 和 Altera 主导,两者共同占有 85%的市场份额。


其中Altera 在 2015 年被 intel 以 167 亿美元收购(此交易为 intel 有史以来涉及金额最大的一次收购案例)。


另一家Xilinx 则选择与 IBM 进行深度合作,背后都体现了 FPGA 在人工智能时代的重要地位。

 

对于机器学习算法的性能和功耗的角度来说:FPGA 可以开发出为机器学习算法专用的架构,但是 FPGA 本身的峰值性能较 GPU 要差很多。

  

FPGA 实现的机器学习加速器,在架构上可以根据特定应用优化所以比 GPU 有优势;但是 GPU 的运行速度(>1GHz) 相比 FPGA 有优势 (~200MHz)。


所以,对于平均性能,看的就是 FPGA 加速器架构上的优势是否能弥补运行速度上的劣势。

 

AISC定制:ASIC是指依产品需求不同而定制化的特殊规格集成电路,由特定使用者要求和特定电子系统的需要而设计、制造。


以谷歌TPU为代表的AISC定制化芯片(包括4个芯片能够提供180TFLOPs浮点运算的计算能力)就是一种最大化性能需求和成本能耗平衡的重要手段。

 

打个形象的比方,我们设计一款人工智能芯片就像设计一个某种功能的房子,那么我们有三种选择:

 

1、买一个已有的比较通用的房子,然后改变内部的软件设施来让这个房子达到我们需要的功能。


优点是对于用户代价小,但肯定没法达到性能最大化,这就对应了通用型GPU芯片。

 

2、买一个半成品的房子,我们可以随时改变房子里面的各个房间格局。


优点是相对第一种房子性能肯定会更贴近我们需求,而且也保证了一定灵活性,如果需求有改变,可以随时再改变内部房间格局。


这对应着FPGA芯片。

 

3、完全一块砖一块砖按自己需求重新搭建一个房子。


这种肯定性能上最能贴近我们的需求,但是一次性投入太大,如果不是确定性需求需要冒风险,这就对应着ASIC芯片。

 

所以,我们不难理解为什么大部分创业公司,都会采用英伟达GPU这类生态成熟的通用芯片;为什么在人工智能算法没有最终成熟需要不断改进时,FPGA会出现在一些应用领域;而谷歌这类财大气粗自己需求量很大的公司自己用ASIC的TPU。

 

终端应用的两种智能芯片应用模式:

 

一种是通用GPU处理器采用较为通用的处理器。


如movidius、英伟达的Jetson系列芯片。


有点事通用性较好,能够运行各类神经网络算法;但价格相对较高,主要针对高端市场。


这类芯片的代表就是刚刚被intel收购的Movidius公司,它们推出 Myriad 系列VPU(视觉处理器)平台可以用于3D感知及扫描建模的芯片,可以支持室内导航、360度全景视频处理等机器视觉应用。

 

第二种是以华为麒麟970为标志的SoC芯片。


这种芯片将已经训练好的较为通用的智能识别类算法直接固化为IP,嵌入到SOC芯片中。


优点是因为是专用芯片(ASIC),量产后功耗、价格等都极具优势,但功能拓展性有限。


例如在安防领域,商汤科技的SenseEmbed将深度学习人脸识别算法通过高性能计算极致优化,搭建底层算法最优解决方案,利用商汤科技自主研发的PPL、FastCV高性能异构并行计算组件库,能将复杂的深度学习算法集成在一张小小的芯片中,进行毫秒级识别速度。


目前已支持海思Hi3519/Hi3516A/Hi3516D、飞思卡尔IMX6、ARMCortexA7等多款主流嵌入式芯片,将为硬件设备提供最优深度学习算法引擎。

 

投资机会有哪些?


重点关注:建议分别从硬件和应用两方面关注具备行业先导指标的意义的公司,人工智能产业发展初期率先启动、弹性最大的行业。


下图为具体的产业标的一览。





评论

发表

回复“

最新评论

这里空空如也,期待你的发声

回顶部

分享

收藏