发布7纳米芯片,寒武纪为何低调?

来源:《中国电子报》2021年01月29日

1月21日,寒武纪在官网披露7纳米AI训练芯片思元 290 智能芯片及加速卡、玄思1000智能加速器的相关信息,并表示该系列产品于去年已经实现规模化出货。该披露信息中有几个关键词:“7nm”“量产”“AI训练芯片”。这不禁令人们感叹,寒武纪太低调了,其他AI芯片大厂发布一颗7nm芯片,往往要开各种发布会来告知全世界,而寒武纪只是在官网披露一下,没有任何其他动作。

异常低调的发布

《中国电子报》记者在寒武纪创始人陈天石的微信朋友圈,看到了一条只有9个字的信息“思元290正式亮相”,转发的是寒武纪公司公众号内容,非常低调。但这并不影响资本市场的敏感嗅觉,当天寒武纪的股价上涨了17.73%,收报170元。随着寒武纪的训练产品线集中亮相,寒武纪从训练芯片到云、边、端等业务布局已经清晰呈现。

思元290芯片以及这些加速卡为何物?在AI芯片市场处于什么样的地位?对于寒武纪与业界有什么突破价值?

人工智能芯片有很多种分类方法。按功能分类,分为训练芯片和推理芯片。按应用场景分类,分为云端和终端芯片。按照技术架构分类,分为冯·诺依曼架构和非冯架构芯片,例如类脑芯片等。这次寒武纪推出的思元290智能芯片是其首颗训练芯片。为什么要做AI训练芯片?AI训练芯片市场有多大?其红利有多“红”?实际上,看看英伟达公司股价这些年在市场上的“一骑绝尘”,便能够理解。

随着AI算法突飞猛进的发展,越来越多的模型训练需要巨量的算力支撑,才能快速有效实施,可以说,算力是人工智能应用取得突破的决定因素。目前,英伟达在全球云端训练芯片市场一家独大,其GPU+CUDA计算平台被认为是最成熟的AI训练方案。此外,还有第三方异构计算平台OpenCL+AMD GPU以及云计算服务商自研加速芯片这两种方案。可见,全球各路芯片厂商基于不同方案,都推出了针对云端训练的人工智能芯片。

从介绍来看,寒武纪推出的首颗训练芯片思元290,采用台积电7nm制程工艺,集成460亿个晶体管,支持MLUv02扩展架构,全面支持AI训练、推理或混合型人工智能计算加速任务。相比此前寒武纪推出的思元270芯片,思元290芯片可实现峰值算力提升4倍、内存带宽提高12倍、芯片间通信带宽提高19倍,可提供更优性能功耗比,以及多MLU系统的扩展能力。

产品具有标志性意义

思元290芯片有三大关键亮点。

其一,是寒武纪采用7nm工艺制程。目前能够提供7nm制程芯片的设计企业,除了海思、英伟达等,寒武纪是少数进入这个阵营的企业。赛迪顾问集成电路产业研究中心分析师李秧认为,其工艺水平能够实现7nm制程,无论是在中国还是在全球,都是比较领先的,在技术上是具有标志性意义的。

思元290问世,网友“无关风月”在相关新闻下评论称:“寒武纪真是低调,发7nm制程的芯片,居然显得如此的平静。目前英伟达的RTX 30系也才用到7nm制程工艺。”工艺越高意味着复杂度也越高,能集成的晶体管数也越多,这次思元290晶体管数超过了460亿个。

网友“无关风月”提及的英伟达RTX 30系列,是去年9月由英伟达创始人兼CEO黄仁勋发布的,RTX 30基于8nm工艺由三星代工,黄仁勋认为RTX架构是英伟达有史以来提升最大的产品迭代。

其二,是寒武纪的多芯互联技术MLU-Link。目前,随着算法模型的复杂度不断增加,为了构建更强大的计算平台,需要多芯片之间进行互联,对算力和训练的速度提出了更高的要求。而寒武纪最新推出的多芯互联技术,首次用在了思元290芯片上。有了这个技术,多卡矩阵就可以很轻松地链接起来。业内人士认为,每颗思元290的多芯互联总带宽能达到600GB/s,这个数据与世界上最快的带宽速度相当。同时称,寒武纪的MLU-Link多芯互联技术应用起来很方便,尤其是对于算力中心而言,既高效又简洁。据介绍,寒武纪首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超过4100万亿次每秒(4.1PetaOPS INT4),一台玄思1000计算单元就足以替代一个小型传统超级计算中心。

其三,是寒武纪对应用生态的支撑进一步提速。寒武纪称Neuware提供完善的开发工具包和社区支持,帮助用户在思元290芯片上进行方便、灵活的定制开发及部署工作。

软件平台和工具链是芯片公司构建生态的必备武器,英伟达之所以能够聚集起强大的AI生态,不仅仅是因为其芯片性能强大,与其软件平台和工具链的完善息息相关。某种意义上说,英伟达的“硬”实力得益于其“软”实力。

寒武纪称,其Neuware软件栈为思元 290 芯片提供完善的软件及应用生态,支持业界主流的TensorFlow和PyTorch等深度学习框架,用户不需要改变使用习惯,即可在思元290芯片上实现图形图像、语音、NLP、搜索推荐等多种应用的训练和推理。

寒武纪从终端IP场景开始,连续推出了寒武纪1A、寒武纪1H、寒武纪1M系列处理器,其后布局云端智能芯片及加速卡系列产品思元100和思元270,在2019年推出基于思元220芯片的边缘智能加速卡。由此建立起覆盖云边端、训练、推理的产品矩阵,并打造了平台级基础系统软件Cambricon Neuware。这次发布思元290之后,寒武纪的产品布局就实现了“训推一体、端云融合”。短短几年,寒武纪就成为了全面掌握通用型智能芯片及其基础系统软件研发和产品化核心技术的企业。

财报预测仍将持续亏损

此前,有机构希望邀请陈天石去大型会议做演讲,陈天石婉拒并表示,目前希望专注把产品和技术做好。或许,对于芯片公司而言,产品是面对市场的核心之剑,做好产品就是最好的宣传。

寒武纪财报显示,2020年上半年营收8720.34万元,同比下降11.01%,亏损2.02亿元,其中研发费用占营收比重为318.1%,同比增加182.69%。去年前三季度营收1.58亿元,同比上涨42.97%,亏损约3.095亿元,研发费用4.33亿元,同比上涨32.78%。财报称,公司预测第四季度仍将持续亏损,主要系公司目前仍属于大规模研发投入阶段。

现在是芯片企业最好的时代。埋头苦干,给出更优的产品,或许是芯片企业迎接这个时代最好的姿态。

Next Post

需求持续火爆 芯片将迎来涨价潮?

周一 2月 1 , 2021
来源:《中国电子报》2021年01月29日 市场需求日益旺盛,芯片产能紧张问题却迟迟得不到缓解,芯片 […]
登录 注册

热门文章