欢迎光临KOTOO财情




即将搭载人工智能芯片的华为 Mate 10,究竟会为业界带来什么?

2024-04-16 215

随着华为旗舰机型 Mate 10 即将发表,科技媒体纷纷爆料,华为 Mate 10 将首次在智能手机历史上,搭载一颗人工智能芯片。其实早在华为半年业绩发表会上,华为余承东就透露,预计将在今年秋季推出人工智能芯片,而根据目前最新的消息,这颗人工智能芯片极有可能就是搭载在麒麟 970 之中的寒武纪芯片。

当然,目前 Mate 10 的最终规格还没发表,得期待 10 月 16 日的慕尼黑发表会,上述消息仅是我们的合理猜测。如果属实,意味着 Mate 10 将成为全球首款具备人工智能芯片机型,这将为业界带来怎样的冲击?毕竟智能手机自乔布斯后,再无革命性进步。

这无疑是一个有趣又重要的问题,本文接下来将看看寒武纪芯片的前世今生,实际上这颗芯片更精确地说,是一款深度网络加速芯片,本身并无梦幻的 AI 技能,而加速功能,究竟能在何种场景带来逆天的变化?

寒武纪芯片是何方神圣?

根据目前最新消息,麒麟 970 极有可能透过 IP 授权方式搭载寒武纪人工智能芯片,这里先解释一下 IP 授权概念。目前无论高通骁龙还海思麒麟,都不是严格意义的纯 CPU 芯片,而是一块 SoC(System-on-chip)芯片。所谓 SoC 即芯片上集成若干不同的功能模组。以高通骁龙 801 为例,801 除了四核 Krait 400 CPU 外,还集成 Adreno 330 GPU、Snapdragon Camera 相机图像讯号处理器、蓝牙、GPS、Wi-Fi 及影音编码等模组,上面每个模组通常都是 SoC 厂商上游技术提供商,透过 IP(intellectual property,知识产权)提供授权,当然这样做的好处是技术提供商可专注于 IP 方案设计,芯片封装工作可交由高通等 SoC 商负责,这样双方扬长避短,共同加速芯片的上市及更新速度。

麒麟 970 搭载的寒武纪 IP,主要用于深度神经网络(DNN)的复杂计算,而深度神经网络正是目前人工智能技术的半壁江山,这样一来麒麟 970 将成为全球首款具备人工智能处理能力的 SoC 芯片。当然目前寒武纪这家公司对大众来说还十分陌生,这里先简单介绍寒武纪。

寒武纪科技(Cambricon)是中国中科院计算所孵化的一家独角兽公司,2016 年推出的寒武纪 1A 处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,针对智能手机、安全监控、可穿戴装置、无人机和智慧驾驶等各类装置,最近获得包括阿里巴巴在内的 1 亿美元 A 轮融资。这家成立于 2016 年的 AI 芯片公司以火箭般的速度发展,据寒武纪称,2016 年已实现了盈利并获得 1 亿元人民币量级的营收。而华为与寒武纪的合作,很可能是因为华为与中国中科院计算所长久以来的合作关系,早在 2011 年,华为就与中科院计算所成立了“中科院计算所-华为联合实验室”。

当然打铁还得自身硬,寒武纪科技创始人陈天石教授是人工智能硬件加速的早期倡导者,连 Google 在万众瞩目的人工智能芯片 TPU 论文,全文共引用寒武纪团队成员发表的 6 篇论文。在全球人工智能公司中,能享受 Google 如此待遇恐怕实属凤毛麟角。

对华为而言,产品中具备一个中国完全自主知识产权的人工智能芯片 IP,或许更是一项行销利器。

AI 芯片将为手机带来何种计算能力?

大家还记得去年火爆的俄罗斯修图应用软件 Prisma 吗?

Prisma 使用深度神经网络来获取著名绘画大师和主要流派的艺术风格,然后对用户的照片进行智慧风格转化,一张普通的照片透过 Prisma 能变成有令人惊叹艺术效果的作品,下面是一组范例:

从技术原理,Prisma 使用 GAN 对抗生成网络,是一款典型利用深度网络的人工智能应用软件。但用过 Prisma 的人都知道,其实际体验并不是非常好。用户首先要上传待修的图片到 Prisma 服务器,经过一段时间才能下载修好的作品。但随着 Prisma 火红,用户等待时间越来越长,中国用户更要忍受连接到俄罗斯服务器的爆高网络延迟。尽管后来 Prisma 实现了本地计算,但速度仍旧缓慢,部分风格滤镜需要计算 10 秒以上才能完成转换,当然相比之前只能依赖云端计算,体验已有所进步,但与美图等主流修图应用软件的速度仍无法相比。

Prisma 这些体验的不完美,主要原因是深度神经网络的执行需要大量计算。一般而言,建立一款如 Prisma 的人工智能应用软件,需要透过训练(training)和推断(inference)两个过程:训练是透过大量资料输入,或采取增强学习等非监督学习方法,训练出一个神经网络模型,如对 Prisma 来说,训练过程中神经网络学习大量的绘画风格。一旦训练完成,即可使用训练确定的权值计算,如 Prisma 中透过训练好的网络改变图像风格,这个应用的过程称为推断(inference)。

由于深度神经网络本身的特征,在推断过程往往需要大量权重计算,这在服务器端通常没什么问题,但一旦放在手机等装置就有点捉襟见肘了。如 Prisma 的手机本地端计算,虽然透过大量最佳化显著降低模型的复杂度(当然这样做的后果就是效果变差了),但对手机 CPU 来说负荷仍然很大。

这样一来问题就显现了,如果要让手机掌握更多人工智能应用软件,需要让手机具备强大的计算能力做 inference,否则用户体验难以保障。但摩尔定律毕竟放在哪,CPU 本身目前难以具备如此的计算能力,这就是深度神经网络在手机等各种嵌入式装置上的应用难题。

这时候,深度网络加速芯片应运而生了。

深度网络加速芯片是怎么一回事?在深度神经网络的应用过程中,人们发现实际上复杂的神经网络架构计算量通常都集中在少量计算类型,比如矩阵运算。如果设计一款专门最佳化的硬件芯片从事这些繁重的计算,正如当年 CPU 对复杂的图像运算力不从心,催生了 GPU 出现,岂不就可解决问题了?

业界确实这样做了,如 Google 自家推出的深度网络加速芯片 TPU,定义了十几个专门为神经网络推理而设计的高级指令,比如矩阵运算、计算激活函数、读取/写入内存等,相比用 CPU 进行相同计算,TPU 的功耗效率(performance / Watt, 每耗电 1 瓦的性能)比 CPU 高出 80 倍,下图列出的是 Google TPU 部分核心的高级指令。

这时候,大家是不是想起了比特币挖矿机的 ASIC(专用集成电路)呢?没错,深度网络加速芯片也是一款 ASIC,只不过比特币的 ASIC 只能进行 Hash 运算,深度网络加速芯片则定位于承载若干种深度网络的常用计算。

华为 Mate 10 即将搭配的寒武纪芯片,也正是这样的一款深度网络加速芯片。由于目前寒武纪芯片尚未正式公布,真实性能情况无从知晓,但从寒武纪科技去年在电脑架构顶级会议 ISCA 发表的论文《Cambricon: An Instruction Set Architecture for Neural Networks》中,我们就能管中窥豹。论文提及寒武纪(Cambricon)是一款面向目前神经网络技术,集结了常量运算、向量运算、矩阵运算、逻辑运算、数据转换以及控制指令等功能的深度神经网络加速芯片架构(……we propose a novel domain-specific Instruction Set Architecture (ISA) for NN accelerators, called Cambricon, which is a load-store architecture that integrates scalar, vector, matrix, logical, data transfer, and control instructions, based on a comprehensive analysis of existing NN techniques.),主要定位是解决深度神经网络中推断(inference)涉及的复杂计算问题。

到此为止,华为 Mate 10 的麒麟 970 芯片,搭载的人工智能模组就相当清晰了:与其说它是一块人工智能芯片,更准确地说是一块深度网络加速芯片,主要用于加速人工智能深度神经网络带来的复杂计算。

若真如此,华为粉丝的热切期待恐怕会失望了,麒麟 970 本身不会带来任何梦幻的智慧,而是赋予手机处理深度神经网络前所未有的计算能力,让如 Prisma 等需要跑在深度神经网络的应用能有革命性的体验。

智能手机迈向智能手机:场景为王

麒麟 970 的深度网络加速模组,如果要为业界带来冲击,首先是让大家深入思考,在手机等行动装置中加入深度网络硬件加速,是否是未来趋势?消费者是否愿意买单?当然这问题很浅显,核心在于能否为消费者带来有价值的应用场景。

深度神经网络是人工智能目前半壁江山,在智慧语音、电脑视觉有广泛的应用。前者典型的应用如 Siri 等智慧语音助手,以及基于此、目前红得不能再红的智慧喇叭;后者在消费端莫过于各种类似 Prisma 的修图应用软件。

透过深度神经网络,能实现图像编辑智慧化。比如以往需要大量用户手工操作的瘦脸、美颜、瘦腰、拉长腿,透过深度神经网络加持,用户可如使用 Prisma 一般,智慧化搞定全部。当然图像智慧编辑是目前电脑视觉的热门应用,期待未来还有更多梦幻的应用出现。

对于很有可能搭载寒武纪的 Mate 10,这里大胆猜测一句,广告语会是“智慧摄影大师”吗?

图像辨识是另外一个应用点,比如,用户在手机中标记一张人脸后(比如同事 A),透过图像辨识,手机能把图库中所有含同事 A 的照片都筛选出来,这个运算在当前的智能手机会非常慢,但有了深度网络加速芯片后,就变得有可能。

语音辨识是深度网络的另外一个核心应用,目前我们都知道,Siri、出门问问等语音助手都需要在联网状态才能使用,原因是语音辨识的 inference 放在云端处理。同样透过深度网络加速芯片,或许能实现手机端的辨识,即在无网络情况下,依然能使用智慧语音助手实现有限度的应用,比如让助手找出通讯录中符合条件的某个人。

当然,站在市场行销层面,有很多实际上并不需要深度网络加速芯片加速的应用,都可以透过混淆概念的方式纳入消费者的想像中,比如拿起手机屏幕就亮、在漆黑的环境自动打开手电筒等。

然而客观地说,目前智能手机需要用到深度网络加速芯片加速的应用,并不算很多。其中真正算是有效需求的更寥寥无几。在安防镜头、无人机、自动驾驶汽车融合人工智能专用芯片,无疑是未来的清晰趋势,毕竟如无人驾驶汽车,我们不能指望使用云端方式做 inference,毕竟网络一旦出现问题,难道放任汽车去撞树?但智能手机这个充分竞争的领域,任何功能的革新都需要经过市场长期考验,关键还是在于场景。

这次极有可能搭载深度网络加速芯片的 Mate 10,将会带来什么尚未想到的场景?或许这点,才是我们真正需要热切期待的。

(本文由 雷锋网 授权转载;首图来源:Flickr/Kārlis Dambrāns CC BY 2.0)

2019-03-18 01:31:00

标签:   资讯头条 kotoo科技资讯 kotoo科技 kotoo科技资讯头条 科技资讯头条 KOTOO商业产经 新闻网 科技新闻网 科技新闻 Kotoo科技新闻网 Kotoo Kotoo科技新闻网 科技新闻 新闻网 KOTOO商业产经 科技资讯头条 kotoo科技资讯头条 kotoo科技 kotoo科技资讯 资讯头条 Kotoo Kotoo科技新闻网 科技新闻网 新闻网 KOTOO商业产经 科技资讯头条 kotoo科技资讯头条 kotoo科技 kotoo科技资讯 资讯头条
0