当前位置:文档之家› AI国芯破局,行业切入成长期

AI国芯破局,行业切入成长期

• 摩尔定律硬件升级周期长 • 深度神经网络无法得到有效
运算
传统 计算
传统计算与人工神经网络计算流程对比
逻辑判断
计算机执行指令
输出结果
处理器串行计算
人工
神经 网络
大量数 据训练
提取训练好的神经网 络模型运行其他数据
输出结果
需要大规模矩阵浮点运算
资料来源:申万宏源研究
传统结构已经不能满足AI计算的需求
资料来源:李宏毅(台湾)教材、申万宏源研究
GPU与CPU架构与计算目的对比
CPU
GPU
架构区别
70%晶体管用来构建Cache 还有一部分控制单元,负责
逻辑算数的部分并不多
整个就是一个庞大的计
算阵列(包括ALU和 shader填充)
非常依赖Cache 逻辑核心复杂
计算目的
适合串行计算
运算复杂度高
资料来源:微软官网、申万宏源研究
3
主要内容
1. AI策略回顾:Know-how时代、冲击层次 2. 国产AI芯片突破 3. 行业切入成长期
4
2.0 算力是核心需求、寒武纪全球领先
算力需求分为云与端,遍布整 个人工智能发展。云端需求以 训练及比对类推理为主(如识 算力 别),终端需求以执行类为主。
算力是AI基础需求云端终端来自本章将论述:8
2.4 GPU:适合训练端、高能耗限制应用
GPU与CPU架构区别对比
GPU(图形处理器)适用场合: 最早适用于图形加速和几何计 算,现在数学计算、电影特技、 图像渲染(包括安防图像)、
大量深度学习等。
性能佳:浮点运算、并行运算 的十倍性能。2006H2推出硬 件和开发工具,2011吴恩达将 其使用在谷歌大脑,12颗GPU 性能相当于2000颗CPU的深度 学习效果。
人工智能下的算力特征是矩阵/ 求导(以训练阶段举例):
• 通常使用梯度下沉法(二维情况 下为最小二乘法,偏导数为0, 多维情况下为梯度最低)
• 大量的浮点运算,需要计算单元 • 大规模矩阵计算,需要并行指令
传统的算力(CPU):
• 处理所有的指令与运算 • 以逻辑顺序为核心 • 计算单元比例约20%,处理分支
资料来源:申万宏源研究
7
2.3 主流异构计算出现三类芯片GPU、FPGA、ASIC
GPU:Graphics Processing Unit
• 本来是做图像计算(Graphics Processing Unit)
• 英伟达2006年引入CUDA(Compute Unified Device Architecture)推进GPU 处理图像以外计算
AI国芯破局,行业切入成长期
——2018人工智能行业投资策略
证券分析师: 刘高畅 A0230517100003 刘 洋 A0230513050006 刘 畅 A0230516090003 孙家旭 A0230517070008 :黄忠煌、郭雅绮 2017.11.22
13736115/30242/20171122 16:14
• 主要玩家:谷歌(TPU)、寒武纪
ISCA大会:ACM International Symposium on Computer Architecture
AI芯片主流异构计算发展沿革
2011年,Rajat Raina,Anand Madhavan 和 Andrew Ng 发表 《使用图形处理器的大规模深度 无监督学习》
• CPU不适应AI需求根本原因
• 三种AI芯片方案优劣比较,明确 ASIC为最佳方案
• 寒武纪与谷歌TPU,明确寒武纪 为目前最佳方案
• 讨论AI芯片市场发展趋势及未来 被超越可能原因
芯片
GPU
应用
FPGA
ASIC
其他
安防
手机
教育
医疗
其他
资料来源:申万宏源研究
5
2.1 AI计算需求与通用计算特征(CPU)不同
复杂指令集不适合并行计算
• 主流服务器芯片架构为X86 • X86指令集为复杂指令集,串
行处理
摩尔定律:当价格不变时,集 成电路上可容纳的元器件的数
目,约每隔18-24个月便会增
加一倍,性能也将提升一倍。 CPU性能有限:
• 浮点计算能力不到GPU一半 • 整点计算能力约为TPU1/40
应用计算需求超过摩尔定律:
不依赖Cache 逻辑核心简单
与跳转的判断能力强 • 大量缓存空间Cache,方便快速
提取数据
AI算法训练过程框架图
训练过程
人工神经网络
语音 人脸 车辆
人工
神经 网络
对应文字 人物标签 车型款式
资料来源:申万宏源研究
GPU架构和CPU架构对比
资料来源:李宏毅(台湾)教材、申万宏源研究
6
2.2 人工智能计算需求超过CPU摩尔定律发展
• 主要玩家:Nvidia/AMD(收购ATI)
FPGA:Field-Programmable Gate Array
• 专用集成电路(ASIC)领域中的一种半 定制电路而出现的
• 主要玩家:Xilinx、微软、英特尔
ASIC:Application Specific Integrated Circuit
主要内容
1. AI策略回顾:Know-how时代、冲击层次 2. 国产AI芯片突破 3. 行业切入成长期
2
1. 两次AI策略逐步验证,预期发酵考验产业成长
2016.11 2017.7
2018?
2017AI年度策略:人工智能处于Know-How时代。从目前 瓶颈、技术、发展阶段、未来机会来看,人工智能发展正处 于Know-How时代,即基础算法已成熟,行业应用型算法 及各类应用、商业模式快速丰富的时代。
微软2014年ISCA最佳论文《A Reconfigurable Fabric for Accelerating Large-Scale Datacenter Services》
中科院计算所陈云霁、陈天石研究 员课题组的《一种神经网络指令集 》,更是ISCA2016最高得分论文
资料来源:申万宏源研究
2017H2AI策略:算力、算法、数据技术三要素决定冲击层 次。 一线为安防、工业,特征为收入、利润将快速兑现。二 线为教育、医疗。特征为技术确定性高、空间较大、具有规 模化优势而进展较慢。三线为金融、与智能驾驶,特征为目 前技术未证明绝对可行,产业处于快速尝试期。
2018:预期逐步发酵,人工智能板块标杆科大讯飞全年上 涨148%(截至2017.11.20)。产业面临成长考验:细分行 业商业化/国内企业是否受益?
相关主题