Maxshall

  • 412 主题
  • 486 帖子
  • 126 积分
  • 身份:LV1 技术小白
  • E币:110

解密苹果A11芯片,技术“无间道”与终端 AI 初战打响

2017-9-13 06:54:28 显示全部楼层
美国当地时间 9 月 12 日上午 10 点,2017 年秋季苹果新品发布会如期举行。会上苹果发布了本年度最重量级的产品——iPhone X (iPhone 10)。iPhone X 无疑是整场发布会唯一的主角,而iPhone X 的众多炫目功能都离不开其“心脏” :一颗全新 A11 Boinic 处理器!
  
苹果中文官网将 A11 Boinic 译成 A11仿生。
  虽然苹果并不是第一次使用 10nm 制程工艺来制造芯片,但 A11 与上一代、同样使用 10nm 工艺的 A10X 处理器相比,通过不同的内核架构,使得性能提高的同时,还降低能耗。
  A11总共有 6 个内核,分为 2 个 Monsoon 高性能核心,以及用来支援高性能核心、用于低强度运算的 4 个 Mistral 低功耗核心。而上一代的 A10X 的内核则是采用 3 个 Hurricane 高性能核心加 3 个 Zephyr 低功耗核心的结构。
  鉴于目前的 iPhone 7 其实已经是一部速度很快的手机,iPhone X 在处理器上的升级能够大幅度的提升支持高屏占比的 OLED 屏幕、无线充电、以及人脸识别Face ID等全新功能之用。
  我们来详细说说这次搭载在全新 iPhone X 上的这颗 A11 芯片,苹果未来数年的发展战略与这颗芯片有着密不可分的关系。
  iPhone 7 上搭载的 A10 Fusion 芯片已经足够让这部手机拥有畅快淋漓的用户体验了。理论上说在处理目前的相关应用时,其计算能力已经游刃有余。苹果将 A10 升级到 A11,四核变六核,多出的计算能力会用在哪里?
  从产品层面看,新款iPhone已经具备人脸识别、无线充电、全屏幕、双摄像头等功能,这些新功能的加入势必会消耗掉一部分计算力。从战略布局上看,A11 芯片完全有可能成为苹果公司用来实现人工智能(如CoreML)、增强现实(如ARKit)技术的重要硬件平台。
  所以,A11 芯片对苹果来说无疑将是一个战略布局点,值得浓墨重彩来分析。
  A11 Boinic( A11仿生)苹果官网资料:

  
   图片.png1005x180 21.9 KB


  

  • A11 Boinic拥有一个每秒运算次数最高可达 6000 亿次的神经网络引擎。神经网络引擎有什么作用?A11 仿生中的神经网络引擎采用双核设计,能够识别人物、地点和物体。它的每秒运算次数最高可达 6000 亿次,能轻松胜任机器学习任务,并为面容 ID 和“动话表情”等创新的功能提供强大的动力。

  • A11 Boinic会在性能核心与能效核心之间合理分配任务,第二代性能控制器和量身定制的电池设计,使充满电后的电池续航时间比 iPhone 7 最多可延长两个小时。

  • A11 Boinic 能为游戏和 app 带来非同寻常的增强现实体验。

  • A11 Boinic 是 专为 Metal 2 和Core ML 设计的芯片。Metal 2 是 Apple 设计的图形处理软件,开发者可利用它开发主机风格的游戏。Core ML 则让开发者能够将机器学习技术整合到自己的 app 中。A11 Boinic的图形处理器已针对这些新颖的沉浸式 3D 游戏和增强现实体验进行了优化。

  
图丨AR软硬件深度整合
  苹果自有芯片技术的演变,与三星之间的“无间道”

  毫无疑问,iPhone 可以说是苹果带给人类的一种革命,其中衍生的应用方式更是彻底改变了人类的生活形态。但最初的 iPhone,里面整合的不是什么全新的技术,反而是现有市场上相当成熟的方案,只不过通过优秀的软件设计,让 iPhone 不论是在用户界面的呈现,以及应用程序的使用体验上,都有着远超过当初同代手机的表现。
  然而,随着苹果最大智能手机生态竞争对手 Android 软件优化能力逐渐改善,甚至有追上苹果的趋势。但是,苹果也开始一反过去使用现成方案的作法,开始发展自有硬件技术。从最早的智能手机核心、基本架构、Touch ID,到现在 AI 芯片,以及显示技术,其参与或自主研发的硬件也越来越多,而这些做法都是为了同一个目标:追求使用者体验的最优化。
  
  目前,苹果在其智能移动终端中采用的处理芯片已经发展到第十代。然而,苹果是从第五代才开始自主设计。
  那么,之前的方案都是来自何处?第一代 iPhone 使用的是德州仪器的 OMAP 处理器;而从 3G 版开始,就转而使用三星的应用处理器,最早是 S3C6410,3GS 版则进化为 S5PC100;iPhone4 则是使用 S5PC110 的小修改版;iPhone 4S 为 Exynos4210 小改款。
  除了第一款 iPhone 以外,早期的 iPhone 或其他苹果移动设备基本上都是直接使用三星芯片,一部份着眼于成本控制,另一部份也算是其阶段性的策略布局。由于苹果最初几代的 iPhone 出货规模仍有限,为确保获利,采用现成方案是比较合理的选择,另外,在芯片制造方面与三星合作,也是出于成本考量。
  
  实际上,三星与苹果的合作可说是“无间道”的关系。三星在应用处理器的开发经验相当丰富,早在智能手机发展初期,就在自有 Galaxy 系列品牌手机上大量使用自家设计生产的芯片。发展自有芯片对三星而言,除了可以提高对硬件设计的掌握度以外,也能帮助其自有半导体事业的技术发展,而这方面包含了设计和制造。
  三星除了半导体事业以外,手机一直是最大的营收来源之一。为了发展自己的手机事业,三星也毫不遮掩的去学习竞争对手比它更好的创意或技术思维。而苹果虽是三星的客户,但也同时是最大的竞争对手之一。所以,三星一方面帮助苹果降低成本,一方面却也同时凭借与苹果的合作,磨练自有的 IC 设计、制造能力,一方面也是“参考”苹果对手机以及芯片设计,好增进自家手机产品的竞争力。
  三星同时也是全球最大的内存与面板供应商之一,苹果虽与三星官司纠纷不断,但为确保关键组件供应来源,二者的合作却从未中断,毕竟对苹果而言,三星无可取代,但对三星而言,苹果并非绝对必要的客户。也正为此,即便官司的源头多半出自于三星对苹果产品的模仿、或致敬,苹果也从未把彻底中断与三星的合作当作第一选项。
  也正因为此,苹果和三星一直处于纠葛不断的情结中,但苹果也有自己的盘算,虽然暂时还无法和三星完全撇清关系,但不论是在材料和元件的供应,甚至芯片的代工制造上,不断降低对三星的依赖——这其实一直是过去苹果在核心技术掌握上的思维。
  自有芯片技术为极端优化用户体验,也为摆脱三星

  从 iPhone 4S 开始,苹果就把处理器以 A 作为代号,最早开始于 A4。而苹果虽然苹果参与了 A4 的部分设计,但基本上都是由三星完成。后续的 A5 则是在芯片上额外增加了一块 earSmart 的区域。虽然 A4 和 A5 都是在三星方案基础上进行的修改,但这二者可以说是苹果自主研发芯片的开端。
  虽然 A4 和 A5 都是基于三星的方案修改而来,但苹果花在平衡性能与功耗的功夫其实相当多,但三星轻易的把其和苹果的芯片设计合作成果转移到自家手机上,这让苹果相当不满,不仅因此发起了多次法律诉讼,也确立其未来在手机硬件的核心技术上要能做到高比重自主研发的方针。
  A5 可以说是苹果自研手机芯片的真正开端。此款芯片主要是增加加速语音辨识算法的功能区块,以及增加了更强大的内建 ISP (Image Signal Processor),其余皆是基于标准 ARM 架构。
  但是自 A6 之后,其使用的ARM架构核心就完全改为订制化设计,甚至在后续几款芯片的设计中采用手工布局(Manual Layout),而不是完全依靠 EDA(Electronic Design Automation)工具。这对于现代芯片设计而言是相当不可思议的作法,毕竟手工布局的作法旷日废时,会导致设计成本明显增加,但财大气粗的苹果为达到最好的芯片表现,优化终端使用体验,显然不在意这部分的额外支出。
  
图丨苹果A系列芯片从A6开始使用手工布局
  手工布局已经被证实是十分有效的作法。凭借手工布局,芯片发热部分得以分散,且对芯片的晶体管使用也获得了更好的控制,从而增进性能表现,降低功耗与发热。而从此以后,苹果的 A 系列芯片和三星的架构就走向了完全不同的方向。
  除核心芯片以外,苹果也积极布局手机内部的其他关键部件,比如说著名的 Touch ID 指纹识别元件的推出,最近则是针对 AI 应用领域开发芯片方案,以及在台湾龙潭设厂,研发 OLED 与 Micro LED 显示技术。
  而目前最受关注的,就是其与鸿海合作,参与购买东芝半导体部门的计划,作为确保半导体储存组件供应来源的重要布局。虽然抢亲失败,最终东芝还是卖给WD,但可看出为摆脱其最大关键零组件来源三星的制约,苹果积极进行各种尝试,不论是自行研发或者是并购。
  要理解 A11 芯片,就得先回头看 A10X

  实际上,苹果首颗 10nm 处理器并不是 A11,而是 A10X。A10X 作为新款 iPad Pro 的处理器,性能要求也非常高,除基于 10nm 工艺外,该芯片内建了 3 大 +3 小,共 6 个 CPU 核心,以及 12 个 GPU 核心,可说是苹果自主研发芯片以来最为庞大的架构规模。
  那么,我们要如何从 A10X 去分析 A11?首先,A10X 是针对平板电脑产品推出,规模或主频设定上可以比较激进,功耗预算也要高于手机产品。但 A11 是针对手机产品,主频或体积上就必须有所取舍。
  芯片设计,尤其是手机芯片设计,如果要走高主频,那么同时运行的核心数就必须受到控制。反之,亦可用较低的主频,但整合较多核心来达到性能的提升。A11处理器就是凭借提升主频从来增强性能。
  
图丨A11 Bionic 芯片性能参数
  由于工艺是相对稳定的因素,不论前期,或者后期的同样工艺,在性能表现上应该可以视为相同等级,差别的只会是良品率。以此前提,A11 所使用的 10nm 工艺理论上和 A10X 并无二致。
  苹果 A 系列处理芯片的发展大致上是随著制程的演进,逐步增加核心与主频设定,来达到性能的成长,A9X 比较特立独行,其与 A8X 的 3 核心设定相较之下,仅使用到两核心,但性能仍有相当大的提升,最主要就是核心架构的改善,以及主频的增加。
  A8X 仅 1.5GHz,而 A9X 则高达 2.26GHz。相较 A8X 使用特性较差的 20nm 工艺,A9X 的 16nm 工艺在性能与功耗控制表现上有著长足的进步,这也是 A9X 主频得以大幅增加的原因之一。相较之下,A10X 主频仅小幅增加到 2.36GHz,一方面是因为 10nm 对提升主频帮助有限,另一方面,是因为苹果增加了 A10X 的架构与核心规模。
  为了控制功耗,虽导入新架构,但因为 A10X 和 A11 使用的是同代的 10nm 工艺,为了增加主频,高性能核心数目就限制为两个,低功耗核心则是增加为四核,总共六个核心,高性能核心代号为 Monsoon,主频为 2.74GHz,单核计算性能较 A10 提升 1.2 倍。低功耗核心代号为 Mistral。另外,A11 所有的核心都可以独立寻址,前代 A10 则不行。
  
图丨A10X处理器
  另外,苹果从 A10 开始,便采用大小核的概念去均衡功耗和性能表现,大小核与一般纯粹大核架构的处理器,最主要的差别在于动态功耗的控制上,如果所有的计算工作都交给大核处理,那么就算 CPU 并没有满负荷工作,动态功耗还是会明显高于小核心。
  由于大小核心分别负担程度不同强度的计算工作,借此可以有效延长平均电池寿命,同时也能改善整体性能表现。这个设计也同样沿用下去,为顾及一般应用的性能表现,A11 低功耗核心增加到了四个,较 A10X 增加一个。
  A11 针对高主频优化,架构效率低于 A10X 水准

  苹果每年更新 CPU 架构的传统仍然不变,但 A10/A10X 中的 Fusion 架构其实已经是不计工本的堆料架构:6 指令发射架构、夸张的 192 个微指令区(Micro-ops)、配合庞大的三级 cache,任何思路正常的 IC 设计公司都不会这么做。
  事实上,目前主流的 Cortex-A73 架构,被使用在包括麒麟 960、970 等方案中,也不过是双发射指令宽度,还未有实际产品上市的 A75 也才增加到三发射。由于增加指令发射数目,必须要有其他包含汇流排、cache 等周边设计的配合,否则随便一个 CPU 核心来个十发射就天下无敌了,但问题远没有那么简单。
  
  也正因为如此,根据現有的测试数据,苹果从 A9 到 A10,主频提升了接近 12%,但 A10 到 A11 提升的幅度反而下降了5~10%左右。为拉高主频,苹果在新 Monsoon 核心的主频效率不进反退,A11 性能增长几乎都是来自主频的增加。
  可见即便是苹果,在核心规模以及效率改善方面也遭遇到瓶颈,未来 A12 如果要取得整体性能成长,增加高性能核心数量,并配合 7nm 工艺进一步提高主频,可能会是无可避免的做法。
  AI 布局比较:Google 注重云端,苹果发力终端

  其实,Google 早在数年前就开始调整开发资源,把过去集中在手机平台上的资源分散到更多应用上,而受益最多的就是 Google 的云端计算服务,之前 AlphaGO、TPU 技术都是在这个策略调整下的产物。
  既然 Google 把重点放在云端应用,手机端就不可能有太多机器学习能力。当然各家 Android 平台的方案供应商还是会提供各自不同的 AI 学习或逻辑处理能力,比如说像华为刚刚在 IFA 上所发表的麒麟 970,其整合的寒武纪芯片就是针对 AI 终端应用的处理架构。
  Google 策略方向如此,那么未来在手机平台上的 AI 应用,恐怕会变成 Google 自家的云端服务与各家的终端AI互相合作/竞争的局面,而竞争的成分恐怕会比合作要来得多。各家 AI 芯片方案设计者必须在基于开放的机器学习 SDK 下完成自己的应用框架,Google 则是推出直接连结自有云端 AI 服务的应用程序,合作厂商要做终端 AI 也没关系,Google 不会禁止,但也不会帮忙。
  然而,相较之下,苹果提供的AI框架就显得相对完整,也更有诚意。
  苹果在今年的 WWDC 发表通用型 AI 的机器学习框架 Core ML,可在苹果的所有设备上将训练完的学习模型以极高效率整合进 APP 之中。Core ML 本身虽不具备建模的能力,但可整合来自于外部机器学习工具所生成的模型。
   图片.png847x238 88.4 KB


  Core ML 中提供包含用于高效能图片、视频分析的 Vison、用于协助自然语言处理的 Fundation 、及让游戏开发者可以在游戏中导入 AI 的 GameplayKit 等三大应用框架。
  除了被动使用模型的 Core ML,苹果正在开发一款名为“Neural Engine”(神经引擎)的独立 AI 芯片,目标就是瞄准终端上的AI应用需求。
  
图丨A11芯片已经整合“神经引擎”
  为何需要终端 AI?就以 AR 应用为例,如果你需要把传感器所收集到的环境信息汇总发送到云端再把模型传回手机,整个传输过程一定会产生延迟,这对于 AR 这种需要高实时反应的应用而言,无疑会伤害到用户体验。
  当然,即便是最新的 iPhone 硬件,也还不能支援太过复杂的本地端 AI 计算,但随著未来神经引擎的开发完成与导入,重视终端整体开发环境与硬件一体化的苹果,在这方面的能力肯定会大大补强。
  相比 Google 的云端导向型 AI 规划,苹果更重视终端方面,但这也不是说苹果就不会做云端 AI 的东西,而是就目前这个阶段而言,终端 AI 更能确保用户的使用体验而已。
  AR生态,苹果后发先至,机会大

  目前,苹果 iOS 与 Google 的 Android 两大手机平台各霸一方,二者在针对手机上的一些延伸应用,包括 AR、VR,甚至未来的 AI 技术的想法和布局也都有不小的差异。
  Google 早在 2014 就公开过针对 AR 应用的开发环境 Tango 计划,配合 Daydream VR 技术,希望能够帮助开发者在 Android 平台上打开虚拟世界的任督二脉,创造更多应用,并能够建立起更多元的生态。
  Tango 并未获得手机厂商太多支持,也因此 Google 最近也提出了简化版的 ARCore,去掉了两个原本在 Tango 中的传感元件定义,以此降低导入难度。
  
图丨Tango计划
  不过要分析 Tango 或 ARCore,还是要先回顾一下 Daydream 的失败经验。Android 受到先天的平台碎片化限制,要推行这种需要较高性能需求与硬件设计规格一致性的标准开发环境,难度本来就比较高。加上软硬件开发者多半都是从成本考量,硬件设计仅针对最低标的必要功能着手,虽然因为低价取向,相关产品一开始还算热销,但因为最终体验不佳,这些低价产品不久后也逐渐从市场上消失了。
  那么, Tango/ARCore 计划能否改变 Daydream 的窘况?Tango 是个定义比较严谨的 AR 生态开发环境,其重点放在环境感知的能力上,通过 Motion Tracking(动态追踪)、Depth Perception(深度感知)以及 Area Learning(区域学习建模)等三大功能,透过整合在手机上的各种传感器,配合空间记录与学习功能,打造出 AR 应用所需要用到的各种空间感知的基础环境。
  但是 Tango 需要特殊的硬件设计,就以 2015 年推出的某款 Tango 平板硬件为例,光是在摄影模组上,就整合了 RGB 相机、IR 相机、鱼眼相机以及红外线发射器。另外,为了配合这些传感模组,核心组件也必须配合采用特制的控制器或加速芯片,对硬件厂商而言,成本负担不小。
  
  也因此,自 Tango 发布以来,相关的硬件乏善可陈。不过,Google 的 Tango 计划也不是纯粹针对手机的 AR 应用而来,这点从 Google 前几年收购的几家厂商去分析就可略知一二,比如下面两家:
  
Industrial Perception:建构 3D 识别与自主导航的机器人框架,并应用在工业机器人上;
Meka robotics:重视视觉与人机互动的机器人技术,可对周围环境进行感知与学习;
  虽然应用方向可能有所落差,但这两家公司的技术发展方向与 Tango 的核心功能诉求及软件框架相当类似。
  另外几家公司则是专精于多重传感器的融合应用环境,并提供一定的技术与专利支持。这么看来 Tango 应用在手机上似乎有点大材小用?
  事实上也是如此,甚至可以说 Google 推出 Tango 计划,其实是项庄舞剑,意在沛公:主要的核心意图还是在未来机器人应用领域,尤其目前机器人的环境感知能力是目前相关技术领域中相对薄弱的一环,Google 放出基本的开发环境,如果能够引出更多开发者投入相关的应用开发,Google 也就有机会收割具备应用潜力的技术开发成果。
  ARM 的高层也曾表示,要把 Tango 所定义的各种定位追踪功能放到手机里并不是件简单的事情,尤其是 Android 手机毛利不断下滑,要说服业界把这些功能放进去,恐怕还需要更多诱因。
  因为成本问题,Tango 在手机应用上并不成功,后续的简化版 ARCore 能否一雪前耻?这也需要再观察,毕竟就如同 Daydream,如果成本精简了,体验也跟着缩水,那早晚还是会被市场所唾弃。
  相较之下,当前苹果台面上与台面下的技术储备与研发布局,手机仍是最重要的项目,其产业布局不像 Google 般复杂。而在手机产品获利能力方面,苹果更是狠狠甩开 Android 阵营好几条街,这也代表苹果更有本钱来玩这个游戏。也因此,其在手机平台上的 AR 应用发展,恐怕会比 Google 更快成熟。
  
图丨发布会上用iPhone 8 运行AR游戏
  苹果针对其手机平台开发的 ARKit,只要利用手机现有的传感元件,就可以达到相当不错的效果。当然,苹果向来都只做最高端的产品,其手机上的传感元件类型也要比 Android 环境更完整,且 Android 还有严重的操作系统版本差异,二者立足点本来就不大一样。
  ARKit 除了环境感知能力以外,也提供两大主流游戏引擎 Unity 以及 Unreal Engine 的支持,为开发者提供一站式服务,而不需要自己花功夫整合。
  新版的 iOS11 完整支持了 ARKit 的运作环境需求,且处理器只要 A9 以上就可完整支持 ARKit,光是操作系统与硬件的一体化这一点,就省下开发者必须针对不同版本系统或者不同硬件设计的手机的庞大测试时间成本。
  总之,先不论未来机器人或其他视觉计算布局的前景如何,光是在手机平台上的AR应用,苹果已经确立了明显的优势。更重要的是,智能终端的概念在软硬件齐头并进之下得到了极大的提升,甚至让现有不少智能手机变成了“功能机”。
  最后,跑个分。
  苹果最新宣布的A11 Bionic的性能无不让人期待万分。现在国外跑分平台Geekbench上已经出现了iPhone X的跑分数据,准确的来说这份数据是在苹果发布会开始前2小时出现的。

  可以看到,苹果A11仿生芯片的单核得分超过了4000,而在6核心的加持下,该芯片的多核得分更是逼近1万分。相比之下,查询Geekbench数据库可发现,去年的iPhone 7 Plus单核和多核得分也不过才3332和5555,A11相比A10的提升简直可以用恐怖至极来形容。而对比Android阵营,目前在Geekbench上排名第一的是Exynos 8895版三星S8+,它拥有8个核心,但是Geekbench跑分远远不及苹果A11,单核和多核得分别只有1965和6495。
  来源:DeepTech深科技,APPLE官网,天极网
回复 收藏 举报

最新评论

楼层直达:

2iot

  • 2 主题
  • 34 帖子
  • 100 积分
  • 身份:LV1 技术小白
  • E币:100
2iot 2017-9-13 09:12:58 显示全部楼层
跑分领先安卓阵营一个身位,厉害了,我果!
  A11自研GPU跑分
什么叫做胜者的寂寞
  

7sms

  • 1 主题
  • 19 帖子
  • 104 积分
  • 身份:LV1 技术小白
  • E币:103
7sms 2017-9-14 02:17:41 显示全部楼层
GPU 真的自己造了,这回算是和 Imagination 彻底断了,下一个目标就是高通了。
  终端芯片搭载AI神经网络看来是趋势了,至于那些说全面屏落后小米,AI落后华为的,你们开心就好。

Unicorn

  • 1 主题
  • 222 帖子
  • 121 积分
  • 身份:LV1 技术小白
  • E币:107
Unicorn 2017-9-15 08:50:34 显示全部楼层
为什么文章要这扯一下,那扯一下,这么碎片化……
新年红包
Loading…
广告
关闭 热点推荐上一条 /1 下一条
快速回复 返回列表