新酷产物第一时间无偿试玩,另有许多优质达人分享独到生活经历,快来全球众测,体会各范畴最前沿、最有趣、最佳玩的产物吧~!下载消费者端还能得到专享福利哦!
由于上一代用骁龙 765G 的骚操作,在大伙心目中间,Google Pixel 系列算是断更一代。而 Pixel 6 系列就不同了,有 Google 自研 SoC——Google Tensor(Tensor 是张量的意思,名字就很 AI,很 ML)、追上时期的相机硬件,也有相对厚道的价值。
重回旗舰市场的计算摄影大佬,终归肯用现代的 CMOS 了!机圈立即奔走相告,直到海外使用者拿到真机,Anandtech 放出 Google Tensor 的测试成绩和剖析……
在不改变 Anandtech 原意的概况下,咱们对这颗如许要紧和有趣的 SoC 的内容发展梳理和编译,原文 https://www.anandtech.com/print/17032/tensor-soc-performance-efficiency
全自研仍是魔改(半定制)?
Google 显示 Google Tensor 是迈向新款事业负载探寻之旅的起点,现存芯片方案没有办法实现它们说的指标。凭借好几年来的机器学习探讨经历,Google 把 Tensor 做成一款以机器学习作为差异化的 SoC,据说其让 Pixel 能实现好多特异的新功效。
对于 Google Tensor 的第一种争议是,它是全自研?仍是魔改(半定制)?这边最重要的看你对“自研”的定义,Google 和三星看似密切的合作,模糊了惯例的自研和半定制之中的界限。
在 Google 里面,Google Tensor 代号是 GS101,可能是 Google SoC 或 Google Silicon 的意思。而此前爆料说的 Whitechapel(白教堂),还无全部证据表达其是真正存留的芯片。
而 Google Tensor 根本遵循三星 Exynos 的命名准则,其 ID 是“0x09845000”,拆解后能见到丝印是 S5P9845(编者:原文发表之初,以为 ID 对应 S5E9845,但经 TechInsights 拆解,确认是 S5P9845)。作为参考,三星 Exynos 2100 的 ID 是 S5E9840,Exynos 1080 是 S5E9815。
几年前就有报导说三星最初提供半定制的芯片效劳,那时就有三星与思科、Google 的合作信息。ETNews 在 2020 年 8 月的文章中提到,三星会依据消费者要求提供“定制”技艺和功效,甚而从芯片设置阶段就最初提供。
三星没再是容易的芯片生产商,却是十足参加芯片设置,这都可行和 ASIC 设置效劳相提并论了。但这是个很特殊的概况,终归三星不仅有台积电那样的芯片代产业务,它也有本人的自研 SoC。
Google Tensor 和三星 Exynos 高度同源,除了大伙常说的 CPU、GPU、NPU 等顶级构造外,芯片中的根本构造好多皆是同源的。尽管纸面子上,三星、联发科、海思,甚而高通(唯有 CPU 方面),用的皆是 arm 的 Cortex CPU 和 Mali GPU 公版架构,但他们的底层架构仍是十分不同的。
Google Tensor 运用的是三星 Exynos 的构架,不仅有相同的时钟和电源治理架构,他们的存储操控器、外部接口的 PHY IP 等顶级块,甚而连 ISP 和媒体编解码器等较大的 IP 功效块都很类似。有趣的是,Github 上曾经有 GS101 的公布消息,可行 1:1 地相比它和 Exynos 的构造构成。
只是,尽管用了 Exynos 的根基模块和构架,但 SoC 的定义切实由 Google 操控,构造和 IP 块之中的接连设置上,Google Tensor 和三星 Exynos 皆是不同的。
比如 Exynos 上,CPU 是用总线连起来的,而 Google Tensor 的 CPU 集群是被集成在一种很大的 CCI 内部。从外部看,可能是用了不同的总线设置,也可能是十足不同的 IP。此外,像内存操控器的接连形式,他们也是不太一样的。
功能规格剖析
单看 CPU 就晓得 Google Tensor 的特殊之处,2x X1 + 2x A76 + 4x A55,这种“2+2+4”构造在三星 Exynos 9820 和 Exynos 990 都显露过。但当今 Android 旗舰 SoC 中,1+3+4 才是一律的主流。况且敢堆 2 颗 X1 的,仅 Google 全家。
理论上有两颗 X1 超大核,其 CPU 多核功能会比单颗 X1 的产物更强。而频次上,Google Tensor 的 X1 皆是 2.8GHz,略低于骁龙 888 的 2.84GHz 和 Exynos 2100 的 2.91Hhz。另外,Google 还和骁龙 888 一样给了 1MB L2 缓存,比 Exynos 2100 的 512KB 残血 X1 更猛。
大核(编者:你喜爱叫中核也行)这里,Google 抉择了古老的 A76 架构,这是件很有争议性的事(2.25GHz,256KB 的 L2 缓存)。终归这其实不合乎道理,由于 A77 和 A78 的功能和能效比都更高。连 Anandtech 全没从 Google 那边获得准确的解释。
它们猜测可能是几年前设置芯片的时刻,三星手上也无革新的 IP 供 Google 抉择。也可能是在超大核换成 X1 的时刻,无时间连大核也一同换了。但 Google 应当非是特意采用 A76 的,由于从下方的测试可行发觉,A76 真的是跟不上时期了。
小核这里,4 个 1.8GHz 的 A55。Google 抉择了 128KB 的 L2 缓存,而非是三星 Exynos 本人用的 64KB,这让这种 CPU 更像骁龙 888 了。但相比奇怪的是,Google 把集群的 L3 缓存频次和 A55 绑定,这会导致延迟和功耗难题。此外,这也和 Exynos 2100 的 L3 频次是不同的。
Google Tensor 的 GPU 是 Mali- G78 MP20,范围仅次于麒麟 9000 的 G78 MP24(编者:G78 的极限)。大伙最最初认为 Google 会用低点的频次来提高能效比。但结果 Google 居然把着色器频次推到 845MHz,把 tiler 和 L2 频次推到 996MHz,简直癫狂。此外,它也是第一种用上 G78 分离频次特性的产物。
作为参考,Exynos 2100 的 G78 MP14 也“不过”854MHz,后者的峰值功耗曾经很高了。结果 Google 增添 42% 的焦点,却依旧保持高频。因而它的峰值功能很使人期待,但峰值功耗也会很猛。而内存操控器仿佛和 Exynos 2100 相同,扶持 4x16bit 的 LPDDR5,理论带宽 51.2 GB/s。
它也用了 8MB 的体系缓存,但也不明白能否用了和三星 Exynos 2100 一样的 IP,由于他们的架构和举止形式都不太一样。Google 大批运用 SLC 来提高 SoC 功能(包括它们本人的定制模块)。这种 SLC 应允自分区,将 SRAM 专门分给 SoC 上特定的 IP 块,使他们在不同用例下,能对悉数或部分缓存发展独占访问。
ISP 与 TPU
大伙说 SoC 集成的 ISP 时,经常把他们描画为单个 IP。但实质上,ISP 是不同的不业余 IP 块的组合,每个 IP 块料理成像管线中的不同任务。而 Google Tensor 十分有趣,由于它将三星用在 Exynos 芯片上的少许片段整合到了一同,同一时间还将本人开发的定制模块整合到了流水线中 —— 正如 Google 在展现 SoC 时所说的那样。
成像体系部分和 Exynos 是一样的,如相位检验料理单元、反差对焦料理单元、图像缩放器、畸变校正料理块和纹理遮挡函数料理块等。比 Exynos 少的部分,可能是三星的少许图像后料理模块。
google在 ISP 中加入本人的 3AA 模块(自动曝光,自动白平衡,自动对焦) ,以及一对本人的时域降噪 IP 模块(用于对齐和合并图像)。这点很可能便是google所说的那一些有助于提速图像料理的模块,这点是 Pixel 系列计算摄影的一部分,毋容置疑地地代表了图像料理流水线中十分要紧的部分。
TPU 是让 Google Tensor 被称为 Tensor 的位置。Google 曾经用自研 TPU 多年了,在驱动层次,Google 把 Tensor 的 TPU 称作 Edge TPU( 端侧边缘 TPU)。这是差不多有趣的信号,由于它应当和 Google 2018 年发表的 Edge TPU 相关,后者是 Google 为边缘推理而设置的 ASIC 芯片(官网 cloud.谷歌.com/edge-tpu)。
当年的 Edge TPU 宣称在 2W 功耗下可行提供 4TOPS 的算力,但 Google 并没有推出 Tensor 的 TPU 功能目标,可是在少许测试中可行见到它的第一大功率是 5W 左右。因而假如他们切实是相关联的,考量到这几年的制程和 IP 上的进步,Google Tensor 的 TPU 功能应当有显著提高了。
这种 TPU 是google芯片团队的骄傲,它正好运用全新的机器学习料理架构,这种架构针对 Google 里面运转机器学习的形式发展过改良,而且显示它可行应允开发新的、特异的用例,这是 Google 做定制 SoC 的最重要的指标和出发点之一。在后面的测试中,这种 TPU 的功能目标切实也是令人感官深切的。由于 TPU 的消息少许,咱们只能鉴于它的驱动程序做容易猜测,它可能包涵四焦点的 Cortex-A32 CPU。
其它模块
在媒体编码器方面,Google Tensor 运用了三星的多功效编解码器(与 Exynos 系列同款),另有一种看起来像是用于 AV1 解码的自研 IP 块。这有点奇怪,由于三星的宣传中,Exynos 2100 是有 AV1 解码功效的,况且这种功效貌似也在内核驱动程序内部。但在 Galaxy S21 系列中,这种 AV1 解码功效从未在 Android 的层次实现过。
google加入的这种专用的 AV1 解码器被它们称做“BigOcean”,它能让 Android 体系具有 AV1 硬解能力。但十分奇怪的是,它真的就只负责 AV1,其它格式编解码仍是由三星的 MFC 负责。
Google Tensor 的音频子体系还不同,Google 用本人设置的 IP 块代替了三星的低功耗音频解码子体系,他们可行在没有需悉数唤醒 SoC 的概况下发展低功耗的音频播放。咱们以为这部分也是当协料理器用的,这也是 Google Tensor 和 Exynos 不同的位置。
Google 还用了一个称为 Emerald Hill 的硬件内存紧缩器,对内存页面发展 LZ77 紧缩提速,反过来也可行用以提速交换中的 ZRAM 的卸载进程。此刻也不确定 Pixel 系列能否曾经启用这种模块,但能确认在“/sys/block/zram0/comp_algorithm”目录中有“lz77eh”。作为课外材料,三星早在 5 年前,就在 SoC 里集成了相似的硬件紧缩 IP 模块。但出于某些原因,这点模块从未被启用过,或许是能效比并未它们意料中的高。
此外,Google 还用三星的 Exynos 基带,做出了第一辆非高通的mm波电话。Pixel 6 系列用的是三星的 Exynos 5123 基带(译者:为遵循国家内部的习惯,这边把调制解调器称为基带)。三星在 2019 年就提到本人的mm波射频和天线模块,说 2020 年会显露在量产机上(不晓得那时能否计划让 Pixel 6 在 2020 年到市场)。Pixel 6 系列的峰值速度可行达到 3200Mbps,但好多测试中,它的网速唯有高通产物的一半左右。
尽管是统一个基带,但它非是像 Exynos 2100 那样集成在 SoC 里,却是外挂的。可能是由于 Google Tensor 的 GPU 和 CPU 范围很大了,况且 TPU 的范围也是未知数。终归就算是把基带外挂出来,Google Tensor 的范围也是差不多大了,即使是和对照 Exynos 2100 的概况下。
总的来看,Google 切实设置和定义了 Tensor ,同一时间有好多 Google 特有的设置,是全体的芯片上的差异化。但从更底层的方位看,Tensor 和 Exynos 有好多共通之处,用了好多三星特有的根基模块,因而叫它“半定制”也许会更适合。
实质功能体现:不尽如人意
测试中,Google Tensor 的 DRAM 延迟较高,也不如 Exynos 2100,和骁龙 888 比就更差了。Google 改通过了内存操控器,它会依据负载和内核的内存失速百分比来操控 MC 和 DRAM 速度,这部分是和三星不同的,本来际应用率还不如三星的内存操控器高。此刻不晓得是 CPU 的难题,仍是全个 SoC 里面的难题,但这确切地作用了下方的测试。
它的 L3 延迟也差不多高,比 Exynos 2100 和骁龙 888 高得多。Google 无给 DSU 和 CPU L3 缓存设定特定的频次,却是把它和 A55 小核的频次关联。奇怪的是,即使 X1 或 A76 载满,A55 和 L3 却在低频“摸鱼”。同样概况下 Exynos 2100 和骁龙 888 皆是会提升 L3 频次的。
在体系缓存测试中,能见到 11-13MB 的延迟概况 (1 MB L2 + 4 MB L3 + 8 MB SLC) ,在寻常的内存访问中,Tensor 也是比 Exynos 要慢的,可能和被改过的个别缓存管线相关。
由于 L3 和 A55 的频次捆绑,且频次高,是以 Google Tensor 的 A55 小核是几个 SoC 里 L3 延迟最低的,彷如无异步时钟桥通常。
CPU 部分,Google Tensor 更像是骁龙 888,而非是 Exynos 2100。尽管 Google Tensor 的 L2 缓存是 Exynos 2100 的 2 倍,但频次低了 3.7%(110MhHz)。
Tensor 的弱点是内存延迟,导致 SPEC 测试中好多子名目都比 骁龙 888 和 Exynos 2100 慢,但能耗却更高(CPU 在干等内存)。SPEC 总分上,Tensor 的体现比 Exynos 2100 略差,对照骁龙 888 的落后幅度达到 12.2% ,源于跑完测试的时间更长,终归耗电还多了 13.8% 。折算回来,相对骁龙 888 的差距应当是 1.4% 左右。
它也有和 Exynos 2100 一样的降频难题,不过相对无那末惨重。假如冷却得当,功能会高 5%-9% 左右(上图的测试结果是在 11 度的环境下获得的)。
可怜的 A76 大核,骁龙 888 的 A78 比它强 46%,还更省电,实质 IPC 差距在 34%,这倒适合两个框架之中的差距。假如真是为了省电,十足可行做个低频的 A78,但结果 Google 放了两颗频次又高、又耗电、功能也不好的 A76,只能推断 Google 是没得选,而非是有意而为之。
越挨近右下角,能效比越低;越挨近左上角,能效比越高 ↑
A55 小核这里还不行,功能不过比同频的骁龙 888 的 A55 高 11%(感谢 L3 和 SLC),但却差不多是 2 倍的功耗,俨然便是继承了 Exynos 高功耗 A55 的血统,能效比甚而比本人的 A76 大核还拉胯。瞧瞧联发科天玑 1200 的 A55,再瞧瞧 A14 的能效焦点,这真是个残酷的全球。
Google Tensor 由于拉胯的 A76 功能体现,就算有 2 颗 X2 都没有力回天,拖低了全体分数。X1 自身也比对手稍慢少许,多数时间的能效比都和 Exynos 2100 的 X1 绝对。但 A76 切实落后时期太多了(不论是功能仍是能效比),而 A55 又继承三星低能效的惯例,一言难尽便是了。
GPU 这里范围大,频次高,但 3DMark Wild Life 测试的峰值功能只比 Exynos 2100 高 21%。在 GFX Bench 的 Aztec 情景测试中,优先 Exynos 2100 14%,小幅优先骁龙 888。尽管采纳了分频设置,但貌似阻碍在 GPU 的其它位置。
Tensor 的 GPU 峰值功率多达 9-10W,电话一跑就降频(一轮测试全没跑完啊……),拖低了全体功耗,是以才会有 7.28 W 的平均功耗。Pixel 6 系列无热管,散热配置和机身构造更像是 iPhone,而非是猛堆散热的安卓旗舰。它跑起来时,左侧的 SoC 45 度,但右侧唯有 30-33 度,散热切实是弱。
使人不解的是,本年这批 SoC 都设定了高得不确实际的 GPU 频次,一跑就降频。可能是为了应对突发的 GPU 负载?或许是其它甚么原因?但不论怎样样,实质能效比是受累了。
TPU:极强的推理功能
这是 Google Tensor 挽回颜面的位置。MLPerf 测试中,Pixel 是在 NNAPI 跑的,其它厂家是各自的库,高通是 SNPE(最近改良了 MLPerf 1.1,提高了成绩)、三星是 EDEN,联发科是 Neuron,而苹果无 coreML 提速,是以吃亏。
在图像分类、指标检验和图像切割事业负载中,Tensor 成绩低于高通,但强于三星。而在言语料理(MobileBERT 模子),Google Tensor 提供了骁龙 888 3 倍的功能,推理部分强得很。Google 在宣传里,切实也提来过实时转录、翻译等运用情景是其差异化所在。
还没发表的 GeekBench ML 测试,用是 TensorFlow 模子,代表的是 GPU 的机器学习功能。这时刻 Google Tensor 就弱于 Exynos 2100。假如用 NNAPI 模子,此时是 CPU+GPU+NPU 的混合事业,Google Tensor 就能大幅优先骁龙 888。
除了一律功能,跑 AI 测试时,Pixel 6 Pro 的整机功耗和 Exynos 2100 的 Galaxy S21 Ultra 挨近。单独发展推理任务时,Exynos 2100 的爆发功率达到 14W,骁龙 888 也有 12W。但由于 Google Tensor 的 AI 功能更高,是以终归能效比要更高少许。
只是 Google 还无计划公布相干的 SDK 让开发者去更好地应用这颗强盛的 TPU 。但再瞧瞧三星,它的 NPU 发表都 2 年了,此刻全没有 SDK…… 此刻 TPU 的强盛功能,最重要的聚集表现在官方 App 里,像是给摄像头加入更多的机器学习功效,以及各式翻译功效。
总结
Google 显示,它们搞自研 SoC 的最重要的原因是现存的 SoC 在机器学习上的功能和能效比太差。而 Tensor 的机器学习功能和能效,被用以支撑新的用例和体会,比如咱们在 Pixel 6 系列上见到的好多机器学习特性。像是实时转录、实时翻译和图像料理等算法,全部这点皆是运转在 Tensor 的 TPU 上的。
尽管 Google 可能不愿承认或许谈论,但 Google Tensor 切实便是和三星合作的产品,多数都源自 Exynos,并继承了三星在能效比方面的弱点。CPU 被古老的 A76 拖后腿,范围巨大的 GPU 被散热拖后腿,但 TPU 切实体现很好,特别是当然言语料理方面,远远抛离全部竞品。
但总的来讲,咱们以为 Google 曾经经过 Tensor 实现了开始的指标。咱们不晓得 Google 下一代的 SoC 会走甚么样的路线,但咱们很有兴趣等等看。
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关心)