这些天,高通在夏威夷召开的第三届骁龙技术峰会,在本次峰会上,万众瞩目、期待已久的骁龙 8 系列旗舰移动芯片 Snapdragon 855 终于揭开详细面纱。正如峰会第一天高通所说,骁龙 855 移动平台是全球首款全面支持数千兆比特 5G 连接、业界领先的人工智能(AI)和沉浸式扩展现实(XR)的商用移动平台。
与此同时,也正如大多数人所知,骁龙 855 也将是下一代顶级旗舰智能手机标配的移动芯片。这枚采用全新芯片架构基于 7 纳米制程工艺而打造的芯片,带来了更高性能提升、更持续的电池续航,同时在影像、音频、流媒体、游戏和 XR 等各个方面都迎来了显著的体验改进。
这一次高通除了强调骁龙 855 为首个 5G 移动平台,支持 Sub-6GHz 低频率以及高频毫米波(mmWave)之外,同样非常重视的还有 AI 人工智能和机器学习能力方面的体验升级。下面,就让我们一起来看看,骁龙 855 在 CPU 和 GPU 等各方面的究竟有那些值得关注的改进。
骁龙 855 芯片规格参数
高通骁龙 855 是一枚 7 纳米工艺八核心设计的芯片,这次高通的核心结构设计与 ARM 的 DynamIQ CPU 集群设计略有不同,具体为 1 大核 + 3 中核 + 4 小核的设计。大核基于 ARM 最新 Cortex-A76 设计,可以提供非常高的峰值性能,3 个中核同样也是 Cortex-A76 定制,4 个小的核心基于 Cortex-A55。
不过,与上一代骁龙 845 芯片相比,骁龙 855 并没有大幅提升 CPU 核心的时钟频率。高通强调,自家的 Kryo 485 CPU 集群由于是基于 ARM 最新的 Cortex-A76 进行半定制设计,所以其 CPU 性能相比上一代还是提高了 45%。毫无疑问,这个提升幅度对于要求 CPU 性能更高的应用程序来说是已经是非常大的的提升了。
骁龙 855 集成了更强大的 Adreno 640 GPU。据高通描述,骁龙 855 的 GPU 性能比上一代芯片提升了 20%,同时还能继续保持业界领先水平的每瓦特能效。可以预计的是,其游戏性能与竞争对手 ARM 的 Mali-G76 相比将再次保持领先地位。关键是,Adreno 640 GPU 还支持 Vulkan 1.1、HDR 和 PBR 基于物理渲染的全新游戏体验。
骁龙 855 集成了新的 ISP 图像信号处理器,支持 4K HDR 视频内容录制,相比上代功耗节省 30%。在 ISP 当中,包含了 Cinema Core、H.265 和 VP9 视频解码器,可提供 7 倍的能效增益。其他还包括支持最高 120fps 的 HDR10+ 视频播放和 8K 视频解码,并支持 8K 360 度全景视频播放。还有其他熟悉的特性,如 aptX 支持,包括对 aptX Adaptive 的硬件支持,以及对快速充电的支持也依然在列。
更智能的 Kryo 485 CPU 配置
相比过往的基于 big.LITTLE 的 4 + 4 八核设计的 CPU 配置而言,全新演进的 ARM DynamIQ 集群技术更加灵活,主要是由于共享集群的设计和共享 L3 缓存的引入,使得每个核心单独的 L2 缓存具有更大的灵活性。这意味着,单个 CPU 内核可以根据特定的性能点和大小进行定制,而且仍保留了在同一个集群中紧密统一的优势。因此,采用 " 小、中、大 " 分层的结构未来会变得越来越流行。
虽然华为麒麟 980 也是基于 Cortex-A76 定制,但高通的骁龙 855 芯片更充分利用了这一优势,从而选择 1 + 3 + 4 的设计,而不是传统的 4 + 4 配置,其中 "1" 和 "3" 都是相同的架构,然后在频率上提供差异,并且所提供的缓存配置也明显有所不同。
骁龙 855 大内核更大的共享 L2 缓存,频率比麒麟 980 2.6GHz 高出 9.2%,达到 2.84GHz 峰值频率,两者结合使其能够将在需要的地方产生更高的性能,可以说这个配置就是为了更高的单线程性能设计,而且可持续时间更长。同时,在骁龙 855 中大核配了 512kb 的 L2 缓存,三个中核频率为 2.42GHz,并各有 256kb 的 L2 缓存,4 个 1.8GHz 主频小核的每个核心各有 128kb 的 L2 缓存。
现在 Android 处理较为繁重的多线程任务已经相对轻松了,而且应用程序实际用例中,也很少需要多个突发的峰值高性能单线程。ARM 很清楚这一点,所以只需配置一个大核心,就能为低端设备提供巨大的体验提升,例如采用 1 + 7 或 2 + 6 DynamIQ 设计的八核 CPU。第二和第三核心也需要提供一定性能,但这些核心通常不需要保持相同水平的持续峰值性能。而较小的内核,一般只用于后台处理或低功耗并行任务。
简单地说,骁龙 855 通过专注于一个非常高性能的核心,整枚芯片获得了更持久的性能和更高的效率。其实对于更多样化的 CPU 设计配置而言,重点还是因为 DynamIQ 的调度比传统的 big.LITTLE 更加仔细和智能,将任务分配到更适当的内核,从而更加行之有效。对此,高通在现场放出骁龙 855 与竞争对手在应用启动时间的对比图,虽然没有点名,但都知道这两个对手就是苹果 A12 和麒麟 980。
话说回来,骁龙 855 之所以在打开应用程序上领先,并不能代表这就是 CPU 的原始性能体验领先,因为可能只是芯片组本身调度程序和架构的作用。当然了,软件优化如今已经变得越来越重要,过去两年时间里,高通的骁龙 8 系列旗舰芯片通过软硬件结合,提供的响应速度和反应性方面表现已经十分出色了。
性能更强劲的 Adreno 640 GPU
GPU 图形处理单元一直是高通旗舰芯片的强项,这一次骁龙 855 所集成的 Adreno 640 GPU 变得更强劲了,高通也意识到手机游戏崛起的趋势,至少与其他传统游戏平台相比,手游如今成为了游戏主流战场。在技术规格方面,按照高通的传统依然没有披露太多新 GPU 的详细细节,而是简单的提供了的提升的数字。
高通表示,Adreno 640 GPU 能够带来高达 20% 的图形渲染速度提升,同时还能继续保持业界领先水平的每瓦特能效。其实这是比较保守的数据了,与过往提升相比较小,更像只是利用了 7 纳米工艺制程的进步而已。不过,在整枚骁龙 855 芯片中,GPU 占据的空间非常小,仅为 10.69 平方毫米,所以得到这个提升说明高通已经增加了核心处理原件的数量,否则更小。
根据高通在现场的介绍,Adreno 640 GPU 支持 FP32 和 FP16 浮点运算,在此基础上增加了 50% 的 ALU(算术逻辑单元)数量。这就表示,相比上一代 Adreno 630 GPU 来计算,Adreno 640 每核应该有 384 个 ALU,共计 768 个 ALU。了解这方面的机友应该注意到了,如果是这个级别的 ALU 数量,所提供的性能提升应该不止 20%。所以很容易发现,高通实际已经降低了 Adreno 640 GPU 的处理频率。
高通在现场还展示了骁龙 855 和骁龙 845 在特定脚本上以 40fps 的速度运行 PUBG 的对比,结果显示最新芯片在相同的负载下功耗降低了 28%。
关于最新的 GPU 支持的屏幕也得到了升级,现在最多可以支持到两个 4K HDR 显示屏的设备,相当于双屏机或可折叠设备都可以上两个 4K HDR 屏幕。同时,GPU 在解码放了进行了增强,首次在移动设备上实现对 4K 120fps HDR10+ 播放的,而且新增的硬件加速 H.265 和 VP9 解码能效更高,功耗降低 7 倍,并可播放 8K 360 VR 视频。
AI 人工智能的改进
在移动领域乃至整个科技行业,当前 AI 是十分流行而且还会一直持续下去的流行词。不过,谈 AI 人工只能就离不开机器学习,高通骁龙 855 芯片通过内部改进 Hexagon 技术,并增加了相应的运算能力,可以实现每秒超过 7 万亿次运算(7TOPs),希望能够给用户带来更实在的体验提升。
高通为骁龙 855 集成了第四代多核高通人工智能引擎 AI Engine,其 Hexagon 690 增加了两个额外的向量处理单元,使组件的向量处理运算能力增加了一倍。更具体来说,上一代 Hexagon 680/685 包含有 4 个标量处理单元和 2 个 1024b 的向量处理单元,而全新一代 Hexagon 690 则包含了 4 个 1024b 的 HVX(Hexagon Vector eXtensions)向量扩展处理单元,所以处理能力是之前两倍。
不过,高通针对 Hexagon 690 最重要的改进在于,首次引入了全新的 HTA(Hexagon Tensor Accelerator)张量加速器,为特定的复杂机器学习任务提供更高的吞吐量。所以高通吹嘘称,骁龙 855 与前代移动平台相比可实现高达 3 倍的 AI 性能提升,而与华为麒麟 980 相比,性能提升最高可达 2 倍。
需要说明的是,高通第四代多核高通人工智能引擎 AI Engine,依然是异构机器学习方案,结合 Hexagon DSP 和新的 HTA 张量加速处理单元,再借助更强的 GPU 和 CPU 完成终端侧神经网络运算。
向量处理单元在机器学习任务中被大量使用,大多数都专注于 INT8 进行优化。高通骁龙 855 中 DSP 的向量单元非常适合于基础的机器学习运算,例如用于分类的向量单元运算。而新的 HTA 张量处理单元,最多可支持 16 位的数据,主要为更为复杂的向量矩阵结构或多维向量数组服务,通常用于复杂的深度学习算法,例如对数字图像做实时卷积处理。张量本质上是更大的向量矩阵,封装了连接到一起的数据,可以是颜色、大小和形状,也可以是跨 RGB 图像颜色组合的特征。高通称,集成 HTA 的关键原因就是为了做更强大的图像处理。
很显然,高通骁龙 855 通过集成全新的 HTA 张量加速处理单元,大幅提升了机器学习算法的性能和能效。高通表示,在未来的芯片中还会继续提高 HTA 的性能。总之,骁龙 855 在 AI 应用中将更快、更准确、更高效,例如能够更好的处理图片,如更快完成更准确的背景虚化效果和图片识别,当然还包括语音检测识别,以及基于 XR 的头部和身体运动追踪。
众所周知,从 Google Pixel 2 系列开始,谷歌旗舰机的图像处理能力之所以强大,原因就在于配备了自主研发的 PVC ( Pixel Visual Core ) 芯片。如今高通骁龙 855 的图像处理核心能力,经过改进计算机视觉(CV)ISP 及释放 Hexagon 690 的 AI 性能,其出色的异构计算性能配合下也能够与之相匹敌了。
全球首款计算机视觉(CV)ISP
说到 ISP,骁龙 855 还改进了 ISP 图像信号处理单元,也就是换上了双核 14 位 Spectra 380 ISP,不过高通称其为 " 全球首个 CV-ISP",因为 Spectra 380 ISP 集成了大量硬件加速的计算机视觉能力,支持更加先进的图像处理能力,从而实现最尖端的计算摄影和视频拍摄功能。简单地说,Spectra 380 ISP 由于能力更强,更能释放 CPU、GPU 和 DSP 的工作负担,高通称为此功耗降低了高达 4 倍。
得益于新的 CV-ISP,搭载骁龙 855 芯片的手机将能够实现基于硬件的深度感测,支持在 4K HDR@60fps 的状态下实时进行视频拍摄、对象分类和对象分割。这意味着用户可以拍摄一段视频并且精准地对选定的对象或背景进行实时替换,并且这一切操作都可以在能够表现超过 10 亿色的 4K HRD 分辨率下实现。
不仅如此,高通表示 Spectra 380 ISP 还是首个支持 HDR10+ 视频拍摄的 ISP,能够保留视频超高的对比度和超过 10 亿色的视觉效果呈现,同时在拍摄 4K HDR 视频中功耗相比骁龙 845 降低了 30% 之多。另外,高通称为了更高效地存储 HDR 视频,骁龙 855 现在也已支持 HEIF 编码格式硬件加速,能够将文件减小 50% 以便于更高效地存储。
关于 HEIF 编码格式的照片,高通提到了几个点,除了常规图像能缩小 50% 的文件大小之外,所保留的 HDR 图片还能支持多种色域,支持存储拍摄的视觉数据,支持存储 RAW 完整数据,支持储存深度图数据,支持储存 Alpha Mask 数据,支持储存高速连拍数据,支持储存动画摄影数据,支持储存 HECV 视频数据。
用通俗的话来说,有了 HEIF 格式的照片,不仅高速连拍多张照片可以保存为一个文件,而且虚化景深和原始照片也可储存为一个文件,包括多摄像头手机拍摄的广角、超广角、长焦、标准视角的照片,同样能保存为一个文件,无需用户做出只选择一张的举措,可保留的数据更多。
骁龙 855 本身没有集成 5G 调制解调器
尽管高通一直表示骁龙 855 是全球首款商用 5G 的移动平台芯片,但该芯片内部集成的调制解调器并不支持 5G,还需要配合外挂的骁龙 X50 调制解调器。这就表示,即便明年大量旗舰都用上了骁龙 855 芯片,但如果 PCB 主板没有安放 X50 调制解调器,那么也无法支持 5G。不过高通表示明年骁龙 855 旗舰都支持 5G,有可能是将芯片和基带打包成一个订单。
骁龙 855 集成的是骁龙 X24 LTE 调制解调器,这是全球首个支持 LTE Category 20 的调制解调器,支持千兆比特 4G 连接,下行速度可以达到 2Gbps,这里主要得益于 4x4 MIMO,7x20 MHz 载波聚合,256-QAM7 提高速度。上行速度在 3x20 MHz 载波聚合下,也能达到 316 Mbps 的速度。说实话,这些理论速度听起来很吓人,但仍取决于真实网络连接速度。
而外挂的骁龙 X50 5G 调制解调器,支持 Sub-6GHz 低频率以及高频毫米波(mmWave),在我们中国国内的 5G 建设中,已经确认将首先使用这一频段。高通表示,5G 带来了快速响应和前所未有的速度是数千兆比特连接。不过,不管怎样,2019 年许多智能手机和网络仍将主要基于 4G。
另外,在连接性其他方面,骁龙 855 属于 Wi-Fi 6-ready 移动平台,支持 802.11ax-ready、802.11ac Wave 2 和 802.11a/b/g/n。高通表示,Wi-Fi 6-ready 为移动平台提供强大的下一代 Wi-Fi 性能,诸如 8 × 8 探测机制的先进特性可以更高效地服务更多终端(与 4 x4 探测终端相比,效率提升高达 2 倍),目标唤醒时间(Target Wakeup Time)能效比提升高达 67%,同时支持最新 WPA3 安全。
不过,目前 Wi-Fi 6-ready 支持的设备很少,预计 2019 年会多一些。同样,骁龙 855 也支持 60 GHz Wi-Fi,即支持 802.11ay 和 802.11ad,新一代 802.11ay 规范将 Wi-Fi 速度提升至前所未有的速度,理论上单流链路每个通道传输速度超过 44Gbps,最高可达 176Gbps。除了 Wi-Fi,蓝牙 5.0 版本也原生支持,传输速度最高为 2 Mbps。
连接性方面还有一点,骁龙 855 芯片也增强了对 TrueWirelss Stereo Plus 技术的支持。高通表示,新技术优化了左右耳塞间的时延,同时降低功耗来延长每次充电后的使用时间,最终集稳定性、顶级音质和显著低时延于一身,音频体验得到了大大提升。
其他方面还要提的是,骁龙 855 是首款支持 Qualcomm 3D 声波传感器的移动平台,是全球首个支持屏下超声波指纹识别的商用解决方案,也是唯一一个能够穿透不同类型污渍准确识别指纹的移动解决方案。不过,这项技术是否问世具体还取决于手机制造商。有消息称,三星明年初的 Galaxy S10 将会是第一台提供 3D 屏下超声波指纹识别技术的手机,其他厂商何时会提供暂时未知。
高通骁龙 855 是令人更满意的旗舰芯片
就目前而言,纵观市面上所销售的智能手机,近两年只要搭载骁龙 8 系列旗舰芯片的手机表现都相当令人满意,包括骁龙 835 和骁龙 845,而骁龙 855 将会让旗舰更令人满意,在各个方面都有了比较明显的改进。除了高通不断宣传 5G,以及更强的 AI 和机器学习之外,高通还进一步强调游戏性能,进行全方面的游戏优化。
为了让游戏玩家相信性能提升,高通特别打造了全新的 Snapdragon Elite Gaming 体验的平台。根据介绍,该体验包括 true HDR(超过 10 亿色)电影级分级调色、电影级色调映射、要求颇高的基于物理渲染(PBR),以及对 Vulkan 1.1 图形库的支持。高通表示,在这个平台优化的游戏,都能利用定制算法降低 90% 以上掉帧的,即便是要求极致的游戏,在骁龙 855 手机上也能流畅运行。
总的来看,骁龙 855 最主要的变化在于新设计的 CPU 配置,在 7 纳米之下大量半定制优化后,可持续峰值性能更优秀,而且通过新增 HTA 张量处理加速单元极大的提高了 AI 人工智能性能。同时,高通对 CV-ISP 的调整,也更能满足用户对移动成像的需求。在这一切改进之下,骁龙 855 究竟实际表现如何非常令人期待。
当然,搭载骁龙 855 芯片的新旗舰手机还要等待一段时间,也就是 2019 年上半年的某个时间点。高通方面已经确认,骁龙 855 移动平台现已向客户出样,搭载该平台的商用终端预计将在明年上班开始全面出货。
最后,再回头来说说大家最关心的 CPU 性能提升,在新的架构和工艺下,45% 的提升已经符合预期了,参照华为麒麟 980 也差不多,其中的疑问就是不同内核如果保持相同的电压水平,如何做到提升能效。而 GPU 性能提升略保守,ALU 数量增加 50% 却只提升 20% 性能。至于新的 AI 单元加持后,骁龙 855 在这方面已经比华为麒麟 850 更强了,只等更成熟基于 AI 的应用。无论如何,也就是不管上述这一切如何改进,最终手机厂商主要宣传骁龙 855 功劳,仍只会有自己优化软件提高跑分这部分,ISP、DSP、AI 这些基本不会提到高通。