麒麟掌

首页 » 常识 » 问答 » ARM推出下一代旗舰芯片架构,GPU提升
TUhjnbcbe - 2023/6/21 19:23:00
白癜风能治好了吗 http://pf.39.net/bdfyy/bdflx/190522/7157873.html

5月27日,ARM于台北COMPUTEX大会开幕前发布了下一代旗舰机手机芯片设计方案,其中包括全新CPUCortex-A77、新GPUMali-G77。这家公司还首次公开了新一代神经网络芯片ARMML,所有这些预计将会在年上市。

ARM表示,新的芯片展示了该公司在5G融合、物联网、人工智能(AI)与自动驾驶领域的投入。

ArmIP产品事业群总裁ReneHaas在发布会上。

Cortex-A77:制程不变,性能提升20%

对Arm自己的CPU设计来说,年是个不错的年份。去年5月,我们看到了Cortex-A76的发布,以及后续的麒麟和骁龙芯片。从人们购买的反应就可以看出来——这代芯片令人印象深刻,而Arm成功实现了其在性能、效率和领域方面的所有承诺,为年的大多数旗舰手机提供了出色的芯片和设备。

今年,Arm跟进了另一项技术,Cortex-A77——Cortex-A76的继任者。这一代CPU将是对去年主要微架构的直接进化,代表了Arm全新Austin内核系列的第二个实例。

Cortex-A77不仅适用于手机,也可用作笔记本处理器,Arm称其性能已经超越14nm制程的英特尔酷睿i5-U。

代号Deimos

新的芯片架构Cortex-A77代号为Deimos。它将Cortex-A76终止的地方作为起点,并遵循Arm的计划轨迹,即每一代新的Austin系列CPU性能都能持续提升20-25%的CAGR。

说到这里,就有必要提一下Cortex-A76的性能了。

A76对Arm及其授权厂商来说无疑是一款非常成功的内核。全新微架构和台积电7nm制程工艺的结合,带来了业内有史以来最大的性能和效率提升。结果就是麒麟和骁龙相对于各自的上一代手机芯片都有很大的性能飞跃。

虽然A76表现不错,但竞争对手也没有停滞不前。三星的Exynos(猎户座)处理器相比其上一代产品就有很大提升,制程是8纳米。而真正的对手苹果当前的A11和A12架构在性能和效率方面仍然遥遥领先,Arm与它的差距大概是两代微架构。

图片来自ChipRebel

Cortex-A77概述

Cortex-A77直接继任了微架构A76意味着新的内核基本与先前的特性保持一致。Arm表示,内核是为厂商设计的,他们无需太费力就可以轻松升级芯片IP。

实际上,这意味着A77与其前身A76在架构上是一致的,仍然以ARMv8.2为CPU内核,并且与DSU(DynamIQSharedUnit)集群内部的Cortex-A55小CPU配对。

A77的缓存大小等基本配置特性与前身也没有太大区别:仍然是64KB的L1指令和数据缓存,以及或KB的L2缓存。有趣的是,Arm的确为基础设施NeoverseN1CPU内核(源自A76)设计了1MBL2缓存选项,但选择保留客户端(移动)CPUIP的较小配置选项。

作为A76的进化版,不论是从微架构还是从绝对性能的角度来看,A77的性能提升都没有预期中那样令人惊艳。

A77将还是采用7纳米制程,Arm宣布它的峰值目标频率与前身一样为3GHz。自然而然地,由于频率不会有太大变化,这意味内核的20%性能提升只能归因于IP的微架构变化。

为了实现IPC(Instructionsperclock)增益,Arm重新设计了微架构并引入了巧妙的新特性,总体上增强了CPUIP,从而实现了更宽、更高性能的设计。

Mali-G77:全新架构,机器学习性能提升60%

在年,全球游戏市场产值将高达近亿美元,这将是全球最大营收的市场之一。ARM昨天推出的新一代移动端GPU将承载其中与日俱增的计算需求。

Mali-G77采用了全新的Valhall架构,这是继上代Bifronst架构发布三年之后的又一次重大升级。在性能上,与上一代的Mali-G76GPU相比,Mali-G77具有近40%的性能提升。同时Mali-G77还在关键的微构架上进行强化,包括引擎、texturepipes和loadstorecaches,并将功耗效率以及性能密度均提升了30%。

除此之外,Mali-G77同时带来60%的机器学习性能提升,显著提升推理与神经网络性能,以支持更多的人工智能应用。新的芯片设计将为开发人员提供更大的发挥空间,为移动APP生态催生出更多的新形式交互体验。

Bifrost架构的最后一次迭代——Mali-G76,对Arm来说是一次重大的飞跃,其IP在很大程度上解决了前身的一些关键问题,为Exynos和麒麟芯片组带来了相对较好的结果。

但是,Arm在迎头追赶并努力解决Bifrost问题时,其对手也没有闲着。高通的AdrenoGPU架构已经引领移动领域好几年了。尽管今年的Adreno没有带来令人印象深刻的进步,但在性能、效率和密度方面,它仍然领先Arm。并且,苹果A12的GPU在性能、效率方面带来的绝对是一个重大飞跃,即使是高通最好的GPU也与之相去甚远,更不要说Arm的了。

ValhallGPU的第一次迭代即是Mali-G77,它实现了一些架构上和微架构的改进。

Arm承诺在能效和面积密度(在ISO性能和制程方面)方面会有30%的增益,而GPU上机器学习推理工作负载的性能会提升60%。

更有趣的是,Arm表示在即将到来的年底和年,SoC将预计比年的设备性能提升40%。下一代SoC将只有微小的制程节点改进,所以这里说的40%增益将主要来自Mali-G77GPU在架构和微架构上的飞跃。

神经网络处理器ARMML

人工智能正在成为便携设备中不可或缺的组成部分,拍照中的场景识别、增强现实中的物体识别都需要特殊的算力。面对目前不断出现的深度学习手机应用,ARM一直在主推「异构计算」方式:使用手机芯片中的CPU、GPU和ISP协同工作承担相应任务。

不过随着华为麒麟、苹果A系列芯片的成功,ARM也在着手开发自己的机器学习IP。年2月,这家公司公布了针对人工智能的计算芯片ProjectTrillium项目。本次ARM透露了自家「NPU」(神经网络处理单元)芯片的能力。

ARM表示,其最新的NPU可与CPU实现协同计算,提供高达两倍的能效(5TOPs/W),存储器压缩能力提升三倍。在与开源框架ARMNN共同使用的情况下,ARMNPU的八核版本可以提供高达32TOP/s的算力。

ARM的神经网络芯片设计作为一个可选项目,即使客户选择的A77设计中不含有该芯片,其手机仍然可以通过CPU、GPU等处理器完成机器学习计算。Haas表示,ARM的优化工作已大幅提升了深度学习框架的性能,特别是TensorFlow。

在活动中,ARM高管,产品事业群总裁ReneHaas也被问及了与华为合作的问题,他表示:目前与华为终止合作仍存在很多变数,目前无法透露太多细节。

ReneHaas在活动中。图片来自ettoday

ARM提供芯片架构设计,具体实现还需要各家厂商的努力。在年,我们或许就可以看到采用新一代设计处理器的手机上市了。

参考链接:

1
查看完整版本: ARM推出下一代旗舰芯片架构,GPU提升