深度体验苹果M1 Max:王炸性能背后的逻辑

上个月,苹果正式发布了M1 Pro和M1 Max两个芯片,以及搭载这两个芯片的两款MacBook Pro笔记本。作为一个2015款MacBook Pro的老用户,这次的产品更新也是我一直希望的,芯片和笔记本都是,我也第一时间下单了。

今天的文章就来聊聊苹果M1 Pro & Max芯片,特别是它相比M1芯片做出的架构优化,以及它擅长与不擅长的事情都有哪些。关注我视频内容的朋友应该也看到,我做了一期视频专门介绍这个内容。不过在这篇文章里,我也会分享一些视频里没有提到的细节,以及我深度使用一个月的上手体验与购买建议。

 

1、M1 Pro & Max 的架构升级

事实上,我其实没想到苹果会在这次一口气发两个芯片。去年苹果M1发布的时候,我也和大家分享过,我不买的主要原因是内存太小了。所以这次我很期待会有64G版本的出现。

结果当时熬夜看发布会的时候,先发布了M1 Pro,然后它最多只支持32G内存,我当时心里就凉了,赶紧安慰自己说32G其实也够了。关于够不够这件事,文章后面会讨论。

接着负责苹果硬件技术的高级副总裁Johny Srouji话锋一转,说我们今天“会把极限推向新的高度,不仅推出一款、而是两款新芯片”,然后屏幕一黑,哗的一下出现了M1 Max。当时看得我鸡皮疙瘩都起来了。

然后的事情大家都知道了,发布了M1 Max,并且可以支持最高64GB内存。

如果说,M1的发布是从0到1的跨越,那么这次发布的M1 Pro和M1 Max应该是从1到5的提升。虽然不是开创性的,但是提升的幅度非常大。

去年的文章介绍过M1性能和功耗如此牛逼的三个主要原因,分别是5纳米工艺的加持、芯片架构的创新,还有最重要的,就是软硬件生态的协同优化。对于M1 Pro Max来说,这三点逻辑依然保持不变,但是在这个基础上又增加了很多芯片架构上的优化和提升,总结来说也有3点,分别是:内核数量的提升,内存带宽的提升,以及专用加速单元的提升。这些提升的目的非常非常的明确,苹果并不是要打造一个适合所有应用的巨无霸计算机,而是要造一个面向专业内容创作者的、远超市面上任何笔记本、甚至是台式机的机器。

这其实是一个非常重要的方法学与思维方式的转变。在很多传统的芯片设计里,技术和业务是分离的,这很容易造成做出来的产品解决不了问题,或者包含了很多不必要的东西,从而白白浪费了面积和功耗。

而苹果这次使用的方法,是把上面的过程反过来,根据应用来设计硬件和芯片架构,这就取得了性能和功耗的双重优化。从M1 Pro/Max身上,也可以看到很多DSA、也就是Domain Specific Architecture 领域专用架构的影子。

简单介绍一下这次的大小王芯片,它们都是片上系统SoC,也就是说在一个芯片里集成了CPU、GPU、神经网络引擎、视频编解码等等IP和模块单元。同时按照M1芯片的传统,它们也使用了统一内存架构,把内存和芯片主体封装在一起。

具体来说,小王M1 Pro最高支持10核CPU、16核GPU、16核神经网络引擎,以及最高32GB内存。大王M1 Max在这个基础上把GPU数量和内存容量都提升了一倍,最高支持32核GPU和64G内存。

可以看到,和M1芯片的8核CPU、8核GPU、最高支持16G内存相比,M1 Pro和M1 Max有着肉眼可见的提升。但值得注意的是,它们仍然采用了台积电的5纳米工艺,而且不管是性能核还是能效核,从架构来看和M1并没有区别,只是数量提升了。但这个提升也有点讲究,大小王采用了8+2的结构,也就是8个性能核、2个能效核,所以性能核相比M1就直接提升了1倍。

很有意思的是,M1 Pro/Max的这8个性能核分成了两组,每组有独立的12MB二级缓存,同时的四个内核还可以动态的工作。比如根据知名科技媒体Anandtech的数据,只开一个内核的时候,频率最高可以跑到3.2GHz,而4核同开的时候频率会降到3GHz左右。当然也可以一组只开一个内核,而另外一组全开。总之,这种架构非常的灵活,又不至于有过于精细、细粒度的调度机制。所以这其实也是在CPU架构设计的时候的一种折中和平衡。

图片来自Anandtech

 

事实上,M1 Pro/Max最大的提升其实并不在CPU和GPU,而是内存带宽。

M1 Pro采用了256位的LPDDR5内存,最高带宽可以达到204GB/s,远超过M1的68GB/s。而M1 Max直接又提升了一倍,把总线宽度提高到512位,内存带宽达到408GB/s。

这个数字是什么概念呢?之前英特尔架构日的文章里介绍过,英特尔当前技术的集大成者、用于下一代超算和云数据中心的GPU Ponte Vecchio,它的内存带宽是5TB/s。而M1 Pro Max这个消费级笔记本处理器的内存带宽是Ponte Vecchio的10分之一,晶体管数量是它的一半。这个就非常夸张了。虽然不能说苹果在笔记本里装了半个超算芯片,但是这个内存带宽在消费级CPU芯片里也是绝对前无古人的存在。

由于M1系列采用了统一内存架构,所以大幅降低了数据传输的延时。而且这么大的内存,这么高的内存带宽,并不专属于CPU或者GPU,芯片上的各个模块都可以快速访问并且共享内存,减少了很多数据搬运、拷贝的开销。

但是另外一方面,M1 Max能不能充分利用这400G的内存带宽还要打个问号。Anandtech的测试发现,M1 Max的CPU只能使用243G的带宽、GPU最多使用小100G,这样还剩下几十G的带宽空余。不过这个其实就引到了我们要说的第三个架构升级,那就是专用加速单元的提升。

在M1 Pro/Max里,共享内存带宽的还有很多硬件加速模块,最典型的就是神经网络引擎Neural Engine,以及这次专门加入的针对图形图像应用的硬件编解码模块。这个其实很好的提现了芯片设计“领域专用”的思想,也就是针对某个具体应用领域,进行专门的硬件优化,让专门的模块做专门的事情,而不是依赖通用的CPU或者GPU来完成。这样就能既大幅提升性能,又大幅降低功耗。

所以基于前面说的这些逻辑,M1 Pro/Max的CPU单核性能和M1几乎没有区别,但是多核性能有了质的飞跃,更是吊打市面上现有的其他移动端CPU。

别的厂商挤牙膏都是百分之几、百分之几的提升,而M1 Pro/Max上来就是几倍几倍的提升。比如根据苹果的数据,在同等功耗条件下M1 Pro Max的性能是某8核 PC笔记本处理器的1.7倍。在同样的性能要求下,M1 Pro Max的功耗只有PC芯片的70%。

这里插一句,去年发布M1的时候我吐槽过苹果的图太营销号了,没说对比的是谁,只能成为张三芯片,横纵坐标也没有。今年的发布这些都有改进,也用小字标明了这里比的是微星GP66,里面用的其实是英特尔的11代酷睿i7-11800H。这个就有点扎心了。

从跑分来看,M1Pro/Max的CPU多核性能、以及GPU性能都非常逆天,分数甚至超过了桌面级CPU 11900K和5800X,甚至逼近服务器CPU的性能。这些产品能放在一起比较,本身就说明M1 Pro Max已经赢了。而且不要忘了M1系列芯片有着极低的功耗,这样M1 ProMax的性能功耗比,就会远远高于任何同级别的竞争对手。

但是,正如在之前视频里说的,我们不可能单独的去买M1 ProMax芯片,而是需要购买苹果的整个生态系统,包括它的硬件、软件,还有它的服务和生态,这些才是真正的溢价和利润。

对于苹果来说,这不仅经济上有大利可图,技术上也有很大好处。因为这让苹果可以专注于自己生态的建设,而不需要各种跨平台、跨厂商的兼容和适配。这次推出的两个芯片和两个Macbook Pro笔记本电脑,就是为了专业用户量身打造的,特别是广大的视频和图形图像内容创作者,他们需要强大的视频处理能能力。这也是苹果往芯片里堆这么多GPU、堆这么多ProRes编解码单元的最主要原因。

至于很多非苹果用户常说的“游戏性能”,则是苹果战略“放弃”的领域。之所以打引号,是因为苹果并不是没有技术能力布局这个方向。事实上,在手游领域,不管是iphone还是ipad,它们的游戏性能都是行业顶级。

油管的知名博主Dave Lee也分析过,不管是游戏主机、还是Mac和Macbook游戏,都不是苹果感兴趣的领域。比如,传统的游戏主机厂商都不是靠主机本身挣钱,而是靠卖游戏挣钱。相比之下,苹果靠卖高溢价高利润的硬件和生态挣钱。此外,使用Mac的用户本来就是少数,他们中有多少人是游戏玩家更要打个问号。所以基于这两点原因,苹果干脆就放掉了主机和电脑游戏这个领域,而专攻内容创作这个更加广泛、专业、且购买力更强的市场。

 

2、上手体验

我不是数码博主,这个玩意就是我的生产力工具。我不买去年发布的Macbook Air和13寸Macbook Pro的主要原因,除了内存太小,还有就是不方便:接口太少,需要外接一个适配器,非常麻烦。

新Macbook Pro恢复了HDMI和SD卡插槽,这个绝对是刚需,特别是对于需要外接显示器和经常使用相机读写东西的人来说。其他硬件就不用多说了,键盘、屏幕、扬声器、电池,每个都是我用过的所有十几款Windows/Mac笔记本里最好的。我经常有这样的疑问,为什么苹果能做出这样细节极度优化的产品,而其他厂商不能?困难在什么地方?

至于中间那个刘海,虽然看起来很丑,但我在日常使用的时候几乎完全不会注意到。大部分应用在使用的时候上面都会有一个菜单栏,会很好的把这个刘海隐藏掉。

我觉得这次苹果做的非常好的一点,就是倾听了广大使用者的感受和反馈,虽然在很多人看来,好像苹果的设计语言又倒退回了几年前,但有的时候以退为进,专注于产品实用性的提升,特别是像这种专业级的产品,是很多人吃饭的家伙,所以好用比特立独行更为重要。

 

3、购买建议

如果你是专业用户,日常工作就需要大量处理视频图片音乐,特别是如果你用的主力软件是苹果生态的,比如我用的final cut pro等等,或者你从事很多苹果生态的软件开发和编译,那么这个机器绝对是性能猛兽。不过如果你是专业用户,应该也不需要我的购买建议。

如果你不是专业用户,我知道关注我的不少朋友都是学生,那么这个机器大概率不适合你。或者说,你可能用不到它这么强劲的性能。买个M1芯片的13寸macbook pro或者macbook air,也很香。

对于我来说,老石谈芯的全部内容都是基于我之前的2015款macbook pro。我从完全不会做视频的小白,到现在做了将近50期视频。从公众号的第一篇文章,到现在一百多篇原创文章,都是用我之前的那台Macbook Pro一个字一个字打出来的。

我用这个电脑开启了太多全新的机会,学到了太多东西,也创作了很多有价值的内容,所以它就是我最重要的生产力设备。但是我的老款电脑做视频的时候特效加多了就很卡、渲染时间很久,网页开多了风扇就呼呼直转,这就限制了我尝试更多的可能性、也限制了我创作更多的内容,这种感觉非常不爽。

我现在其实也并不需要64GB内存的机器,就像6年前我不需要16GB内存一样。但我很难保证,未来的某一天我是否有需要,就像我自己也不知道我会开始做视频一样。

我相信,有了这台机器,在今后的五年里,电脑不会是我创造力的制约,我也会用它创作更多更有意思的东西带给大家。

至于要不要等M2出来,我只能说:等等党,永不为奴!


更多芯片技术解读和资料分享,并与老石一对一交流,欢迎加入知识星球:“老石谈芯-进阶版”,一个关乎技术与观点的互动社区

 

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注