m3 max 和 13900k cpu 性能的简单对比

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 669 天前的主题，其中的信息可能已经有所发展或是发生改变。

测试项目是编译 clickhouse 。

windows11 23H2 ，13900k + 64GB 内存 + 2T ，是在 wsl2 里面编译的，我网上搜了下说 wsl2 的 cpu 性能损耗大概在百分之二左右，测试结果如下： ClickHouse Compilation Time.png

Mac os 14.2 ，M3 Max + 128G + 2T ，测试结果如下：

各位只需要关注最后面的 cpu total 时间就行了。

13900k 之所以这么慢，我猜测主要是有两个原因：

13900k 有 32 个逻辑核心，但从结果来看只用到 16 个核心；
得益于 clang 和苹果的关系，clang 肯定在 mac os 下有特殊优化。

测试不严谨，各位权当看个乐好了。

第 1 条附言 · 2023-12-14 10:28:00 +08:00

说明一下，我平常上班用的就是上面测试中的 Mac ，下班回来用的是上面测试中的 windows+wsl2 ，所以上面的测试结果非常的“个人化”，但是从最终结果来看，对我（或者类似使用似场景的人）也是非常的有意义。

86 条回复 • 2024-05-18 14:58:34 +08:00

NatureSpirit

2023-12-14 09:46:04 +08:00

Intel 这几年一直很拉胯。
等憋大招吧。

希望 amd 和苹果越来越好，有竞争，舒服的用户

biglion666

2023-12-14 09:47:24 +08:00

wsl io 烂的一笔。。。。

noErr

2023-12-14 09:49:56 +08:00

12535 vs 9496 是什么情况

Cyshall

2023-12-14 09:56:49 +08:00

@biglion666 代码文件在 wsl2 文件系统里面，不是在 windows 系统下面。

avalon8

2023-12-14 09:59:10 +08:00

直接把 win 机器装上 linux 效果会不会好一些

kneo

2023-12-14 10:01:08 +08:00 via Android

CPU 型号不同，指令集不同，内存不同，硬盘不同，操作系统不同，隔离环境不同，编译的 target 不同。真不知道最后比较个啥……

wsl 标称的性能损失应该只是机器码指令的执行性能。但是系统调用特别是 io 这方面，最终在代码层面多干了不少事，损失很多。就你这个结果来说，不奇怪。但毕竟你这个测试太不严谨，证明不了什么问题。

chenjiangui998

2023-12-14 10:18:14 +08:00

@biglion666 wsl2 的 io 和实体 linux 是一样的, 除非你跨系统

ttvast

2023-12-14 10:18:26 +08:00

不严谨的测试，除了黑，哪来的乐子？

chenjiangui998

2023-12-14 10:18:38 +08:00

@avalon8 不会, 我测试过, 基本一样

Cyshall

2023-12-14 10:20:14 +08:00

@ttvast 这结果是我自己的机器跑出来真实结果，黑啥了？

beimenjun

PRO

2023-12-14 10:26:43 +08:00

其实也可以看 GeekBench 平均值附近的结果，M3 Pro 16 核 Clang 得分是 3W8 左右，13900K 得分是 4W1-4W8

理论上应该还是 13900K 要更强的。

airqj

2023-12-14 10:28:22 +08:00 via Android

装上 linux 再测试看看吧

blackeeper

2023-12-14 10:28:57 +08:00

一个是 12535 ，一个是 9496 ，这是啥情况

xtreme1

2023-12-14 10:35:05 +08:00

根据我自己的经验... wsl2 会经常被调度到小核上去
op 可以编译时开个任务管理器监控一下

forgetlight

2023-12-14 10:38:11 +08:00

和我的实际体验确实也是差不多的.. 之前有几个机器人位姿优化的 c++的 base, 在 m1 pro 在 pd 下都比我的 12900k 快...

Cyshall

2023-12-14 10:38:42 +08:00

@xtreme1 可以的，我下班回看再跑一遍看看。

murmur

2023-12-14 10:40:34 +08:00

13900k 有 32 个逻辑核心，但从结果来看只用到 16 个核心；
那不是用 13700 差不多就可以了？

murmur

2023-12-14 10:41:21 +08:00

@Cyshall 128g+2t ，这个价格差价能配一台新 windows 电脑出来了，不考虑价格的性能比较不是黑是啥。。。

Cyshall

2023-12-14 11:01:07 +08:00

@murmur #18 捏造事实叫才叫黑啊，但是我没有阿。

ntedshen

2023-12-14 11:07:42 +08:00

1618%。。。16 线程多一点
13900k8 大核 16 小核合计 32 个线程。。。

也就是说 13900k 在仅出力一半而且有性能损耗甚至 build 对象多了三分之一的情况下就能和 m3max 打成了 2：3 。。。

kanepan19

2023-12-14 11:10:59 +08:00

两边都装虚拟机，设置相同核心数，测一个呗。

bjfane

PRO

2023-12-14 11:17:00 +08:00

我之前有简单测试过 nodejs 的个人自用项目，
12700 64G 3200 频率的 win11 和 m2max 的 mac studio
大致结论是：
1 ，win11 下最慢，
2 ，wsl 下中
3 ，mac studio 最快
非严格测试。

oxromantic

2023-12-14 11:24:41 +08:00

建议两个平台都用 vm linux 测试比较，这样只有架构差异，专治嘴硬

ShadowPower

2023-12-14 11:31:28 +08:00

有一个变量没控制好，就是编译输出的目标平台
编译到 x86 和编译到 arm ，它们不是相同的任务

fgodt

2023-12-14 11:42:21 +08:00

12535 vs 9496 两边编译的文件数量不一样

Huelse

2023-12-14 11:46:51 +08:00

你这个结果会误导人，如果不是在 v2 已经有一大批人相信你的结论了，所以会有人说你有黑的嫌疑，而不是给自己加个个性化的条件就与己无关了。

lostberryzz

2023-12-14 11:47:09 +08:00

楼主你惹怒了果黑...

AllenTsui

2023-12-14 11:54:27 +08:00

只有我羡慕 OP 好有钱吗

ysc3839

2023-12-14 12:12:06 +08:00 via Android

这个估计是 Intel 大小核的问题，应该加个 AMD 7950X 对比

Nazz

2023-12-14 12:14:54 +08:00 via Android

苹果编译速度确实快，不仅仅是 clang, go 和 java 都是如此

Philippa

2023-12-14 12:15:37 +08:00 via iPhone

应该用 7950x3D 来比较，大缓存会加速编译。另外别用 windows ，用 linux 。另外别编一天，arm 和 x86 编译过程是不一样的。最后 pc 端的内存应该超频，毕竟这是常规了。

Lanayaaa

2023-12-14 12:23:14 +08:00

好歹也用 13900k 装个黑苹果试试吧，就 cpu 的性能来说，在不同的平台的测试结果能说明什么吗？

errZX

2023-12-14 12:31:24 +08:00 via Android

还好我手里的项目不是你来提需求

F281M6Dh8DXpD1g2

2023-12-14 12:32:27 +08:00 via iPhone

Intel fanboy 真多

Cyshall

2023-12-14 12:35:15 +08:00 via Android

@blackeepe 一个是 Mac arm ，一个是 Linux x86 可能是架构不一样导致的实现不一样，所以文件文件数量不一样。

Cyshall

2023-12-14 12:42:16 +08:00

@Huelse 就这么几十个字，但凡看完也不至于说我在黑，而且我还解释了 wintel 慢的可能原因。

huyomi

2023-12-14 13:00:21 +08:00

不懂就问，编译和 io 也有很大关系，wsl2 下的虚拟盘，io 性能会较低吗？

cnbatch

2023-12-14 13:14:18 +08:00

这么对比就不可靠了，文件数量相差三千多，这本身的任务量差距就很大。
最起码的，编译的文件数量要相同。最好是编译的文件完全一样，这样才有意义。

DICK23

2023-12-14 13:50:58 +08:00

想看 13900k 在黑果下的性能表现

zacard

2023-12-14 14:03:07 +08:00

这配置是真羡慕了

mjikop1231

2023-12-14 14:08:36 +08:00

为什么对比 CPU 性能是去跑编译算 CPU 时间啊。。。
这不该正经跑点基准么？通用内存在编译场景下的表现的那不比牙膏厂的小缓存高多了

Cyshall

2023-12-14 14:11:18 +08:00

@mjikop1231 普通用户，刚好有设备就顺手跑了一下，没必要太正经。

saturn7

2023-12-14 14:29:11 +08:00

WSL1/2 挂磁盘来用写 web 开发还能凑合，写 C++与 Rust 项目用 Linux IO 对比一下，WSL2 IO 性能烂到天际，根本是不可用的东西。

Edward5937

2023-12-14 14:59:34 +08:00

一般程序上遇到的性能问题瓶颈都是 io ，wsl 同样

wwthappy

2023-12-14 15:10:14 +08:00

确实对于类似使用似场景的人是有意义的。编译是个 cpu 和 IO 密集型的任务，wsl2 还是需要 drvfs 去转换 IO 到 ntfs ，带来的损失在这种场景下是不能忽略的，肯定跟 macos 的原生文件系统有差距。

shimanooo

2023-12-14 15:24:01 +08:00

大冬天的，M3 这种几十 W 的能用吗？
13900K 400W 暖风机不香吗，老寒腿都治好了。

M3 开春再说（逃

zouywx86

2023-12-14 15:29:34 +08:00

没懂怎么有人会对这个结果激动？
我看标题和写的内容，也没啥过激的情况，而且 OP 也特别提到了，这是他日常使用的 2 台机器，只是做个日常使用对比而已。

hobbitlhy

2023-12-14 15:47:47 +08:00

和我日常感觉一样，mac 上编译项目比我 windows 台式机要快

Cyshall

2023-12-14 16:04:20 +08:00

@shimanooo 真的，13900K + 4090 + 4k 160 显示器，打开大型 3A 游戏，画质拉满，分辨率拉到 4k ，运行半个小时左右，机箱周围要高 4 度左右。

q447643445

2023-12-14 16:13:03 +08:00

这种东西自己知道就好放出来只会能让一部分人不适
这还是在 V2 放其他地方早就开始成群结队哄堂大笑了
最终就是引战

TOM2333

2023-12-14 16:13:17 +08:00 via iPhone

楼主，输出的二进制文件不一样也能比的吗

TOM2333

2023-12-14 16:13:48 +08:00 via iPhone

@TOM2333 说错了，输出的文件是一样的吗

xigins

2023-12-14 16:34:02 +08:00

m3 的内存延迟比 intel 快太多，一个是芯片内访存，一个要在主板上绕一圈，，，

bluearc

2023-12-14 16:56:56 +08:00

其实结果并不意外吧，毕竟 m3 max 的规格比 i9 高很多，内存延迟也低些，即使严格条件下 m3 max 也应该好点

Cyshall

2023-12-14 17:26:38 +08:00 via Android

@TOM2333 额，首先一个 mac os arm 系统，一个 Linux x86 系统，编译出来的文件肯定不一样，但这属于显而易见的事情，所以有点不明白你的意思。

enihcam

2023-12-14 19:18:01 +08:00

制品链接很耗内存。

sunfall

2023-12-14 20:18:07 +08:00

@kneo 编译器不同，编译文件个数不同，编译的源码版本可能不同，内存大小不同。
看个乐子吧

SekiBetu

2023-12-14 20:22:32 +08:00

测试很有意义，希望苹果赶紧支持 windows 系统的安装，我已经忍不住了

yanqiyu

2023-12-14 20:25:45 +08:00

@Cyshall 就生成 arm 下的二进制和生成 x86 的二进制的工作量显然是不同的，作为性能比较最好编译到相同的目标

ly841000

2023-12-14 20:54:22 +08:00

@Cyshall #55 编译器中，x86 的优化器和 arm 的优化器完全不是一个水平的，x86 优化器进化了这么多年，相当相当复杂了

laminux29

2023-12-14 21:55:02 +08:00

13900k 只用了一半核，就能和 M3 平分秋色了。

买 M3 的人真惨。

YsHaNg

2023-12-14 22:44:29 +08:00

@wwthappy 放 wsl2 ext 文件树里跟 ntfs 有什么关系

lindt99cocoa

2023-12-14 23:48:26 +08:00

如果 LZ 的工作就是基于 clickhouse 做二次开发，那我认为这个比较没问题，在这种使用场景下确实 Mac 具有更好的体验。如果是原生环境，我相信 13900k 的表现不会这么拉垮，但可惜 clickhouse 不支持 Windows 开发，而 Linux 桌面的使用体验只能说差强人意。不过这个对比也可以从侧面说明 wsl 并不是最好的 Linux 发行版

Granthese

2023-12-14 23:53:13 +08:00

https://www.reddit.com/r/rust/s/C0TF99l2xM
13900KF 19.39s
M3 Max 18.05s

Granthese

2023-12-14 23:53:55 +08:00

@Granthese 13900KF *29.39s

MrKrabs

2023-12-15 00:54:50 +08:00

这帖子就叫做真相真的是很伤人

tairan2006

2023-12-15 08:54:46 +08:00

你这测试一点不科学啊。。图一乐

ShadowPower

2023-12-15 10:21:52 +08:00

@YsHaNg 当然有关系，实际上是 NTFS 上的 VHDX 文件里的 EXT4 文件系统。
大多数虚拟机的运算性能其实都不错，不过虚拟机的 IO 性能就没那么好了。

WSL2 还有另一种情况，把整个物理硬盘挂在到 WSL 里面。这样会好不少。

HangoX

2023-12-15 10:24:55 +08:00

m3 max ,我好羡慕，m3 max 128G 的价格太贵了。。intel 的 128G 只要不要 1w
虽然我觉得 intel 的 cpu 真的很垃圾，那个 200w 的 i7 13700k 和我的 m1 max 差不多，但是扛不住人家内存大

Cyshall

2023-12-15 11:08:25 +08:00

@laminux29 第一句话没问题，13900k 的绝对性能肯定不差，但是大部分软件根本无法利用好这么多核心，所以就结果来看，M3 Max 更胜一筹。

laminux29

2023-12-15 15:45:51 +08:00

@Cyshall

这是软件的问题，这不是 CPU 的问题。不要本末倒置。

如果真要比，应该拿那种能跑满所有核的专业跑分软件，在双方都是顶配的情况下，来进行测评。

ShadowPower

2023-12-15 18:37:01 +08:00 via Android

@Cyshall 大多数真吃性能的专业软件还真能最大限度地利用每一个核心……
日常生活中碰到的无法充分利用多核的场景反而是游戏。

上面的有个链接里的帖子其实还给了一组数据，同一台电脑，不同系统：
Asus G15 | 6900HS | Ubuntu 22.04: 1m 20s
Asus G15 | 6900HS | Windows Native: 1m 08s
Asus G15 | 6900HS | WSL-Ubuntu 22.04: 2m 08s

造成 Windows 和 Linux 下的差距的原因，是两个平台下编译的代码内容其实也不相同。有些代码分支或者依赖只用于某个平台。

如果算上编译输出 x86 和 ARM 指令集的差异，不相同的地方更多了。

除此以外还有编译器实现的差异。

这种对比，其实只能说明特定软件用某个编译器，在特定平台编译到特定目标所需要的时间，无法得出一个适用于其他场景的通用结论。

squarefong17

2023-12-16 04:12:34 +08:00

7945HX ，64G+2T ，archlinux ，顺手跑了一下 clickhouse 的编译，clone 最新主线之后直接 cmake 然后 ninja -j 32 ，忘了加 time ，有没精确到秒，不过大约从 3:15 开始到 4:41 ，大概二十六分钟的样子完成。

标题是 m3 max 和 13900K 的对比，实际负载一个跑在实体，一个在虚拟机，这对比本身已经比较离谱了，怨不得别人说你黑。我这个跑分只能跟不超频的 12900K 打的 7945hx 都能 26 分钟编完，我这内存频率还算比较低的，13900K 得接近 40 分钟？多花了 50%以上的时间？显然你的打开方式没能吃满性能，跟 clang 没啥关系，C/C++的编译器多核优化都不错的，你就算拿 64 核的 7995wx 来测，时间消耗的差距不说是线性的，快一两倍总还是有的。如果你坚持 wsl 来编译，当然测试结果对你有意义，但是这不是这两款 CPU 的性能对比。

最后，clang 再怎么跟苹果有优化也不至于这么离谱，更何况 geekbench 测试中直接就有 clang 子项，这对于性能估算十分具有参考价值。geekbench 还是被人戏称为 applebench 的跑分软件，在这个软件的跑分中，m3 max 和 13900K 的 clang 子项都没什么明显的差距，都在 4 万分左右。你这个 i9 的编译速度，大概率是别的原因，不是 clang 的原因。

Cyshall

2023-12-17 01:42:17 +08:00

@squarefong17 我今天又用 wintel 跑了两次，快了三四分钟吧，cpu 方面就刚开始的时候会 32 核心吃满，后面就只能吃到一半核心的样子，不知道是不是 wsl2 的问题，你编译的时候全程 32 个核心吃满了吗？

squarefong17

2023-12-17 03:55:17 +08:00

@Cyshall 我这后半段也有好长时间没吃满 32 线程。这一段似乎什么 asm 的编译？

annieguo

2024-01-28 23:00:27 +08:00

ubuntu 下编译能吃满：
[12728/12728] Stripping clickhouse binary
ninja 44531.85s user 2145.34s system 3157% cpu 24:38.12 total

annieguo

2024-01-28 23:46:05 +08:00

补一下我的配置和环境，机器是 nuc13 extreme ，13900k + 96g ，ubuntu 22.04 ，llvm17 。nuc 的性能相比同配置的台式机会略弱一点。

指令：
cmake -S . -B build
time cmake --build build -j 32

结果：
[12728/12728] Stripping clickhouse binary
cmake --build build -j 32 44499.11s user 2132.85s system 3160% cpu 24:35.45 total

Cyshall

2024-01-29 09:45:13 +08:00

@annieguo #77 你的 nuc13 是拿来当服务器用的吗？待机功耗大概多少哦？

annieguo

2024-02-10 11:08:51 +08:00 via Android

@Cyshall 是的，待机差不多 30-50w 之间。nuc13 最高 250w ，然后我在 bios 里面设置了 pl1 持续 192s ，之后功耗限制在 200w （放在隔壁，冬天不开空调，温度在 80 度左右）

Cyshall

2024-02-12 16:38:22 +08:00

@annieguo 你这里的 80 度是 cpu 满负载的情况吗？

s1461a

2024-05-17 15:51:38 +08:00

@kneo 为啥要管指令集内存硬盘，mac 和 win 都是开发使用，直接测试自己开发环境情况下哪个更有效率才是目的

kneo

2024-05-17 21:41:59 +08:00 via Android

@s1461a 作为一个苹果用户，说出“我不管”没问题。但是作为一个程序员，这么说我认为是挺没面子的。

s1461a

2024-05-18 12:37:32 +08:00

@kneo 不结合实际情况，而单纯考虑跑分更是不负责任的。

kneo

2024-05-18 12:43:10 +08:00 via Android

@s1461a 啊？不结合实际情况？你说的是前面那个“为啥要管指令集内存硬盘”这种人？

s1461a

2024-05-18 13:16:45 +08:00

@kneo 实际情况表达有误，是实际使用情况。楼主使用 windows+wsl2 和 macbook 对比，然后得出了再 clang 下使用效率。你在意的是两个 cpu 内部哪个更优秀，我在意的是我用 win+wsl2 台式和 macbook 日常使用差距多大。更像是你抛弃了系统对软件的优化，从这个角度而已，你只是在关心硬件，但使用电脑工作不仅仅只是硬件，你能脱离系统跑软件？

kneo

2024-05-18 14:58:34 +08:00 via Android

@s1461a

首先，你说你在意的是“win+wsl2”和“macbook”，但是 op 标题写的是“CPU 对比”。先搞清楚别人在讨论什么。

如果你说自己在比较特定型号机器，在特定运行环境下，执行特定任务的结果，并且，你只在乎这个任务的结果，OK 。

但凡这些条件你换一个，比如同样的运行环境比较，你并非运行 clang 执行编译任务，而是使用 nodejs 运行一个 web 服务器，这个比较结果就没有参考意义。

你说别人在乎“硬件参数”这有点离谱了。我只是指出方法中的问题。我在意的的是科学的思路，工程的方法，然后对海量信息垃圾进行一个标记。难道和我不同，你在这里得到了什么结论？你口中的“系统对软件的优化”，请问哪个系统对哪个软件有优化？证据是什么？技术是什么？别给我整一句“macbook 系统对日常开发使用有优化”，那我可要笑死了。

最后，我不知道你哪冒出来的，逮个人就一口一句“我在意的是”“我在意的是”，是你自己跑过来挖坟的，没人在意你在意什么。有效信息才会被别人在意。op 和你的回复，都不是有效信息。特此标记，恕不回复。