David's random thoughts @david_random Channel on Telegram

David's random thoughts

@david_random


个人想法合集,主要同步来自Twitter (𝕏)、知乎、博客等账号发布的内容。可能包含一些直言不讳的评价,慎入。

个人博客:https://blog.hjc.im

David's random thoughts (Chinese)

如果您正在寻找一个充满随机想法和直言不讳评论的地方,那么@david_random就是您的理想选择!这个频道汇集了David的个人想法,可能会包含一些颇具启发性的见解和对各种话题的独特看法。作为一个真诚而坦率的频道,您可以期待在这里看到各种各样的话题,从生活琐事到全球时事,再到个人观点和情感体验。David不会害怕表达自己的想法,因此您可能会在这里找到一些独特而挑战性的观点,但正是这些观点使这个频道如此引人注目。无论您是想探索新观点,还是寻找一些奇思妙想,@david_random都能满足您的需求。加入我们,与David一起探讨各种话题,发现新的想法和见解!

David's random thoughts

20 Nov, 03:14


有趣的OS小细节:Linux使用4K页面并关闭THP时,由于内存映射粒度是页面所以无法触发Zen的TLB聚结,TLB覆盖范围是4K*entry。但Windows下由于粒度是64K所以可以正常观测到等效16K页面的TLB覆盖,未来理论上硬件还可无缝扩展至更大的64K。这也是近年来我见过的为数不多的Windows比Linux性能表现更好的地方

David's random thoughts

18 Nov, 09:26


Linux下nvidia和amdgpu有criu支持,不过我好像还没见过谁把它用在游戏图形应用上

https://www.zhihu.com/question/456048017/answer/34367726593

David's random thoughts

17 Nov, 13:24


补充一个Linux默认glibc malloc+更换16K page内核的成绩,520/523有一些提升,不过跟macOS还是差得远。

David's random thoughts

17 Nov, 09:30


图1: Linux vs macOS 默认malloc
图2: Linux vs macOS 统一jemalloc

均为手动拉满风扇。统一malloc必要性还是很大的,Linux在纯核心瓶颈的场景下表现略好,但是macOS libmalloc帮大忙让520 523绝杀。这个现象在M2上还不够明显,但是M3之后为了拉高频率大幅度放松L2时序,可能使得malloc的重要性增加。

David's random thoughts

17 Nov, 06:00


笑了,M4 Pro拿UTM/qemu开个linux虚拟机随手跑了下548结果发现比macOS host跑的还高

David's random thoughts

16 Nov, 16:21


M4 Pro跟自家3年前的M1 Max比,同样8线程运行SPEC int测试性能提升35.5%,如果算上核心数增长就达到了惊人的67.4%。

不过10大核版本的M4 Pro运行8线程测试并不会平衡到两个P cluster 4+4调度而是会先把一边填满形成5+3,所以可能会略低于同参数的8大核版本的分数。

David's random thoughts

16 Nov, 16:02


M4 Pro vs 9950X的同核心数的多核能效(开/关SMT)

David's random thoughts

15 Nov, 17:09


看了眼之前测的265K,感觉这代多核没必要带Intel玩了。

https://t.me/david_random/355

David's random thoughts

15 Nov, 16:42


M4 Pro的SPEC多核,核心功耗从25W到60W不等,package功耗不明。图1/2两个报告是纯大核的10线程和大小核14线程,分别略低于55W/88W package功耗的9950X。

比较亮眼的子项有gcc和mcf,这两项和内存带宽强相关所以AM5自然性能是一坨;比较差的子项有perlbench和xz以及古典AI三项,其中有几个比较喜欢SMT

David's random thoughts

15 Nov, 06:32


M4 Pro Geekbench 6.3 vs 6.2.2: https://browser.geekbench.com/v6/cpu/compare/8846063?baseline=8845664

其它成绩也更新在了GB个人主页。

David's random thoughts

13 Nov, 12:38


Apple统一内存适合运行LLM?理想很丰满,现实很骨感 https://blog.hjc.im/apple-uma-for-llms-problems.html

David's random thoughts

12 Nov, 13:42


今年测ARM处理器给我一个很不好的印象,就是频率极难跑满,仿佛整个Fmax就是专门给数码媒体玩干冰液氮刷分定制的一样。高通8E作为手机处理器也就算了,连Mac Mini都能在低温下分数足足高出一代,那到底该用哪个成绩呢?

我玩着玩着反正已经开始无比怀念当年M1 max不管怎么上强度都不降频的日子了。

David's random thoughts

12 Nov, 13:31


感觉Mac Mini常温下高性能模式的SPEC成绩就这样了,离低温测试的成绩略有一些差距

David's random thoughts

10 Nov, 10:16


受不了了,连续好几天听到路边外放短视频里面各种Trump相关内容。。。这么关心选举,是上海啥时候变成美国第五十一个州了吗?

David's random thoughts

09 Nov, 08:08


加入M4 Pro的测试成绩,感谢知乎网友 @计三水 的提供。
加入9800X3D默频与OC 5.7 GHz的成绩,正好可以拿来看看x86现在需要花多大代价才能在SPEC分数里摸到M4。

M4 Pro等我订的机器到货之后会做更多详细的分析。

https://blog.hjc.im/spec-cpu-2017