一、前言:真正100%自研的新一代龙芯处理器
20年前,龙芯1号处理器面世,基于MIPS授权指令集。
2021年,龙芯中科发布了一款跨时代的产品,也就是龙芯3A5000处理器。
这款处理器采用了龙芯自主研发的LoongArch指令集,也就是龙架构,这也是中国历史上首个100%自研的芯片指令集,彻底摆脱了对国外厂商的依赖。
龙芯3A5000首次实现了从指令集、微构架到芯片设计的完全自研,是一款根红苗正的100%纯国产处理器。
不过在性能方面,龙芯3A5000与市面上主流的酷睿/锐龙处理器相比还有着非常明显的差距。
2023年8月,龙芯中科推出了龙芯3A6000处理器,这是龙芯第四代微架构的首款产品,基于12nm制程工艺制造,集成4个最新研发的高性能6发射64位LA664处理器核,核心频率2.5GHz,支持128位向量处理扩展指令(LSX)和256位高级向量处理扩展指令(LASX)。
与同样是12nm制程工艺、2.5GHz主频的龙芯3A5000相比,龙芯3A6000的单核性能提升了60%以上。
另外,龙芯3A6000处理器还加入了超线程技术,达到了4核心8线程,综合下来多核性能提升幅度超过了100%。
在性能上,这款处理器已经可以媲美Intel 10代酷睿和AMD Zen2处理器。
另外有一点不得不提,不同的芯片指令集在软件兼容性方面会存在一些问题,比如当年苹果从X86构架转向ARM的时候,导致MAC OS上大量的X86应用无法正常使用。
为了解决LoongArch指令集在软件兼容方面的问题,龙芯中科一方面与软件厂商合作,比如现在QQ、微信、WPS、钉钉、腾讯会议等大批常见的应用已经对LoongArch指令集做了适配。
另外一方面,龙芯团队利用二进制翻译技术,实现了LoongArch指令集对于MIPS、X86、ARM等主流构架的兼容,现在龙芯3A6000处理器就可以直接运行一些X86应用。
二、图赏:BGA整合于主板之上
龙芯3A6000处理器,LA664核心,采用的BGA封装直接焊接在主板上。
参与对比测试的还有Intel酷睿i3-10100F处理器和AMD锐龙3 3100处理器。
送测的龙芯主机配置为爱国者ES650电源、DDR4 3200MHz 8GBx2内存、大华C900 256GB SSD、铭影RX 580 8GB显卡。
致铭RX 580 8GB显卡。
拆掉CPU散热器。
三、SPEC CPU 2006与Stream测试:与i3-10100F互有胜负
1、SPEC CPU 2006
SPEC CPU 2006是一个大型的CPU性能测试项目,包含了12个整数性能测试项目,和17个浮点性能测试项目,每个子项目都单独评分,然后把各个子项的测试成绩进行几何平均得出总分。
SPEC CPU 2006的测试十分漫长,我们分别测试了几款处理器的单核与多核性能。
在SPEC CPU 2006浮点测试中,龙芯3A6000的单核分数为54.2,多核分数为142。
与上代的龙芯3A5000相比,单核与多核性能都实现了翻倍的提升。
与锐龙5 3100相比,龙芯3A6000在单核性能上有10%的差距,多核性能则有14%的差距,而锐龙5 3100的频率比龙芯3A6000高出了56%,就IPC性能(同样核心数、相同频率下的性能)而言,龙芯3A6000要更强一些。
酷睿i3-10100F的成绩有点意外,虽然核心频率高达4.0GHz,比龙芯3A6000高了60%,但其单核分数竟然比起龙芯还差了5%,多核性能也只强了6%。
在SPEC CPU 2006整数测试中,龙芯3A6000的单核分数为54.2,多核分数为142,对比龙芯3A5000分别大幅提升了76%、83%。
单核性能已经与锐龙5 3100、酷睿i3-10100F不相上下,多核性能差距也不大。
2、Stream测试
Stream是业界主流的内存带宽测试程序,、对CPU的计算能力要求很小,对CPU内存带宽压力很大。随着处理器核心数量的增大,而内存带宽并没有随之成线性增长,因此内存带宽对提升多核心的处理能力就越发重要。
虽然我们使用的是DDR4 3200MHz内存,但i3-10100F最高只能运行在2666MHz频率上,其多线程内存访问速度反而还不如龙芯3A6000,不过龙芯3A在单线程访问速度方面比起i3-10100F来还有比较大的差距。
四、UnixBench整机系统综合性能测试
UnixBench主要是测试一台电脑处理日常事务的效率,包括文本处理、浮点函数、文件读写、进程创建、管道通信、脚本执行等等。也就是说UnixBench并非只是单纯的CPU测试,而是测试系统的整机综合性能。
以下是龙芯3A6000的测试截图:
单核成绩2429分。
多核成绩为8824分。
首先与上代的龙芯3A5000对比,同样的2.5GHz频率,龙芯3A6000的单核性能提升幅度高达40%,在加入了超线程之后,多核性能提升幅度高达72%。
与i3-10010F相比,由于后者频率高达4.0GHz,多核性能较龙芯3A6000强了8%左右,单核性能则强了3%。要知道他们之间的频率可是相差了足足1.5GHz,由此可见龙芯3A6000的IPC性能并不弱于十代酷睿,甚至还要强上不少。
锐龙3 3100的情况与i3-10100F类似,其单核性能比龙芯3A6000强了3%,多核性能强了18%左右,考虑到它的频率高了1.4GHz,在IPC性能方面,依旧是龙芯3A6000要更强一些。
四、在线视频体验:4K30FPS零掉帧、4K60FPS轻微掉帧
1920*1080分辨率,视频帧率30FPS,码率5127Kbps,播放8501帧,CPU占用率5~10%,掉帧为0。
3840*2160分辨率,视频帧率30FPS,码率17019Kbps,播放33844帧,CPU占用率10%左右,0掉帧。
更换一个4K60FPS的视频,码率17074播放市场1000秒共59421帧,掉了17帧,CPU占用在10~20%之间跳动。
平均就是每60秒会掉一帧,也就是一分钟里面有59秒能够稳定60帧,剩下1秒掉到59帧,这个掉帧不会影响观影体验。
五、总结:IPC性能可以媲美13代酷睿 龙架构生态完善离不开大家的支持
在性能上,龙芯3A6000处理器相比上代的龙芯3A5000进步非常明显,实测单核性能提升60%以上,多核性能差不多有100%的提升,基本符合官方宣传的媲美Intel十代酷睿和AMD Zen2处理器。
在多项单线程性能测试中,龙芯3A6000处理器仅凭2.5GHz的频率就战胜了4.0GHz主频的i3-10100F处理器,多核性能的差距也在个位数。
这表明在IPC性能方面,龙芯3A6000处理器超出了i3-10100F至少30%以上,差不多可以媲美13代酷睿处理器。
在龙芯3A6000之后,明年还将会有8核心的3B6000、16核心的3C6000和32核心的3D6000,随着核心数的增加,他们在性能上将会更加靠近Intel主流的13代酷睿处理器产品。
在日常体验方面,龙芯3A6000处理器可以流畅播放1080P30帧、4K30帧高码率视频,在播放4K60帧视频时,也能做到极少掉帧,同时CPU占用率仅有10%左右,可以放心进行多任务处理。
至于不足之处,就是软件的兼容性了。虽然通过二进制翻译能让龙芯3A6000处理器运行一些其他指令集的软件,但是在效率和流畅度方面,和原生适配LoongArch指令集的应用比起来还是差了一些。
但随着龙芯处理器用户群逐步扩大,相信LoongArch软件生态会越来越完善,这也将形成未来会有更多用户购买龙芯产品这样一个良性循环。
原文标题 : 真正100%自研!龙芯3A6000评测:2.5GHz就与4GHz 10代酷睿互有胜负