微星RTX 4070 SUPER 12G 魔龙姬显卡评测 定制背板玩法多
不久前NVIDIA发布了RTX 40 SUPER系列,共3张显卡,均为加量不加价或加量降价。下面为大家带来的是,个人认为该系列最值得购买的RTX 4070 SUPER——微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG显卡的评测。
目前本系列降价最多的RTX 4080 SUPER相比RTX 4080直降1400元,但考虑到其本身的定位,依然价格不菲,大概率只有发烧级玩家才会配备。
而今天评测的RTX 4070 SUPER,官方建议售价为4899元,仍在大部分3A游戏玩家的承受范围之内。而且在国内虽然它只比RTX 4070贵了100元,但性能堪称质的飞跃,具体相差有多大,下面我们直接看测试。
本次测试的显卡为微星最新推出的魔龙姬IP产品,相比其他系列更活泼,下面先来看看外观。
1 微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG概览
本次微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG(以下简称微星GeForce RTX 4070 SUPER 12G 魔龙姬)采用了该系列IP的独立包装,魔龙姬端坐于画面正中心,整体背景均为红色。
魔龙姬系列显卡在包装内不仅附赠了供电转接线以及显卡支架,还有魔龙姬的立绘贴纸和Q版的卡通贴纸,可以贴在机箱或其他摆件上。除此之外,还有一个魔龙姬金属背板,这个一会儿我们后面直接看效果。
下面先来看显卡本体,微星GeForce RTX 4070 SUPER 12G 魔龙姬的整体尺寸约为307×125×46mm,占用2槽空间,作为一款中高端产品来说,它的厚度控制的比较出色。
微星GeForce RTX 4070 SUPER 12G 魔龙姬的整体造型与原版的魔龙基本相同,导流罩均采用了不规则几何面覆盖,不过为了搭配魔龙姬这个原创的二次元IP,色调采用了魔焰红。
散热方面,微星GeForce RTX 4070 SUPER 12G 魔龙姬整体采用了TRI-FROZR 3散热模组。主动散热的风扇部分,采用刀锋7代风扇,它采用三组倾斜22度的扇叶连成环形,慢转速下也能保持高压气流。而在扇叶外侧,还新增了特殊构造风扇罩,大幅提高气流稳定性并能降低噪音。
内部散热微星GeForce RTX 4070 SUPER 12G 魔龙姬采用镀镍铜底座,紧密贴合GPU核心和显存颗粒,可将其产生的热量迅速传导到热管上。搭配特制的方形核心热管,进一步把热量传导至整个散热鳍片。
另外该显卡的散热鳍片采用交错的波浪形鳍片2.0,可快速引导气流导出,而升级后的导流板等设计优化了散热和安静之间的平衡。
微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡默认的背板,采用了常规的黑色一体式金属背板,从右侧镂空的进气格栅能看到大量散热鳍片以及热管。
不过作为魔龙姬IP产品,自然不会甘于那么朴素,包装内附赠的魔龙姬金属背板采用磁吸的方式,玩家只需把背板靠在显卡背面,即可自动贴合,方便快捷。
视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。从侧面可以看出微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡在该型号中,也算是相当轻薄的。
微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡侧面可以看到16pin供电接口,它的TDP功耗为245W,建议电源650W及以上。不过16pin接口可支持单路600W输出,这接口着实有点浪费。
另外使用微星的魔龙姬显卡,下载MSI Center后可以使用专属的主题UI,大家千万不要错过,又纯又欲的小魔龙可比那些死板的背景好看多了。
2 NVIDIA GeForce RTX 4070 SUPER 架构浅析
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了的760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。
本次发布的RTX 4070 SUPER共有7168个CUDA核心,提供了35.5-TFLOPS算力;56个第三代Ada RT Core拥有82.1 RT-TFLOPS;224个第四代Tensor Core可提供568 Tensor-TFLOPS(AI TOPS)。
RTX 4070 SUPER的L2 Cache容量为48MB,带宽为504 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。
在真正的GPU中,内核是所有计算发生的地方,而 这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。 然而由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张RTX 4070 SUPER更接近于RTX 4070 Ti,但功耗相比RTX 4070只提升了20W。
另外最主要的价格方面,相比RTX 4070的建议售价只贵了100元,下面我们直接看测试成绩。
3 测试平台简介
首先介绍一下测试平台,为了保障微星GeForce RTX 4070 SUPER 12G 魔龙姬的性能发挥,我们的平台采用了最新的i9-14900K。
下面还是来看看本次评测的显卡参数,目前最新的GPU-Z为2.57版本,参数识别较为详细。
微星GeForce RTX 4070 SUPER 12G 魔龙姬 拥有7168个CUDA,Boost频率为2640MHz,而公版为2475MHz,有较大提升。显存方面,12GB GDDR6X显存,位宽为192bit,显存带宽504 GB/s,光栅单元和纹理单元为80和224。
4 理论性能测试
本次测试微星GeForce RTX 4070 SUPER 12G 魔龙姬 主要对比它的上下型号,RTX 4070 Ti以及RTX 4070。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在FS测试中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070,其中FS提升17%;FSE提升18%;FUS提升25%,综合提升20%。对比RTX 4070 Ti,综合成绩相差4%左右。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相较RTX 4070的提升分别为:TS提升18%;TSE提升19%,综合约为19%。对比RTX 4070 Ti,综合成绩相差4%左右。
PortRoyal是3DMARK中专门针对光追性能的测试项,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相较RTX 4070的提升约为18%。对比RTX 4070 Ti,相差3%左右。
下面我们再来看看3DMARK中新增的一些具体应用场景的测试。
Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。
微星GeForce RTX 4070 SUPER 12G 魔龙姬 对比RTX 4070,从1080p分辨率到4K提升依次为:17%/18%/18%。
而对比RTX 4070 Ti的成绩几乎持平,差距不超过1%,整体来看,这张RTX 4070 SUPER基本有着媲美RTX 4070 Ti的性能。
在DLSS 3的理论测试中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 在2K分辨率下DLSS开关相比RTX 4070的提升为16%/20%;4K分辨率,提升约为16%/22%。
从整体的理论测试成绩来看,传统的FS/TS/PR三项测试,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070综合提升约为19%左右;相比RTX 4070 Ti的差距在3%左右,
不过在最新的SW综合测试中,这张RTX 4070 SUPER基本已经达到了RTX 4070 Ti的水准,下面我们在游戏中实际看看它的表现。
5 常规游戏 性能测试
由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。
在《极限竞速:地平线5》中,其中微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070提升明显,达到12%,2K分辨率提升15%;4K分辨率提升17%,综合提升15%。
在《刺客信条:幻景》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070的提升分别为:1080p提升8%;2K提升9%;4K提升13%,综合提升10%。
在《无主之地3》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070的提升分别为:1080p提升19%;2K提升16%;4K分辨率提升14%,综合提升16%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。
性能方面,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070的提升分别为:1080p提升18%;2K提升24%;4K提升26%,综合提升23%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
在《边境》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 相比RTX 4070的提升分别为:1080p提升17%;2K提升18%;4K提升19%,综合提升18%。
在“游戏测试标杆”的《赛博朋克2077》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬 在超级画质下,2K分辨率百帧完全没有问题的;在光追超级画质下2K流畅运行同样没有问题;而作为次世代光追体验的超速模式中,2K分辨率下只有52帧。
不过不必着急,上面我们的测试均为DLSS 2模式,尚未开启DLSS 3,下面在DLSS 3的专项测试中,能够看到帧数上的飞跃。
下面体会一下《赛博朋克2077》中不同的光影模式。
从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
另外《赛博朋克2077》更新了DLSS 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启RTX能够看出画质明显的区别,不再赘述。重点在于DLSS 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。
6 DLSS 3性能测试
截止目前,超过 500 款游戏和应用已支持 RTX 技术。
其中《龙之信条 2》、《灰区战争》、《半条命 2》RTX 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《Pax Dei》、《星际矿工》和《王权与自由》均支持 DLSS 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 DLSS 3 的支持,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。
本次DLSS 3增加了1% Low FPS和延迟的测试,1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。
本次我们分别对《赛博朋克2077》,在三档画质下进行了DLSS 3的帧数测试,所有档位均开启DLSS质量记录帧数。
可以看到在2K分辨率下,在是光追超速模式,开启DLSS 3后微星GeForce RTX 4070 SUPER 12G 魔龙姬 能达到80帧的成绩,已经是流畅运行标准。
另外DLSS 3技术主要针对于CPU瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中光追超速的1080p分辨率能够达到53%左右。
《星空》经历了首发后的低迷和差评,近期反响还不错,在1.8.86大版本更新后,加入了DLSS 3,这也让手持N卡的用户终于不用再开启FSR了,整体来看效果非常好。
其中1080p分辨率下DLSS 3相比DLSS 2提升达到62%;2K分辨率提升51%;4K分辨率提升42%。不难看出在越低的分辨率,也就是CPU瓶颈下,DLSS 3的帧生成加成越大。
虽然目前《星空》饱受批评的频繁读图依然没有修改,但至少使用N卡的用户,画面流畅度能够大幅提升了。
《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在微星GeForce RTX 4070 SUPER 12G 魔龙姬 也有较明显的体现。在3种分辨率中,开启DLSS 3相比DLSS 2的提升分别为39%/27%/10%。
最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升,几乎达到了不开DLSS无法流畅游戏的地步。其中微星GeForce RTX 4070 SUPER 12G 魔龙姬 开启DLSS 3相比关闭DLSS,提升达到了129%;相比DLSS 2的提升也达到了47%。
7 生产力工具测试
V-Ray
在生产力工具上,我们测试了最新版本的V-Ray渲染器,选择使用GPU渲染的CUDA测试和RTX测试,成绩如图。
Blender
Blender是一款专业的三维渲染软件,目前推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。软件会自动渲染测试monster/junkshop/classroom共三个场景。
上图为微星GeForce RTX 4070 SUPER 12G 魔龙姬 显卡得分,分别为3328/1561/1664分,平均2184分。
D5渲染器
D5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。 目前也已经支持DLSS 3,下面我们分别看看帧数和功耗的情况。
选择软件自带的默认场景【简约客厅】
在实时帧数表现上,由于D5采用实时GPU渲染,所以压力全在显卡。可以看到在4K分辨率下,微星GeForce RTX 4070 SUPER 12G 魔龙姬 是PPT的状态,而开启DLSS 3后,帧数提升可达到462%左右,非常暴力。
功耗方面,微星GeForce RTX 4070 SUPER 12G 魔龙姬 的TDP为245W。关闭DLSS的情况下,实际平均使用功耗为208W,而在开启DLSS 3后,功耗仅有170W。更低的功耗,更高的帧数,可以说DLSS 3不仅对于游戏玩家有非常大的帮助,对于内容创作者来说,也是1+1>2的效果。
8 AIGC测试
AI时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力,不过目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力,下面我们来测试一下微星GeForce RTX 4070 SUPER 12G 魔龙姬 在这方面的性能表现。
【注:所有测试默认开启xformers优化方案】
首先是较为基础的SD1.5模型测试,在SD1.5中模型的输出分辨率为512×512和768×768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。
根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Euler a;采样步骤:50;Batch Count:10
【默认SD1.5模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 40.6s 约合 4.06秒一张图
【TRT SD1.5模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 31.3s 约合 3.13秒一张图
第二次测试为的SDXL模型测试,SDXL模型将在1024×1024分辨率进行训练,相比SD1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。
我们按照相同的参数进行设置,但尺寸规定为1024×1024,下面看看微星GeForce RTX 4070 SUPER 12G 魔龙姬 的表现如何。
【默认SDXL模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 2m49.2s 约合 16.92秒一张图
【TRT SDXL模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 1m47.1s 约合 10.71秒一张图
在更复杂的模型中,TensorRT引擎的优势愈发明显,单张图片的出图速度能够提高6秒左右。并且显存利用达到了100%,跑满12GB显存。
生成式AI在2023年初露端倪,2024年将迎来彻底爆发,虽然帮助最大的依然是内容创作者,但对于普通用户来说,他也可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。
9 RTX 视频超分辨率(RTX Video Super Resolution)测试
目前RTX 视频超分辨率(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。
RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启RTX 视频超分辨率不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。
我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
(点击放大查看原图)
在下面这幅图的对比中,可以明显看到开启RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。
不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2K以上,则基本很难看出区别。
这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。
10 温度及功耗测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
可以看到微星GeForce RTX 4070 SUPER 12G 魔龙姬 这张显卡但通过20分钟左右的拷机测试,温度在68℃左右,热点温度在78℃左右,显存温度为62℃。
游戏动态功耗测试
本次我们在拷机测试中最大板载功耗为245W左右。不过由于不同游戏负载不同,GPU的实际功耗是动态变化的,类似于FPS随时间的变化,RTX 40系列很难触及功耗墙。
微星GeForce RTX 4070 SUPER 12G 魔龙姬 3A游戏平均功耗
RTX 3070 Ti 3A游戏平均功耗
在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、DLSS质量、2K分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。
可以看到微星GeForce RTX 4070 SUPER 12G 魔龙姬 平均功耗为223W,而RTX 3070 Ti甚至达到了288W,低了65W。
游戏平均220W的功耗,对于长时间使用电脑的用户来说,确实能够有效降低电费,尤其是在南方,这种电费奇高的地区。同时对比上一代同级别产品有大幅下降,可以说RTX 40系显卡拥有更低功耗和更高的性能。
11 魔龙姬定制背板 玩法多
通篇测试下来,相信大家已经对微星GeForce RTX 4070 SUPER 12G 魔龙姬 性能有了大概的掌握。可以说本次SUPER系列依然是加量不加价,这一点与RTX 20系非常相似。
从产品定位来说,RTX 4070 SUPER在性能上几乎与RTX 4070 Ti持平,可以说这次SUPER系列的推出,将RTX 40系中高端显卡完全提升了一个等级。
综合性能方面,公版RTX 4070 SUPER相比RTX 4070提升在15-20%左右,与RTX 4070 Ti的差距在5%左右。而微星GeForce RTX 4070 SUPER 12G 魔龙姬作为OC版显卡,进一步将这一差距缩小到了3%左右。
虽然RTX 4070 SUPER它定位2K分辨率的高帧光追游戏,但不管是日常网游、独立游戏,或是传统3A游戏,在4K分辨率下都能够达到流畅甚至电竞级水准。
以目前RTX 40系发布的这些显卡来说,RTX 4070 SUPER是堪称完美平衡的一款显卡,不仅在3A游戏玩家中,又多了一个2K高性能游戏体验的显卡,对于内容创作,RTX 4070 SUPER也同样得心应手。
它搭配了12GB显存,拥有568 TOPS AI算力,尤其在搭配了TensroRT插件后,SDXL这种大模型的单张图片,较原先生成速度快了38%左右。而且生成图片也只是AIGC的基础玩法,随着OpenAI发布的Sora大模型逐渐成熟应用,相信中高端显卡仍会再次成为抢手货。
本次测试的微星GeForce RTX 4070 SUPER 12G 魔龙姬虽然不是该系列显卡的首秀,但魔龙姬作为可替换背板出现还是首次,相信微星也正在摸索该系列的各种玩法。目前这张显卡在微星旗舰店有售,感兴趣玩家不妨前去了解一下。
微星(MSI)魔龙 GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG 电竞游戏设计智能学习黑神话:悟空显卡 ¥ 5499 京东 购买