耕升 GeForce RTX 5050 追风 OC显卡评测:DLSS 4畅享3A,入门级显卡新选

   2025-07-27 kongyu700
核心提示:写在开头就在前几天,NVIDIA终于正式发布了RTX 50系的最后一张显卡——GeForce RTX 5050,包括台式机和笔记本显卡版本。这对于玩

写在开头

就在前几天,NVIDIA终于正式发布了RTX 50系的最后一张显卡——GeForce RTX 5050,包括台式机和笔记本显卡版本。这对于玩家来说,这确实是个好消息,毕竟上一代RTX 40系的桌面端显卡并没有真正的入门级显卡,仅笔记本端推出了RTX 4050,而上一张桌面端入门级还得追溯到三年前的RTX 3050,但它的性能放在今天,显然是有点力不从心了。

图片

而这次发布的GeForce RTX 5050显卡则延续了前面几位RTX 50系老大哥的规格,搭载了服务器级别的Blackwell架构、还带来了DLSS 4、Reflex 2等黑科技,整体性能表现还是非常值得期待的。正好,我们最近上手了耕升最新推出的GeForce RTX 5050追风OC 8GB显卡,下面就给大家看看这款显卡的性能表现吧!

规格介绍

开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更逼真的渲染方式,带给玩家全新的游戏体验。

图片

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新以及划时代的神经网络渲染。

第五代Tensor核心

其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor Core,新一代Tensor核心添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。

图片

图片

第四代RT核心

而光线追踪技术的革新则仰赖于第四代RT Core的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

图片

综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada Lovelace架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。

图片

第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。

该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。

图片

另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。

图片

神经网络着色器

接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。

图片

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。

这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

图片

目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。

图片

而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。

图片

另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。

图片

这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。

图片

先进的AI管理处理器

此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。

图片

而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。

图片

GeForce RTX 5050 8GB规格

说了这么多,接下来给大家介绍一下GeForce RTX 5050 8GB的硬件规格,不同于两张60级别的显卡,它的核心采用了新的GB207芯片,核心代号为GB207-300-A1。在架构上拥有2个GPC,GeForce RTX 5050 8GB上总共集成了10个TPC,20个SM单元,80个TMUs纹理单元,32个ROPs光栅化处理单元以及2560个CUDA核心。

图片

在工艺制程方面,新的GB207芯片沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。内部晶体管数量为169亿,晶体管数量对比RTX 3050的话,整整提升了28%。基础频率与Boost频率也大幅上升,由RTX 3050的1552MHz与1770MHz提升至现在的2317MHz以及2572MHz,甚至比RTX 4060还要高一些。除此之外,PCIe总线也更新为PCIe 5.0×8标准,能够带来更高的传输速率。

图片

最后一点区别就是售价了,全新上市的GeForce RTX 5050 8GB MSRP版本官方建议零售价为2099元,对比之前的GeForce RTX 3050 8GB稍微提升了200元,对比同代的RTX 5060则是便宜了400元。这个定价对于预算有限,但又想体验最新DLSS 4的玩家来说还是相当给力的。

显卡外观赏析

接着我们来个开箱,首先是耕升GeForce RTX 5050追风OC 8GB的外包装,黑色主色调搭配醒目的紫色图案,整体视觉效果更加年轻化。

图片

包装右下角很醒目标注了型号“GEFORCE RTX 5050”。

图片

包装左下角则标注了这款显卡的显存容量,为8GB GDDR6。

图片

包装右上角还有“三年质保”以及“个人送保”的标识,玩家可以放心购买。

图片

包装的背面就比较常规了,主要是一些显卡的卖点介绍以及RTX 50系显卡的参数,旨在让玩家更全面的了解自己手上的这款利器。

图片

终于见到了耕升GeForce RTX 5050追风OC 8GB的本体。这款显卡的三围是236×128.5×42mm,大约是两槽的厚度,这个尺寸能够轻松适配mini-ITX和micro-ATX机箱,非常适合追求空间效率与一定性能的玩家。

图片

设计语言上,耕升GeForce RTX 5050追风OC 8GB延续了耕升风系列经典的外观造型设计,整体以黑色为基底,搭配醒目的红色点缀,形成强烈的视觉对比,四四方方的造型尽显硬朗风格,妥妥的电竞黑武士。

图片

正面抢眼的还有两把散热风扇,耕升GeForce RTX 5050追风OC 8GB采用第三代炫风之刃风扇设计,在风扇方面加大了尺寸,两把风扇大小为92mm,每把风扇配备7 组环形扇叶,每组扇叶精心设计导流线,提升高负载时的风压与进风量,获得最好的散热效能。

图片

显卡的背板上印有耕升的英文Logo和几何图案,为单调的背板增添了一丝点缀。背板一侧则是镂空散热设计,能够增加空气的流通路径,进一步提升了散热效能,确保显卡在长时间高负载运行时也能保持冷静,稳定发挥性能。

图片

显卡顶部可以看到密密麻麻的散热鳍片,这里是显卡的出风区域。耕升在这里印上了品牌LOGO,能够进一步提升辨识度。

图片

供电接口位于显卡顶部的中央位置,耕升GeForce RTX 5050追风OC 8GB采用的是单8Pin供电,老设备的玩家也能无损升级!

图片

视线继续往上则可以看到NVIDIA显卡的另一经典标识“GEFORCE RTX”。

图片

底部则是显卡的金手指,支持PCIe 5.0×8标准,总带宽为64GB/s。

图片

显示接口方面,耕升GeForce RTX 5050追风OC 8GB同样采用目前RTX 50系标配的3个DP 2.1b接口与1个HDMI 2.1b接口,接口速率最大可满足原生4K 240Hz视频信号传输与显示需求。

图片

显卡拆解介绍

拆解环节,这里需要注意,拆解这款显卡需要从背部开始,另外显卡背板与PCB利用了单独的螺丝进行固定,因此需要先拧下这些螺丝,才能顺利分离背板和PCB。

图片

卸下PCB以后,不难看出耕升GeForce RTX 5050追风OC 8GB的PCB为自研的非公版设计,并且面积非常小,另外耕升也对其中的电路进行了优化。

图片

PCB的背面则比较干净了,不同于正面密密麻麻的元器件,背面仅有2颗控制芯片。

图片

PCB中间的就是这款显卡的GB207-300-A1芯片,由TSMC 4N工艺打造,拥有2560组CUDA核心,规格上与RTX 3050一致,不过应用了最新的Blackwell架构,整体性能表现也更加出色。

图片

核心的四周是4颗GDDR6显存,由三星提供,显存型号为K4ZAF325BC-SC20,速率为20Gbps。

图片

下面我们讲讲这款显卡的供电设计,从PCB上可以看出它是4+2相供电,对于这款TGP仅有130W的显卡来说,完全足够了。

图片

其中PCB左侧的4相供电为核心供电,每相供电均配上了固态电容、全封闭电感,以及DrMos芯片。其中DrMos芯片为SIC 653A,最大持续输出电流达50A,确保核心供电稳定高效。

图片

PCB右侧的两相则是显存供电,DrMos则是来自力智的QA3111。

图片

下面让我们来关注一下耕升GeForce RTX 5050追风OC 8GB的散热装置,正中央是超大面积的镀镍铜底,上面则是厚厚的硅脂,能够紧密贴合GPU核心,确保热量能够迅速传递至热管。

图片

整个散热器为两段式设计,两侧均为大面积的鳍片模块设计,搭配镂空金属背板能够允许热空气排出,增强了气流,防止PCB热量积聚。

图片

鳍片之下则是2根6毫米镀镍热管,采用回流焊接技术优化热传导。并且它还与铜底直触,能够更快的将热量传导出显卡。

图片

主动散热部分为正面的两把92mm风扇,其能够在提供强劲的气流同时保持低噪音。风扇还采用优化的叶片设计,最大化空气压力,确保热量有效散布于显卡的散热片上。

图片

测试平台介绍

关于测试平台则还是原来RTX 50系显卡首发时的配置, CPU使用的是目前毫无争议的游戏神U——AMD Ryzen R7-9800X3D,主板则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。

图片

完整配置如下所示:

图片

理论性能测试

测试开始前,我们先用GPU-Z看看这款显卡的基本信息,耕升GeForce RTX 5050 追风OC 8GB的基准频率为2317 MHz,Boost频率为2632 MHz,毕竟是带着OC后缀的型号,其Boost频率对比MSRP版本的RTX 5050要高一些,由2572 MHz提升到了2632 MHz,这也意味着其性能释放更强劲一些。

图片

理论性能测试方面我们则是以3DMark为基准,实测在Fire Strike系列测试中,耕升GeForce RTX 5050 追风OC 8GB表现非常亮眼,其中1080P分辨率下不仅大幅领先前作RTX 3050,对比RTX 4060也有2%左右的领先;2K下则可以领先RTX 3050约76%;4K则差距最大,对比RTX 4060有9%的提升。而在以DX12为代表的Time Spy测试中,新显卡同样逆天,对比RTX 3050,领先幅度超过63%,不过对比RTX 4060则稍逊色一些,毕竟单论核心规格,二者还差了20%左右。

图片

但是没关系,得益于Blackwell架构的加持,以及第五代Tensor Core与第四代RT Core的应用,新显卡的光追项目也有史诗级的提升,耕升GeForce RTX 5050 追风OC 8GB得分6255,这个成绩与RTX 4060差不多,领先约5%左右,至于对比RTX 3050,提升幅度甚至可以用代际来形容,74%的领先接近翻倍,非常夸张。

DLSS 4性能测试

看完了理论性能部分的测试,我们接下来将聚焦于本次RTX 50系列显卡最令人振奋、也最具“颠覆性”的升级——DLSS 4技术。RTX 40系显卡上引入了DLSS 3帧生成技术,其能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。

图片

而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。无论是对性能、显存的开销还是延迟都比之前要好了许多。

图片

图片

另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。

图片

同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

图片

不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。

图片

光说DLSS 4有多强你可能没有实感,还是用经典的3DMark测试一下才行。别看耕升GeForce RTX 5050 追风OC 8GB只是一张入门级显卡,但在搭配上DLSS 4后,帧数就跟打了鸡血一样,开关前后的性能简直天壤之别!开完DLSS 4以后完全不像一张入门级显卡的表现,甚至可以比肩主流级显卡。其中2K分辨率下,开关前后性能差距足足有4倍之多,4K分辨率时帧数差距直接就是6倍,换作以前,谁敢相信入门级显卡也能畅享2K游戏。

图片

接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。

图片

我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。

图片

第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。

图片

这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。

图片

不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。

图片

见识完Transformer模型的魅力以后,我们再来看DLSS 4的性能表现,毕竟,对于像《赛博朋克2077》这样的“显卡杀手”级游戏来说,即使是顶级显卡也面临着不小的压力。在1080P分辨率,最高画质+路径追踪的情况下,耕升GeForce RTX 5050 追风OC 8GB只能跑15 FPS,几乎不可游玩。开启DLSS 3以后,游戏帧数勉强来到了63 FPS,已经能玩了。但是在开启DLSS 4以后,耕升GeForce RTX 5050 追风OC 8GB已经可以畅玩了,游戏帧数能够做到111 FPS,对比原生分辨率,性能足足提升了7.4倍。

图片

DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。

图片

第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。

图片

总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。它彻底颠覆了我们对入门级显卡性能的认知,DLSS 4的强大优化能力,使得主流玩家也能在极致画质下,流畅体验最具挑战性的游戏大作,这无疑是游戏技术发展的一大里程碑。

我们测试的第二款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。

图片

有一说一《霍格沃兹之遗》这款游戏的优化比2077不要好太多,1080P分辨率画质光追均设置最高的情况下,耕升GeForce RTX 5050 追风OC 8GB在不开任何超分技术的情况下,平均帧为49 FPS,已经达到能玩的水平了。不过当你开启DLSS 3质量档,此时帧数已经能够做到108 FPS了,满足高刷完全没有问题,体验相当丝滑。开启DLSS 4以后,帧数则进一步提升至169 FPS,对比原生1080P的表现,性能提升了约3.5倍左右。

图片

第三款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持4X的选项,也就是DLSS 4多帧生成功能。这款游戏的优化更是出色,一会儿的实际性能绝对能够吓你一跳!

图片

实测在1080P原生分辨率下,将画质、光追均设定为Ultra,此时耕升GeForce RTX 5050 追风OC 8GB的平均帧仅有71 FPS,流畅游玩绝对是没有问题了。而开启DLSS 3质量档以后,游戏平均帧则有152 FPS,游戏体验已经能够实现高刷了,在数据层面,对比原生1080P的表现,完全是翻倍的提升。如果你开启DLSS 4质量档,平均帧更加逆天,247 FPS已经是超高刷的水准了,换作以前,你敢相信这是入门级显卡在最高画质最高光追下能跑出来的成绩吗?

图片

接下来我们再测一下第一款国产3A大作、去年的热门单机游戏《黑神话:悟空》,去年发售时,这款游戏也是率先支持了DLSS 3帧生成功能,如今它还支持了RTX 50系显卡的DLSS 4多帧生成,游玩体验将会更加顺畅,开启方式也很简单,在游戏菜单设置中即可找到4X的选项。

图片

我们在1080P下将画质调整至影视级,全景光追也拉到最高,此时耕升GeForce RTX 5050 追风OC 8GB在不借助任何超分技术的条件下,游戏帧数仅有13 FPS。而有DLSS 3的帮助后,游戏帧数也只是勉强能够去到39 FPS,当然,如果你降低一些画质,其实DLSS 3也能够畅玩,不过这时如果你有RTX 50系显卡,开启DLSS 4多帧生成以后,就完全不需要担心,全高画质随便开,此时游戏帧数也能稳定在72 FPS,对比原生分辨率提升了5倍以上,非常夸张。

图片

网游方面我们测的是《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。

图片

实测耕升GeForce RTX 5050 追风OC 8GB在1080P全高设置下,不开超分,帧数为69 FPS,游玩肯定是没有问题了。不过FPS游戏肯定追求更高的帧数,开启DLSS 3后帧数可以达到141 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升3.7倍,256 FPS的表现妥妥的高刷电竞。同时延迟以及1%Low表现也非常出色,反应在游戏中会更加跟手,体感更佳。

图片

最后一款游戏我们测的是最近刚支持DLSS 4的《毁灭战士:黑暗时代》,实测耕升GeForce RTX 5050 追风OC 8GB在1080P分辨率、超级噩梦画质下,表现还是非常不错的,即便不开启超分,也能以62 FPS流畅游戏;开启DLSS 3质量档后,游戏帧数基本能够达到高刷需求了,为115 FPS,接着开启DLSS 4质量档后,游戏帧数则可以轻松实现188 FPS,稍微降低一些画质,冲上200 FPS完全没有问题!

图片

当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。

图片

在体验了一系列支持 DLSS 4 技术的 3A 大作后,不得不说DLSS 4 多帧生成技术还是厉害,它确实使更多玩家能在更高分辨率下享受到了流畅的游戏过程。以实际测试的这几款游戏为例,以前的 RTX 3050 显卡在 1080P 分辨率下开启 DLSS 2 时,仍有不少游戏难以畅玩,玩家往往要在画质和帧数之间做出权衡;而 RTX 4060 虽然有 DLSS 3 加持,但面对像《黑神话:悟空》这种顶级 3A 游戏仍稍显吃力。再看新推出的耕升 GeForce RTX 5050 追风 OC 8GB 显卡,虽是入门级显卡,但凭借 DLSS 4 黑科技,1080P 最高画质畅玩毫无压力,甚至有望挑战 2K 分辨率。

图片

另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。

图片

为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。

图片

图片

而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

图片

而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。

游戏性能测试

下面我们要测试的是常规的游戏以及支持DLSS 3的游戏性能。还是老样子,先看看DLSS 3的理论性能如何。实测在3DMark的测试里,耕升GeForce RTX 5050 追风 OC 8GB在2K分辨率下,对比RTX 4060,二者性能几乎不相上下,差距在4%以内;4K分辨率下,开启DLSS 3以后,对比RTX 4060,两张显卡的差距就更小了,只有1%,甚至可以忽略不计。

图片

实际游戏表现又如何呢?这里我们选取了10款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。至于超分方面,RTX 3050只能开启DLSS 2,而剩余显卡我们则是用DLSS 3进行测试。

图片

经过实测,在 1080P 分辨率下,耕升 GeForce RTX 5050 追风 OC 8GB 显现出强劲实力,运行大多数游戏都十分轻松,并且这一成果是在开启 DLSS 3 的情况下达成的。从目前的帧数表现来看,若是搭配 DLSS 4 多帧生成技术,它完全有能力在 2K 分辨率下流畅运行众多 3A 大作。此外,从实测数据综合分析,耕升 GeForce RTX 5050 追风 OC 8GB 在整体性能上与 RTX 4060 基本持平,二者在多款游戏中的表现各有千秋。而与 RTX 3050 相比,则呈现出碾压式的优势,在不少游戏中性能领先达 2 倍以上。

图像视频创作性能测试

游戏性能的表现应该给大家带来了不小的震撼。下面就是专业创作领域的内容了。先给大家伙看一下综合场景的性能表现,在PCMark 10 Extended测试,耕升GeForce RTX 5050追风OC 8GB在游戏、数位内容创作方面的表现更佳,基本上要比RTX 4060高14%左右,对比RTX 3050则最高可以做到92%左右的提升,几乎是翻倍的性能提升。总分方面,耕升GeForce RTX 5050追风OC 8GB则与RTX 4060持平,领先RTX 3050约19%。

图片

再看大伙关心的图像编辑与视频创作表现,我们采用UL Procyon进行测试,在图像编辑上耕升GeForce RTX 5050追风OC 8GB已经有不小的性能提升,综合性能对比另外两张卡领先约8%左右,而在视频剪辑方面,耕升GeForce RTX 5050追风OC 8GB更是进一步扩大了优势,对比RTX 4060以及RTX 3050分别领先19%和30%。

图片

在Adobe以及达芬奇的Benchmark测试里,耕升GeForce RTX 5050追风OC 8GB延续了刚刚领先的优势,例如视频编辑部分,由于这一代RTX 50系显卡对编码器进行了升级,不仅编解码的效率更高,同时支持的格式也更丰富。在达芬奇和PR的测试中,耕升GeForce RTX 5050追风OC 8GB领先RTX 4060与RTX 3050 分别20%和30%以上。

图片

3D渲染创作性能测试

简单的图像视频创作过后,让我们上点强度,看看压力更大的3D渲染性能表现。首先关注到的是Blender以及V-Ray测试,在这两项测试中,耕升GeForce RTX 5050追风OC 8GB的表现还可以。虽然CUDA核心数比RTX 4060少了20%,不过实际性能表现丝毫不逊色,实测性能仅跟RTX 4060差了10%左右。当然,如果对比对象换成RTX 3050的话,那领先优势就大了,基本都是翻倍的性能提升,非常可观。

图片

再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。

图片

实际测试中,有了DLSS 4加持的耕升GeForce RTX 5050追风OC 8GB与另外两张显卡完全不在一个维度上。例如RTX 3050在开启DLSS 2以后依旧只有22 FPS,RTX 4060开启DLSS 3能够做到72 FPS,而耕升GeForce RTX 5050追风OC 8GB在DLSS 4下能够轻松做到117 FPS,性能是RTX 3050的5倍,RTX 4060的2倍左右。之前卡顿的渲染体验,一扫而空,换来的是极致流程的创作感受。

图片

工业领域我们用的是最新的SPECviewperf 15进行测试,最新版本引入了对最新图形 API 的支持,包括 DirectX 12 和 Vulkan,并具有反映新兴行业用例的工作负载。凭借这些增强功能,SPECviewperf 15 使用户能够准确评估其首选应用程序的最新版本在当前一代硬件上的性能表现。实测在多项测试中耕升GeForce RTX 5050追风OC 8GB对比RTX 4060几乎持平,少部分项目后者有10%以内的领先幅度,而对比RTX 3050则可以说是完胜,部分项目提升幅度超过100%。

图片

NVIDIA编解码测试

接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。

这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,耕升 GeForce RTX 5050 追风 OC 8GB导出三段视频的时间均为15秒,效率比另外两张显卡快了80%左右。

图片

同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。

图片

图片

图片

值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。

4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。

图片

AI性能测试

在深入剖析新一代显卡的游戏和编解码能力后,我们把目光聚焦到同样备受瞩目的 AI 性能领域。我们对 RTX 50 系列显卡展开了全面的 AI 测试,测试范围涵盖当前流行的本地大语言模型部署以及热门的文生图应用。

图片

先来了解一下 RTX 50 系显卡在 AI 部分的升级亮点。其中最具突破性的改进是加入了对 FP4 精度模型加速处理的支持。与之前 RTX 40 系列显卡支持的 FP8 精度相比,FP4 精度能在保证相近计算精度的基础上,大幅加快生成速度,同时显著减少显存占用。这使得用户可以在有限显存条件下运行更大规模的 AI 模型,或者更快速地生成内容,从而极大提升了 AI 应用的效率和可玩性。

实际测试中,另外两款显卡因显存不足,无法完成测试任务。而同为 8GB 显存的耕升 GeForce RTX 5050 追风 OC 8GB 凭借对 FP4 精度模型的支持,成功跑完了测试流程,生成一张图片仅用时 33.439 秒,表现相当出色。这无疑是入门级显卡在本地 AI 应用能力上的关键突破,让众多玩家有机会亲身体验 AI 技术带来的便捷与乐趣。

图片

接下来看看耕升 GeForce RTX 5050 追风 OC 8GB 在 Stable Diffusion 中 FP16 精度下的表现。依然采用 UL Procyon 进行测试,在相对轻松的 SD 1.5 文生图 FP16 精度测试中,耕升 GeForce RTX 5050 追风 OC 8GB 生成一张图片的速度仅需 4.696 秒,比 RTX 4060 的效率高出 10%。当切换至 INT8 精度时,该显卡生成同样一张图片的效率依然超过 RTX 4060,且领先幅度达到 20% 之多。

图片

而在本地大模型部署测试环节,我们采用 MLPerf Client v0.5 大语言模型进行测试,该模型基于 Meta 的 Llama 2 7B 开源 LLM 构建,包含内容生成、创意写作以及对两份不同长度文本进行总结摘要这四项 AI 任务。实测结果显示,新显卡的表现与 RTX 4060 基本相当,二者性能差距仅在 2% 左右。而与 RTX 3050 相比,耕升 GeForce RTX 5050 追风 OC 8GB 的性能则领先 35% 左右。

图片

此外,我们还利用 UL Procyon 的 AI Text Generation 功能对更多大语言模型进行了测试。结果表明,耕升 GeForce RTX 5050 追风 OC 8GB 的性能依旧与 RTX 4060 不相上下,而对比 RTX 3050 则实现了 20 - 50% 左右的性能提升。

图片

功耗与温度表现

最后一项测试烤机,这也是许多玩家关注的重点。得益于耕升GeForce RTX 5050追风OC 8GB显卡出色的散热配置,整体表现非常出色。在室温20℃下,Furmark烧机10分钟后,整张显卡的温度并不高,甚至可以说凉快,核心仅有58.8度,显存温度更是低至54度,此时显卡的最大功率为130W,已经完全顶着TDP的上限了,风扇转速则是1500RPM,整体性能释放强劲,几乎没有噪音。

图片

横向对比RTX 3050跟RTX 4060两张显卡时可以看到,耕升GeForce RTX 5050追风OC 8GB整体的散热效果极其出色,无论是待机时还是满载时的温度都比115W的RTX 4060还要低,属于是非常惊喜了。对比前作RTX 3050更是出色,用更低的功耗与更低的温度实现了更高的性能释放!

图片

评测总结

总的来说,耕升GeForce RTX 5050追风OC的表现还是非常给力的。几乎给入门级玩家交上了一份不错的答卷,可以说是专为1080P分辨率的轻度游戏爱好者,或者是办公、轻度AI用户群体量身定制。凭借全新NVIDIA Blackwell架构和各种黑科技实现了跨代提升,甚至可以挑战前代更高级别的显卡。

图片

这款显卡最大的亮点还是性能表现方面,经过实测耕升GeForce RTX 5050追风OC 8GB拥有跟上一代更高级别显卡RTX 4060相近的性能,这意味着它在1080P分辨率中能以高帧率游玩绝大部分的网游,并能通过DLSS 4技术来让3A光追游戏达到极其流畅的水平。对于还在使用RTX 3050、RTX 2060乃至GTX 16系的玩家来说,这张显卡绝对是绝佳的升级选择,游戏体验能够获得史诗级的加强。

图片

当然,玩家最关心的还是它的售价,耕升GeForce RTX 5050追风OC 8GB的起售价为2099元,作为一款定位入门级的显卡来说,这个价格说实话并没有那么“入门”,不过考虑到这款显卡应用了Blackwell架构,还有目前最强的DLSS 4多帧生成,对比其他入门级来说,确实是爆杀般的存在,性能表现绝对包赢的,这一点完全不用担心。如果你预算有限,但又想升级显卡,那这款显卡还是值得考虑的。

图片

 
举报收藏 0打赏 0评论 0
 
更多>同类资讯
  • kongyu
    加关注0
  • 没有留下签名~~
推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号