当 AMD 发表拥有 6-inches Super Small Form Factor 的 Radeon R9 Nano 时,不仅为显示卡界带来了新气象,同时也对市场投下了一颗震撼弹。不单拥有超迷你尺寸,在散热模组方面也不若 NVIDIA 在 GeForce GTX 中的离心扇作法,做了相当令人意外的轴流扇设计。 Radeon R9 Nano PCB Layout 新的 R9 Nano 採用 6-inches 长度设计,採用相当紧凑的电路与元件,大致上主要迴路为 4+1+1+1 相,分别为 VDDC:4 相、MVDD:1 相、VDDCI:1 相与 MVPP:1 相。虽说板子上元件看起来相当精简,但R9 Nano可说是用上了许多高级元件,除了核心 4 相採用 CooperMOS 之外,其余各项均採用整合度相当高的 Dual-Stack MOSFET,透过堆叠的方式进一步缩减体积。 在显示卡背面则是放满了钽质电容与陶瓷电容做输出滤波,进一步强化电压与电流的稳定度。对于各输入端,则放上电感做高压滤波,相对于其它自製板卡,R9 Nano 堪称今年度内涵相当到位的设计。 VDDC PWM:IR3564 Doubler:IR3598 MOSFET:IR6894(L)、IR6811(H) MVDD PWM:NCP5230 MOSFET:NTMFD4C85N VDDCI PWM:NCP5230 MOSFET:NTMFD4C85N GPU I/O 1.8V PWM:NCP5230 MOSFET:NTLLD4901NF GPU I/O 0.95V PWM:NCP5230 MOSFET:NTLLD4901NF 轴流、离心之差别 论轴流与离心,谁优谁劣,倒也说不出个準儿。不过可以肯定的是离心扇,并没有办法建构在 6-inches 的迷你长度中,轴流扇则是没有这个困扰。不过在解热方面,则又有了逆转,离心扇由于结构上为封闭风道,热气只从 bracket 离开机壳内部,较不仰赖机壳对流。相反的轴流扇则仰赖对流,在风扇向下吹拂后,热气从 PCB 四周溢散,此时若机壳内对流较差,则会形成内部积热不去的问题。 那么 AMD 为什么选择在两款同核心产品 Fury X、Nano 中做出两款不同取向的设计呢?我们可以发现 Fury X 採用了先前双核心旗舰 Radeon R9 295X2 所使用的水冷散热,Nano 则是精进至 6-inches。更精确地说,Nano 的尺寸更小于 Fury X 的 7.5-inches,将高性能显示卡的里程碑推向了尖峰。而这一切的幕后功臣,首推与 SK hynix 合作的 HBM,将记忆体裸 die 透过堆叠的方式,进一步缩减常态记忆体所需要的空间与落落长的线路。 不同于 NVIDIA 第一次亮相的 GeForce GTX 670,採用较短 PCB 搭配离心扇的作法,AMD 这次的 Nano 做了更为夸张的设定,实现真正意义的 mini Card, Max Power。不过这么做的方式,倒也激起了所有人的兴趣,AMD 如何将同款核心放到两种不同尺寸、不同解热机制内? PowerTune 帮了大忙 以目前所知的规格,两款产品最大差别首先指向 Board Power 差距了 100W,Fury X 为 275W,Nano 则仅 175W。如何做到同一核心,再次降低 3 成 6 的功率需求?则成了所有人所好奇的方向。 在如何达成之前,我们首先要认识 AMD PowerTune Technology 背后所代表的意涵。这项技术其实出现的不算晚,至少在 2011 年底就被 AMD 搬出来应用,不过实际上在显示卡中,被大量提及的时间为 Radeon HD 7000 系列中后期,在 NVIDIA 推出 GPU Boost 1.0 之后,AMD 针对已经推出的显示卡导入第二次升级,加入 Boost State 技术。也就是我们所熟知的 HD 7970 面临第二次改版,核心时脉从原先的 1000MHz 升级为 1050MHz 的时间点。 那么 PowerTune 到底做了什么,是我们所知与所不知的呢?其中最值得注意的就属核心时脉难以达到标示值这点,如果你仔细去观察,AMD 在核心时脉的标示值,或许可以发现些端倪,已经不再採用 XXX MHz 的标示法,而是採用 Up To XXX MHz。这个作法给予了 AMD 相当程度的保护。 那么为何会有这种状况呢?应该要去了解 PowerTune 的工作机制,主要由「电压、电流、温度」三项组成所有的规则。其中又以众人所熟悉的温度为各家所强调的重点,应该可以发现近年来所多厂商都会强调自家产品,拥有多强的解热能力,比公板散热器还要低上多少度。这部份主要是在强调自家产品,不容易产生因温度而降频的问题,不过许多厂商并不会去强调自家在其它限制中做了哪些调整,一般人也难以察觉。 除了温度之外,更重要的数值非电压、电流莫属,由于各款软体中所需要的数值并不近相同,最简单的限制方式就属直接限制显示卡能够输入的瓦数上限,也就是这次 AMD 所强调的 Board Power(Fury:275W、Nano:175W)。透过硬体限制输入上限,就拥有相当大程度的控制原先较不受控的能耗比,不过这也相当大程度的限制性能表现。 PowerTune real-time 限制实况 或许有许多人认为 PowerTune 的限制其实并不算广,仅只有少数几款业界中认定必定启动限制的软体,例如一般消费者相当容易取得的 Furmark 显示卡烧机软体。不过这点恐怕就是一般消费者误会 GPU 厂仍处于软体面限制,例如以往我们可以听到需要修改 Furmark 软体名称,方能正常测试出正确数值,这部份主要是靠着软体黑名单做动,属相当低技术含量的限制方式。 不过 PowerTune 可没有那么简单,它属于硬体层面的限制,透过实时监控的方式来限制显示卡所有行为。这部份也就造成了许多游戏会面临到降频的限制,款数远远多于一般消费者所认知的少数几款的情况,也造就了目前各协力厂在调教面上的恶斗。 这边将会以 Metro:Last Light 这款游戏进行测试与绘製,透过内建的 Benchmark Tool 调整常用于高、中、低阶平台设定档与 3 Loop 的方式,为实际的运作情形描绘模型。同时间,也对 NVIDIA GeForce GTX 970 DC Mini 进行同样模式的测试,透过这种方式,解析两家对于 GPU 限制方面所做的不同规则。 Metro:Last Light Benchmark Tool,红:Low Setting、绿:Medium Setting、蓝:Very High Setting 从图片中可以看到,R9 Nano 在不同设定模式下,时脉表现平均为 925.9MHz、918.5MHz、893.6MHz,设定值越複杂的情况下,时脉下滑的情形也越严重。另不论哪一个模式,时脉在游戏中表现均呈现切换频繁的状况,曲线相当不规则,可以视为游戏内部分场景会启动 PowerTune 的部份限制,导致时脉与电压双双下滑的表现。 Metro:Last Light Benchmark Tool,红:Low Setting、绿:Medium Setting、蓝:Very High Setting 在 GTX 970 DC Mini 中,一样可以看到不同模式下,得到不同平均时脉,分别为 1254MHz、1250MHz、1227MHz。虽然时脉一样下滑,不过 NVIDIA 的标示方式为 Base Clock、Boost Clock 两种,按官方定义 Base Clock 为时脉下限,Boost Clock 则为正常表现,其中又有 Over Boost,这一种情况属于官方所允许的超频。透过硬体判定的方式,进行核心时脉上提,藉此强化游戏表现。 限制大不同,各显本事 两家的方式各不相同,但依照目前两家厂商对于显示卡的限制程度,又以 AMD 方面更为严谨,不仅不准协力厂自製部分型号产品,对于 BIOS 限制也较为严苛许多(e.g. R9 Nano 不可进行任何修改)。相反地 NVIDIA 阵营则分为几种情形,其一为顶级型号不开放自製,但允许协力厂修改 BIOS。不过 BIOS 修改需经过 NVIDIA 认证,这方面原厂要求颇多,造成部分出色显示卡无法发挥原先的超水準表现(e.g. 不准第三方晶片电压超出公板所使用的型号)。 总的来说,两家在限制面上大同小异,唯一差异就在于对使用者的开放程度,以 AMD 来说,直接在自家软体中开放输入功率上限提昇 50% 的方式,给玩家们自行探索极限。NVIDIA 则是没有这类功能,仅能依靠协力厂或玩家自製的软、韧体才有机会压榨出每一分性能。 来源: AMD Radeon R9 Nano 评测:Round 1 外在硬体介绍