主页 > 学者IT >针锋相对,卡王对决GTX 680 PK HD 7970 >
针锋相对,卡王对决GTX 680 PK HD 7970

显示卡

  • 针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    今年的上半年度由于新一代显示卡、处理器和主机板的推出,让整个IT业都热闹了起来!玩家们满心欢喜期待,而编辑们也没闲着,不断忙着测试和写稿,即使加班熬夜也要完成报导,让读者们都能轻鬆掌握新产品的资讯!

    小编这几个月可忙得很,不久前AMD才推出HD 7000系列,近日NVIDIAGTX 600系列也由GTX 680揭开序幕,所以每个月都有要把玩数张显示卡。但是最为重要的不外乎就是一年一度的卡王对决,由AMD HD 7970对上NVIDIA GTX 680,这两张都是单晶片最高阶的旗舰产品,不论是设计、功能或是价格,都有很多地方值得大家一起来讨论,接下来就让我们一起来讨论这两张旗舰产品吧!

    █ 前言

    还记得去年再163期本刊的封面故事GTX 580和HD 6970的对决吗?已经不记得的同学们还不去翻一下!好吧,很显然各位已经拿去垫桌脚,或是只有吃泡麵才会拿出来。其实常摸显示卡的玩家应该都明白,去年GTX 580和HD 6970这两张卡虽然受单晶片最高阶,但是定位却不太一样,GTX 580整体效能远胜HD 6970,就连价格也相差约5000元新台币!我们先不论为什幺落差这幺大,但是已经等级来说,这两张卡都是NVIDIA和AMD最高阶的产品,即使明知道效能上有落差,依照先例旗舰对决是免不了的!

    转眼间一年时光又匆匆消逝了,随着28奈米新製程技术突破,最新的HD 7970与GTX 680都相继在2011年12月和2012年3问世,这一次两家的产品只相隔约3个月,是近年来推出时间相差较近的一代,且不论硬体设计或是价格都是旗鼓相当,尤其是这一代的产品由于製程进步的关係,增加了许多新技术与功能,例如AMD的GCN架构(Graphic Core Next)、ZeroCore Power,NVIDA则是有SMX架构、GPU Boost、Adaptive Vsync等全新功能,但是两家新产品还是有支援相同的功能,就是PCI-E 3.0和DirectX 11.1两大重点技术,后面小编会更详细说明上述的功能与技术。

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / 两大品牌旗舰产品外观样式,与上一代相比质感略微提升。

    从规格表来看,这两款显示卡相较于上一代都有很大的提升,尤其是GTX 680更是显着,由于利用製程进步的优势,在核心体积不变的条件下,一举将CUDA核心数量从512个提升至1536个,是原先的三倍之谱,时脉也大幅提升了23%左右,而记忆体只增加512MB,在多数规格都提升的情况下,记忆体位元宽却从384-bit减少为256-bit,相信许多玩家都会觉得匪夷所思!此外,GTX 680的外接电源只需要6Pin×2,对于近几代的显示卡来说非常特别,难道GTX 680还不算是高阶卡吗?以上这些问题在下个阶段小编都会一併为各位解答。

    再来看到HD 7970的规格表,大致上较为明显提升的部分为核心数量、时脉与记忆体规格,核心数量增加了512个,但以提升比例来看还是NVIDIA取胜。时脉其实提升45MHz其实并不明显,通常各品牌出货版的超频幅度都不只45MHz,或许是有所保留,让各品牌推出时能有更大的超频空间;记忆体的部分早期一直都是AMD显示卡的优势,当NVIDIA还在使用GDDR3时,AMD就推出业界第一张使用GDDR5记忆体的显示卡,而且时脉远比NVIDIA显示卡高出许多,可以比对一下GTX 580和HD 6970的记忆体时脉就知道。唯独让小编讚赏看好的是,记忆体的位元宽终于从原本的256-bit提升至384-bit,因此频宽也加大了,传输速度提升对于运算效能有一定的帮助!
     

    NVIDIA规格表

    详细规格 / 产品名称

    GTX 580

    GTX 680

    核心数量

    512

    1536

    核心时脉

    772MHz

    1006MHz(OC 1058MHz)

    记忆体时脉

    2004MHz(4008MHz)

    1506MHz(6000MHz)

    记忆体容量

    1536MB GDDR5

    2048MB GDDR5

    记忆体位元宽

    384-bit

    256-bit

    记忆体频宽

    192.4GB/s

    192.2GB/s

    最高功耗

    244W

    195W

    外接电源

    AMD规格表

    详细规格 / 产品名称

    HD6970

    HD7970

    核心数量

    1536

    2048

    核心时脉

    880MHz

    925MHz

    记忆体时脉

    1375MHz(5500MHz)

    1375MHz(5500MHz)

    记忆体容量

    2048MB GDDR5

    3072MB GDDR5

    记忆体位元宽

    256bit

    384-bit

    记忆体频宽

    176GB/s

    264GB/s

    最高功耗

    250W

    250W

    外接电源

    8Pin+6Pin

    8Pin+6Pin

    针锋相对,卡王对决GTX 680 PK HD 7970  针锋相对,卡王对决GTX 680 PK HD 7970

    图 / HD 7970内用用料一览,供电模组为5+2相。

    针锋相对,卡王对决GTX 680 PK HD 7970  针锋相对,卡王对决GTX 680 PK HD 7970

    图 / GTX 680内部用料一览,供电模组为4+2相,相较上一代减少许多。

    █ 通用运算迫使AMD更改架构

    小编相信现在有多数人都还在使用N年前的产品,没办法,显示卡技术就是发展得那幺快,短短几年间从1XX奈米到今日已经进步到28奈米,光是相较于上一代的40奈米就有很大的差异性,所以接下来要进入核心架构的比较,才能知道这一代究竟是改进了那些。

    显示卡在互相较劲时,通常都会从核心的架构开始,核心的设计是影响效能的重要因素,尤其是这一代两大品牌都推出新款的28奈米产品,整个核心内部架构大翻修,虽然从架构图看起来差异并不大,但其实可以说几乎都快翻新了!先看到AMD推出的Tahiti XT绘图核心,首次採用了Graphic Core Next架构,在架构图中标示了许多GCN,这就是这次HD 7970所使用的GCN核心架构,是AMD多年来首次深度更换核心架构,而原先以前SIMD阵列的位置,取得代之的是GCN阵列。不晓得各位知不知道其实AMD在GPGPU的部分效率并不如NVIDIA来得好,由于当时NVIDIA推出Fermi架构时,大幅提升GPGPU的运算效率,因此才会看到从GTX 400系列开始大力强调转档和硬体加速等相关通用运算,简单来说,以往显示卡能只用于图形运算,近年来已经可以兼具通用运算的能力。

    注:GPGPU的全名是General-Purpose Computing on Graphics Processing Units,就是所谓的通用绘图处理器。

    █ VLIW4瓶颈迫在眉睫,GCN解套!

    提升通用运算就能扩展显示卡的领域,或许就是这种动力促使AMD更改核心架构!在发布GCN架构的同时,AMD也强调「图形就是计算,计算就是图形」的理念,很明显AMD不想让NVIDIA专美于前。会大幅更改架构的另一个因素,就是旧有的VLIW5(HD 5970以前)与VLIW4(HD 6970)执行的效能不彰,不过为何效率不彰呢?我们以较新的VLIW4来举例,採用4D架构,简单来说GCN架构的前身SIMD,就是由4个1D向量为一组(向量由多个纯量所组成),并且可同时平行运算,但是,当只需要由1D的纯量来运算时,那幺其余的处理单元都帮不上忙,如此一来效率自然就降低了!加上从VLIW5改成VLIW4之后,由于电晶体数量大增,虽然效能较优异,但功耗也随之提升,所以说如果再不更改架构,那下一代的功耗将会非常可观!

    新架构的GCN和旧架构VLIW的处理效率以天地之差来形容一点都不为过,最主要的差异是VLIW为指令平行,而GCN则是执行续平行,运算程序大不同!GCN架构中主要有32组的CU(Compute Unit)计算单元阵列,而每一组CU内包含着4个SIMD模组,每个模组内更是有16个ALU处理单元,拿台计算机算一算总数有2048个ALU,就是我们常说的流处理器,相较于HD 6970,流处理器的数量足足多出了512个,也因此大幅提升运算能力。事实上一开始AMD公布GCN架构时,早就说明GCN是一个以SIMD为基础的MIMD架构,不过当时外传AMD有40组CU的HD 7970,虽然未被证实且良率也让人质疑,但从GTX 480的前例来看,起初良率不高而隐蔽8组CU也是不无可能!

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / 全新的GCN架构,除了增加512处理单元,也大幅度增进CU单元的处理程序,

    运算效率上远超过上一代。

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / CU单元的架构图中,可明显看出有4组16个ALU处理单元。

    █ NVIDIA祭出Kepler出战GCN

    前面提到或许是因为Fermi的关係,让AMD感受到强烈的威胁,我们不得而知,但有一点可以确认的是,Fermi在GPGPU的部分效率相当高,这是因为自从NVIDIA提出CUDA概念之后,将处理单元个别拆开,每一个CUDA核心都是单兵,需要多少人力来做多少事都能详尽分配,不会浪费核心资源,当然会比VLIW架构更有效率。GTX 680所使用的新架构名为Kepler,但是从核心架构图来看,不难看出依旧保有Fermi的基本架构,只是规模似乎有点不太一样?眼尖的读者应该早就看出GTX 680的CUDA核心数量远多过于GTX 580,算不出有多少吧!GTX 580有512个CUDA核心,而GTX 680却足足有1536个CUDA核心,数量达三倍之谱!

    Kepler主要的重点就在这4组的GPC处理器模组,GPC模组的设计是从GF100核心开始(在这之前称为TPC),在没有更先进的设计之前,GPC模组将会是NVIDIA核心设计的主要架构。从图中可以看到每一组GPC处理器主要包含2组的「SMX模组」,所以可以将GTX 680想像成八核心处理器的GPU!在以往的核心架构中,这部分称为SM「Streaming Multiprocessor」流处理器模组,但新架构已改为SMX「Streaming Multiprocessor Extreme」极致流处理器,在这每一组的SMX中拥有192个CUDA核心(GF110只有32个),因此总数才会是1536个。在上一期小编GTX 680的介绍中,小编已经详细解说GTX 680核心的运算程序,以下就简单再描述。

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / GTX 580所使用的Fermi二代GF110核心架构

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / 新架构Kepler明显是减少SM阵列,并大幅增加CUDA核心数量。

    █ Kepler:速度才是王道!

    或许对AMD来说,GCN架构的创新设计能大幅提升运算速度,但相较于NVIDIA来说,除了保有原来通用计算的优势之外,减少GPC模组但大幅增加处理单元,最明显的就是效率上的提升。如果我们深入SMX中来看,就会发现SMX模组和SM一样有CUDA核心与各种计算单元,内建4个Wrap Scheduler调度器和8个Dispatch Unit指令分配单元,Wrap Scheduler是用来调度SMX内的所有CUDA核心以及SFU单元,因此在上一段中有提到处理图像时,GigaThread引擎会下达指令给SMX,再经由SMX内的Wrap Scheduler将工作分配给CUDA核心,所以我们将它简单化之后,GigaThread引擎就像是指挥官一样,而Wrap Scheduler如同是队长,指挥CUDA小队执行任务,有多少工作就使用多少CUDA核心,这样是非常有工作效率的做法!

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / SMX细部架构图,可以看到各个处理单元都是以往的数倍之多。

    █ 记忆体控制器的改变

    除了核心之外,这次要提一下记忆体的部分,由于游戏的运算需求越来越大,所以除了核心的运算速度之外,HD 7970和GTX 680的记忆体都有做改变;相较于HD 6970,HD 7970的记忆体增加到6个64-bit记忆体控制器所组成,所以位元宽从原先的256-bit提升至384-bit,但记忆体颗粒的工作时脉并没有提升,最高还是和HD 6970一样为5500MHz,记忆体高时脉一直以来都是AMD显示卡的优势,相反的早期NVIDIA在记忆体控制器的设计还有很大的进步空间,因此运作的时脉迟迟无法突破。

    反观NVIDIA这次在GTX 680上使用全新设计的记忆体控制器,但是数量从GTX 580的6个减为4个,所以位元宽就只有256-bit,不过全拜新设计的记忆体控制器所赐,GTX 680的记忆体时脉一举突破6000MHz,相较于GTX 568提升了约2000MHz,打破有史以来显示卡记忆体时脉最高的纪录,即使控制器只有4组,相信也能够透过高时脉来弥补频宽的不足!

    █ 新技术带来全新功能

    每当新款显示卡推出就会带来不同的惊喜,HD 7970和GTX 680也分别带来不同的新功能给玩家,这两家的产品多年来的诉求都不一样,不过这一代还是有同时都有支援的功能,比方说PCI-E 3.0和DirectX 11.1,这先前小编都介绍过了,老实说目前玩家们都还没办法体会到这两大功能,尤其是PCI-E 3.0,虽然Z77和X79平台都有支援,但在一般游戏的需求下根本塞不满这幺大的频宽,因此现阶段只能说有支援但用不到。支援DirectX 11.1也是为未来Windows 8所準备的游戏特效技术,就像当年DirectX 10更新到DirectX 10.1一样,这部分届时会再另外介绍。

    以AMD的技术来说,这两年极力推动Eyefinity多萤幕功能,但是由于三萤幕所需要的效能加倍,想要顺畅的游戏画面就必须要使用中高阶以上或是双显卡,而且多萤幕对多数玩家来说并不是绝对需求,因此AMD在消费端推广上有难度。如今推出Eyefinity 2.0,虽然显卡效能提升不少,并且对多萤幕输出也有优化,甚至原本就不太推广多萤幕的NVIDIA,竟已经在GTX 680上提供单卡四萤幕的功能。老实说并不是小编不看好,而是目前的萤幕技术来无法达到薄边框甚至无边框,使用多萤幕玩游戏有时候会造成视角盲点,在还没有适当的萤幕之前,这项技术将只会是附加功能,有也未必用得到。

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / HD 7970支援Eyefinity 2.0,画质更提升,效能更优异!

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / NDVIDIA首次在GTX 680上支援单卡四萤幕

    █ 创新的GPU Boost智慧超频技术

    想必多数玩家都知道CPU会自动超频,依照不同负载调整时脉的高低。而GPU以往在低负载的情况下会降低时脉运作,但负载增加并不会提升时脉,这部分在GTX 680中已经找到答案了!透过专用的控制IC随时监控GPU的运作状态,GTX 680核心的基本时脉为1006MHz,当GPU负载达到TDP的上限时会即刻启动GPU Boost功能,并将时脉提升至1058MHz以上。但这并不是固定值,小编测试手上的GTX 680,进行游戏时所测得的时脉为1097MHz,且原厂的说法,在某些情况下会甚至超过1100GHz以上!而原厂也表示目前GPU Boost是无法自行关闭,但这方面NVIDIA未来会提供API给合作伙伴,让各品牌都能推出GPU Boost相关的控制软体,让玩家们也能自行调校。AMD目前并没有相关的技术,但这次的一部分测试也会将HD 7970时脉调整与GTX 680一样给玩家们参考。

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / GPU Boost是一相显示卡创新的功能,会依照负载量进行超频。

    GTX 680还有个Adaptive Vsync的技术,和我们所知道的垂直同步相去不远,唯独不同的地方是垂直同步需要手动开启,但是Adaptive Vsync会自行侦测画面FPS,当大于萤幕更新率时会自动开启Adaptive Vsync功能,确保画面不会出现撕裂状态;一但FPS过低,Adaptive Vsync将会自动关闭,维持画面的流畅度!

    █ 游戏效能测试

    接下来就是真正进入PK赛,也是最现实的时刻!这次测试的项目依然是各种热门游戏,分别有3DMark 11、DirectX 10、DirectX 11,和针对Tessellation项目的Haeven DX11 Benchmark v3.0,最后则是有基本的运作功耗的测试。以下的测试成绩会因为测试环境和其他硬体所影响,所以成绩的部分仅供玩家参考,因为小编所提供的测试成绩为多次的平均值,部分成绩有些微差距都可能是误差值,接下来就是测试的部分。

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / 两张新款显卡对于Tessellation运算都大有进步,尤其是HD 7970进步幅度极为可观!

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    █ 结论:势均力敌

    从以上的测试成绩来看,很明显这两张显示卡相较上一代效能提升非常多,处理单元的大幅增加和记忆体的效能提升,都是提升游戏效能的主要因素。除了许多新功能之外,由于28奈米製程的因素,让整体功耗都大幅降低,一般高阶卡都需要8Pin+6Pin的外接电源,但是GTX 680却能够做到使用双6Pin就好,官方公布的TDP也只要195W,可见这次NVIDIA在供电的部分令人讚赏!HD 7970也推出ZeroCore Power技术,在多显卡待机的环境下关闭第2张以后的显示卡,让电源最低只有3W~5W左右,休眠时几乎是不使用电源,但是单卡本身却达到近250W,这方面似乎还有进步空间!

    针锋相对,卡王对决GTX 680 PK HD 7970

    针锋相对,卡王对决GTX 680 PK HD 7970

    图 / 图上为GTX 680,外接电源只需要双6Pin,右下的HD 7970比照以往高阶卡8Pin+6Pin供电。

    其实除了3DMark 11有较大差距之外,其余游戏的部分可说是平分秋色,多数游戏的差距都相当小,很明显可以看到这两款显示卡在那些游戏中较有优势,虽然GTX 680有GPU Boost功能,但是小边疆HD 7970的时脉调到与GTX 680一样时,最后得到的成绩其实相当接近,如果再进一步提升时脉肯定大有作为。最后小编认为AMD这次确实有非常大的进步,大改架构后处理效率大幅提升,效率提升相对也会更省电,搭配众多先进功能之后,相信这一代的显示卡能在市场上大放异彩!
     


    上一篇: 下一篇: