20 12
发新话题
打印

ATi的乌托邦世界!RV560/570显卡抢先曝光

ATi的乌托邦世界!RV560/570显卡抢先曝光

理想化的DX9架构,ATi的乌托邦世界
  托马斯·莫尔(ThomnasMore,1478-1535年)这位英国人曾写过一部小说《乌托邦》,在这部小说中作者根据当时英国的社会现状描绘出了一个名为乌托邦的梦话世界,虽然这样的世界从来都没有存在过,但对于理想化的追求从来都不乏痴人。就像ATi这次的RV560/570,这两款芯片就是ATi研发们追求理想化DX9架构的产物,从中我们可以看见这些工程师们心中的乌托邦世界。



  从上面ATi的这份针对3D游戏中使用Pixel Shaders操作的比例调查来看,ATi的工程师任务在Vertex Shader与Pixel Shader两种操作中,Pixel Shader操作在3D游戏中的负荷正在逐年增加,因此在以后的GPU发展中应当逐年增加GPU中Pixel Shader操作单元的对Vertex Shader的比率,以适应3D游戏发展的趋势。



  在Pixel Shader操作中,又分为Texture操作与Arithmetic操作两种,在ATi针对Pixel Shader内部负载的调查中:Arithmetic操作在近几年所占的比重越来越来大,从上面的图表中我们可以看到,在2006年每一个Pixel Shader操作中Arithmetic操作的负荷超过了80%,当然Texture操作的负荷也是在逐年增长,只是其负荷的增长远不及 Arithmetic操作来的明显。这其中的一个重要原因是Texture操作需要通过显存控制器去拾取纹理数据,操作需要占用大量的显存容量及带宽,在使用上不及Arithmetic操作来的灵活。



  既然从上面两张图表我们可以得知ATi对图形渲染未来发展的理解,那么接下来我们就来看看ATi对Shader Model3.0的理解。Shader Model3.0是Microsoft开发的一种编程语言,其针对Pixel Shader部分提供可编程管理,可以实现多元化的功能,此外Shader Model3.0还为程序员提供了各种不同的API,如HDR(High Dynamic Render)API和Vertex Shader3.0部分的运动模糊效果。
  Shader Model3.0除了提供一些额外的功能特性外,还针对了编程语言本身提供了动态流程管理(Dynamic Flow Control)简称DFC,DFC旨在帮助使用Shader Model3.0框架的程序员更好的协调各线程间的通讯,以优化该架构的并行计算能力。ATi对于Shader Model3.0的理解主要体现在DFC上,而Radeon X1K Series的Ultra-Threaded Pixel Shader Engine就是DFC在硬件层级的体现,Ultra-Threaded Pixel Shader Engine是通过一个Ultra-Threaded Dispatch Processor对最多512条线程进行监控、管理,以实现程序员Shader Model3.0语言编写中的线程通讯、共享资源闭锁互斥等多线程程序编写的手段,以达到更佳的Shader Model3.0程序执行效率。
  通过上面三个子项目的分析,我们不难总结出ATi在新一代GPU设计中理想的架构是:Pixel Shader操作单元要比Vertex Shader操作单元占的比重大,在Pixel Shader操作单元内部,Arithmetic操作单元数量要比Texture单元数量多,而在架构设计方面,尽力配合Shader Model3.0语言中的动态流程管理,优化多线程编译的并行执行效率。从上面对Radeon X1K Series的Ultra-Threaded Pixel Shader Engine解析来看,ATi的确在这些设计上对于并行编译做出了相应的设计,再下面来看看Pixel Shader中关于Texture与Arithmetic的部分。
本帖最近评分记录
简单的爱~

TOP

3:1的Arithmetic:Texture渲染管线



  根据ATi对每一个Pixel Shader指令所包含的Texture、Arithmetic指令的预估,ATi的Radeon X1600Series/X1900Series/都是被设计为Arithmetic:Texture=3:1的架构。不过这里有个疑问,在ATi针对 Pixel Shader内部负载的调查中:在2006年每一个Pixel Shader操作中Arithmetic操作的负荷超过了80%,,ATi的Radeon X1600Series/X1900Series/被设计为Arithmetic:Texture=3:1的架构是否会不能达到性能的最优化呢?其实并不需要真的把Arithmetic:Texture的比例做到8:1,因为很多Texture操作都需要耗费大量的时间,如果按照8:1的比例,那么很多 Arithmetic单元都会在纹理拾取期间处在等待状态。再加上目前制程方面的限制,3:1的比例可以说是ATi所认同的最佳比例。



  既然前面已经有了Radeon X1600Series/X1900Series是采用Arithmetic:Texture=3:1架构,那么ATi为何需要RV560、570呢?其实是因为产品定位方面的原因,Radeon X1600系列虽然采用的是3:1架构,但其仅有12个Arithmetic单元处理能力有限。Radeon X1900则拥有48个Arithmetic单元3亿8千万个晶体管,无论是从性能还是功耗控制都远离了普通用户需求。因此ATi需要性能介于 Radeon X1600Series/X1900Series之间的中端产品,以贴合用户的实际使用,从上图我们可以看出,RV560 Pixel Shader Engine拥有24个Arithmetic单元及8个Texture单元,核心默认频率为600MHz,显存位宽是128bit。而RV570定位则稍高,拥有36个Arithmetic单元及12个Texture单元,核心默认频率为256bit,两款产品都拥有8个Vertex Processors。从上面的构架设计来看,RV570与RV560的性能正好介于Radeon X1600Series与Radeon X1900Series之间,为用户提供了Arithmetic:Texture=3:1架构的中档选择。全系列的产品线一起营造了一个ATi的乌托邦世界,3:1架构、先进的流程控制管理等等。
简单的爱~

TOP

ATi第三代原生CrossFire接口






  这就是ATi第一代的CrossFire接口——DMS,从卡需要输出数据到主卡的DMS传输到Composting Engine进行数据熔合,然后才统一输出到DVI接口。第一代的DMS CrossFire被应用在Radeon X850 CrossFire Edition上。



  在Radeon X1900CrossFire Editon上应用了ATi第二代的CrossFire接口——VHDCI,这是源于ATi专业卡上的双阜接口,应用在Radeon X1900CrossFire Editon上的原因是为了解决传输带宽问题,使得第二代的ATi CrossFire系统得以支持更高的分辨率。






  在RV560、RV570上应用的是第三代的CrossFire接口,这次ATi在RV560、RV560LE、RV570芯片上整合了 Multi-GPU接口,从此再无需Master/Slave卡之分,使用CrossFire桥来连接两片显卡,这种设计有点类似于NVIDIA的MIO 接口。
  据目前最新的消息显示,由于ATi的RV560、RV570第三代CrossFire接口过于类似NVIDIA的MIO设计,因此涉及到专利诉讼方面的问题。ATi已经于近期研制了第四代的CrossFire接口,从新回归到使用线缆连接的时代,从ATi公布的初步资料来看,第四代的 CrossFire线缆将会采用DVI接口来连接,我们到时候将会进一步更新相关的资讯。
简单的爱~

TOP

迪兰恒进Radeon X1950Pro(RV570)








[/url]
  迪兰恒进的这款Radeon X1950Pro采用了瑞士散热器厂商Arctic Cooling的Accelero X2散热器,外观相当的雄伟。PCB板则是采用与Radeon X1900GT一样的板型,治需要稍加修改供电不分则可支持RV570芯片。这与Radeon X1650XT(RV560)的情况相类似, Radeon X1600XT的PCB只要稍加修改供电部分就可以应用在Radeon X1650XT(RV560)上。
[url=http://diy.yesky.com/TLimages/picview/?/imagelist/06/42/fj932qa16j5l.jpg]


  RV570的芯片真身,为06年第33周生产,拥有8个Vertex Processors、36个Arithmetic单元以及12个Texture单元,采用80nm工艺由TSMC生产,默认的核心频率为600MHz,核心显存位宽为256bit。



  迪兰恒进的这款Radeon X1950Pro采用的是Infineon 1.4ns颗粒,默认的运行频率为1400MHz,正面八颗一共是512MBx256bit。
简单的爱~

TOP

技嘉GV-RX195P256D-RH(RV570)






  一线大厂Gigabyte这次也第一时间发布了自家的Radeon X1950Pro产品,产品编号为技嘉GV-RX195P256D-RH,采用了全新的非公版设计,从图片上我们可以明显的看到Gigabyte这款GV -RX195P256D-RH在供电部分进行了重新设计。核心频率为575MHz,显存部分采用了Infineon的1.4ns GDDR3颗粒,默认运行频率为1380MHz,为256MBx256bit设计。另一个有特色的地方就是采用了韩国ZALMAN的散热风扇,对于常关注显卡的玩家来说,ZALMAN以及它的这款风扇大家都该不会陌生了。



  在正式发售的GV-RX195P256D-RH中会附送一款正版——游戏荒野双蛟龙 (Call of Juarez ),喜欢该游戏的玩家不容错过。
简单的爱~

TOP

蓝宝石 Radeon X1950Pro






  Sapphire作为AIB当然会第一时间推出Radeon X1950Pro,与Gigabyte的产品一样,Sapphire的Radeon X1950Pro也是采用256MB版本设计,核心频率为575MHz,现存为256MBx256bit GDDR3规格,默认的运行频率为1380MHz。


简单的爱~

TOP

RV570测试平台及测试环境介绍




  Catalyst Control Center中的Graphics Software信息中心,我们使用的这款Catalyst Version为06.8为内部版,可以支持RV570、RV560核心的产品,从上面我们可以看到这款驱动已经识别出RV570为Radeon X1950Series。



  从驱动中我们可以看到我们手上的Radeon X1950Pro为512MB版本,默认核心频率为594MHz,显存核心为1390MHz。
简单的爱~

TOP

RV570性能实测-Benchmark软件性能

  3DMark05一直以来都是ATi产品的强项,在这之中的RV570对比也不例外,在各个分辨率下都领先于GeForce 7900GS。并且单卡的成绩也能顺利打破一万分。



  在3DMark06中一共有4个项目的对比,分别是Shader Model2.0渲染能力、Shader Model3.0渲染能力、CPU性能、Total总分,因为我们的测试都是居于同一套平台——Intel Conroe X6800处理器上,因此我们省略了CPU部分的成绩对比,只把Shader Model2.0渲染能力、Shader Model3.0渲染能力、Total总分列出来对比。从最后的得分来看,Radeon X1950Pro无疑是在各个项目中保持不同幅度的领先,尤其是在Shader Model3.0渲染能力测试的部分。
简单的爱~

TOP

RV570性能实测-3D游戏软件性能




  从上面实际游戏的测试来看,Radeon X1950Pro在D3D接口的程序中是比较有优势的,在Splinter Cell Chaos Cheory、FarCry、Serious Sam2中都体现出了在执行效率方面的优势,但在使用DOOM3引擎的Prey游戏中,Radeon X1950Pro还是落于下风。因为其Pixel Shader Engine是位D3D,准确点来说是D3D中的Shader Model3.0而优化的,但这种优化并不能带来OpenGL程序的执行效率。
简单的爱~

TOP

DX9乌托邦世界,真是ATi的伊甸园吗?
  从上面我们可以看到,RV560、RV570两款新核心的GPU代表了ATi对显卡未来发展方向的预测以及对Shader Model3.0的理解。在D3D程序的实行效能上我们看到了ATi所需求的结果,但营造一个DX9乌托邦世界,真是ATi的伊甸园吗?





  上面两张图片中,左边为GeForce 7900GTX的核心,右边为Radeon X1950Pro核心,通过对比我们不难看出Radeon X1950Pro的核心尺寸比GeForce 7900GTX的还要大,这就意味着Radeon X1950Pro的核心成本比GeForce 7900GTX还要高,为了所谓的效率,这个代价是否太高了点?
简单的爱~

TOP

 20 12
发新话题