NVIDIA Turing 图灵架构的 RTX 20 系列显卡带来了革命性的游戏实时光线追踪,开创性是空前的,不过也引发了一些争议,比如现阶段光追的实用性,比如光追对芯片核心面积的影响。
不少人认为,NVIDIA RTX 系列核心加入的 RT 光线追踪核心、Tensor 张量计算核心占用了过多的计算面积,如果把它们用来提升传统的 Shader 着色性能,效果会更好。
真的这样吗?
加入光追的《雷神之锤 2》
除了架构示意图,NVIDIA 近日又放出了 TU106 ( RTX 2070/2060 ) 、TU116 ( GTX 1660 Ti/1660 ) 核心的结构透视图。Reddit 用户 @Qesa 就借此分析了核心内各个单元的面积,尤其是光追的影响。
分析对象是 NVIDIA GPU 核心内的 TPC 单元,它是包含 SM 流处理器阵列、RT 核心、Tensor 核心以及多边形引擎在内的完整基本模块,向上多个 TPC 组成一整个 GPC,再结合显存控制器、缓存、Hub、NVLink 总线、PCIe 总线等组成一个完整的 GPU。
TU106 架构示意图:每个 TPC 单元中一个 RT 核心 ( 黄色 )
分析显示,TU106 核心中每个 TPC 单元的面积为 10.89 平方毫米,TU116 核心中则是 8.94 平方毫米,相差了 1.95 平方毫米,大约 22%,正是 RT、Tensor 核心额外占用的面积,其中 Tensor 核心为 1.25 平方毫米,RT 核心则只有 0.7 平方毫米。
换言之,RT 核心在每个 TPC 单元中的占比只不过区区 6.4%,对整体影响并不大,而依靠这么点面积实现游戏光追,不得不说效率还是极高的。