Sony PlayStation 5 游戏主机标准版和 Pro 版本的首席架构师 Mark Cerny 最近详细介绍了 PS5 Pro 支援的 PSSR 超解像度技术。 这项技术由三个主要环节构成:预处理阶段、轻量级 CNN(卷积神经网络)以及后处理阶段。在对比 NPU(神经网络处理器)和 AI GPU 方案后,Sony 发现后者在处理前后阶段更为出色,因此决定採用后者。 为了实现超解像度,Sony 对 RDNA 架构的著色器核心和缓存系统进行了特别优化,即所谓的“定制 RDNA”。PS5 Pro 的目标是达到 300TOPs(8bit)的 AI 性能,但这一性能要求意味著其 GDDR6 的频宽不足以支援将 CNN 处理的中间结果全部导出到外部缓存。 对此,Sony 著力在处理器内部缓存中存储尽可能多的中间步骤数据,以减少对外部 GDDR 缓存的访问需求。然而,300TOPs 的性能目标对应的是数百 TB/s 的频宽需求,这远远超出了数 TB/s 的 L2 缓存能力。最后,PS5 Pro 的开发团队最终将重点放在了 WGP(Wavefront Processing Unit)矢量寄存器上,并通过图像分块技术减少了对处理器内部缓存容量的需求。PS5 Pro 处理器的 WGP 矢量寄存器总容量达到了15MB,能够提供 200TB/s 的频宽,有效地承担了存储 CNN 中间数据的任务。 PS5 也对 RDNA GPU 的架构和指令集进行了修改,新增了 44 条与 CNN 计算和 WGP 矢量寄存器操作有关的著色器指令。 此外 PSSR 和其它超解像度的主要区别之一是在 PC 游戏中超解像度一般而言是固定原生解像度和超解像度比例,动态调整最终帧率;而 PSSR 技术的最终帧率一般处于固定状态,超解像度比例随可达到的原生解像度而变动。 |