pascal
Pascal是英伟达公司于2016年推出的新一代GPU架构,用于接替上一代的Maxwel架构。
Pascal GPU内含1500亿个由16纳米FinFET制造工艺打造的晶体管,是FinFET芯片。
Pascal能让普通计算机变身为超级计算机,包括可为HPC工作负载提供超过5万亿次的双精度浮点运算能力。在深度学习方面,与当代GPU架构相比,搭载Pascal架构的系统使神经网络的训练速度提高了12倍多(将训练时间从数周缩短为数小时),并且将深度学习推理吞吐量提升了7倍。
Pascal是率先集成了革新性的英伟达 NVLink™高速双向互联的架构。此技术能跨越多个GPU扩展应用程序。
Pascal架构将处理器与数据封装到一起,采用HBM2的CoWoS®(晶圆基底芯片)技术采用创新型内存设计方法,可提供高于NVIDIA 麦克斯威(上海)商贸有限公司™架构3倍的显存带宽性能。
概述
Pascal是Maxwell的接替者,增强了异步计算功能实现硬件层了对DirectX API的更高版本(DirectX 12 Feature Level 12_1 )的支持。除了架构上的改进,还使用了更好的16nm FF+工艺(对比Maxwell所使用的28nm),晶体管密度和性能大幅度提升,功耗发热进一步降低,高端产品还配备带宽更高的HBM2显存,性能和能耗比都有了很大提升。
关键技术
台积电 16nm FF+工艺
英伟达® NVLink™ 高速互连技术
HBM2 第二代3D堆栈式高带宽内存
依靠Async shaders从硬件层面完整实现AsyncCompute
支持DirectX 12 Feature Level 12_1
架构
Pascal的GPC有6个SM,每个SM只含有64个CUDA Core,但是拥有64个FP32单元32个FP64单元,FP64与FP32比例达到了1:2,双精度性能大幅度提高,而Pascal的FP32单元可以同时执行2个FP16半精度运算,因此FP16浮点性能也同样获得极大提升。
产品
GeForce系列游戏显卡
GTX1050、1050Ti、1060(3G, 5G, 6G)、1070、1070Ti、1080、1080Ti等
QUADRO系列专业显卡
GP100、P6000、P5000、P4000、P2000、P1000、P600、P400等
Tesla系列加速计算卡
P100、P4、P40
NVS系列多显示器商用显卡
暂无Pascal产品
TITAN显卡
TITAN Xp
参考资料
GPU 选择 深度学习 图像识别.CSDN博客.2024-03-14
NVIDIA Pascal 架构.NVIDIA.2024-03-14
NVIDIA新Pascal发飙:完整支持异步运算.网易.2018-06-25
工艺大提升:Nvidia全新GPU架构Pascal曝光.IT之家.2018-06-25
NVIDIA 发布全球首例高速 GPU 互联技术.环球网.2018-06-27
NVIDIA 2016年推Pascal架构GPU:32GB显存,TB/s带宽.快科技.2018-06-25
Nvidia连发六款Pascal专业卡:旗舰搭载16GB HBM2显存.IT之家.2018-06-25