So sánh kiến trúc của NVIDIA GPU trong các dòng card đồ họa: Pascal, Volta, Turing

Kiến trúc của mỗi GPU sẽ quyết định hiệu suất và cách thức hoạt động của của card đồ họa nói riêng và của toàn bộ hệ thống nói chung. GPU của NVIDIA, AMD hay các hãng khác nhau sẽ có kiến trúc khác nhau. Thậm chí, trong cùng 1 hãng, như NVIDIA chẳng hạn, các dòng card khác nhau cũng được dựa trên các nền tảng kiến trúc khác nhau.
Mỗi nhà sản xuất GPU thiết kế kiến trúc GPU của riêng mình và kiến trúc GPU của card đồ họa từ Nvidia và AMD hoàn toàn khác nhau về cách làm việc, vận hành hay thậm chí là cách đặt tên. Ví dụ, kiến trúc GPU của Nvidia là Fermi, Kepler, Pascal, Volta, Turing trong khi GPU của AMD là GCN (1.0, 2.0, 3.0), Polaris (GCN 4.0) và Vega.
Bài viết này so sánh 3 kiến trúc GPU hiện đại nhất của Nvidia, đó là Pascal, Volta và Turing dựa trên đặc điểm kỹ thuật, hiệu suất, cách sử dụng và ứng dụng của chúng trong ngành công nghiệp đồ họa, bao gồm cả các ứng dụng cho AI, Deep learning và Machine Learning.

Kiến trúc NVIDIA Pascal GPU

Pascal (2016) là một trong những kiến trúc GPU phổ biến nhất của Nvidia, được kế thừa từ kiến trúc GPU Maxwell (2014). Các dòng card đồ họa GeForce 10 và Quadro P được xây dựng trên kiến trúc GPU Pascal. GPU Pascal được thiết kế trên công nghệ 16nm / 14nm và sử dụng CUDA Cores làm công nghệ chính trong việc xử lý pixel và Rasterization.
GeForce GTX 1050, GTX 1050 Ti và GT 1030 được xây dựng trên công nghệ Finnm 14nm trong khi các kiến trúc của dòng GPU khác được xây dựng trên quy trình công nghệ 16nm. Kiến trúc GPU Pascal mang lại những cải tiến đáng kể so với các kiến trúc cũ hơn về hiệu năng, mức tiêu thụ điện năng (TDP) và phát sinh nhiệt.
Kiến trúc GPU Pascal hỗ trợ bộ nhớ GDDR5, GDDR5X và HBM2. Trong đó, chỉ có card đồ họa workstation cao cấp hơn (Nvidia Quadro GP100) có bộ nhớ HBM2 băng thông cao. Kiến trúc GPU của Nvidia Pascal hỗ trợ DirectX 12, OpenGL 4.6, Vulkan, OpenCL, SLI (dành cho card GeForce cao cấp), NVLink (workstation SPUs), NVENC, G-Sync, GPU Boost 3.0, DisplayPort 1.4, HDMI 2.0b , CUDA Compute Capability 6.0 / 6.1 và VR Ready.

Kiến trúc NVIDIA Volta GPU

Volta (2017) kế thừa kiến trúc GPU Pascal dựa trên công nghệ 12nm. Nó hỗ trợ bộ nhớ HBM2 tốc độ cao và băng thông cao. Kiến trúc Volta được thiết kế để phục vụ nhu cầu của các cluster chuyên dụng và trung tâm dữ liệu. Kiến trúc GPU này được cung cấp bởi CUDA Cores và Tensor Cores. Tensor Cores được sử dụng cho trí tuệ nhân tạo (AI), Deep Learning, Machine Learning, các tính toán số học phức tạp với hiệu suất tăng hơn 5 lần so với kiến trúc Nvidia Pascal.
Các dòng card đồ họa sử dụng kiến trúc Volta GPU bao gồm Nvidia Titan V, Nvidia Titan V CEO Edition và Nvidia Quadro GV100. Kiến trúc Volta hỗ trợ công nghệ NVLink 2.0 nhanh hơn nhiều so với NVLink trước đó và cho phép tốc độ truyền dữ liệu cao hơn nhiều là 25 Gbit/s cho mỗi luồng dữ liệu.

Kiến trúc NVIDIA Turing GPU

– Turing là sự kế thừa của kiến trúc GPU Volta. Đây là một trong những kiến trúc GPU tiên tiến nhất tính đến hiện nay (2018). Turing GPU được xây dựng trên công nghệ FinFET 12nm và hỗ trợ bộ nhớ GDDR6 hoạt động ở tốc độ rất cao, có thể đạt được băng thông cao hơn nhiều so với các bộ nhớ GDDR5X và GDDR5 trước đó. Kiến trúc GPU tiên tiến này đi kèm với CUDA Cores, Tensor Cores và RT Cores. Turing là kiến trúc GPU đầu tiên hỗ trợ Real Time Ray Tracing để tạo ra ánh sáng, bóng, phản xạ, khúc xạ và các hiệu ứng ánh sáng tiên tiến khác. Ray theo dõi thời gian thực được xử lý bởi RT Cores và hiệu suất của nó được đánh giá trong một chỉ số mới có tên là Giga Rays / giây.
– Tensor Cores trong Turing GPU được thiết kế đặc biệt cho Artificial Intelligence (AI) và Deep Learning để thực hiện các loại tính toán phức tạp khác nhau. Nó cũng được sử dụng cho một kỹ thuật được gọi là Deep Learning Super-Sampling (DLSS) hoặc (Deep learning anti-aliasing) để làm mịn các đường viền trong games, giảm nhiễu, cho độ phân giải cao và video trong thời gian thực.
– CUDA được sử dụng cho các nhiệm vụ xử lý dựa trên Pixel chuẩn hoặc Rasterization, nhưng trong Turing chúng có một kiến trúc đa xử lý trực tuyến mới (Streaming Multiprocessor – SM) hỗ trợ tới 16 nghìn tỷ phép toán điểm động song song với 16 nghìn tỷ phép tính nguyên trong mỗi giây. Điều này bây giờ có thể cho phép các nhà phát triển tạo ra các mô phỏng phức tạp, chẳng hạn như các hạt hoặc chất lỏng chuyển động trong các thí nghiệm mô phỏng, môi trường ảo và các hiệu ứng đặc biệt. Theo Nvidia, Turing GPU cung cấp hiệu năng lên đến 6X so với GPU dựa trên Pascal.
– Nvidia còn sản xuất cả card đồ họa và máy trạm chơi game dựa trên kiến trúc GPU Turing. Card đồ họa Turing Workstation bao gồm các dòng Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000. Còn Gaming Graphics Cards có GeForce RTX 20 series bao gồm GeForce RTX 2080 Ti, RTX 2080 và RTX 2070. Turing hỗ trợ thiết lập đa GPU cho cả Quadro RTX và Thẻ đồ họa GeForce RTX sử dụng NVLink để tăng gấp đôi hoặc gấp ba lần hiệu suất tính toán của chúng. Card đồ họa GeForce RTX cũng hỗ trợ kết nối VirtualLink qua đầu nối USB Type-C để kết nối tai nghe VR trên cổng USB Type-C để có trải nghiệm thực tế ảo tuyệt vời. Mặt khác, Quadro RTX GPU có khả năng xử lý video 8K trong thời gian thực cho thấy sức mạnh của kiến trúc mới này.

BẢNG SO SÁNH CHUNG NVIDIA GPU PASCAL, VOLTA, TURNING

GPU Architecture ->	Pascal	Volta	Turing
GPU Manufacturer	Nvidia	Nvidia	Nvidia
Fabrication Process	14nm / 16nm	12nm	12nm
CUDA Cores	Yes	Yes	Yes
Tensor Cores	NA	Yes	Yes
RT Cores	NA	NA	Yes
Memory support	DDR4, GDDR5, GDDR5X, HBM2	HBM2	GDDR6
VR Ready	Yes	Yes	Yes
VirtualLink (USB Type-C)	NA	NA	Yes
Multi-GPU support	Yes (in high end cards), SLI and NVLink	NVLink 2	NVLink 2 / NVLink SLI
Graphics Cards	GeForce 10 series, Nvidia Titan X, Nvidia Titan Xp, Quadro P series workstation graphics cards, Quadro GP100	Nvidia Titan V, Quadro GV100	Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000 / RTX series graphics cards
Applications	Gaming, Workstation	Artificial Intelligence (AI), Workstation, Datacenter	Artificial Intelligence (AI), Workstation, Gaming