RTX 3070 : https://www.techpowerup.com/gpu-specs/geforce-rtx-3070.c3674
GTX 650 : https://www.techpowerup.com/gpu-specs/geforce-gtx-650.c894
PS5 : https://www.techpowerup.com/gpu-specs/playstation-5-gpu.c3480
XBOX Series X : https://www.techpowerup.com/gpu-specs/xbox-series-x-gpu.c3482
RTX 3070(2020) | PS5(2020) | SnapDragon865 (2020) |
GTX650(2012) | XBOX SeriesX (2020) |
|
GPU Name | GA104(8nm) Ampere |
Oberon(7nm) RDNA 2.0 |
Adreno 650(7nm) | GK106(26nm) Kepler |
Scarlett(7nm) RDNA 2.0 |
Base Clock | 1500MHz 1725MHz (Boost Clock) |
2233MHz | 250MHz 587MHz (Boost Clock) |
1058MHz |
1825MHz |
Memory Clock Memory Size Memory Type Memory Bus Bandwidth |
1750MHz 14 Gbps effective 8GB GDDR6 256bit 448.0 GB/s |
1750MHz 14 Gbps effective 16GB GDDR6 256bit 448.0 GB/s |
2750MHz / LPDDR4X(or LPDDR5) 64bit 44 GB/s |
1250MHz 1GB GDDR5 128bit 80.00 GB/s |
1750MHz 14 Gbps effective 10GB GDDR6 320bit 560.0 GB/s |
Shading Units TMUs ROPs |
5888 184 96 |
2304 144 64 |
512 24*2 7 |
384 32 16 |
3328 208 64 |
Pixel Rate Texture Rate FP16(half) FP32(float) FP64(double) |
165.6 GPixel/s 317.4 GTexel/s 20.31 TFLOPS(1:1) 20.31 TFLOPS 317.4 GFLOPS(1:64) |
142.9 GPixel/s 321.6 GTexel/s 20.58 TFLOPS(2:1) 10.29 TFLOPS 643.1 GFLOPS(1:16) |
14.1 GPixel/s 28.1 GPixel/s / 1.3 TFLOPS / |
8.464 GPixel/s 33.86 GTexel/s / 812.5 GFLOPS 33.86 GFLOPS(1:24) |
116.8 GPixel/s 379.6 GTexel/s 24.29 TFLOPS(2:1) 12.15 TFLOPS 759.2 GFLOPS(1:16) |
Bandwidth : 메모리 대역폭. 버스메모리(비트)/8 x 그래픽카드 클럭. GPU성능이 우선이고 이를 전달할 통로가 대역폭이다.
GDDR3/GDDR4/GDDR5 칩 하나당 32bit interface가 있는데, 2개를 병렬로 연결하면 64bit GDDR5 bus, 4개면 128 bit, 6개면 192 bit, 8개면 256 bit, 12개면 384 bit, 16개면 512 bit. 메모리칩을 하나의 GPU에 연결하기 위해서 PCB설계가 더욱 더 복잡해지고, 메모리 클럭도 떨어지게 된다. 더 높은 메모리 버스 일수록 파워를 더 많이 먹게되고, 발열, 그리고 GPU자체도 메모리 컨트롤러 때문에 커지게 됨. 256과 512비트의 경우 PCB 기판 가격도 고가가 된다.
HBM/HBM2같은경우는 1스택당 1024 bit bus인데, 여기서는 버스가 높아서 클럭을 낮추어도 총 Bandwidth는 크다.
메모리 버스 * 속도 (Gbps)/8= 메모리 시스템의 총 Bandwidth
ex. 256-bit bus * 8Gbps GDDR5/8= 256GB/s - RX 480 8GB의 총 Bandwidth
ex2. 4096-bit bus * 1Gbps HBM/8=512GB/s - R9 Fury X의 총 Bandwidth
ex3. 2048-bit bus * 1.89Gbps HBM2/8 = 484GB/s - Radeon Vega FE의 총 Bandwidth
TMU는 텍스쳐 맵핑 유닛.
픽셀 필레이트 : 초당 주사되는 픽셀(도트)의 양. 1GB/s = 초당 10억개. ROPs x 코어클럭으로 계산.
텍셀 필레이트 : 초당 픽셀에 주사할수 있는 텍스쳐의 양.
Shading Units(쉐이더 유닛수) : 각종 그래픽 효과의 처리를 전문적으로 담당하는 쉐이더 유닛의 수
(AMD와 Nvidia의 그래픽 처리 방식의 차이에 따라 숫자가 다르게 나올수 있음)
ROPs(Render Output Pipelines) : 해당 GPU가 동시에 몇 개의 연산을 할 수 있는지를 나타내는 수치
TMUs(Texture Mapping Units) : 화면을 화려하고 현실적으로 꾸미는 '텍스처 매핑'을 담당하는 유닛의 수
shading unit >> ROPs를 통해 화면에 그려주게 됨.
'Technical Report > Graphics Tech Reports' 카테고리의 다른 글
[번역]Occluders : Blocking the player (0) | 2022.01.12 |
---|---|
[번역]Unity(및 기타 프로그램)를 위한 완벽한 노멀 맵 생성 (0) | 2022.01.07 |
URP에서 TransparentObject mesh Depth pass에 쓰기 (0) | 2021.04.22 |
shader gamma test (0) | 2021.03.03 |
Uncharted 4 Technical art review (0) | 2020.12.07 |