본문으로 바로가기
반응형

RTX 3070 : https://www.techpowerup.com/gpu-specs/geforce-rtx-3070.c3674

GTX 650 : https://www.techpowerup.com/gpu-specs/geforce-gtx-650.c894 

PS5 : https://www.techpowerup.com/gpu-specs/playstation-5-gpu.c3480

XBOX Series X : https://www.techpowerup.com/gpu-specs/xbox-series-x-gpu.c3482

  RTX 3070(2020) PS5(2020) SnapDragon865
(2020)
GTX650(2012) XBOX SeriesX
(2020)
GPU Name GA104(8nm)
Ampere
Oberon(7nm)
RDNA 2.0
Adreno 650(7nm) GK106(26nm)
Kepler
Scarlett(7nm)
RDNA 2.0
Base Clock 1500MHz
1725MHz
(Boost Clock)
2233MHz 250MHz
587MHz
(Boost Clock)
1058MHz

1825MHz
Memory Clock


Memory Size
Memory Type
Memory Bus
Bandwidth
1750MHz
14 Gbps effective

8GB
GDDR6
256bit
448.0 GB/s
1750MHz
14 Gbps effective

16GB
GDDR6
256bit
448.0 GB/s
2750MHz
/

LPDDR4X(or LPDDR5)

64bit
44 GB/s
1250MHz


1GB
GDDR5
128bit
80.00 GB/s
1750MHz
14 Gbps effective

10GB
GDDR6
320bit
560.0 GB/s
Shading Units
TMUs
ROPs
5888
184
96
2304
144
64
512
24*2
7
384
32
16
3328
208
64
Pixel Rate
Texture Rate
FP16(half) 
FP32(float)
FP64(double) 
165.6 GPixel/s
317.4 GTexel/s
20.31 TFLOPS(1:1)
20.31 TFLOPS
317.4 GFLOPS(1:64)
142.9 GPixel/s
321.6 GTexel/s
20.58 TFLOPS(2:1)
10.29 TFLOPS
643.1 GFLOPS(1:16)
14.1 GPixel/s
28.1 GPixel/s
/
1.3 TFLOPS
/
8.464 GPixel/s
33.86 GTexel/s
/
812.5 GFLOPS
33.86 GFLOPS(1:24)
116.8 GPixel/s
379.6 GTexel/s
24.29 TFLOPS(2:1)
12.15 TFLOPS
759.2 GFLOPS(1:16)

Bandwidth : 메모리 대역폭. 버스메모리(비트)/8 x 그래픽카드 클럭. GPU성능이 우선이고 이를 전달할 통로가 대역폭이다. 

GDDR3/GDDR4/GDDR5 칩 하나당 32bit interface가 있는데, 2개를 병렬로 연결하면 64bit GDDR5 bus, 4개면 128 bit, 6개면 192 bit, 8개면 256 bit, 12개면 384 bit, 16개면 512 bit.
메모리칩을 하나의 GPU에 연결하기 위해서 PCB설계가 더욱 더 복잡해지고, 메모리 클럭도 떨어지게 된다. 더 높은 메모리 버스 일수록 파워를 더 많이 먹게되고, 발열, 그리고 GPU자체도 메모리 컨트롤러 때문에 커지게 됨. 256과 512비트의 경우 PCB 기판 가격도 고가가 된다.
HBM/HBM2같은경우는 1스택당 1024 bit bus인데, 여기서는 버스가 높아서 클럭을 낮추어도 총 Bandwidth는 크다.

메모리 버스 * 속도 (Gbps)/8= 메모리 시스템의 총 Bandwidth
ex. 256-bit bus * 8Gbps GDDR5/8= 256GB/s - RX 480 8GB의 총 Bandwidth
ex2. 4096-bit bus * 1Gbps HBM/8=512GB/s - R9 Fury X의 총 Bandwidth
ex3. 2048-bit bus * 1.89Gbps HBM2/8 = 484GB/s - Radeon Vega FE의 총 Bandwidth

TMU는 텍스쳐 맵핑 유닛.

픽셀 필레이트 : 초당 주사되는 픽셀(도트)의 양. 1GB/s = 초당 10억개. ROPs x 코어클럭으로 계산.

텍셀 필레이트 : 초당 픽셀에 주사할수 있는 텍스쳐의 양.

Shading Units(쉐이더 유닛수) :  각종 그래픽 효과의 처리를 전문적으로 담당하는 쉐이더 유닛의 수
(AMD와 Nvidia의 그래픽 처리 방식의 차이에 따라 숫자가 다르게 나올수 있음)

ROPs(Render Output Pipelines) : 해당 GPU가 동시에 몇 개의 연산을 할 수 있는지를 나타내는 수치
TMUs(Texture Mapping Units) :  화면을 화려하고 현실적으로 꾸미는 '텍스처 매핑'을 담당하는 유닛의 수
shading unit >> ROPs를 통해 화면에 그려주게 됨.

반응형