짤은 월탱의 멀티코어 매커니즘에 대한 것이지만, 꽤나 설명이 직관적이라 가져옴


왜 이딴거 적냐고? 할 게 없어서.


뉴비용임




[기본 지식]


CPU가 하는 일

  • 게임파일을 읽어내고, 거기 적혀 있는 설계도를 해석해서 그래픽카드에게 전달함
  • 설계도를 해석하는 능력은 CPU의 역할이지만, 그걸 그래픽카드에 전달하는 건 CPU 성능 외에도 게임의 최적화 등의 성능이 추가로 필요함


그래픽카드가 하는 일

  • CPU에게 받은 해석된 설계도를 이용하여 결과물을 만들어냄 -> 결과물 1개 = 1프레임
  • 하나의 설계도를 이용해서 결과물을 만드는 시간은 제한되어 있음 -> 그 시간동안 만들어진 결과물이 60개라면 60프레임임. 100개라면 100프레임임
  • 하지만 해석된 설계도로 결과물을 뽑아내는 건 그래픽카드의 능력(성능)에 따라 다름 -> 같은 시간동안 얼마나 많은 프레임을 만들 수 있는가, 얼마나 더 커다란 화면을 빠르게 만드는가
  • 만약 해석된 설계도를 받지 못했다? 업무 지시도 없고 뭘 할지 모르는데 무언가 할 수 있을 거 같음? 아무 일도 안하게됨
  • 만약 해석된 설계도를 받아도 빠르게 처리 못한다? 이미 그래픽카드는 성능의 100%를 활용하는 상태임. CPU가 아무리 좋아도 그래픽카드는 절대로 자기 역량 그 이상으로 일할 수 없음


램(메모리)이 하는 일

  • 램(메모리) = 임시로 저장하는 공간
  • CPU가 저장장치에서 읽어내면 속도가 느리기 때문에, 저장장치에서 자주 사용하는 데이터를 미리 램에다 저장을 하고 그걸 CPU가 램에서 끄집어내서 읽음
  • 당연히 램이 속도가 빠르면 CPU가 더 빠르게 램에서 데이터를 가져올 수 있기 때문에 게임 성능이 향상됨
  • 단, 램이 빠르다고해서 무조건 좋은건 아님. CPU와 램 사이의 통신 딜레이(레이턴시)가 짧아야함. 이건 램의 클럭(속도) 외에도 다양한 요소가 들어감
  • 저장장치의 속도는 50mb-7000mb/s정도지만, 램의 속도는 30000-100000mb/s (30gb/s-100gb/s)


CPU의 L3캐시가 하는 일

  • L3캐시 = 속도가 매우매우매우 빠르지만 공간은 작은 임시 저장공간
  • 램이 아무리 빨라도 CPU의 처리속도에 비해서는 느리기 때문에, CPU 바로 옆에다가 속도가 매우매우매우 빠르지만 작은 램을 추가로 배치하여 CPU가 빠르게 데이터를 확인할 수 있도록 도와줌
  • L3캐시의 속도는 DDR4냐 DDR5냐에 따라다르지만, 일반적으로 4000000 ~ 10000000mb/s (400GB/s-1000GB/s)


해상도가 높아지면 왜 CPU와 램 성능의 영향이 줄어드는가

  • CPU는 해상도와 관계없이 설계도를 한번 해석하고 보내면 그걸로 끝이지만, 그래픽카드는 그 설계를 이용해서 해상도에 맞게 같은 시간동안 여러장 만들어야하기 때문에 결과라 할 수 있는 하나의 프레임에서 CPU와 그래픽카드의 절대 작업량 비율이 1:10이였다면, 고해상도에서는 1:100으로 올라감 (결과론적 관점)
    *잘 모르겠으면 저해상도에서는 해석이 쉬운 설계도가 엄청 많고, 고해상도에서는 해석이 까다로운 설계도지만 수량이 적다고 생각하면 편함 (단, 개념상으론 어느정도 맞지만 설명 자체는 부정확함)

  • 위 특징을 활용하여 CPU는 성능이 낮지만, 모니터의 해상도를 이용하여 그래픽카드만 무식하게 올리는 방법을 사용할 수 있음 (i7-8700k + RTX 4090 조합같은거. 물론 그래픽카드 성능과 CPU의 갭이 너무 큰 상태라면 이 방법을 사용해도 그래픽카드가 처리할 수 있는 설계도 수를 CPU가 제공할 수 없기 때문에 그래픽카드의 성능이 떨어짐. 왜냐면 글카가 CPU가 준 일 다했는데 일을 안주니까 일을 안함!)


VRAM이 게임 성능에 미치는 영향

  • VRAM은 그래픽카드가 사용하는 램. 까다로운 설계도(고해상도)일수록 그걸 만들어내기 위하여 더 많은 임시 공간이 필요함
  • 그래서 고해상도일수록 더 많은 공간을 요구하며(당연히 고화질 이미지를 저장하니까), VRAM의 속도가 빠를수록 저장된 데이터를 빠르게 읽어냄
  • 다르게 말하면 이미 충분한 속도와 공간을 가지고 있다면 VRAM이 게임에 미치는 영향은 적음





[게임 최적화 및 CPU 구조에 따른 그래픽카드 성능 활용도 차이]


viewimage.php?id=2bbb8172&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd5e08bbe314eba769739e89044deaa7c414fa83da15e34eb4d43d5369e70d2

파판14 (일반적인 게임들)


  • 파판은 CPU 최적화가 좋지 않음(중요) -> 근데 K-게임보단 훨씬 좋음, 반박시 내 말이 맞음
  • 코어마다 설계도를 해석해서 그래픽카드에게 전달해야 하는데, 특정 코어의 의존도가 너무 커서 다른 코어들이 설계도를 받질 못함
  • 최종적으로 동일한 시간동안 해석된 설계도가 많이 없고, 그로 인해서 그래픽카드가 일을 제대로 못하게됨
  • 만약 코어 성능 자체가 높다면 일부 코어가 멱살잡고 캐리할 수 있음
  • 이것은 필요한 설계도가 많은 상황인 [주변에 플레이어가 많은 경우에 심해짐, 다르게 말하면 플레이어가 적다면 완화됨]
    -> CPU/램 성능이 좋다면 위 상황에서 프레임이 급감할텐데, 프레임이 떨어지는 폭을 크게 완화시킴


*파판의 코어 활용은 최대 6-8코어(스레드)까지임. 만약 그거보다 많은 거 같다? 그럼 너가 잘못 측정한거임. 반박시 내 말이 맞음

*우리는 이러한 특징을 생각하고, 다른 요소들을 활용해서 이 문제를 해결해야함
*다른 요소 = CPU 성능 자체를 높인다, L3캐시가 많은 CPU를 쓴다, 램 오버클럭을 통해서 램 속도를 빠르게한다
*램 오버클럭은 설정값에 따라 다르지만 FHD 파판 기준으로 약 10-15%정도의 성능향상이 있음 (게임의 CPU활용이 비효율적일수록 빛을 보는 방법)





viewimage.php?id=2bbb8172&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd5e08bbe314eba769739e89044deaa7c414fa83da25063ef4e13d2369e70d2

파판14에서 L3캐시가 많은 CPU를 사용하는 경우(5600x3d, 5800x3d, 7800x3d, 7900x3d, 7950x3d)

*5600x3d는 국내 미정발임. 북미에서만 파는 제품

  • 코어들이 그래픽카드를 위한 해석해야 하는 설계도를 제대로 못받고 있다고? 그러면 해석해야 하는 설계도를 빨리 받으면 더 빨리 일 할 수 있는거 아냐?
  • 코어마다 할당되는 일의 비중은 동일하지만, 설계도를 더 빨리 받기 때문에 결과적으로는 같은 시간동안 더 많은 설계도를 해석할 수 있음
  • 현재 이 방법의 문제는 'CPU가 비싸다' '발열이 높다' '발열이 높으니 다른 곳에서 발열을 줄여야해서 CPU 성능 자체를 줄여야한다'

    *이미 CPU로 성능을 끌어올릴 수 있는 한계치까지 닿았기 때문에, 램 오버클럭 등을 통한 성능 향상이 거의 없음(1%이내)






viewimage.php?id=2bbb8172&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd5e08bbe314eba769739e89044deaa7c414fa866ce40c7e079fde7bb5d26f7

초-갓겜 월드 오브 탱크(=CPU 최적화가 좋은 경우)


  • 모든 코어를 적절하게 사용하여 일을 배분할 수 있음
  • 결과적으로 그래픽카드에게 더 많은 일을 시킬 수 있게됨
  • 일반적으로 DX12 게임들은 멀티스레드 렌더링을 지원하기 때문에 AAA급 게임들은 저러한 모습을 보여줌 (월탱이 특이한거임)










viewimage.php?id=2bbb8172&no=24b0d769e1d32ca73fea8efa11d028317044ef0bb41aaa70c68a363cd5e08bbe314eba76d265bef641d3ad7c414bc466f966937e1cf53fc3922e9dbea0bc6b

(16스레드가 모두 활성화되는 갓겜짤, 32스레드도 가능)




게시물 요약

  1. 월드 오브 탱크는 정말 최적화 초초초초갓겜입니다
  2. 파판의 경우에는 CPU 최적화에 한계점이 분명하기 때문에 CPU 자체 성능을 높이거나 다른 요소를 활용하여 그 문제를 해결해야한다
  3. 그래도 결국 게임 프레임은 그래픽카드가 중요하기 때문에 그래픽카드에 더 많은 투자를 해야한다
  4. 그래픽카드는 좋은대, CPU가 안좋다? 그러면 해상도를 높이는 방법으로도 CPU성능 부족을 커버할 수 있음

견적 팁
  1. 작업용 컴퓨터(4k이상의 영상편집/3D 렌더링)가 아니라면 '일정 수준 이상의 CPU와 좋은 그래픽카드'를 조합
  2. 예산이 적다면 CPU를 일정 수준까지 낮추면서, 글카는 가능한 최대치로 맞추셈. 그게 게임 체감이 더 좋음
  3. 예산이 많다면 CPU하고 글카 둘 다 올리셈 (작업 성능은 물론이고 프레임이 순간적으로 떨어지는 낙폭을 줄여줌. 단, 작업성능과 게임성능은 별개임)
  4. (매우매우매우 중요) 다나와에서 제발 사지마라. 무지성으로 살거면 컴퓨존에서 사라. 반은 간다 (무통장은 아이코다가 나음, 네이버페이는 컴퓨존이 나음)



그리고 모니터는 제발 좀 부탁이니까 글카 성능에 맞게 구매해서 써주셈
50만원 100만원 200만원짜리 글카를 25만원 50만원 100만원처럼 쓰지말란거임. RTX 4090 샀으면 4K 고주사율 모니터로 돌리고, 4070TI 샀으면 QHD 고주사율 모니터로 돌리라는 뜻