엔비디아 지포스 RTX 3090·RTX 3080·RTX 3070, 예상 스펙은?

뉴스/IT|2020. 8. 27. 15:12

엔비디아 지포스 RTX 3090·RTX 3080·RTX 3070, 5248·4352·2944 쿠다 코어 탑재


- 작성자 : 세비지 -


엔비디아(NVIDIA)는 튜링(Turing) 후속으로 암페어(Ampere) 아키텍처 기반의 지포스 RTX 30 시리즈를 출시할 것으로 알려진 가운데 먼저 시장에 출시할 하이엔드와 퍼포먼스 라인업 GPU의 예상 스펙이 등장했습니다.


videocardz는 엔비디아의 지포스 RTX 30 시리즈 3종의 예상 스펙을 소개했습니다. 그에 따르면 지포스 RTX 30 시리즈는 하이엔드와 퍼포먼스 부터 등장합니다.


가장 높은 성능의 지포스 RTX 3090(GeForce RTX 3090)은 5248 쿠다 코어(CUDA Cores)와 384bit 메모리 버스와 24GB GDDR6X 메모리, 지포스 RTX 3080(GeForce RTX 3080)은 4352 쿠다 코어와 320bit 메모리 버스와 10GB GDDR6X 메모리를 탑재한다. 지포스 RTX 3070(GeForce RTX 3070)은 2944 쿠다 코어 스펙 외에 메모리 버스와 용량 등의 내용은 확인되지 않았습니다.


엔비디아는 지포스 RTX 30 시리즈 출시를 앞두고 새로운 제품에 적용될 것으로 보이는 쿨링 솔루션, PCB 기판 설계, 새로운 12핀 전원 공급 커넥터 등을 소개하는 영상을 공개했습니다. 쿨링 솔루션은 기존 지포스 RTX 20 FE와 다른 디자인을 통해 향상된 냉각 효율 제공, PCB도 기존 대비 작아지고 12핀 보조 전원 커넥터는 FE 모델에서 적용될 것으로 예상되고 있습니다. 기존 PCIe 8핀과 호환되는 어댑터는 기본 제공하며 지포스 RTX 3090 FE는 850W PSU가 필요할 것으로 알려졌습니다.


최근 등장한 지포스 RTX 30 시리즈 3DMark Time Spy Extreme 테스트의 그래픽 스코어에 따르면 지포스 RTX 3090 FE는 10000 스코어, 지포스 RTX 2080 Ti FE는 6400 스코어로 RTX 3090 FE가 RTX 2080 Ti FE 대비 56.25%의 향상, 지포스 RTX 3080 FE는 8500 스코어로 32.8% 가량 앞서는 것으로 나타났습니다. 다만 유출된 스코어가 실제 제품에도 그대로 반영될지는 확실치 않아 보이나 해당 성능 향상이 사실이라면 파스칼(Pascal) 등장을 연상케 합니다.


예상 가격은 지포스 RTX 3090이 1399달러($1399), RTX 3090 FE는 1499달러($1499), RTX 3080은 799달러($799), RTX 3060은 399달러($399)로 예상되고 있습니다. 지포스 RTX 3070은 599달러($599)에 지포스 RTX 2080 Ti FE급의 성능을 제공하며 8GB GDDR6와 16GB GDDR6의 2가지 버전으로 등장할 것이라는 소식도 전해졌습니다.


한편 엔비디아는 지포스 RTX 30 시리즈를 9월 2일 새벽 1시(한국시간)에 발표할 것으로 알려졌습니다.



내용 참고 : https://blueframe.co.kr/bbs/board.php?bo_table=news01&wr_id=3630


댓글()

내장 GPU부터 고성능 GPU 라인업까지, 인텔 Xe 그래픽 아키텍처

뉴스/IT|2020. 8. 15. 17:19

내장 GPU부터 고성능 GPU 라인업까지, 인텔 Xe 그래픽 아키텍처

 

- 작성자 : 세비지 -

 

인텔은 8월 13일(현지시간) 아키텍처 데이 2020(Architecture Day 2020)을 열고 새로운 시대의 변화에 맞춰 기술 혁신의 6가지 분야에서의 진전을 소개했습니다. 

 

이날 인텔은 6가지 분야의 진전 중 차세대 Xe 그래픽 아키텍처에 대한 내용도 공개했습니다.

 

 

인텔 Xe 그래픽 아키텍처는 제온과 내장 등 오픈 소스 기반으로 소프트웨어 최적화와 내장 칩과 패키지 등 다양화, 인공지능(AI)와 비주얼 클라우드(Visual Cloud) 최적화 등을 통한 새로운 워크로드 지원을 목표로 개발되었습니다. 기존의 GPU가 게이밍을 위한 제품에서 GPGPU와 같은 범용적으로 사용 가능해진 것처럼 Xe 그래픽 아키텍처도 범용 연산부터 게이밍을 위한 외장 GPU, 모바일과 소형 폼팩터 등을 위한 내장 GPU(iGPU), 고성능 컴퓨팅(HPC)에 이르는 다양한 구성이 가능한 것이 특징입니다.

 

 

 

 

내장 GPU는 저전력의 Xe-LP, 게이밍에는 Xe-HPG, 고성능 컴퓨팅에는 Xe-HP, 데이터선터용으로는 서버 GPU(SG1), 첫 Xe 기반 외장 GPU로 Xe-LP 기반 코드명 DG1을 공개한 바 있습니다.

 

이중 비교적 상세한 내용이 공개된 Xe-LP는 모바일 플랫폼에 최적화된 저전력 아키텍처로 기존 Gen11의 48개 보다 증가한 최대 96개의 실행유닛(EU, Execution Units)를 제공하며 비동기 컴퓨팅과 뷰 인스턴싱, 샘플러 피드백, AV1 코덱으로 업데이트된 미디어 엔진, 최신 디스플레이 엔진, 인스턴트 게임 튜닝과 캡처 및 스트림, 이미지 선명화의 새로운 기능, 새로운 DX11 경로와 최적화된 컴파일러를 통해 드라이버를 개선할 수 있습니다. Xe-LP 그래픽에 대한 내용은 인텔 차세대 프로세서, 윌로우 코브·타이거 레이크 SoC에서 확인할 수 있습니다.

 

 

 

또한 Xe 그래픽 아키텍처를 기반으로 하는 외장 GPU는 외부 파운드리를 이용해 제조될 것으로 알려졌으며 TSMC가 유력하게 거론되고 있습니다. TSMC를 이용한다면 제조 공정은 7nm를 이용할 가능성이 높으며 DG1 외장 GPU와 서버용 SG1이 인텔 10nm 슈퍼핀(SuperFin)을 기반으로 제조되는 것과 차이가 있습니다. 패키징 기술은 Xe-HP 등이 다중 타일(MCM)로 EMIB 패키징이 필요할 것으로 알려졌는데 Xe-HPG는 초기에는 MCM GPU가 아닌 단일 타일 기반의 외장 GPU가 됩니다.

 

 

 

 

게이밍용 고성능 외장 GPU가 될 Xe-HPG는 GDDR6 메모리와 단일 HPG 타일로 구성될 것으로 외신을 통해 전해졌습니다. 고성능 컴퓨팅을 위한 Xe-HP 아키텍처 기반 아틱 사운드(Arctic Sound)를 통해 알려진 GPU의 타일(Tile) 구성은 1 타일이 512개 실행유닛(512EUs, 4096코어), 2타일이 1024개 실행유닛으로 8192코어, 4타일은 2048개 실행유닛으로 16384 코어를 탑재합니다. Xe-HPG가 512개 실행유닛(512EUs, 4096코어)를 그대로 탑재하고 등장할지 라인업에 따라 다양하게 구성할지는 차후 공개될 것으로 예상됩니다.

 

Xe-HPG는 단일 타일, 1개의 타일로 512개의 실행유닛(4096코어)를 탑재할 것으로 알려졌고 Xe-HP 단일 타일은 4K 60 HEVC 컨텐츠 10개의 개별 스트림을 트랜스코딩할 수 있는 성능을 제공합니다. 4타일은 40개의 다른 스트림을 트랜스코딩할 수 있으며 MCM GPU로 1.3GHz 클럭에서 FP32 42 TFLOPs 연산 성능을 제공합니다.

 

다만 Xe-HP 아키텍처의 이와 같은 성능이 그대로 게이밍용 Xe-HPG 아키텍처에 그대로 적용될 것인지는 확실치 않습니다. AMD와 엔비디아(NVIDIA)와 같이 전문가용 GPU는 해당 분야의 기능을 축소하거나 제거해 출시하는 경향을 고려하면 게임 지향 Xe-HPG는 게이밍에 집중한 설계로 전환될 가능성이 높아 보입니다.

 

 

 

Xe-HPG는 외장 GPU로 구성되고 게이밍을 위한 성능을 제공해야 하는 만큼 조금 더 세부적으로 공개된 모바일 등을 위한 저전력 Xe-LP 아키텍처와는 차이가 있을 것으로 보입니다.

 

Xe-LP의 내장 GPU는 연산 엔진이 기존 Gen11 대비 1.5배(1.5x) 더 확장되었으며 2개의 실행유닛(EU)를 제어하는 고효율 스케쥴러를 탑재합니다. 기존 Gen 11은 실행유닛(EU) 당 1개의 스레드 컨트롤이 이루어졌습니다. 최대 96개 실행유닛으로 1536FLOPs/ 1clock, 48 텍셀/ 1클럭 샘플러, 최대 24 픽셀/ clock 픽셀 백엔드, 기존 Gen11은 4-Wide FP/INT ALU, 4-Wide FP/EM ALU인데 반해 Xe-LP에서는 8-Wide FP/INT ALU(2x INT16과 INT32 2배 증가, Fast INT8 with DP4A)과 2-Wide EM ALU로 전환되었습니다. 메모리 컨트롤러와 상호 연결 대역폭(GTI, Graphics Technology interface)은 2배로 늘어났습니다. 이러한 변화는 정수 연산 중요성이 높아지는 최근의 상황을 고려한 아키텍처적인 변화입니다.

 

 

 

또한 Xe-HPG는 하드웨어어 기반 레이 트레이싱(Ray-Tracing)을 가속합니다. 레이 트레이싱은 광선을 픽셀 단위로 추적해 게임의 화면을 구현하는 기법으로 광선을 따라 가면서 빛의 밝기를 계산해 높은 연산 성능이 필요합니다.

 

엔비디아(NVIDIA)의 실시간 레이 트레이싱 RTX, AMD도 차세대 GPU에서 레이 트레이싱 가속을 지원할 것으로 알려진 바 있습니다. 엔비디아의 RTX 기능을 구현한 지포스 RTX 20 시리즈는 사실적인 광원 효과 등을 구현해 향상된 게임 화면을 제공하지만 1세대 RT 엔진으로는 RTX를 켜면 프레임(FPS)이 크게 저하되는 만큼 다음 세대인 지포스 RTX 30 시리즈에서의 개선을 기대하고 있습니다. 그만큼 레이 트레이싱 가속은 높은 연산 성능이 필요한데 Xe-HPG는 초기 제품이 엔비디아 지포스 RTX 20 시리즈와 같이 충분한 성능을 제공하지 못할 가능성도 있어 보입니다.

 

 

 

 

 

 

인텔은 Xe 그래픽 아키텍처에는 새로운 기능도 추가됩니다. 인텔 그래픽 커맨드 센터(IGCC)에서는 인스턴트 게임 튜닝과 게임 샤프닝, 캡처 및 스트림 등을 지원합니다. 인스턴트 게임 튜닝은 게임에 특화된 드라이버로 전체 드라이버를 다운로드 및 설치하지 않고도 수정 및 최적화를 이전보다 빠르게 적용할 수 있으며 게임당 사용자로부터 한 번의 적용만 필요합니다.

 

 

 

 

가변 레이트 쉐이딩(Variable Rate Shading)은 GPU 전체의 쉐이딩 작업을 줄여줘 쉐이더 처리 부하를 줄이고 효율을 개선합니다. 게임 샤프닝은 게임 선명도를 높이는 컴퓨트 셰이더(compute shader) 기반 어댑티브 샤프닝 알고리즘인 퍼셉츄얼 어댑티브 샤프닝(Perceptual adaptive sharpening) 기능을 사용해 게임 이미지를 선명하게 만드는 새로운 후처리(Post-processing) 기능입니다. 특히 해상도 스케일링을 사용하여 성능과 이미지 품질의 균형을 맞추는 타이틀에 유용하며 IGCC 옵트인 기능으로 활용 가능합니다. 가변 레이트 쉐이딩과 게임 샤프닝은 엔비디아와 AMD GPU에서 지원되고 있는 기능들입니다.

 

이러한 Xe-LP의 변화를 고려하면 Xe-HPG 역시 Xe-LP의 효율화와 정수 연산 성능 개선, 레이 트레이싱 가속, 최적화 드라이버, 주요 GPU 제조사가 지원하는 게임 선명도 향상 등 다양한 변화가 예상합니다.

 

한편 인텔 Xe 그래픽 아키텍처를 기반으로 하는 게이밍용 Xe HGP GPU는 2021년 출시 예정입니다.

 

 

내용참고 : https://blueframe.co.kr/bbs/board.php?bo_table=article04&wr_id=116

 

댓글()