엔비디아 차세대 파스칼 GP100, 단정밀도 연산 성능은 12TFLOPS로 케플러 GK110의 3배?

뉴스/IT|2016. 2. 19. 00:27

엔비디아 차세대 파스칼 GP100, 단정밀도 연산 성능은 12TFLOPS로 케플러 GK110의 3배?

 

- 작성자 : 세비지-

 

엔비디아 (NVIDIA)는 2016년 차세대 파스칼 (Pascal) 기반 GPU를 공개할 것으로 예상되는 가운데 파스칼 GPU의 부동소수점 연산 성능에 대한 정보가 등장했다는 소식입니다.

 

소식을 전한 사이트는 지난 6월 공개되었던 프리젠테이션 자료에서 파스칼의 연산 성능에 대한 내용도 포함되었다고 전했습니다.

 

엔비디아 파스칼은 지금까지 알려진 내용에 따르면 새로운 16nm FinFET 공정과 3D 스택 메모리인 2세대 HBM (HBM2, High Bandwidth Memory 2)를 탑재할 것으로 알려진 바 있습니다.

 

이번에 소개된 내용에서 파스칼 GPU는 스펙과 같은 주요한 내용은 언급되지 않았지만 부동소수점 연산 성능을 통해 기존 세대 GPU 대비 향상된 성능을 제공할 것임을 예상해볼 수 있습니다.

 

공개된 연산 성능을 보면 단정밀도가 12TFLOPS이고 배정밀도는 4TFLOPS, 3D 스택 메모리를 이용해 1024GB/s의 메모리 대역폭을 제공하는 것으로 나타났는데 이 성능은 케플러 (Kepler) 기반 GK110 GPU의 3배에 이릅니다.

 

케플러 (Kepler) GK110 GPU 기반 테슬라 (Tesla) K20X는 14 SMX로 2688개의 쿠다 코어 (CUDA Cores)를 탑재했고 384bit 메모리 버스로 대역폭은 25GB/s, 연산 성능은 단정밀도 3.95TFLOPS, 배정밀도 1.31TFLOPS를 제공합니다.

 

이를 미루어보면 플래그십 그래픽카드에 사용될 파스칼 GP100 GPU임을 예상할 수 있으며 비교에 사용되지 않은 맥스웰 (Maxwell) GM200 GPU 기반 테슬라 M40을 보더라도 단정밀도 연산 성능이 7TFLOPS인데 이와 비교해도 파스칼 GP100은 1.7배, 70% 향상된 연산 성능을 제공합니다.

 

파스칼 GP100 GPU는 170억개 트랜지스터를 탑재해 다이 사이즈는 600mm^2의 크기, 6144 쿠다 코어와  2세대 HBM (High Bandwidth Memory 2, HBM2)를 이용할 것으로 알려졌습니다.

 

한편 파스칼 기반 GPU는 4월 열리는 GTC 2016을 통해 GP100 기반 테슬라가 공개되고 이어서 6월 컴퓨텍스 2016 (Computex 2016)에서는 GP104 기반의 지포스 GTX 1080 (GeForce GTX 1080)과 지포스 GTX 1070 (GeForce GTX 1070)이 지포스 GTX 980/ 970 (GeForce GX 980/ 970) 전환, 4분기 GP106과 GP107 기반 지포스, 2016년 4분기 이후에서 2017년 1분기에는 지포스 GTX TITAN 시리즈가 GP100 기반으로 등장, 2017년 1분기와 2분기에는 GM108의 리브랜드로 예상되는 GP108도 등장할 것으로 전망되고 있습니다.

 

 

 

 

 

 

 

내용 참고  :

http://www.3dcenter.org/news/nvidias-gp100-chip-mit-4-tflops-dp-und-12-tflops-sp-rechenleistung-geplant

http://www.expreview.com/45650.html

 

 

 

댓글()