슈퍼 컴퓨터의 트렌드는 GPU, 그 중심에는 NVIDIA

슈퍼 컴퓨터의 연산 성능의 순위를 지정하는 "TOP 500 Lists"의 2018년 6월 최신 랭킹이 발표되었다. 2018년 6월 판 랭킹에서는, 연산 성능에서 차지하는 GPU의 중요성이 두드러지는 결과가되었고, 향후 컴퓨팅의 방향성이 결정지어 졌다는 지적이 있다.


TOP 500 Supercomputer Sites가 작성하는 슈퍼 컴퓨터 랭킹 "TOP 500 Lists 2018"에서는, 미국이 중국으로부터 선두 자리를 탈환한 것이 화제가 되었지만, 상위에 들어간 슈퍼 컴퓨터의 대부분이 GPU를 중시 한 구성으로 되어있다.


그 GPU로 가장 높은 인기를 모은 것이 NVIDIA의 "Tesla GPU"이며, TOP 500 Lists 2018에서 새롭게 추가 된 연산 성능의 무려 56%가 Tesla GPU에 의해 초래 된 것이라는 것.




연산 성능 세계 최고 인 미국의 IBM이 개발 한 "Summit"에는 "Tesla V100"이 6기, 총 2만 7648개의 GPU가 사용되고 있으며, 187.7PFLOPS를 발휘. 이 연산 성능의 무려 95%가 GPU에서 발생하고 있다.



제 3위에 오른 IBM의 "Sierra"도 NVIDIA Tesla V100을 사용하는 Summit와 같다. 그러나, Summit의 Tesla V100이 6기였던 것에 비해 Sierra는 4기. 그럼에도 불구하고 랭킹 3위에 오르는 성과의 높이를 보이고 있다. 또한 일본의 후지쯔가 개발 한 "ABCI"도 Tesla V100을 4기 탑재하여 랭킹 5위에 올랐다.


테네시 대학의 잭 돈가라 교수는 "올해 TOP 500 Lists는 HPC(고성능 컴퓨팅)와 AI 컴퓨팅을 모두 지원하는 시스템에 대한 명확한 전환을 나타냅니다"라고 말한대로, 기존 CPU 중시 한 구성에서 GPU를 중시하는 구성으로 슈퍼 컴퓨터의 트렌드가 서서히 바뀌고 있는 듯.





AI 기술의 개발로 최근, 눈부신 발전을 이루고 있는 딥 러닝 분야에서는 NVIDIA GPU의 존재감은 더욱 커지고 있다. NVIDIA의 GPU를 채택하는 TOP 500 Lists의 1위, 3위, 5위의 슈퍼 컴퓨터 딥 러닝의 연산 성능의 합계는 무려 랭킹에 들어가는 나머지 497개 슈퍼 컴퓨터의 전체 딥 러닝 연산 성능을 상회하는 무서운 수준이라는 것.


Intel, Google, 후지쯔, Wave Computing, Graphcore 등도 데이터 센터를 위한 특별한 딥 러닝 가속기를 개발하고 있지만, NV IDIA는 AI와 HPC를 통합하는 AI-HPC 디자인을 채용하고 있다. 이 NVIDIA의 전략은 "기존 HPC 애플리케이션을 가속시키기 위해 AI를 활용한다"는 세계적인 트렌드에 부합하고, 슈퍼 컴퓨터뿐만 아니라 딥 러닝과 AI 개발에 있어서도 우위를 가지는 요인으로 되어있다.



NVIDIA의 이안 백 씨는, "TOP 500 Lists에 의해 명확하게 표시된 것은, "무어의 법칙이 끝난 시대"로, 슈퍼 컴퓨팅이 진화를 계속하려면 GPU가 필요하다는 것입니다"라고 NVIDIA의 Tensor 코어 GPU가 기존의 HPC 시뮬레이션과 AI 워크로드를 모두 처리 할 수있다는 장점을 강조하고 있다.