NVIDIA×MACNICA/CLAVIS/TECSTAR > 取扱製品 TESLA / QUADRO

プロセッサ(Tesla® / QUADRO®)

tesla&quadro

世界最先端のデータセンター GPU NVIDIA® Tesla®



TESLA V100


NVIDIA® Tesla® V100 はAI、HPCそしてグラフィクス処理を高速化する史上最高のデータセンター向け GPU です。

最新のNVIDIA VoltaTM アーキテクチャにより、Tesla V100は1基で最大100CPU分のパフォーマンスを発揮し、かつては不可能と考えられていた課題に取り組むデータサイエンティスト、研究者、エンジニアを強力に支援します。




特長



VOLTAアーキテクチャ



TENSORコア



新世代のNVLINK

CUDAコアとTensorコアの組み合わせにより、Tesla V100搭サーバーの性能はHPCやディープラーニング用途で100台のコモディティCPUサーバーに匹敵します。

新たな640個のTensorコアにより、Tesla V100は120 Tensor TeraFLOPSのディープラーニング性能を発揮。これは、NVIDIAPascal™世代GPUとの比較で学習が12倍、推論は6倍のパフォーマンスです。

CUDAコアとTensorコアの組み合わせにより、Tesla V100搭サーバーの性能はHPCやディープラーニング用途で100台のコモディティCPUサーバーに匹敵します。



最大効率モード



HBM2



プログラミング効率

新たな「最大効率モード」によりデータセンターの電源容量はそのままに、ラックあたり計算性能を最大40%向上させられます。このモードのTesla V100は最大性能の80%を、最大消費電力の半分で実現します。

900GB/sに向上した帯域幅と95%向上したDRAM効率により、Tesla V100は STREAM 計測でPascalGPU比1.5倍のメモリ帯域幅を記録しています。

Tesla V100 はプログラムをシンプルにするために設計されました。新しい独立したスレッドスケジューリングにより同期の粒度を細かく設定可能で、小さなジョブを複数同時に処理する効率を高められます。

製品スペック

Tesla V100 PCle Tesla V100 SXM2
製品画像 Tesla V100 PCle Tesla V100 SXM2
GPUアーキテクチャ NVIDIA Volta -
NVIDIA Tensorコア 640
NVIDIA CUDA® コア 5,120
倍精度演算性能 7 TFLOPS 7.5 TFLOPS
単精度演算性能 14 TFLOPS 15 TFLOPS
行列演算性能 112 TFLOPS 120 TFLOPS
GPUメモリ 16 GB HBM2
メモリ帯域幅 900 GB/sec
ECC 対応
GPU間接続帯域 * 32 GB/sec 300 GB/sec
システム接続 PCIe Gen3 NVIDIA NVLink
フォームファクタ PCIe Full Height/Length SXM2
最大消費電力 250 W 300 W
冷却方式 パッシブ(冷却ファンなし)
対応計算API CUDA, DirectCompute,OpenCL™, OpenACC

TESLA P100


NVIDIA Tesla P100 GPU は、前例のない最先端のデータセンターアクセラレータです。新たに開発された NVIDIA Pascal GPU アーキテクチャにより、汎用ノード数百台分を超える性能を持つ世界最速の計算ノードが誕生しました。少ない台数で高い性能をもたらす超高速ノードにより、データセンターではスループットを大幅に向上させる一方で、コストを削減できます。


400 を超える HPC アプリケーション (上位 10 個のうち 9 つが含まれています) に加え、すべてのディープラーニングフレームワークが高速化されるため、HPC のどのお客様も自社のデータセンターにアクセラレータを展開できます。

TESLA P100 と NVLINK によってデータセンターアプリケーションのパフォーマンスが最大で 50 倍向上

NVIDIA TESLAシリーズ P100

製品スペック

P100 for PCIe-Based Servers P100 for NVLink-Optimized
Servers
Double-Precision Performance 4.7 TeraFLOPS 5.3 TeraFLOPS
Single-Precision Performance 9.3 TeraFLOPS 10.6 TeraFLOPS
Half-Precision Performance 18.7 TeraFLOPS 21.2 TeraFLOPS
NVIDIA NVLink? Interconnect Bandwidth - 160 GB/s
PCIe x16 Interconnect Bandwidth 32 GB/s 32 GB/s
CoWoS HBM2 Stacked Memory Capacity 16 GB or 12 GB 16 GB
CoWoS HBM2 Stacked Memory Bandwidth 720 GB/s or 540 GB/s 720 GB/s
Enhanced Programmability with Page Migration Engine
ECC Protection for Reliability
Server-Optimized for Data Center Deployment

Pascal™ を採用したプロフェッショナルグラフィックス NVIDIA® QUADRO®


デザインは複雑さを増しています。メディアは、忠実度が高まり、解像度の向上と複雑な視覚効果により、よりリッチになってきています。科学分野におけるビジュアル化とコンピューティングの問題は、これまで以上に大きくなっています。バーチャルリアリティー (VR) により、エンターテイメント、デザイン、エンジニアリング、建築、医学のあらゆる面で変化が起きています。各分野のプロフェッショナルは、アイデアの体験、デザインの検証、手順のリハーサル、そして、それらに伴う問題のビジュアル化を実物大で自然に行うことを望んでいます。

NVIDIA のこれまでで最も強力な GPU アーキテクチャである NVIDIA Pascal? をベースとした新しい Quadro 製品は、デスクトップで、VR で、さらには外出先でも、ビジュアルコンピューティングにまったく新しいレベルのパフォーマンスと革新的な機能を提供します。画期的な新製品を開発している方も、革新的な建築をデザインしている方も、壮大で美しいビジュアルストーリーを創作しようとしている方も、Quadro ならそれらをより高度に、より迅速に行うことができます。


3つの特長


  • 超高速のパフォーマンス
  • 巨大なメモリ容量
  • 究極のビジュアルワークスペース

製品名

QUADRO GP100 QUADRO P6000 QUADRO P5000 QUADRO P4000
製品画像 QUADRO GP100 QUADRO P6000 QUADRO P5000 QUADRO P4000
CUDA並列処理コア 3584 3840 2560 1792
GPU メモリ 16 GB HBM2 24 GB GDDR5X 16 GB GDDR5X 8 GB GDDR5
FP64 パフォーマンス 5.2 TFLOPS - - -
FP 32パフォーマンス 10.3 TFLOPS 12 TFLOPS 8.9 TFLOPS 5.3 TFLOPS
FP16 パフォーマンス 20.7 TFLOPS - - -
最大消費電力 235 W 250 W 180 W 105 W
グラフィックバス PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16
ディスプレイコネクター DP 1.4 (4)、
DVI-D (1)、
Optional Stereo (1)
DP 1.4 (4)、
DVI-D (1)、
Optional Stereo (1)
DP 1.4 (4)、
DVI-D (1)、
Optional Stereo (1)
DP 1.4 (4)、
Optional Stereo (1)
フォームファクター 4.4” H x 10.5” L Dual Slot 4.4” H x 10.5” L Dual Slot 4.4” H x 10.5” L Dual Slot 4.4” H x 9.5” L Single Slot

 

製品名

QUADRO P2000 QUADRO P1000 QUADRO P600 QUADRO P400
製品画像 QUADRO P2000 QUADRO P1000 QUADRO P600 QUADRO P400
CUDA並列処理コア 1024 640 384 256
GPU メモリ 5 GB GDDR5 4 GB GDDR5 2 GB GDDR5 2 GB GDDR5
FP64 Performance - - - -
FP 32パフォーマンス 3.0 TFLOPS 1.894 TFLOPS 1.195 TFLOPS 0.641 TFLOPS
FP16 パフォーマンス - - - -
最大消費電力 75 W 47 W 40 W 30 W
グラフィックバス PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16
ディスプレイコネクター DP 1.4 (4) mDP (4) mDP (4) mDP (3)
フォームファクター 4.4” H x 7.9” L Single Slot 2.7” H x 5.7” L Single Slot 2.7” H x 5.7” L Single Slot 2.7” H x 5.7” L Single Slot

製品名

Quadro Synk II
製品画像 Quadro Synk II
Per Sync II Up to 16 Displays
Up to 4 GPUs
Per system with 2 Sync II Up to 32 Displays
Up to 8 GPUs
Per Cluster
(1 or 2 Sync II per Node)
Up to 50 Nodes
Up to 200 GPUs
House Sync TTL/Composite Input or TTL Output
Power Connectors 6-pin PCI or SATA
Form Factor 4.2” H x 6” L Single Slot

製品名

Quadro NVLink Bridge
製品画像 Quadro NVLink Bridge
Bandwidth Up to 80 GB/s bi-directional (with two bridges)
Form Factor 2-Way 2-Slot Spacing

製品名

Quadro SLI HB Bridge QUICK SPECS
製品画像 Quadro SLI HB Bridge QUICK SPECS
Resolution
Supported
Up to 4K @ 60 Hz
Up to 5K @ 60 Hz
Form Factor 2-Way 2-Slot Spacing and
2-Way 3-Slot Spacing

Copyright 2017 MACNICA, Inc.