NVIDIA×MACNICA/CLAVIS/TECSTAR > 取扱製品 TESLA / QUADRO

プロセッサ(Tesla® / QUADRO®)

tesla&quadro

世界最先端のデータセンター GPU NVIDIA® Tesla®



TESLA V100


NVIDIA® Tesla® V100 はAI、HPCそしてグラフィクス処理を高速化する史上最高のデータセンター向け GPU です。

最新のNVIDIA VoltaTM アーキテクチャにより、Tesla V100は1基で最大100CPU分のパフォーマンスを発揮し、かつては不可能と考えられていた課題に取り組むデータサイエンティスト、研究者、エンジニアを強力に支援します。




特長



VOLTAアーキテクチャ



TENSORコア



新世代のNVLINK

CUDAコアとTensorコアの組み合わせにより、Tesla V100搭サーバーの性能はHPCやディープラーニング用途で100台のコモディティCPUサーバーに匹敵します。

新たな640個のTensorコアにより、Tesla V100は120 Tensor TeraFLOPSのディープラーニング性能を発揮。これは、NVIDIAPascal™世代GPUとの比較で学習が12倍、推論は6倍のパフォーマンスです。

CUDAコアとTensorコアの組み合わせにより、Tesla V100搭サーバーの性能はHPCやディープラーニング用途で100台のコモディティCPUサーバーに匹敵します。



最大効率モード



HBM2



プログラミング効率

新たな「最大効率モード」によりデータセンターの電源容量はそのままに、ラックあたり計算性能を最大40%向上させられます。このモードのTesla V100は最大性能の80%を、最大消費電力の半分で実現します。

900GB/sに向上した帯域幅と95%向上したDRAM効率により、Tesla V100は STREAM 計測でPascalGPU比1.5倍のメモリ帯域幅を記録しています。

Tesla V100 はプログラムをシンプルにするために設計されました。新しい独立したスレッドスケジューリングにより同期の粒度を細かく設定可能で、小さなジョブを複数同時に処理する効率を高められます。

製品スペック

Tesla V100 PCle Tesla V100 SXM2
製品画像 Tesla V100 PCle Tesla V100 SXM2
GPUアーキテクチャ NVIDIA Volta -
NVIDIA Tensorコア 640
NVIDIA CUDA® コア 5,120
倍精度演算性能 7 TFLOPS 7.8 TFLOPS
単精度演算性能 14 TFLOPS 15.7 TFLOPS
行列演算性能 112 TFLOPS 125 TFLOPS
GPUメモリ 32/16 GB HBM2
メモリ帯域幅 900 GB/sec
ECC 対応
GPU間接続帯域 * 32 GB/sec 300 GB/sec
システム接続 PCIe Gen3 NVIDIA NVLink
フォームファクタ PCIe Full Height/Length SXM2
最大消費電力 250 W 300 W
冷却方式 パッシブ(冷却ファンなし)
対応計算API CUDA, DirectCompute,OpenCL™, OpenACC

TESLA P100


NVIDIA Tesla P100 GPU は、前例のない最先端のデータセンターアクセラレータです。新たに開発された NVIDIA Pascal GPU アーキテクチャにより、汎用ノード数百台分を超える性能を持つ世界最速の計算ノードが誕生しました。少ない台数で高い性能をもたらす超高速ノードにより、データセンターではスループットを大幅に向上させる一方で、コストを削減できます。


400 を超える HPC アプリケーション (上位 10 個のうち 9 つが含まれています) に加え、すべてのディープラーニングフレームワークが高速化されるため、HPC のどのお客様も自社のデータセンターにアクセラレータを展開できます。

TESLA P100 と NVLINK によってデータセンターアプリケーションのパフォーマンスが最大で 50 倍向上

NVIDIA TESLAシリーズ P100

製品スペック

P100 for PCIe-Based Servers P100 for NVLink-Optimized
Servers
Double-Precision Performance 4.7 TeraFLOPS 5.3 TeraFLOPS
Single-Precision Performance 9.3 TeraFLOPS 10.6 TeraFLOPS
Half-Precision Performance 18.7 TeraFLOPS 21.2 TeraFLOPS
NVIDIA NVLink? Interconnect Bandwidth - 160 GB/s
PCIe x16 Interconnect Bandwidth 32 GB/s 32 GB/s
CoWoS HBM2 Stacked Memory Capacity 16 GB or 12 GB 16 GB
CoWoS HBM2 Stacked Memory Bandwidth 720 GB/s or 540 GB/s 720 GB/s
Enhanced Programmability with Page Migration Engine
ECC Protection for Reliability
Server-Optimized for Data Center Deployment

TESLA P40 / P4

製品スペック

Tesla P40
最大推論スループット サーバー向け
Tesla P4
超高効率スケールアウト サーバー向け
製品画像 tesla-p40-front tesla-p4-front
単精度演算性能 12 テラフロップス 5.5 テラフロップス
整数演算 (INT8) 47 TOPS* 22 TOPS*
GPU メモリ 24 GB 8 GB
メモリ帯域幅 346 GB/秒 192 GB/秒
システムインターフェース デュアルスロット、フルハイト PCI Express フォームファクタ ロープロファイル PCI Express フォームファクタ
電力 250 W 50 W/75 W
ハードウェアアクセラレーションを使用したビデオエンジン デコード エンジン x 1, エンコード エンジン x 2 デコード エンジン x 1, エンコード エンジン x 2

AI 向けワークステーションの革命 NVIDIA® QUADRO®


Quadro® は、驚異的な工業デザインから高度な特殊効果、複雑な科学的視覚化までを取り扱う、世界随一のビジュアル コンピューティング プラットフォームです。Quadro は、ワークフローを加速することで何百万人ものクリエイティブ/テクニカル プロフェッショナルから信頼されており、今日の課題を明日のビジネス成功に変えるために、ハードウェア、ソフトウェア、ツールの最も高度なエコシステムを搭載しています。


QUADRO GV100

新しいQuadro GV100は、7.4 TFLOPS倍精度、14.8 TFLOPS単精度、118.5 TFLOPSの学習能力を備え、32GBの高帯域幅メモリ容量を備えています。

2つのGV100カードをNVIDIA NVLink相互接続技術を使用して組み合わせることで、メモリとパフォーマンスを拡張し、単一のワークステーションシャーシに大量のビジュアルコンピューティングソリューションを作成できます。

quadro_gv100-3qtr-front-left-9

製品スペック

CUDA 並列処理コア 5120
NVIDIA Tensor コア 640
GPU メモリ 32 GB HBM2
FP64 パフォーマンス 7.4 TFLOPS
FP32 パフォーマンス 14.8 TFLOPS
FP16 パフォーマンス 29.6 TFLOPS
Tensor パフォーマンス 118.5 TFLOPS
最大消費電力 250 W
グラフィックス バス PCI Express 3.0 x 16
ディスプレイ コネクタ DP 1.4 (4)
フォーム ファクタ 4.4” H x 10.5” L デュアルスロット

GV100用 NVLink ブリッジ

2 GV100用 NVLinkブリッジにより2つのGV100を従来のPCIeバス間の通信よりも高速に通信することを可能です。GV100は第2世代のNVLinkテクノロジーを採用しており、100GB/s(双方向)のGPUからGPUへのデータ転送速度を実現します。 

製品名

QUADRO GP100 QUADRO P6000 QUADRO P5000 QUADRO P4000
製品画像 QUADRO GP100 QUADRO P6000 QUADRO P5000 QUADRO P4000
CUDA並列処理コア 3584 3840 2560 1792
GPU メモリ 16 GB HBM2 24 GB GDDR5X 16 GB GDDR5X 8 GB GDDR5
FP64 パフォーマンス 5.2 TFLOPS - - -
FP 32パフォーマンス 10.3 TFLOPS 12 TFLOPS 8.9 TFLOPS 5.3 TFLOPS
FP16 パフォーマンス 20.7 TFLOPS - - -
最大消費電力 235 W 250 W 180 W 105 W
グラフィックバス PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16
ディスプレイコネクター DP 1.4 (4)、
DVI-D (1)、
Optional Stereo (1)
DP 1.4 (4)、
DVI-D (1)、
Optional Stereo (1)
DP 1.4 (4)、
DVI-D (1)、
Optional Stereo (1)
DP 1.4 (4)、
Optional Stereo (1)
フォームファクター 4.4” H x 10.5” L Dual Slot 4.4” H x 10.5” L Dual Slot 4.4” H x 10.5” L Dual Slot 4.4” H x 9.5” L Single Slot

 

製品名

QUADRO P2000 QUADRO P1000 QUADRO P600 QUADRO P400
製品画像 QUADRO P2000 QUADRO P1000 QUADRO P600 QUADRO P400
CUDA並列処理コア 1024 640 384 256
GPU メモリ 5 GB GDDR5 4 GB GDDR5 2 GB GDDR5 2 GB GDDR5
FP64 Performance - - - -
FP 32パフォーマンス 3.0 TFLOPS 1.894 TFLOPS 1.195 TFLOPS 0.641 TFLOPS
FP16 パフォーマンス - - - -
最大消費電力 75 W 47 W 40 W 30 W
グラフィックバス PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16 PCI Express 3.0 x 16
ディスプレイコネクター DP 1.4 (4) mDP (4) mDP (4) mDP (3)
フォームファクター 4.4” H x 7.9” L Single Slot 2.7” H x 5.7” L Single Slot 2.7” H x 5.7” L Single Slot 2.7” H x 5.7” L Single Slot

製品名

Quadro Synk II
製品画像 Quadro Synk II
Per Sync II Up to 16 Displays
Up to 4 GPUs
Per system with 2 Sync II Up to 32 Displays
Up to 8 GPUs
Per Cluster
(1 or 2 Sync II per Node)
Up to 50 Nodes
Up to 200 GPUs
House Sync TTL/Composite Input or TTL Output
Power Connectors 6-pin PCI or SATA
Form Factor 4.2” H x 6” L Single Slot

製品名

Quadro NVLink Bridge
製品画像 Quadro NVLink Bridge
Bandwidth Up to 80 GB/s bi-directional (with two bridges)
Form Factor 2-Way 2-Slot Spacing

製品名

Quadro SLI HB Bridge QUICK SPECS
製品画像 Quadro SLI HB Bridge QUICK SPECS
Resolution
Supported
Up to 4K @ 60 Hz
Up to 5K @ 60 Hz
Form Factor 2-Way 2-Slot Spacing and
2-Way 3-Slot Spacing

Copyright 2017 MACNICA, Inc.