NVIDIA×MACNICA/CLAVIS/TECSTAR > 取扱製品 Tesla / Quadro

プロセッサ(Tesla® / Quadro®)

tesla&quadro

Quadro製品については こちら

世界最先端のデータセンター GPU NVIDIA® Tesla®



TESLA V100


NVIDIA® Tesla® V100 はAI、HPCそしてグラフィクス処理を高速化する史上最高のデータセンター向け GPU です。

最新のNVIDIA VoltaTM アーキテクチャにより、Tesla V100は1基で最大100CPU分のパフォーマンスを発揮し、かつては不可能と考えられていた課題に取り組むデータサイエンティスト、研究者、エンジニアを強力に支援します。




特長



VOLTAアーキテクチャ



TENSORコア



新世代のNVLINK

CUDAコアとTensorコアの組み合わせにより、Tesla V100搭サーバーの性能はHPCやディープラーニング用途で100台のコモディティCPUサーバーに匹敵します。

新たな640個のTensorコアにより、Tesla V100は120 Tensor TeraFLOPSのディープラーニング性能を発揮。これは、NVIDIAPascal™世代GPUとの比較で学習が12倍、推論は6倍のパフォーマンスです。

CUDAコアとTensorコアの組み合わせにより、Tesla V100搭サーバーの性能はHPCやディープラーニング用途で100台のコモディティCPUサーバーに匹敵します。



最大効率モード



HBM2



プログラミング効率

新たな「最大効率モード」によりデータセンターの電源容量はそのままに、ラックあたり計算性能を最大40%向上させられます。このモードのTesla V100は最大性能の80%を、最大消費電力の半分で実現します。

900GB/sに向上した帯域幅と95%向上したDRAM効率により、Tesla V100は STREAM 計測でPascalGPU比1.5倍のメモリ帯域幅を記録しています。

Tesla V100 はプログラムをシンプルにするために設計されました。新しい独立したスレッドスケジューリングにより同期の粒度を細かく設定可能で、小さなジョブを複数同時に処理する効率を高められます。

製品スペック

Tesla V100 PCle Tesla V100 SXM2
製品画像 Tesla V100 PCle Tesla V100 SXM2
GPUアーキテクチャ NVIDIA Volta -
NVIDIA Tensorコア 640
NVIDIA CUDA® コア 5,120
倍精度演算性能 7 TFLOPS 7.8 TFLOPS
単精度演算性能 14 TFLOPS 15.7 TFLOPS
行列演算性能 112 TFLOPS 125 TFLOPS
GPUメモリ 32/16 GB HBM2
メモリ帯域幅 900 GB/sec
ECC 対応
GPU間接続帯域 * 32 GB/sec 300 GB/sec
システム接続 PCIe Gen3 NVIDIA NVLink
フォームファクタ PCIe Full Height/Length SXM2
最大消費電力 250 W 300 W
冷却方式 パッシブ(冷却ファンなし)
対応計算API CUDA, DirectCompute,OpenCL™, OpenACC

TESLA P100


NVIDIA Tesla P100 GPU は、前例のない最先端のデータセンターアクセラレータです。新たに開発された NVIDIA Pascal GPU アーキテクチャにより、汎用ノード数百台分を超える性能を持つ世界最速の計算ノードが誕生しました。少ない台数で高い性能をもたらす超高速ノードにより、データセンターではスループットを大幅に向上させる一方で、コストを削減できます。


400 を超える HPC アプリケーション (上位 10 個のうち 9 つが含まれています) に加え、すべてのディープラーニングフレームワークが高速化されるため、HPC のどのお客様も自社のデータセンターにアクセラレータを展開できます。

TESLA P100 と NVLINK によってデータセンターアプリケーションのパフォーマンスが最大で 50 倍向上

NVIDIA TESLAシリーズ P100

製品スペック

P100 for PCIe-Based Servers P100 for NVLink-Optimized
Servers
Double-Precision Performance 4.7 TeraFLOPS 5.3 TeraFLOPS
Single-Precision Performance 9.3 TeraFLOPS 10.6 TeraFLOPS
Half-Precision Performance 18.7 TeraFLOPS 21.2 TeraFLOPS
NVIDIA NVLink? Interconnect Bandwidth - 160 GB/s
PCIe x16 Interconnect Bandwidth 32 GB/s 32 GB/s
CoWoS HBM2 Stacked Memory Capacity 16 GB or 12 GB 16 GB
CoWoS HBM2 Stacked Memory Bandwidth 720 GB/s or 540 GB/s 720 GB/s
Enhanced Programmability with Page Migration Engine
ECC Protection for Reliability
Server-Optimized for Data Center Deployment

TESLA P40

製品スペック

Tesla P40 最大推論スループット サーバー向け
製品画像 tesla-p40-front
単精度演算性能 12 テラフロップス
整数演算 (INT8) 47 TOPS*
GPU メモリ 24 GB
メモリ帯域幅 346 GB/秒
システムインターフェース デュアルスロット、フルハイト PCI Express フォームファクタ
電力 250 W
ハードウェアアクセラレーションを使用したビデオエンジン デコード エンジン x 1, エンコード エンジン x 2

TESLA T4

NVIDIA® T4 GPU は、ハイ パフォーマンス コンピューティング、ディープラーニングのトレーニングと推論、機械学習、データ分析、グラフィックスなど、さまざまなクラウド ワークロードを加速します。新しい NVIDIA Turing™ アーキテクチャを基盤とし、エネルギー効率に優れた 70 ワットの小型 PCIe フォームファクターに収納された T4 は、主要なコンピューティング環境に最適化されており、多精度のTuring Tensor コアと新しい RT コアを備えています。NGC のコンテナー化された高速ソフトウェア スタックと組み合わせることで、T4 は規模に応じた革新的なパフォーマンスを提供します。

製品スペック Tesla T4
製品画像 tesla_t4
TURING TENSORコア 320
NVIDIA CUDA® コア 2,560
SINGLE PRECISION PERFORMANCE (FP32) 8.1 TFLOPS
混合精度 (FP16/FP32) 65 FP16 TFLOPS
INT8 精度 130 INT8 TOPS
INT4 精度 260 INT4 TOPS
パフォーマンス GEN3×16PCIe
メモリ容量 16 GB GDDR6
メモリ帯域幅 320+ GB/秒
電力 70 watts

AI 向けワークステーションの革命 NVIDIA® Quadro®

Quadro® は、驚異的な工業デザインから高度な特殊効果、複雑な科学的視覚化までを取り扱う、世界随一のビジュアル コンピューティング プラットフォームです。Quadro は、ワークフローを加速することで何百万人ものクリエイティブ/テクニカル プロフェッショナルから信頼されており、今日の課題を明日のビジネス成功に変えるために、ハードウェア、ソフトウェア、ツールの最も高度なエコシステムを搭載しています。

NVIDIA® Quadro RTX™ 8000

NVIDIA®Quadro RTX™8000 は、48 GB の高速 GDDR6 メモリおよび NVIDIA NVLink™ により、卓越したパフォーマンスとスケーラビリティを備えたプロフェッショナル グラフィックスの新たな未知の領域を切り開きます。デザイナーやアーティストは、大規模で複雑なレイ トレーシング、ディープラーニング、ビジュアル コンピューティングのワークロードで、今まで可能であった枠を越えて作業できるようになります。

Quadro RTX 8000

NVIDIA® Quadro RTX™ 6000

NVIDIA Turing™アーキテクチャとNVIDIA RTX™プラットフォームを搭載したNVIDIA®Quadro RTX™6000は、数十年にわたりプロフェッショナルワークフローにコンピュータグラフィックスの最も大きな進歩をもたらしました。デザイナーやアーティストは、ハードウェアアクセラレーションによるレイトレーシング、深い学習、先進的なシェーディングを活用して、生産性を飛躍的に向上させ、これまで以上にすばらしいコンテンツを作成することができます。

Quadro RTX 6000

NVIDIA® Quadro RTX™ 5000

NVIDIA®Quadro RTX™5000の可能性の境界を解消します.NVIDIA Turing™アーキテクチャとNVIDIA RTX™プラットフォームを搭載し、レイトレーシング、ディープラーニング、高度なシェーディングを融合し、次世代のワークフローを強化します。クリエイティブおよびテクニカルプロフェッショナルは、情報に基づいた意思決定をより迅速に行い、厳しい設計および視覚化ワークロードに容易に対応できます。

Quadro RTX 5000

製品スペック

Quadro RTX 5000 Quadro RTX 6000 Quadro RTX 8000
CUDA Parallel Processing cores 3072 4608
NVIDIA Tensor Cores 384 576
NVIDIA RT Cores 48 72
Frame Buffer Memory 16 GB GDDR6 24 GB GDDR6 48 GB GDDR6
RTX-OPS 62T 84T
Rays Cast 8 Giga Rays/Sec 10 Giga Rays/Sec
Peak Single Precision (FP32)
Performance
11.2 TFLOPS 16.3 TFLOPS
Peak Half Precision (FP16)
Performance
22.3 TFLOPS 32.6 TFLOPS
Peak Integer Operation (INT8)
Performance
178.4 TOPS 261.0 TOPS
Deep Learning TeraFLOPS ※1 89.2 TFLOPS 130.5 Tensor TFLOPS
Memory Interface 256-bit 384-bit
Memory Bandwidth 448 GB/s 672 GB/s
Max Power Consumption 265 W 295 W
Graphics Bus PCI Express 3.0 x16
Display Connectors DP 1.4 (4) + VirtualLink (1)
Form Factor 4.4” H x 10.5” L Dual Slot
Product Weight 975 g 976 g 977 g
Thermal Solution Active
NVIDIA® 3D Vision® and 3D Vision Pro Support via 3 pin mini DIN
Frame lock Compatible (with Quadro Sync II)
NVLink Interconnect 50 GB/s 100 GB/s

※1 FP16 matrix multiply with FP16 or FP32 accumulate

モバイル ワークステーション向け Quadro RTX™

本ラインナップは、NVIDIA向けにカスタマイズされた最先端の12nm FinFET製造プロセスをベースにしており、ラップトップのHPC、AI、VR、グラフィックワークロード用の最も強力なコンピューティングプラットフォームを作成します。

Turing GPUアーキテクチャは、10年以上にわたりコンピュータグラフィックスにおける最大の飛躍を可能にし、単一のダイに136億個ものトランジスタを搭載しています。

最新のQuadroモバイルワークステーションのラインナップは、最高9.4 TFLOPのピーク単精度演算能力と75.2 TFLOPのテンソル演算能力を提供し、最も要求の厳しいプロフェッショナルユーザーに究極のグラフィックスと演算性能を提供します。


製品スペック

RTX5000 RTX4000 RTX3000
製品画像 Quadro RTX 5000 Quadro RTX 4000 Quadro RTX 3000
CUDA Parallel Processing Cores 3072 cores 2560 cores 2304 cores
NVIDIA Tensor Cores 384 320 288
NVIDIA RT Cores 48 40 36
GPU Memory 16GB GDDR6
Up to 448 GB/s
8GB GDDR6
Up to 448 GB/s
6GB GDDR6
Up to 336 GB/s
Theoretical Peak Single Precision Performance Up to 9.4 TFLOPS Up to 8.0 TFLOPS Up to 6.4 TFLOPS
Tensor Performance Up to 75.2 TOPS Up to 63.9 TOPS Up to 51.4 TOPS
Memory Interface 256-bit 192-bit
Memory Bandwidth Up to 448 GB/s Up to 336 GB/s
Max Power Consumption (TGP) 80 - 110W 60 - 80W
Graphics Bus PCI Express 3.0 x16

製品スペック

T2000 T1000 P620 P520
CUDA Parallel Processing Cores 1024 cores 768 cores 512 cores 384 cores
GPU Memory 4GB GDDR5
128 GB/s
4GB GDDR5
96 GB/s
2GB GDDR5
48 GB/s
Theoretical Peak Single Precision Performance Up to 3.5 TFLOPS Up to 2.6 TFLOPS Up to 1.5 TFLOPS Up to 1.1 TFLOPS
Memory Interface 128-bit 64-bit
Memory Bandwidth 128 GB/s 96 GB/s 48 GB/s
Max Power Consumption (TGP) 40 - 50W 25W 18W
Graphics Bus PCI Express 3.0 x 16

* using Advertised Boost clock

Quadro GV100

新しいQuadro GV100は、7.4 TFLOPS倍精度、14.8 TFLOPS単精度、118.5 TFLOPSの学習能力を備え、32GBの高帯域幅メモリ容量を備えています。

2つのGV100カードをNVIDIA NVLink相互接続技術を使用して組み合わせることで、メモリとパフォーマンスを拡張し、単一のワークステーションシャーシに大量のビジュアルコンピューティングソリューションを作成できます。

quadro_gv100-3qtr-front-left-9

製品スペック

CUDA 並列処理コア 5120
NVIDIA Tensor コア 640
GPU メモリ 32 GB HBM2
FP64 パフォーマンス 7.4 TFLOPS
FP32 パフォーマンス 14.8 TFLOPS
FP16 パフォーマンス 29.6 TFLOPS
Tensor パフォーマンス 118.5 TFLOPS
最大消費電力 250 W
グラフィックス バス PCI Express 3.0 x 16
ディスプレイ コネクタ DP 1.4 (4)
フォーム ファクタ 4.4” H x 10.5” L デュアルスロット

GV100用 NVLink ブリッジ

2 GV100用 NVLinkブリッジにより2つのGV100を従来のPCIeバス間の通信よりも高速に通信することを可能です。GV100は第2世代のNVLinkテクノロジーを採用しており、100GB/s(双方向)のGPUからGPUへのデータ転送速度を実現します。 

Quadro P2200

Quadro P2200は、パフォーマンス、魅力的な機能、およびコンパクトなフォームファクタの完璧なバランスにより、さまざまなプロフェッショナル向け3Dアプリケーションで素晴らしい創造的な経験と生産性を提供します。

1280 CUDAコアを搭載したPascal GPU、5 GBの大容量GDDR5Xオンボードメモリ、および最大4台の5K(5120 x 2880 @ 60 Hz)ディスプレイをネイティブで駆動するための電源を備えています。

大規模なシーンやモデルで作業するために必要な流動的な対話性を提供するGPUを使用して、製品開発およびコンテンツ作成ワークフローを加速します。

Quadro P2200

製品スペック

Quadro P2200
NVIDIA CUDA® Parallel Processing Cores 1280
Frame Buffer Memory 5 GB GDDR5x
Peak Single-Precision Performance Up to 3.8 TFLOPs
Memory Interface 160-bit
Memory Bandwidth Up to 200 GB/s
Max Power Consumption 75 W
Graphics Bus4 PCI Express 3.0 x16
Display Connectors DP 1.4 (4)
Form Factor 4.4” H x 7.9” L Single Slot
Product Weight 256 g
Thermal Solution Active

その他のQuadro製品

製品スペック

Quadro GP100 Quadro P6000 Quadro P5000
製品画像 Quadro GP100 Quadro P6000 Quadro P5000
CUDA並列処理コア 3584 3840 2560
GPU メモリ 16 GB HBM2 24 GB GDDR5X 16 GB GDDR5X
FP64 パフォーマンス 5.2 TFLOPS - -
FP 32パフォーマンス 10.3 TFLOPS 12 TFLOPS 8.9 TFLOPS
FP16 パフォーマンス 20.7 TFLOPS - -
最大消費電力 235 W 250 W 180 W
グラフィックバス PCI Express 3.0 x 16
ディスプレイコネクター DP 1.4 (4)、DVI-D (1)、Optional Stereo (1)
フォームファクター 4.4” H x 10.5” L Dual Slot

製品スペック

Quadro P4000 Quadro P2000 Quadro P1000
製品画像 Quadro P4000 Quadro P2000 Quadro P1000
CUDA並列処理コア 1792 1024 640
GPU メモリ 8 GB GDDR5 5 GB GDDR5 4 GB GDDR5
FP 32パフォーマンス 5.3 TFLOPS 3.0 TFLOPS 1.894 TFLOPS
最大消費電力 105 W 75 W 47 W
グラフィックバス PCI Express 3.0 x 16
ディスプレイコネクター DP 1.4 (4)、Optional Stereo (1) DP 1.4 (4) mDP (4)
フォームファクター 4.4” H x 9.5” L Single Slot

製品スペック

Quadro P600 Quadro P400
製品画像 Quadro P600 Quadro P400
CUDA並列処理コア 384 256
GPU メモリ 2 GB GDDR5
FP32パフォーマンス 1.195 TFLOPS 0.641 TFLOPS
最大消費電力 40 W 30 W
グラフィックバス PCI Express 3.0 x 16
ディスプレイコネクター mDP (4) mDP (3)
フォームファクター 2.7” H x 5.7” L Single Slot

製品スペック

Quadro Synk II
製品画像 Quadro Synk II
Per Sync II Up to 16 Displays
Up to 4 GPUs
Per system with 2 Sync II Up to 32 Displays
Up to 8 GPUs
Per Cluster
(1 or 2 Sync II per Node)
Up to 50 Nodes
Up to 200 GPUs
House Sync TTL/Composite Input or TTL Output
Power Connectors 6-pin PCI or SATA
Form Factor 4.2” H x 6” L Single Slot

製品スペック

Quadro NVLink Bridge
製品画像 Quadro NVLink Bridge
Bandwidth Up to 80 GB/s bi-directional (with two bridges)
Form Factor 2-Way 2-Slot Spacing

製品スペック

Quadro SLI HB Bridge QUICK SPECS
製品画像 Quadro SLI HB Bridge QUICK SPECS
Resolution
Supported
Up to 4K @ 60 Hz
Up to 5K @ 60 Hz
Form Factor 2-Way 2-Slot Spacing and
2-Way 3-Slot Spacing

Copyright 2017 MACNICA, Inc.