NVIDIA GeForce RTX 30シリーズ&Ampere GPUの詳細 – GA102/GA104 GPUスペック&RTX 3090, RTX 3080, RTX 3070パフォーマンス&機能詳細も明らかに。

アンペアSMユニットをよく見ると、各ブロックは128個のFP32ユニットで構成されています。しかし、2つのFP32データパスのうちの1つは、INT32演算を同時に実行することもできます。Tensorコアは4つのユニットで構成されており、SMあたり4つのテクスチャユニットと1つのRTコアがあります。

第3世代のTensorコアについては、NVIDIAは、GPUのAmpere HPCラインで使用されているのと同じスパース・アーキテクチャを使用しています。Ampereは、Turingの8個のTensorコア/SMと比較して、4個のTensorコア/SMを特徴としていますが、それらは新しい第3世代設計に基づいているだけでなく、より大きなSMアレイでカウントを増やしています。

Ampere GPUは、INT16コア全体を利用してTensorコアごとに128個のFP16 FMA演算を実行でき、スパースシティがあれば最大256個の演算を行うことができます。SMあたりのFP16 FMA演算の合計は、Sparsityで512、1024に増加しています。Tensorコア設計し直したことで、推論性能の面ではTuring GPUの2倍になったことになります。

同じことがレイトレーシングコアにも当てはまり、2回目のイテレーションでは、Turingアーキテクチャと比較して2倍のレイの交差数を提供します。SMの数が多いほどRTコアの数も多くなりますし、それはAmpereでのレイトレーシングアクセラレーションの全体的な性能にも影響します。

GDDR6X — NVIDIAのGeForce RTX 30シリーズグラフィックスカード専用に設計されたグラフィックスメモリの次なる進化。

Micron GDDR6Xメモリは、多くの新機能を搭載しています。より高速で、I/Oデータレートが2倍になり、メモリ・ダイにPAM4マルチレベル・シグナリングを初めて実装しました。Geforce RTX 3090クラスの製品では、MicronのGDDR6Xメモリは最大1TB/sの帯域幅を実現しており、8Kなどの高解像度で次世代のゲーム体験を実現するために使用されます。

新しいGDDR6X SGRAMです。

  • SGRAMのデータレートを2倍にし、1トランザクションあたりの消費電力を抑えながら、グラフィックスカードアプリケーションのための1テラバイト/秒(TB/秒)のシステムメモリ帯域幅の境界を突破することができます。
  • プロセッサとDRAM間で4つの電圧レベルを使用して1インターフェースクロックあたり2ビットのデータをエンコードして転送するPAM4エンコード信号を採用した初のディスクリート・グラフィックス・メモリ・デバイスです。
  • 高速で安定した設計・運用が可能で、大量量産で作られる。

前述したように、GDDR6Xは新しいPAM4マルチレベルシグナリング技術を採用しており、データの転送速度が格段に速くなり、I/Oレートが2倍になり、各メモリの能力を64GB/sから84GB/sに押し上げています。

Micron GDDR6Xメモリダイは、PAM4シグナリングを搭載しながら量産可能な唯一のグラフィックスDRAMでもあります。

興味深いのは、MicronがそのGDDR6Xメモリが21Gbpsまでの速度を打つことができることを引用しているのに対し、我々はGeForce RTX 3090のアクションで19.5Gbpsを見るようになっただけです。AIBが利用できるようになれば、より高いビンディングダイを利用できるようになる可能性が高いと思われます。

Micronはまた、2021年には21GB/s以上の速度を提供することを計画していることを確認していますが、将来的にグラフィックスカードに採用されるかは明らかではありません。

単に速度が速いだけでなく、MicronのGDDR6Xは、前世代のGDDR6メモリと比較して転送ビットあたりの電力を15%削減しながら、より高い帯域幅を提供しています。

Micron GDDR6X Memory

FeatureGDDR5GDDR5XGDDR6GDDR6X
DensityFrom 512Mb to 8Gb8Gb8Gb, 16Gb8Gb, 16Gb
VDD and VDDQEither 1.5V or 1.35V1.35VEither 1.35V or 1.25VEither 1.35V or 1.25V
VPPN/A1.8V1.8V1.8V
Data ratesUp to 8 Gb/sUp to 12Gb/sUp to 16 Gb/s19 Gb/s, 21 Gb/s,
>21 Gb/s
Channel count1122
Access granularity32 bytes64 bytes
2x 32 bytes in pseudo 32B mode
2 ch x 32 bytes2 ch x 32 bytes
Burst length816 / 8168 in PAM4 mode
16 in RDQS mode
SignalingPOD15/POD135POD135POD135/POD125PAM4 POD135/POD125
PackageBGA-170
14mm x 12mm 0.8mm ball pitch
BGA-190
14mm x 12mm 0.65mm ball pitch
BGA-180
14mm x 12mm 0.75mm ball pitch
BGA-180
14mm x 12mm 0.75mm ball pitch
I/O widthx32/x16x32/x162 ch x16/x82 ch x16/x8
Signal count61
– 40 DQ, DBI, EDC
– 15 CA
– 6 CK, WCK
61
– 40 DQ, DBI, EDC
– 15 CA
– 6 CK, WCK
70 or 74
– 40 DQ, DBI, EDC
– 24 CA
– 6 or 10 CK, WCK
70 or 74
– 40 DQ, DBI, EDC
– 24 CA
– 6 or 10 CK, WCK
PLL, DCCPLLPLLPLL, DCCDCC
CRCCRC-8CRC-82x CRC-82x CRC-8
VREFDExternal or internal per 2 bytesInternal per byteInternal per pinInternal per pin
3 sub-receivers per pin
EqualizationN/ARX/TXRX/TXRX/TX
VREFCExternalExternal or InternalExternal or InternalExternal or Internal
Self refresh (SRF)Yes
Temp. Controlled SRF
Yes
Temp. Controlled SRF Hibernate SRF
Yes
Temp. Controlled SRF Hibernate SRF
VDDQ-off
Yes
Temp. Controlled SRF Hibernate SRF
VDDQ-off
ScanSENIEEE 1149.1 (JTAG)IEEE 1149.1 (JTAG)IEEE 1149.1 (JTAG)
List Micron 

ページ3へ

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

ABOUTこの記事をかいた人

映画、海外ドラマ、音楽、ビデオゲーム、ガジェット、自作ハイエンドPC、車、バイク、政治、経済、株式投資、格闘技、70年代のTVドラマ、超常現象などが大好きな湘南在住の管理人です。東京に住んでいた頃は、ハイエンドオーディオ、ハイエンドホームシアターなど趣味で実践していました。現在は、ソニー4KブラビアX9500Gの85インチで洋画、海外ドラマ、ビデオゲームをYAMAHAのA3070AVアンプ経由で5-1-4 9.1チャンネルのDolby Atmos環境で楽しんでいます。映画やゲームレビューはこのシステムかサブシステムのLG 55インチNANO91 4K 120Hzで検証しています。様々な幅広いジャンルでの経験で得た知識、見識をレビューやエッセイも含め、色々と書き綴って情報発信していきたいと思っています。尚、当サイトで書く内容は、あくまで個人的な好みや価値観での意見を書き綴っていますので、あしからず。 YOUTUBEチャンネルでは、高画質をモットーに4K解像度のゲームプレイ、PCゲームのベンチマーク動画、グラフィック比較動画に加えて他に好きなものなど、色々と公開していきたいと思いますので、お気に召したらチャンネル登録をよろしくお願いいたします。  https://www.youtube.com/user/hidebusa720