2020.09.04 Game hidebusa

【RTX 30シリーズ購入予定の方にオススメ】NVIDIAがコミュニティの質問に詳細に回答。

nVIDIAがredditでユーザーからのたくさんの質問に回答しています。Q＆A形式でVideocardzに掲載されたので、RTX30シリーズの購入を考えているユーザーさんが知りたいような（私も含めて）重要な内容がぎっしり詰まっていたので、日本語訳して掲載します。RTX 30シリーズを検討されている方は必見の内容です。

RedditでのQ&Aセッションでは、NVIDIAの社員が、サブレディットコミュニティからの最も気になる質問のいくつかに答えています。

今回のAmpere RTXシリーズの発表では、あまり詳細な情報が出てこなかったのは周知の事実です。実際には、技術発表、製品デザイン、価格設定などに限定されていました。

詳細な情報は、NVIDIAとGeForceのウェブサイトのブログ記事や公式の仕様で後から提供されました。

Q&Aセッションでは、NVIDIAのコミュニティマネージャーから直接回答がありましたが、今週予定されているプレス向けのブリーフィングや、最初のAmpereカードが正式に発売された後（9月17日）には、もっと多くのことが分かるようになると予想されます。

HDMI 2.1のスペック

Q：Ampereはフル48Gbpsの帯域幅でHDMI 2.1をサポートしていますか？

A：はい。NVIDIA Ampere Architectureは、4つのレーンすべてにわたって最高のHDMI 2.1リンクレート12Gbs/レーンをサポートし、さらにDSC(Display Stream Compression)をサポートしているので、HDRで8K、60Hzまでのパワーを供給することができます。

AmereのためのSSD必要条件

Q：RTX I/Oには一定のSSDの速度が要求されるのでしょうか？

RTX IOのためのSSDの速度要件はありませんが、明らかに、最新世代のGen4 NVMe SSDのようなより速いSSDの方が、より良い結果、つまりより速いロード時間、そしてゲームがより多くのデータをダイナミックに世界にストリーミングする能力を生み出します。ゲームによっては、将来的にSSDのパフォーマンスのための最低限の要件が必要になるかもしれませんが、それはゲーム開発者によって決定されます。

RTX IOは、I/Oに必要なCPU負荷を軽減することで、どれだけ高速であるかに関わらず、SSDのパフォーマンスを加速させます。また、GPUベースの解凍を可能にすることで、ゲーム資産を圧縮形式で保存することができ、数十個のCPUコアの負荷を軽減することができます。圧縮率は通常2:1なので、どのようなSSDでも2倍の読み取り性能を効果的に増幅させることができます。

RTX IOについて

Q：RTX IOはSSDの空き容量をVRAMとして使用できるのでしょうか？それとも私が完全に誤解しているのでしょうか？

A：RTX IOは、従来の方法よりもはるかに高速にSSDからデータを読み出すことを可能にします。また、GPUで圧縮された形式でデータを保存したり読み込んだりすることができ、GPUで解凍して使用することができます。SSDがフレームバッファメモリの代わりになるわけではありませんが、SSDからのデータがGPUやGPUメモリに届く速度が格段に速くなり、CPUのオーバーヘッドが格段に少なくなります。

Q：Pytorchのような機械学習ライブラリにRTX IOが来るのを見ることができるだろうか？これはリアルタイムアプリケーションのパフォーマンスを向上させるのに役立つだろう。

A：NVIDIAは、約1年前にNVIDIA GPU DirectStorageで様々なデータ分析プラットフォーム向けの高速I/Oソリューションを提供しました。GPUとストレージ間の高速I/Oを提供し、AIやHPCタイプのアプリケーションやワークロードに特化しています。詳細はこちらをご覧ください。

Q：私はRTX I/O機能に興奮していますが、私は部分的にそれがどのように正確に動作するかをまだ情報を得ていません。

RTX IOとDirectStorageは、新しいAPIを組み込むことで、アプリケーションがこれらの機能をサポートする必要があります。マイクロソフトは来年、ゲーム開発者向けにDirectStorage for Windowsの開発者プレビューを目標にしており、NVIDIA RTXゲーマーはRTX IOで強化されたゲームを利用できるようになり次第、その恩恵を受けることができるようになります。

NVIDIA Ampereストリーミング・マルチプロセッサ

Q：シェーダーユニットの期待される性能について

・これらのCUDAコアの倍増について少し詳しく教えてください。

・GPCの一般的なアーキテクチャにどのような影響を与えるのでしょうか？

・FP32ユニットの供給を維持するのはどれだけ大変なことなのでしょうか？

・高い稼働率を確保するために何をしたのか？

A：Ampere 30シリーズSMの主な設計目標の1つは、FP32動作のスループットをTuring SMの2倍にすることでした。この目標を達成するために、Ampere SMにはFP32およびINT32動作のための新しいデータパス設計が含まれています。各パーティションの1つのデータパスは、1クロックあたり16個のFP32演算を実行できる16個のFP32 CUDAコアで構成されています。

もう一つのデータパスは、16個のFP32 CUDAコアと16個のINT32コアの両方で構成されています。この新しいデザインの結果、各Ampere SMパーティションは、1クロックあたり32個のFP32演算、または1クロックあたり16個のFP32と16個のINT32演算のいずれかを実行することができます。

4つのSMパーティションを組み合わせた場合、1クロックあたり128個のFP32演算を実行することができ、これはTuring SMの2倍のFP32レート、つまり1クロックあたり64個のFP32演算と64個のINT32演算を実行することができます。FP32の処理速度を2倍にすることで、多くの一般的なグラフィックスや計算操作、アルゴリズムの性能が向上します。

最近のシェーダのワークロードは通常、FFMA などの FP32 算術命令が混在しています。浮動小数点加算 (FADD) や浮動小数点乗算 (FMUL) のような単純な命令と、アドレス指定やデータ取得のための整数加算、浮動小数点比較、処理結果の min/max などの命令を組み合わせたものです。

パフォーマンスの向上は、シェーダとアプリケーションのレベルで、命令の組み合わせによって異なります。レイトレーシング・デノイジング・シェーダは、FP32のスループットを2倍にすることで大きな利益を得ることができる良い例です。

数値でのスループットを2倍にするには、それをサポートするデータパスを2倍にする必要があったため、Ampere SMでは共有メモリとL1キャッシュの性能も2倍になりました。(Ampere SMでは128バイト/クロック、チューリングでは64バイト/クロック)。GeForce RTX 3080の総L1帯域幅は219GB/秒であるのに対し、GeForce RTX 2080 Superは116GB/秒です。

先行のNVIDIA GPUと同様に、Ampereは、グラフィックス・プロセッシング・クラスタ（GPC）、テクスチャ・プロセッシング・クラスタ（TPC）、ストリーミング・マルチプロセッサ（SM）、ラスタ・オペレータ（ROPS）、およびメモリ・コントローラで構成されています。

GPCは、主要なグラフィックス処理ユニットのすべてがGPCの内部に存在する、支配的な高レベルハードウェアブロックです。各GPCには専用のRaster Engineが搭載されており、NVIDIA Ampere Architecture GA10x GPUの新機能である2つのROPパーティション（各パーティションには8つのROPユニットが含まれている）も搭載されるようになりました。NVIDIA Ampereアーキテクチャの詳細は、近日中に発表されるNVIDIAのAmpereアーキテクチャホワイトペーパーに掲載されています。

ページ2へ

4 件のコメント

30シリーズカードは10ビット444 120fpsをサポートしますか？従来、Nvidiaコンシューマカードは8ビットまたは12ビットの出力のみをサポートしており、10ビットはサポートしていません。市場に出ているHDRモニター/ TVの大部分は10ビットです。

[Qi Lin] 30シリーズは10ビットHDRをサポートしています。実際、HDMI 2.1は12ビットHDRで最大8K @ 60Hzをサポートでき、10ビットHDRディスプレイをカバーします。

という記述もredditのほうではあったので、LGの今年モデルの4KテレビのHDMI2.1帯域が40Gbpsまでであっても大丈夫そうですね。

コメントを残すコメントをキャンセル

ABOUTこの記事をかいた人

hidebusa

映画、海外ドラマ、音楽、ビデオゲーム、ガジェット、自作ハイエンドPC、車、バイク、政治、経済、株式投資、格闘技、70年代のTVドラマ、超常現象などが大好きな湘南在住の管理人です。東京に住んでいた頃は、ハイエンドオーディオ、ハイエンドホームシアターなど趣味で実践していました。現在は、ソニー4KブラビアX9500Gの85インチで洋画、海外ドラマ、ビデオゲームをYAMAHAのA3070AVアンプ経由で5-1-4 9.1チャンネルのDolby Atmos環境で楽しんでいます。映画やゲームレビューはこのシステムかサブシステムのLG 55インチNANO91 4K 120Hzで検証しています。様々な幅広いジャンルでの経験で得た知識、見識をレビューやエッセイも含め、色々と書き綴って情報発信していきたいと思っています。尚、当サイトで書く内容は、あくまで個人的な好みや価値観での意見を書き綴っていますので、あしからず。 YOUTUBEチャンネルでは、高画質をモットーに４K解像度のゲームプレイ、PCゲームのベンチマーク動画、グラフィック比較動画に加えて他に好きなものなど、色々と公開していきたいと思いますので、お気に召したらチャンネル登録をよろしくお願いいたします。　 https://www.youtube.com/user/hidebusa720