【ゲームハード】次世代機テクノロジー14【スレ】
■ このスレッドは過去ログ倉庫に格納されています
!extend:default:vvvvv:1000:512
!extend:default:vvvvv:1000:512
此所はゲームハード&ソフト関連の技術を語り合うスレです。
※嘘・捏造の反証は手短に、煽りはNG・スルー
※マルチソフトのグラ比較は専用スレでお願いします。
※ソフトの内容・批評等は各ソフト・機種総合スレで。
前スレ
【ゲームハード】次世代機テクノロジー13【スレ】
https://krsw.5ch.net/test/read.cgi/ghard/1592394892/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured >>563
知ってる人も何もPSSLで全機能呼べなくてどうすんだよwww
辺な心配すんな >>564
アンチはそう思いたいんだろうが
他機種で同じ事が実現出来るかどうかまだ立証されてないじゃん
四苦八苦してなかなか出てこないかも知んないんだぜ? XSXはそもそもUE5のアセットをまともに読み込めるの? >>570
魔法のDirectAPIがCPUオーバーヘッドを極力小さくし
BCPackの50%圧縮で帯域を2.4GB→4.8GBに理論値通り拡張できさえすれば
CPU3個分の展開プロセッサがフル稼働して、PS5の1/3程度の実効性能は出せるはずだ
まあそれでもUE5デモ終盤の様な高速ストリーミングはガッタガタになるだろうけどな 高速ストリーミングが必要なゲーム以外は全てにおいて劣化するって事? >>573
XSXのDirectAPIが、PS5のCPU完全パススルー型I/Oユニット並にCPUオーバーヘッドを減らせる事を無邪気に夢見てるのなら
やはりそれは魔法で良いんじゃないかな
まあ夢はでっかく持たなきゃねw >>572
何でわざわざ海外VPN通して書き込んでるの? 正直「魔法の〜」はどういう使い方にしろ思考を放棄してるので好きではないな
はっきり理由をつけて過大評価だと言えばよいのにね そもそもAPIとしてる時点でCPUの処理が入るって事だからな
まあWindowsでも使うにはそうするしか無いけど
CPUの介入を可能な限り排除したPS5と同じになるわけない >>578
PS5はアプリケーションがアクセラレータを直接制御するって事?
んなわけないでしょ。PS5だってディスクI/OはAPI経由で行うでしょ
APIの改良についての話とハードウェアアクセラレータの有無/優劣の話を同列に語っても仕方あるまいよ
全体のフローとして語るなら分かるが PS5はSSDをストレージとして扱っているかどうかも定かじゃない
Windowsで言うところのMS的仮想メモリーではなく
本来の意味での仮想メモリとしてストレージapiすっ飛ばしてメモリ間転送に見える実装も有り得る Velocityでハードウェア化してるのはデコーダーだけで、残りはAPIの改良とPRFの改良
DirectXでwindows10と互換保つためにはハードウェアアクセラレータは使えなかったんだろうな オンメモリで行う環境だとしてNanite、Lumenの両方とも箱はPS5と同じクオリティーで実行できない気がするわ
解説を聞いてたらコンピュートで行うカリングとジオメトリバッファの生成や3Dテクスチャの展開ってのは今までのハードウェアで完結してるものであってUE4でもやれるものだったわけだしな
シャドウ生成まで行うNaniteってジオメトリの情報を一元管理されるプリミティブシェーダの恩恵そのものだし
ボクセル化されたテクスチャの展開もKrakenからのものだし
そのあたりをハードウェアの支援なしでコンピュートでやるってのはかなりの性能を必要とする そもそも現行のGPUやメッシュシェーダーにあるタスクシェーダでやろうにも頂点管理用のメモリが足りない
それらが前フレームから取り除かれ元から必要ないプリミティブ向けの設計になっている
少ない頂点を増やすという設計のメッシュシェーダーとは真逆
逆にメッシュシェーダーのためにテッセレーションモデルがこれから普及するかといえば難しいと思う
クラーク法解禁されても普及しなかった時点で終わった技術なんだろうと テッセレーションはもう終わり
これからの時代は頂点は動的に増やすものじゃなく動的に減らすものにシフトする
メッシュシェーダは向こう2年くらいで消えるだろう
プリミティブシェーダーの方が有利なんだから 増やすのと減らすのならどちらのほうが負荷が軽いのっと >>586
メッシュはPCゲー移植を生命線にするNVが捻りだした妥協案のようなもの
こんなのを標準化したMSは恐竜と一緒にあの世に逝くだけ >>588
PCのグラボは非効率と分かっていても、DX互換性の為に短期的にはメッシュを採用せざるをえまい
中長期的にはZblushのモデルをそのまま取り込んでゲームと映画の開発環境を統合できる、プリミティブシェーダへ移行するのは確実 どのスタジオでもモデルの作るのが、ZBrush前提になってきて
ハイメッシュの高密度ポリゴンを作ってから、プラットフォームに合わせてゲームモデルとして
落とし込んでいくってやり方になってるから
ゲーム内でローポリモデルをテッセレーションして増やすってやり方は
あまり使われなくなってきたしなぁ >>588
メッシュはNvidiaの技術でAMDは関係無い https://www.pcgamesn.com/unreal-engine-5-fortnite-performance
・Epic Gamesによれば、PlayStation5のUnreal Engine5技術デモはそれほどGPU負荷が高いものではなかったようだ
・「UE5デモのジオメトリのレンダリングにかかったGPU時間は、据置機で『フォートナイト』を60fpsで走らせるぐらいのレンダリングバジェットだった」とエンジニアリング副社長Nick Penwarden氏が言及していた
マジかよスゲーなこれ AMDのアーキテクチャで一方がプリミティブシェーダを積んでいないと思う頭 >>596
取捨選択できるカスタマイズがAMDの強みです
MSは捨てた チカ君完全論破された挙句、プリミティブシェーダクレクレを始めてて草生える NGGの意味でのプリミティブシェーダーはGDSの利用方法の見直しなので普通にできるのはいいとして、
Navi10Liteに無理なクロックを指定したためにプリミティブ発行可能レートが設計目標の8割性能なのどうするんだろう?
それでも2.0GHzのままなので8.4TFしか出ないことになる
開発機は9.4TFとCU数多かった噂まで見かけるが初期型どうするんだろう?下手するとUE5デモが動かない落ちもある
CPUもベース1.6GHzがリークされたあと音沙汰ないし、よくそんな状況でネガキャンやる気になれるよなと メモリの帯域幅、VRSサポートを加えると実効性能差は2.2倍から差が出るので1440pではフレームレート半減でごまかせるかもだが、
無理に4Kやろうとするとテクスチャレートが足りなくて劣化せざるを得なくなる
GTX1080未満相当とRTX2080Ti相当+HWRT強化では実質2世代差なので仕方がないが、
8割しか出せなかったプリミティブシェーダーがどうのとはさすがにならないよ サーニーの講演を聞く限り、プリミティブシェーダは箱に載ってなさそうじゃね
>10年以上の間、GPUはゲームエンジンに制限を課してきました。
>ソフトウェアは頂点処理を行いますが、ほとんどの場合、三角形や頂点が形成するその他のジオメトリを処理する、専用のハードウェアが使用されています。
>つまり、頂点を使用する全てのジオメトリが画面に表示されていない場合には、頂点処理を中止するなどの基本的な最適化すらできないということです。
>PlayStation5にはジオメトリエンジンと呼ばれる新しいユニットがあり、三角形やその他のプリミティブの処理を完全なプログラム制御下に置くことができます。
>ゲーム開発者は、ジオメトリエンジンの存在を無視して、PlayStation5 GPUをPS4 GPUと同等の能力だけのように扱ったり、この新しいインテリジェンスをさまざまな方法で利用したりすることができます。
>単純な用途としては、背面または画面外の頂点や三角形を削除するなどのパフォーマンス最適化があります。
>より複雑な用途としては、プリミティブシェーダと呼ばれるものがあります。これを使用すると、レンダリング中にジオメトリをその場で合成できます。
>これはまったく新しい機能です。
>PlayStation5でプリミティブシェーダを使用することで、ディテールのレベルをスムーズに変化させることができ、オブジェクトをクローズアップするためのプロシージャル(編者注:ここでは、用意されたデータから自動生成する手法を指す)なディテールの追加や、
>パーティクル効果やその他の視覚的な特殊効果の改善など、幅広いテクニックを可能にします。 >>602
その意味でのプリミティブシェーダーはGDSを経由したメッシュシェーダーエミュレーション
Navi10Liteにはメッシュシェーダーサポートがないので苦肉の策だが、あまり効率のよいものとは言えない この話って>>548らへんの話ともリンクしてるよね >プリミティブシェーダを使用することで、ディテールのレベルをスムーズに変化させることができ、
>オブジェクトをクローズアップするためのプロシージャル(編者注:ここでは、用意されたデータから
>自動生成する手法を指す)なディテールの追加
ここだけ読むと頂点も動的に増やすと言う話じゃないの?なんでスレでは増やさないという話になるのか Navi10Liteという間違った情報を起点にすると、無理のある説明にしかならんなw >>605
テッセレータの本来の機能は与えられたパラメータから頂点を増やすことにあるのだが、
内容を理解していない日本語も苦手なLOD否定派がLOD否定の意味でテッセレーション否定するのでわけがわからなくなっている
この手の誤解は大抵の場合、西川さんの雑な解説が元だったりする
悪い人じゃないんだけど、そこまで技術詳しくないよ >>604
TimがこれをずっとやりたがっていたがGCNではできなかった
それがコンピュートシェーダーの登場で可能になった
ラスタライズ段に使えるのがプリミティブシェーダーだったので取りあげたら大騒ぎになったが、
ノートPCのRTX2070Sでさらに高速に動作させた講演が漏れて火消しからの、やっぱり動きます、プリミティブシェーダー必須ではないです。なう https://www.4gamer.net/games/032/G003263/20080912053/
>また,GPUがプログラマブルであるのは確かだが,それをあえて「固定機能」的と呼んでいた。シェーダ自体はともかく,パイプラインがきっちり決まっているので固定機能のようなことしかできず,
>結果としてどのゲームを見ても同じようにしか見えないという。また,こういった固定機能だと,仮にシェーダが20倍の性能になったとしても,見た目的には2倍も綺麗になったりはしないものだと氏は語る。
Tim Sweeneyとサーニーが言ってること完全にリンクしてるよね
>10年以上の間、GPUはゲームエンジンに制限を課してきました。
>ソフトウェアは頂点処理を行いますが、ほとんどの場合、三角形や頂点が形成するその他のジオメトリを処理する、専用のハードウェアが使用されています。
>つまり、頂点を使用する全てのジオメトリが画面に表示されていない場合には、頂点処理を中止するなどの基本的な最適化すらできないということです。
>PlayStation5にはジオメトリエンジンと呼ばれる新しいユニットがあり、三角形やその他のプリミティブの処理を完全なプログラム制御下に置くことができます。 メッシュシェーダーとプリミティブシェーダーの違いってつまり何なの?
どちらも1頂点入力、1頂点出力のバーテックスシェーダーから
複数のポリゴン単位で扱えて増減も可能にしたものでしょ
同じようなものにしか見えないんだが どっちも、あくまで与えられたデータから動的にポリゴンを生成するしくみであって、増やすとか減らすとかはどうでも良いような。
昨日のマイクロポリゴンの話じゃないけど、メッシュ状に並んだ頂点の差分データから、表示密度に応じた三角形ポリゴンを自動生成する場合、
それは増やしてるのか減らしてるのか? どちらとも言えるw まだUE5がノートで動いたとか言うデマまき散らしてる奴生き残ってんのか >>610
説明のためにAS(TS)の段を飛ばして話をするよ AS段でのカリングは柔軟性にかかってくるが必須ではない
今までは頂点リストを頂点座標とインデックス、そのトポロジーの形でInput Assemblerに入力する必要があった
Draw Callで発行する際にはこの組み合わせにデータを整理しなければならなくて面倒だった
コンピュートシェーダーの登場でプリミティブの発行をIAを通さずコンピュートシェーダーに行わせるのがメッシュシェーダー
IAのためのセットアップを省けることは様々な利点がある
まず入力に使うデータはユーザー定義の自由な構造体を使えるようになるので出力されるプリミティブよりも多い情報を与えて柔軟性の高いテッセレーションを行ったり、発行しなくてよいプリミティブの情報を与えたりと柔軟性が増えた
逆に少ない情報から発行することも可能になって、インデックスを2段回参照にすることでインデックスに必要なビット数を削減したり、四角形を与えて三角形を2つ出力したりといったことも可能になった
IAの固定機能を自由に記述することでIAのセットアップ時間をなくし、自由な入力から柔軟にプリミティブを出力できるようにするのがメッシュシェーダー https://wccftech.com/sony-really-did-a-fantastic-job-of-implementing-ps5-around-revolutionized-storage-says-tim-sweeney/
>マーク・サーニーと次世代の可能性について話し始めたのは、少なくとも3、4年前のことです。
>中略
>そして、何年にもわたる議論とそれに至るまでの努力の結果として、ソニーと提携してその努力がついにPS5で実現したことを示す絶好の機会でした。
4年も協業して開発してきたゲームエンジンとゲーミングハードウェアっていうことを考えるとサーニーの講演内容とUE5の機能が見事にリンクしてるのはまあ必然だよね
そもそもUE5のデモはサーニーのGDC講演で一緒に披露される予定だったわけで、当たり前っちゃ当たり前なんだけど >>611
グラフィクスはパイプラインが組まれていて、
シェーダーのタイプごとに決められた入出力にあわせる必要がある
だから増減で考える必要がある
例えばテッセレーター使う場合も最大何倍まで増えるとか決めて使う
完全に自由なのはコンピュートだけど入出力が非効率になるよね >>615
そうしてVegaベースでDSBRとNGG構想が生まれたのだが開発が早すぎた
そうしている間にコンピュートシェーダーの使い道を示したNVIDIAによってこの2年でVulkanもDX12もメッシュシェーダーに乗り換えてしまう
クロックは伸び悩み、HBMが廉価になることもなく時は進み、AMDもRDNAに舵を切ったが命令パイプラインがGCNと別物になってしまった
18CUと36CUの呪いにハードウェア互換を求めたためにレガシーモードを追加する作業に時間がかかり、
Navi10ベースで設計するもスペックがちぐはぐなNavi10Liteリフレッシュが生まれた
だが、メッシュシェーダーやVRS、並行BVH試験、int4ドット積命令はNavi2に向けてMSとの共同開発となり、Navi10Liteにはサポートが入らなかった >>614
おお詳しい人だありがとう
IAはあくまでDXの概念で実体としてはソフトウェア(ドライバ)であってる?
ここがcomputeにオフロードされてかつプログラマブルになってかつvertex/geometry shaderと一体化した
という理解でOK? デモ冒頭の「これが正しい道のはず」がどうのこうのとか何言ってんだって感じだったけど
SIEとEpicがタッグ組んで既存のゲーム開発を根底から覆すための講演で披露されたデモの冒頭って考えると納得できるわ そして昨年、悪夢が訪れる
MSが52CUで12TFを達成したのだ
二桁と一桁では見栄えが違いすぎる
慌てて二桁にするために逆算してピーククロックを導いたものの、それに合わせるためには抜本的な見直しが必要になった
RDNAは命令パイプラインが深くなっていたためより高い周波数を実現することは完全に不可能ではなかったが、
各部のレイテンシーは物理的に下げることができなかったのだ
この変更のために各基本性能は定格動作時のものからだいぶ落とされた
だが、約束したのはピーク性能の設計目標だけで黙っていれば気づかれないはずだった
ユーザーの目はそこまでよくはない
ここで二度目の悪夢が訪れる 内部管理のデータが大量に流出したのだ さらに大量の廃棄までリークされる事態となった
性能の劣化だけでなく、試験にVRSやBVH試験が含まれていないことが明らかになったのだ
さらに悪夢は続く
去年の秋から順調であったArdenに追加発注がかかりラインの2/3以上を圧迫しているのだ 見切りで出したステッピングの緊急発注も間に合っていない
以上がリークした情報まとめ >>620
IAはVS使う全てのAPI共通ですよ
その後の段についてはその理解で大丈夫です >>624
> IAはVS使う全てのAPI共通ですよ
実体がハードかソフトかを知りたいのだけどどちら?
GPUのスペックの説明ではIAtってでてこないと思うんだけど キチガイって物語作るの好きよね
それを真実として語るさまは統失そのものだ https://youtu.be/ph8LyNIT9sg
https://youtu.be/qC5KtatMcUw
だからこの2つの動画はセットで見るべきなんだよね
サーニーとデモの解説はPS5とUE5の両方について語ってると考えて間違いない
その中で一番重要なのはCPUやGPUじゃなくてSSDだってことは、講演の尺のとり方みてもEpic側の興奮ぶりを見ても間違いない GPUの性能の説明で出てこないのはただバッファからインデックス見ながら三角形をVSに渡すだけなので十分すぎる供給能力があるためですね リークされた情報をデマとするためには実機プレイを見せるだけで十分なはずだったが
その後、ハードウェア支援でしか実現不可能な速度のレイトレーシングも高速な互換タイトルロードデモも発表されなかった
そしてUE5はXbox Series Xで問題なく動作することが発表され、何が売りなのかよくわからなくなった
SSDを連呼せざるを得ないように、次世代機には高性能なグラフィックスは不要との認識のようだけどね ラチェクラは実効速度7GB/sぐらい出てるみたいだけどSoD2のロードテックデモは実効速度1GB/sもあやしいからな… >>627
vulkanどうなってるか見てみたら同じ名前で確かに固定ハードという説明が書かれていた
ttps://vulkan-tutorial.com/Drawing_a_triangle/Graphics_pipeline_basics/Introduction
ここのプログラマブルになったと、なるほど
プリミティブシェーダーについてはどう?
本質的にメッシュと何が違うの?(あるいは変わらない?)
いまいち「コンピュートシェーダーの使い道を示したNVIDIA」の意味がわからない
コンピュートだからって別に演算性能自体は変わらないわけで
スクラッチパッドメモリの使い方とかそのへん? ただの煽り厨ならまだ可愛げがあるけど周りに目もくれず一方的に自分の妄想を吐き出してる姿は不気味というしかない >>632
CS世代になってもIAに依存していた世代はユーザー入力をCSで処理、IA用のバッファに書き出し、一番厄介な待機処理が完了するのを待つ必要があったのね
CUに対するスケジューリングは完璧ではないので、待機命令を入れると使用率が悪化してしまう
それIAのセットアップしなければよいだけの話だよね、がメッシュシェーダーになる
静的な描画であれば気にする必要はないが、例えばアニメーションのスキニングや破壊をCSに行わせるなど動的オブジェクトが多い場合には待機いらずで性能が向上する
GPGPUを言い出したNVIDIAが先なように見えて、近年のAMDもこっち路線だったのだけれど、先に策定したのはNVIDIAだね
プリミティブのディスパッチのためにメモリに書き出す必要性もなくなるし、計算が空けば発行されたプリミティブから処理していけるのでそういった面でも有効
プリミティブシェーダーはここではいいように単語が使いまわされているので、DSBRなのかNGG構想か、UE5の用法なのかわからないとなんとも 議論にすらならない妄想はスルーすればよいのです無駄に荒れるから >>634
> プリミティブシェーダーはここではいいように単語が使いまわされているので、DSBRなのかNGG構想か、UE5の用法なのかわからないとなんとも
同意だw
やっぱりプリミティブシェーダーは例の特許情報ぐらいね >>573
魔法のSSD言われたのが悔しかったんだよ グラフィックに使えるメモリが10GBとするとラチェクラは1秒ちょっとで10GBのデータを読み込んでる
これはサーニーの7.4GB/sって説明とおおよそ合致してる
SoD2は現行機タイトルだから使うメモリ量は7GB程度の考えられる
ロードに10秒かかってるから実効速度は1GB/sにも満たない計算になる >>637
特許のはDSBRだね TBDRは目新しくないのでスケジューリングが新規性かな?
帯域幅3割減のフレームレート1割増しとの話だけれど、FRに比べると各タイルでのソートが必要なのでソートしている間はROPが暇してしまう、
発行PS数下がってZテスト減るから帯域幅減らせるけど、暇な部分が増えて相殺ですね
モバイル用APUにはいいと思う UE5の解説のあとぐらいに新GPUが発表されるっぽい
あとPS5の新しい機能や互換と予約が始まるかも見たいな話出てる
今年のNBAとかのゲームはPC版はPS4とかベースのものでPS5版だけが次期エンジンらしい
箱は言及なしなので不明 CCXL3を4MBにしてIFを強化したRyzen4000のG系も出るようでPS5ってのはやはり基礎として次アーキ構成で発表かもなあ >>642
サーニーが思わせぶりな発言してるもんな >>634
> プリミティブシェーダーはここではいいように単語が使いまわされているので、DSBRなのかNGG構想か、UE5の用法なのかわからないとなんとも
といいつつ、
>>603
> >>602
> その意味でのプリミティブシェーダーはGDSを経由したメッシュシェーダーエミュレーション
> Navi10Liteにはメッシュシェーダーサポートがないので苦肉の策だが、あまり効率のよいものとは言えない
とプリミティブシェーダーの中身を知っているようだけど何が根拠? 根拠なんてあるわけねーじゃん
そいつただの知ったかだし w 心配しなくてもプリミティブなんて1stの一部タイトルしか使わんよ
どうせマルチばっかだからメッシュもプリミティブも使われない
見てみろよテッセレーターを >>644
Navi10LiteにはメッシュシェーダーサポートがないのだからNGGと考えるのが妥当かな
RadeonSIのコード読むのが一番理解が早いよ
ドライバで透過的に利用できる範囲でのNGG利用はあるだろうけれど、Navi10Liteでやらかした低いプリミティブ発行レートならメリットないなあ
コンピュートシェーダーの普及速度はものすごいので、この手の議論もすぐに消えてなくなる >>646
1stに自信のあるSIEは、むしろ1stの優位性を保つためにサードはそれらを使う必要がないと思っていた感もあるよな
ところがPS5にベタ惚れしたEpicが、プリミティブシェーダもSSDもブン回してきやがった
SIEとしては痛し痒しといったところだろう
ただPS5のフルプログラマブルジオメトリエンジンあたりまで使いこなしているわけでは無さそうなんで
1stはそこらで差を付けられそうだが 同世代の同じ規模のトランジスター数のハードのゲームはそのうちだいたい同じ見た目に落ち着く法則 世代別のレンダリングパイプライン
■DirectX 9
頂点シェーダ(Vertex Shader)
→ピクセルシェーダ(Pixel Shader)
■ DirectX 10
頂点シェーダ側にGeometry Shaderが加る。
頂点シェーダ
→ジオメトリシェーダ
→ピクセルシェーダ
■ DirectX 11
テッセレーションステージ(Tessellation Stage)が加わった。
「ハルシェーダ」(Hull Shader)
「テッセレータ」(Tessellator)
「ドメインシェーダ」(Domain Shader)の3ブロック
頂点シェーダ
→ハルシェーダ → テッセレータ → ドメインシェーダ
→ジオメトリシェーダ
→ピクセルシェーダ
■ プリミティブシェーダ
サーフェスシェーディング(Surface Shading)
(旧 : ハルシェーダ + テッセレータ)
→ポジションシェーディング(Position Shading)
(旧 : 頂点シェーダ + ドメインシェーダ)
→プリミティブカリング(Primitive Culling)
→アトリビュートシェーディング(Attribute Shading)
※レンダリングパイプラインの最適化が狙いだった。
もう主流はコンピュートシェーダだし、メッシュシェーダは
コンピュートシェーダと書き方同じだからな。
DirectXの標準になったし、OpenGLも追随したら決定打だな。 UEもUnityも、現場ではもうコンピュート使ってのシェーダが
普及しだしてるんだけど?
アーティストがShaderGraph使ってシェーダ作るようになって
きたから、内部は勝手にコンピュートシェーダで作られる。
で、メッシュシェーダはコンピュートの仕組み使ってるから、
親和性も高い。
近頃は大手ミドルウェアもメッシュシェーダ基準で作ってるし。
(Houdini, Substance Painterとか)
もう本気でプリミティブシェーダで書くとこは、せいぜいソニー
セカンドまで。
近頃は話題になってるから。
シェーダの項目、読んどいたほうがいいぞ。
https://docs.unity3d.com/ja/2019.3/Manual/ShadersOverview.html
一部の大手以外はUE or Unityだし。
カプコン、スクエニも汎用エンジンの採用本格的になってきたからね。 >>647
え?RadeonSIにprimitive shaderの実装載ってるの?まじで?
> Navi10Liteでやらかした低いプリミティブ発行レートならメリットないなあ
これはどこ情報? >>632
プログラマブルシェーダとコンピュートシェーダは、実装全然
違うんだけど?
コンピュートはGPGPUみたいに、汎用寄りの演算を行うことも
可能な仕組み。
HLSL, GLSL書いたことないのかな?
vert, fragとか予約語があって、グラフィックのパイプラインに
最適化されてるから。
CPUからの情報も渡しづらいし、もう触りたくないなーって
よく聞くよ。
https://docs.unity3d.com/ja/current/Manual/SL-VertexFragmentShaderExamples.html
https://yttm-work.jp/shader/shader_0001.html
https://yttm-work.jp/shader/shader_0002.html よくわからないのが
ttps://www.4gamer.net/games/421/G042134/20180913178/SS/038.jpg
この図の下にもPDがあるところだな
これってIAに対応するものじゃないの?
いらなくなってなくない?
でも
ttps://developer.nvidia.com/blog/introduction-turing-mesh-shaders/
ttps://developer.nvidia.com/blog/wp-content/uploads/2018/09/meshlets_pipeline.png
この図だとvertex attribute fetchが相当するのか?
これはなくなっている ジオメトリパイプラインを刷新。新設の「プリミティブシェーダ」
とは何か?
https://www.4gamer.net/games/337/G033714/20170804085/
https://www.4gamer.net/games/337/G033714/20170804085/TN/006.jpg
まず,機能面で重複する頂点シェーダとドメインシェーダを
プリミティブシェーダに統合し,
「ポジションシェーディング」(Position Shading)という機能
ブロックとして扱う。
ドメインシェーダは「テッセレータ実行後の頂点シェーダ」
みたいなものなので,まとめることには合理性がある。
次に,「ジオメトリパイプラインの後段に行けば行くほど,
頂点データと,付随する属性パラメータが爆発的に増えていく」
ことを防ぐため,ジオメトリパイプラインの上流で早期カリング
を行う機能ブロック
「プリミティブカリング」(Primitive Culling)を置く。
加えて,複数ビューポートへ向けた投射のような,
ジオメトリシェーダが持つ特殊なジオメトリパイプライン機能は,
「アトリビュートシェーディング」(Attribute Shading)という
機能ブロックが担当する。
以上の3ブロックが,プリミティブシェーダという新シェーダ
ステージを司るプログラマブルシェーダとなるのだ。
しかも,話はこれで終わらない。
従来はジオメトリパイプライン後段に位置し,ジオメトリ
シェーダと一部機能がダブる部分もあったテッセレーション
ステージは,最上流に再配置となり,頂点(≒ポリゴン)分割
機構であるテッセレータを制御するハルシェーダとともに,
「サーフェスシェーディング」(Surface Shading)という機能
ブロックとして再構成を果たした。 >>656
IA相当ではないと思う PDがなんの略か書いてないが、ワークロード分配機能の概略かと
そもそもこのスライドは概略図としても結構雑で関係ない場所が1:1対応しているように見える
VSと違いTSに渡されるのはプリミティブではなく、入力へのポインタと自分が並列の中でどこを担当しているかなので意味合いも違う 答えは来週か
って言ってもPS5は普通に到達してるから、箱がそこに入るのかどうかだろうな
箱も次世代なのか次世代ではないのか プリミティブシェーダーとメッシュシェーダーの意味をめちゃくちゃな形で紹介したの西川さんかよ・・
リファレンスとの不一致を感じたら西川さんの記事忘れたほうがいいよ >>658
primitive distributorの略だね
ttps://www.4gamer.net/games/421/G042134/20180913178/
このpdfでもPDを不要にするのがmesh shaderという説明っぽいんだけどはっきりとは書かれてない
ttp://on-demand.gputechconf.com/gtc-eu/2018/pdf/e8515-mesh-shaders-in-turing.pdf >>659
どれだっけ?リンク張れる?
Nanite実現できてたら十分じゃないのという気がするけど そろそろ世界中のエンジニアがメッシュシェーダ最適化に取り組んでその限界を知った頃だろう。
パイプラインの最適化ってハードウェアの進化なんかより余程センセーショナルなはずなのに、誰もその成果を自慢しないのは異常に思わないのかね。
成果を出したのはほぼ唯一、プリミティブシェーダーに最適化したUE5だけなんだよね。 ■ このスレッドは過去ログ倉庫に格納されています