X



【ゲームハード】次世代機テクノロジー14【スレ】
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん必死だな (5級) (ワッチョイ ad25-NJGG)
垢版 |
2020/06/29(月) 00:24:41.21ID:RD42SYL30
!extend:default:vvvvv:1000:512
!extend:default:vvvvv:1000:512
此所はゲームハード&ソフト関連の技術を語り合うスレです。

※嘘・捏造の反証は手短に、煽りはNG・スルー
※マルチソフトのグラ比較は専用スレでお願いします。
※ソフトの内容・批評等は各ソフト・機種総合スレで。

前スレ
【ゲームハード】次世代機テクノロジー13【スレ】
https://krsw.5ch.net/test/read.cgi/ghard/1592394892/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0565HYns6mPSx (ワッチョイW cfb9-Cx62)
垢版 |
2020/07/04(土) 07:06:05.52ID:iGEZ9ytC0
>>563
知ってる人も何もPSSLで全機能呼べなくてどうすんだよwww
辺な心配すんな
0566HYns6mPSx (ワッチョイW cfb9-Cx62)
垢版 |
2020/07/04(土) 07:09:05.61ID:iGEZ9ytC0
>>564
アンチはそう思いたいんだろうが
他機種で同じ事が実現出来るかどうかまだ立証されてないじゃん
四苦八苦してなかなか出てこないかも知んないんだぜ?
0567名無しさん必死だな (ワッチョイW 03f3-iS2j)
垢版 |
2020/07/04(土) 07:37:30.54ID:yQT57E110
>>566
UE5のロードマップ理解できてる?
0570名無しさん必死だな (ブーイモ MMc7-h0J+)
垢版 |
2020/07/04(土) 08:37:44.41ID:jnrYQHieM
XSXはそもそもUE5のアセットをまともに読み込めるの?
0572名無しさん必死だな (JPW 0H96-h0J+)
垢版 |
2020/07/04(土) 08:41:55.31ID:GbkGxZuvH
>>570
魔法のDirectAPIがCPUオーバーヘッドを極力小さくし
BCPackの50%圧縮で帯域を2.4GB→4.8GBに理論値通り拡張できさえすれば
CPU3個分の展開プロセッサがフル稼働して、PS5の1/3程度の実効性能は出せるはずだ

まあそれでもUE5デモ終盤の様な高速ストリーミングはガッタガタになるだろうけどな
0575名無しさん必死だな (JPW 0H96-h0J+)
垢版 |
2020/07/04(土) 09:09:10.68ID:DGLzYr5sH
>>573
XSXのDirectAPIが、PS5のCPU完全パススルー型I/Oユニット並にCPUオーバーヘッドを減らせる事を無邪気に夢見てるのなら
やはりそれは魔法で良いんじゃないかな
まあ夢はでっかく持たなきゃねw
0576名無しさん必死だな (ワッチョイW 03f3-iS2j)
垢版 |
2020/07/04(土) 09:13:25.49ID:yQT57E110
>>572
何でわざわざ海外VPN通して書き込んでるの?
0578名無しさん必死だな (ワッチョイ 1eb0-Wiu6)
垢版 |
2020/07/04(土) 09:20:33.03ID:YSuCtBB40
そもそもAPIとしてる時点でCPUの処理が入るって事だからな
まあWindowsでも使うにはそうするしか無いけど
CPUの介入を可能な限り排除したPS5と同じになるわけない
0579名無しさん必死だな (ワッチョイ 0b25-VQSO)
垢版 |
2020/07/04(土) 10:10:33.62ID:/YqOp8AR0
>>578
PS5はアプリケーションがアクセラレータを直接制御するって事?
んなわけないでしょ。PS5だってディスクI/OはAPI経由で行うでしょ

APIの改良についての話とハードウェアアクセラレータの有無/優劣の話を同列に語っても仕方あるまいよ
全体のフローとして語るなら分かるが
0580名無しさん必死だな (ワッチョイW 03f3-1BkK)
垢版 |
2020/07/04(土) 10:17:06.43ID:58RTxXlW0
PS5はSSDをストレージとして扱っているかどうかも定かじゃない

Windowsで言うところのMS的仮想メモリーではなく
本来の意味での仮想メモリとしてストレージapiすっ飛ばしてメモリ間転送に見える実装も有り得る
0581名無しさん必死だな (ワッチョイ 1eb0-Wiu6)
垢版 |
2020/07/04(土) 10:25:29.45ID:A4JRpKwx0
Velocityでハードウェア化してるのはデコーダーだけで、残りはAPIの改良とPRFの改良
DirectXでwindows10と互換保つためにはハードウェアアクセラレータは使えなかったんだろうな
0582名無しさん必死だな (ワッチョイ 4a8a-BXkI)
垢版 |
2020/07/04(土) 11:03:30.90ID:5POgDOYC0
オンメモリで行う環境だとしてNanite、Lumenの両方とも箱はPS5と同じクオリティーで実行できない気がするわ
解説を聞いてたらコンピュートで行うカリングとジオメトリバッファの生成や3Dテクスチャの展開ってのは今までのハードウェアで完結してるものであってUE4でもやれるものだったわけだしな
シャドウ生成まで行うNaniteってジオメトリの情報を一元管理されるプリミティブシェーダの恩恵そのものだし
ボクセル化されたテクスチャの展開もKrakenからのものだし
そのあたりをハードウェアの支援なしでコンピュートでやるってのはかなりの性能を必要とする
0583名無しさん必死だな (ワッチョイ 4a8a-BXkI)
垢版 |
2020/07/04(土) 11:11:10.75ID:5POgDOYC0
そもそも現行のGPUやメッシュシェーダーにあるタスクシェーダでやろうにも頂点管理用のメモリが足りない
それらが前フレームから取り除かれ元から必要ないプリミティブ向けの設計になっている
少ない頂点を増やすという設計のメッシュシェーダーとは真逆

逆にメッシュシェーダーのためにテッセレーションモデルがこれから普及するかといえば難しいと思う
クラーク法解禁されても普及しなかった時点で終わった技術なんだろうと
0584名無しさん必死だな (ワッチョイW de25-N1rm)
垢版 |
2020/07/04(土) 11:15:11.53ID:KGq62Dyb0
>>555
頭悪そう
0585名無しさん必死だな (ワッチョイW 0a92-dBP2)
垢版 |
2020/07/04(土) 11:50:48.79ID:KbNNuWZ20
テッセレーションはもう終わり
これからの時代は頂点は動的に増やすものじゃなく動的に減らすものにシフトする
メッシュシェーダは向こう2年くらいで消えるだろう
プリミティブシェーダーの方が有利なんだから
0586名無しさん必死だな (ラクッペペ MMc6-yPih)
垢版 |
2020/07/04(土) 11:55:52.39ID:kSREclqbM
増やすのと減らすのならどちらのほうが負荷が軽いのっと
0587名無しさん必死だな (ワッチョイ 0baa-ERT+)
垢版 |
2020/07/04(土) 12:02:52.06ID:m7jNkUVR0
>>586
メッシュはPCゲー移植を生命線にするNVが捻りだした妥協案のようなもの
こんなのを標準化したMSは恐竜と一緒にあの世に逝くだけ
0588名無しさん必死だな (ササクッテロラ Sp23-iS2j)
垢版 |
2020/07/04(土) 12:06:09.21ID:03Dzu+r7p
だったらAMDもメッシュに舵きりはしないのでは?
0589名無しさん必死だな (ワッチョイW 8765-h0J+)
垢版 |
2020/07/04(土) 12:15:36.61ID:QjRG32Xp0
>>588
PCのグラボは非効率と分かっていても、DX互換性の為に短期的にはメッシュを採用せざるをえまい
中長期的にはZblushのモデルをそのまま取り込んでゲームと映画の開発環境を統合できる、プリミティブシェーダへ移行するのは確実
0590名無しさん必死だな (ワッチョイ 1eb0-Wiu6)
垢版 |
2020/07/04(土) 12:28:45.13ID:A4JRpKwx0
どのスタジオでもモデルの作るのが、ZBrush前提になってきて
ハイメッシュの高密度ポリゴンを作ってから、プラットフォームに合わせてゲームモデルとして
落とし込んでいくってやり方になってるから
ゲーム内でローポリモデルをテッセレーションして増やすってやり方は
あまり使われなくなってきたしなぁ
0593名無しさん必死だな (アウアウウー Sacf-heYS)
垢版 |
2020/07/04(土) 12:54:23.88ID:eDLoaMXYa
https://www.pcgamesn.com/unreal-engine-5-fortnite-performance

・Epic Gamesによれば、PlayStation5のUnreal Engine5技術デモはそれほどGPU負荷が高いものではなかったようだ

・「UE5デモのジオメトリのレンダリングにかかったGPU時間は、据置機で『フォートナイト』を60fpsで走らせるぐらいのレンダリングバジェットだった」とエンジニアリング副社長Nick Penwarden氏が言及していた


マジかよスゲーなこれ
0597名無しさん必死だな (ワントンキン MMa7-N1rm)
垢版 |
2020/07/04(土) 14:45:54.01ID:zUrhMs1jM
>>596
取捨選択できるカスタマイズがAMDの強みです
MSは捨てた
0598名無しさん必死だな (ワッチョイW cf28-h0J+)
垢版 |
2020/07/04(土) 14:45:56.74ID:PNM5unAV0
チカ君完全論破された挙句、プリミティブシェーダクレクレを始めてて草生える
0600名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 14:49:48.00ID:UZM2X6GoM
NGGの意味でのプリミティブシェーダーはGDSの利用方法の見直しなので普通にできるのはいいとして、
Navi10Liteに無理なクロックを指定したためにプリミティブ発行可能レートが設計目標の8割性能なのどうするんだろう?
それでも2.0GHzのままなので8.4TFしか出ないことになる
開発機は9.4TFとCU数多かった噂まで見かけるが初期型どうするんだろう?下手するとUE5デモが動かない落ちもある

CPUもベース1.6GHzがリークされたあと音沙汰ないし、よくそんな状況でネガキャンやる気になれるよなと
0601名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 14:54:59.23ID:UZM2X6GoM
メモリの帯域幅、VRSサポートを加えると実効性能差は2.2倍から差が出るので1440pではフレームレート半減でごまかせるかもだが、
無理に4Kやろうとするとテクスチャレートが足りなくて劣化せざるを得なくなる

GTX1080未満相当とRTX2080Ti相当+HWRT強化では実質2世代差なので仕方がないが、
8割しか出せなかったプリミティブシェーダーがどうのとはさすがにならないよ
0602名無しさん必死だな (ワッチョイ c63b-ldKj)
垢版 |
2020/07/04(土) 15:02:39.54ID:RwMRf1ur0
サーニーの講演を聞く限り、プリミティブシェーダは箱に載ってなさそうじゃね

>10年以上の間、GPUはゲームエンジンに制限を課してきました。
>ソフトウェアは頂点処理を行いますが、ほとんどの場合、三角形や頂点が形成するその他のジオメトリを処理する、専用のハードウェアが使用されています。
>つまり、頂点を使用する全てのジオメトリが画面に表示されていない場合には、頂点処理を中止するなどの基本的な最適化すらできないということです。
>PlayStation5にはジオメトリエンジンと呼ばれる新しいユニットがあり、三角形やその他のプリミティブの処理を完全なプログラム制御下に置くことができます。
>ゲーム開発者は、ジオメトリエンジンの存在を無視して、PlayStation5 GPUをPS4 GPUと同等の能力だけのように扱ったり、この新しいインテリジェンスをさまざまな方法で利用したりすることができます。
>単純な用途としては、背面または画面外の頂点や三角形を削除するなどのパフォーマンス最適化があります。
>より複雑な用途としては、プリミティブシェーダと呼ばれるものがあります。これを使用すると、レンダリング中にジオメトリをその場で合成できます。
>これはまったく新しい機能です。
>PlayStation5でプリミティブシェーダを使用することで、ディテールのレベルをスムーズに変化させることができ、オブジェクトをクローズアップするためのプロシージャル(編者注:ここでは、用意されたデータから自動生成する手法を指す)なディテールの追加や、
>パーティクル効果やその他の視覚的な特殊効果の改善など、幅広いテクニックを可能にします。
0603名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 15:05:37.81ID:UZM2X6GoM
>>602
その意味でのプリミティブシェーダーはGDSを経由したメッシュシェーダーエミュレーション
Navi10Liteにはメッシュシェーダーサポートがないので苦肉の策だが、あまり効率のよいものとは言えない
0604名無しさん必死だな (ワッチョイ c63b-ldKj)
垢版 |
2020/07/04(土) 15:07:38.53ID:RwMRf1ur0
この話って>>548らへんの話ともリンクしてるよね
0605名無しさん必死だな (ワッチョイ 8aaa-up82)
垢版 |
2020/07/04(土) 15:08:44.47ID:F1QkG5Ge0
>プリミティブシェーダを使用することで、ディテールのレベルをスムーズに変化させることができ、
>オブジェクトをクローズアップするためのプロシージャル(編者注:ここでは、用意されたデータから
>自動生成する手法を指す)なディテールの追加

ここだけ読むと頂点も動的に増やすと言う話じゃないの?なんでスレでは増やさないという話になるのか
0607名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 15:13:11.90ID:UZM2X6GoM
>>605
テッセレータの本来の機能は与えられたパラメータから頂点を増やすことにあるのだが、
内容を理解していない日本語も苦手なLOD否定派がLOD否定の意味でテッセレーション否定するのでわけがわからなくなっている

この手の誤解は大抵の場合、西川さんの雑な解説が元だったりする
悪い人じゃないんだけど、そこまで技術詳しくないよ
0608名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 15:18:07.12ID:UZM2X6GoM
>>604
TimがこれをずっとやりたがっていたがGCNではできなかった
それがコンピュートシェーダーの登場で可能になった
ラスタライズ段に使えるのがプリミティブシェーダーだったので取りあげたら大騒ぎになったが、
ノートPCのRTX2070Sでさらに高速に動作させた講演が漏れて火消しからの、やっぱり動きます、プリミティブシェーダー必須ではないです。なう
0609名無しさん必死だな (ワッチョイ c63b-ldKj)
垢版 |
2020/07/04(土) 15:18:11.11ID:RwMRf1ur0
https://www.4gamer.net/games/032/G003263/20080912053/
>また,GPUがプログラマブルであるのは確かだが,それをあえて「固定機能」的と呼んでいた。シェーダ自体はともかく,パイプラインがきっちり決まっているので固定機能のようなことしかできず,
>結果としてどのゲームを見ても同じようにしか見えないという。また,こういった固定機能だと,仮にシェーダが20倍の性能になったとしても,見た目的には2倍も綺麗になったりはしないものだと氏は語る。

Tim Sweeneyとサーニーが言ってること完全にリンクしてるよね

>10年以上の間、GPUはゲームエンジンに制限を課してきました。
>ソフトウェアは頂点処理を行いますが、ほとんどの場合、三角形や頂点が形成するその他のジオメトリを処理する、専用のハードウェアが使用されています。
>つまり、頂点を使用する全てのジオメトリが画面に表示されていない場合には、頂点処理を中止するなどの基本的な最適化すらできないということです。
>PlayStation5にはジオメトリエンジンと呼ばれる新しいユニットがあり、三角形やその他のプリミティブの処理を完全なプログラム制御下に置くことができます。
0610名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 15:18:22.37ID:sbvtmeBw0
メッシュシェーダーとプリミティブシェーダーの違いってつまり何なの?
どちらも1頂点入力、1頂点出力のバーテックスシェーダーから
複数のポリゴン単位で扱えて増減も可能にしたものでしょ
同じようなものにしか見えないんだが
0611名無しさん必死だな (ワッチョイ 27c5-Wiu6)
垢版 |
2020/07/04(土) 15:23:04.14ID:3+BptUZ20
どっちも、あくまで与えられたデータから動的にポリゴンを生成するしくみであって、増やすとか減らすとかはどうでも良いような。
昨日のマイクロポリゴンの話じゃないけど、メッシュ状に並んだ頂点の差分データから、表示密度に応じた三角形ポリゴンを自動生成する場合、
それは増やしてるのか減らしてるのか? どちらとも言えるw
0614名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 15:32:46.67ID:UZM2X6GoM
>>610
説明のためにAS(TS)の段を飛ばして話をするよ AS段でのカリングは柔軟性にかかってくるが必須ではない
今までは頂点リストを頂点座標とインデックス、そのトポロジーの形でInput Assemblerに入力する必要があった
Draw Callで発行する際にはこの組み合わせにデータを整理しなければならなくて面倒だった
コンピュートシェーダーの登場でプリミティブの発行をIAを通さずコンピュートシェーダーに行わせるのがメッシュシェーダー
IAのためのセットアップを省けることは様々な利点がある
まず入力に使うデータはユーザー定義の自由な構造体を使えるようになるので出力されるプリミティブよりも多い情報を与えて柔軟性の高いテッセレーションを行ったり、発行しなくてよいプリミティブの情報を与えたりと柔軟性が増えた
逆に少ない情報から発行することも可能になって、インデックスを2段回参照にすることでインデックスに必要なビット数を削減したり、四角形を与えて三角形を2つ出力したりといったことも可能になった
IAの固定機能を自由に記述することでIAのセットアップ時間をなくし、自由な入力から柔軟にプリミティブを出力できるようにするのがメッシュシェーダー
0615名無しさん必死だな (ワッチョイ c63b-ldKj)
垢版 |
2020/07/04(土) 15:36:51.25ID:RwMRf1ur0
https://wccftech.com/sony-really-did-a-fantastic-job-of-implementing-ps5-around-revolutionized-storage-says-tim-sweeney/
>マーク・サーニーと次世代の可能性について話し始めたのは、少なくとも3、4年前のことです。
>中略
>そして、何年にもわたる議論とそれに至るまでの努力の結果として、ソニーと提携してその努力がついにPS5で実現したことを示す絶好の機会でした。

4年も協業して開発してきたゲームエンジンとゲーミングハードウェアっていうことを考えるとサーニーの講演内容とUE5の機能が見事にリンクしてるのはまあ必然だよね
そもそもUE5のデモはサーニーのGDC講演で一緒に披露される予定だったわけで、当たり前っちゃ当たり前なんだけど
0616名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 15:40:28.48ID:sbvtmeBw0
>>611
グラフィクスはパイプラインが組まれていて、
シェーダーのタイプごとに決められた入出力にあわせる必要がある
だから増減で考える必要がある
例えばテッセレーター使う場合も最大何倍まで増えるとか決めて使う
完全に自由なのはコンピュートだけど入出力が非効率になるよね
0617名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 15:46:36.07ID:UZM2X6GoM
>>615
そうしてVegaベースでDSBRとNGG構想が生まれたのだが開発が早すぎた
そうしている間にコンピュートシェーダーの使い道を示したNVIDIAによってこの2年でVulkanもDX12もメッシュシェーダーに乗り換えてしまう
クロックは伸び悩み、HBMが廉価になることもなく時は進み、AMDもRDNAに舵を切ったが命令パイプラインがGCNと別物になってしまった
18CUと36CUの呪いにハードウェア互換を求めたためにレガシーモードを追加する作業に時間がかかり、
Navi10ベースで設計するもスペックがちぐはぐなNavi10Liteリフレッシュが生まれた
だが、メッシュシェーダーやVRS、並行BVH試験、int4ドット積命令はNavi2に向けてMSとの共同開発となり、Navi10Liteにはサポートが入らなかった
0620名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 16:04:14.85ID:sbvtmeBw0
>>614
おお詳しい人だありがとう

IAはあくまでDXの概念で実体としてはソフトウェア(ドライバ)であってる?
ここがcomputeにオフロードされてかつプログラマブルになってかつvertex/geometry shaderと一体化した
という理解でOK?
0621名無しさん必死だな (ワッチョイ c63b-ldKj)
垢版 |
2020/07/04(土) 16:06:52.43ID:RwMRf1ur0
デモ冒頭の「これが正しい道のはず」がどうのこうのとか何言ってんだって感じだったけど
SIEとEpicがタッグ組んで既存のゲーム開発を根底から覆すための講演で披露されたデモの冒頭って考えると納得できるわ
0623名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 16:10:00.93ID:UZM2X6GoM
そして昨年、悪夢が訪れる
MSが52CUで12TFを達成したのだ

二桁と一桁では見栄えが違いすぎる
慌てて二桁にするために逆算してピーククロックを導いたものの、それに合わせるためには抜本的な見直しが必要になった
RDNAは命令パイプラインが深くなっていたためより高い周波数を実現することは完全に不可能ではなかったが、
各部のレイテンシーは物理的に下げることができなかったのだ

この変更のために各基本性能は定格動作時のものからだいぶ落とされた
だが、約束したのはピーク性能の設計目標だけで黙っていれば気づかれないはずだった
ユーザーの目はそこまでよくはない

ここで二度目の悪夢が訪れる 内部管理のデータが大量に流出したのだ さらに大量の廃棄までリークされる事態となった
性能の劣化だけでなく、試験にVRSやBVH試験が含まれていないことが明らかになったのだ

さらに悪夢は続く
去年の秋から順調であったArdenに追加発注がかかりラインの2/3以上を圧迫しているのだ 見切りで出したステッピングの緊急発注も間に合っていない

以上がリークした情報まとめ
0626名無しさん必死だな (ワッチョイW 6baa-yPih)
垢版 |
2020/07/04(土) 16:18:14.55ID:nppArLSy0
キチガイって物語作るの好きよね
それを真実として語るさまは統失そのものだ
0628名無しさん必死だな (ワッチョイ c63b-ldKj)
垢版 |
2020/07/04(土) 16:24:32.74ID:RwMRf1ur0
https://youtu.be/ph8LyNIT9sg
https://youtu.be/qC5KtatMcUw
だからこの2つの動画はセットで見るべきなんだよね
サーニーとデモの解説はPS5とUE5の両方について語ってると考えて間違いない

その中で一番重要なのはCPUやGPUじゃなくてSSDだってことは、講演の尺のとり方みてもEpic側の興奮ぶりを見ても間違いない
0630名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 16:31:52.32ID:UZM2X6GoM
リークされた情報をデマとするためには実機プレイを見せるだけで十分なはずだったが
その後、ハードウェア支援でしか実現不可能な速度のレイトレーシングも高速な互換タイトルロードデモも発表されなかった

そしてUE5はXbox Series Xで問題なく動作することが発表され、何が売りなのかよくわからなくなった
SSDを連呼せざるを得ないように、次世代機には高性能なグラフィックスは不要との認識のようだけどね
0631名無しさん必死だな (ワンミングク MMfa-Xq1m)
垢版 |
2020/07/04(土) 16:37:27.98ID:p3pWPXjjM
ラチェクラは実効速度7GB/sぐらい出てるみたいだけどSoD2のロードテックデモは実効速度1GB/sもあやしいからな…
0632名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 16:38:00.69ID:sbvtmeBw0
>>627
vulkanどうなってるか見てみたら同じ名前で確かに固定ハードという説明が書かれていた
ttps://vulkan-tutorial.com/Drawing_a_triangle/Graphics_pipeline_basics/Introduction
ここのプログラマブルになったと、なるほど

プリミティブシェーダーについてはどう?
本質的にメッシュと何が違うの?(あるいは変わらない?)
いまいち「コンピュートシェーダーの使い道を示したNVIDIA」の意味がわからない
コンピュートだからって別に演算性能自体は変わらないわけで
スクラッチパッドメモリの使い方とかそのへん?
0634名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 16:53:01.71ID:UZM2X6GoM
>>632
CS世代になってもIAに依存していた世代はユーザー入力をCSで処理、IA用のバッファに書き出し、一番厄介な待機処理が完了するのを待つ必要があったのね
CUに対するスケジューリングは完璧ではないので、待機命令を入れると使用率が悪化してしまう
それIAのセットアップしなければよいだけの話だよね、がメッシュシェーダーになる
静的な描画であれば気にする必要はないが、例えばアニメーションのスキニングや破壊をCSに行わせるなど動的オブジェクトが多い場合には待機いらずで性能が向上する
GPGPUを言い出したNVIDIAが先なように見えて、近年のAMDもこっち路線だったのだけれど、先に策定したのはNVIDIAだね
プリミティブのディスパッチのためにメモリに書き出す必要性もなくなるし、計算が空けば発行されたプリミティブから処理していけるのでそういった面でも有効

プリミティブシェーダーはここではいいように単語が使いまわされているので、DSBRなのかNGG構想か、UE5の用法なのかわからないとなんとも
0637名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 17:13:54.09ID:sbvtmeBw0
>>634
> プリミティブシェーダーはここではいいように単語が使いまわされているので、DSBRなのかNGG構想か、UE5の用法なのかわからないとなんとも

同意だw
やっぱりプリミティブシェーダーは例の特許情報ぐらいね
0639名無しさん必死だな (ワンミングク MMfa-Xq1m)
垢版 |
2020/07/04(土) 17:16:17.56ID:p3pWPXjjM
グラフィックに使えるメモリが10GBとするとラチェクラは1秒ちょっとで10GBのデータを読み込んでる
これはサーニーの7.4GB/sって説明とおおよそ合致してる
SoD2は現行機タイトルだから使うメモリ量は7GB程度の考えられる
ロードに10秒かかってるから実効速度は1GB/sにも満たない計算になる
0640名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 17:22:35.62ID:UZM2X6GoM
>>637
特許のはDSBRだね TBDRは目新しくないのでスケジューリングが新規性かな?
帯域幅3割減のフレームレート1割増しとの話だけれど、FRに比べると各タイルでのソートが必要なのでソートしている間はROPが暇してしまう、
発行PS数下がってZテスト減るから帯域幅減らせるけど、暇な部分が増えて相殺ですね
モバイル用APUにはいいと思う
0641名無しさん必死だな (ワッチョイ 4a8a-BXkI)
垢版 |
2020/07/04(土) 17:27:36.07ID:5POgDOYC0
UE5の解説のあとぐらいに新GPUが発表されるっぽい
あとPS5の新しい機能や互換と予約が始まるかも見たいな話出てる
今年のNBAとかのゲームはPC版はPS4とかベースのものでPS5版だけが次期エンジンらしい
箱は言及なしなので不明
0644名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 18:06:45.22ID:sbvtmeBw0
>>634
> プリミティブシェーダーはここではいいように単語が使いまわされているので、DSBRなのかNGG構想か、UE5の用法なのかわからないとなんとも

といいつつ、

>>603
> >>602
> その意味でのプリミティブシェーダーはGDSを経由したメッシュシェーダーエミュレーション
> Navi10Liteにはメッシュシェーダーサポートがないので苦肉の策だが、あまり効率のよいものとは言えない

とプリミティブシェーダーの中身を知っているようだけど何が根拠?
0646名無しさん必死だな (ワッチョイW 8ff3-muTG)
垢版 |
2020/07/04(土) 19:51:23.95ID:rF4SQq5j0
心配しなくてもプリミティブなんて1stの一部タイトルしか使わんよ
どうせマルチばっかだからメッシュもプリミティブも使われない
見てみろよテッセレーターを
0647名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 20:15:47.09ID:8FUNVmqnM
>>644
Navi10LiteにはメッシュシェーダーサポートがないのだからNGGと考えるのが妥当かな
RadeonSIのコード読むのが一番理解が早いよ
ドライバで透過的に利用できる範囲でのNGG利用はあるだろうけれど、Navi10Liteでやらかした低いプリミティブ発行レートならメリットないなあ
コンピュートシェーダーの普及速度はものすごいので、この手の議論もすぐに消えてなくなる
0649名無しさん必死だな (ワッチョイW 0310-h0J+)
垢版 |
2020/07/04(土) 20:25:36.42ID:3bGo9p440
>>646
1stに自信のあるSIEは、むしろ1stの優位性を保つためにサードはそれらを使う必要がないと思っていた感もあるよな
ところがPS5にベタ惚れしたEpicが、プリミティブシェーダもSSDもブン回してきやがった
SIEとしては痛し痒しといったところだろう

ただPS5のフルプログラマブルジオメトリエンジンあたりまで使いこなしているわけでは無さそうなんで
1stはそこらで差を付けられそうだが
0650名無しさん必死だな (ワッチョイW 6baa-yPih)
垢版 |
2020/07/04(土) 20:27:13.99ID:nppArLSy0
>>649
お、おう…
0652名無しさん必死だな (ワッチョイW 6a43-xy87)
垢版 |
2020/07/04(土) 20:33:19.80ID:VWyG2Rhs0
世代別のレンダリングパイプライン

■DirectX 9
 頂点シェーダ(Vertex Shader)
→ピクセルシェーダ(Pixel Shader)

■ DirectX 10
 頂点シェーダ側にGeometry Shaderが加る。

頂点シェーダ
 →ジオメトリシェーダ
→ピクセルシェーダ

■ DirectX 11
テッセレーションステージ(Tessellation Stage)が加わった。
「ハルシェーダ」(Hull Shader)
「テッセレータ」(Tessellator)
「ドメインシェーダ」(Domain Shader)の3ブロック

頂点シェーダ
 →ハルシェーダ → テッセレータ → ドメインシェーダ
 →ジオメトリシェーダ
→ピクセルシェーダ

■ プリミティブシェーダ
サーフェスシェーディング(Surface Shading)
 (旧 : ハルシェーダ + テッセレータ)
→ポジションシェーディング(Position Shading)
 (旧 : 頂点シェーダ + ドメインシェーダ)
→プリミティブカリング(Primitive Culling)
→アトリビュートシェーディング(Attribute Shading)

※レンダリングパイプラインの最適化が狙いだった。

もう主流はコンピュートシェーダだし、メッシュシェーダは
コンピュートシェーダと書き方同じだからな。
DirectXの標準になったし、OpenGLも追随したら決定打だな。
0653名無しさん必死だな (ワッチョイW 6a43-xy87)
垢版 |
2020/07/04(土) 20:33:52.00ID:VWyG2Rhs0
UEもUnityも、現場ではもうコンピュート使ってのシェーダが
普及しだしてるんだけど?

アーティストがShaderGraph使ってシェーダ作るようになって
きたから、内部は勝手にコンピュートシェーダで作られる。
で、メッシュシェーダはコンピュートの仕組み使ってるから、
親和性も高い。

近頃は大手ミドルウェアもメッシュシェーダ基準で作ってるし。
(Houdini, Substance Painterとか)

もう本気でプリミティブシェーダで書くとこは、せいぜいソニー
セカンドまで。

近頃は話題になってるから。
シェーダの項目、読んどいたほうがいいぞ。

https://docs.unity3d.com/ja/2019.3/Manual/ShadersOverview.html

一部の大手以外はUE or Unityだし。
カプコン、スクエニも汎用エンジンの採用本格的になってきたからね。
0655名無しさん必死だな (ワッチョイW 6a43-xy87)
垢版 |
2020/07/04(土) 20:41:57.21ID:VWyG2Rhs0
>>632
プログラマブルシェーダとコンピュートシェーダは、実装全然
違うんだけど?

コンピュートはGPGPUみたいに、汎用寄りの演算を行うことも
可能な仕組み。

HLSL, GLSL書いたことないのかな?
vert, fragとか予約語があって、グラフィックのパイプラインに
最適化されてるから。
CPUからの情報も渡しづらいし、もう触りたくないなーって
よく聞くよ。

https://docs.unity3d.com/ja/current/Manual/SL-VertexFragmentShaderExamples.html

https://yttm-work.jp/shader/shader_0001.html
https://yttm-work.jp/shader/shader_0002.html
0656名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 20:43:13.69ID:sbvtmeBw0
よくわからないのが

ttps://www.4gamer.net/games/421/G042134/20180913178/SS/038.jpg

この図の下にもPDがあるところだな
これってIAに対応するものじゃないの?
いらなくなってなくない?

でも

ttps://developer.nvidia.com/blog/introduction-turing-mesh-shaders/
ttps://developer.nvidia.com/blog/wp-content/uploads/2018/09/meshlets_pipeline.png

この図だとvertex attribute fetchが相当するのか?
これはなくなっている
0657名無しさん必死だな (ワッチョイW 6a43-xy87)
垢版 |
2020/07/04(土) 20:44:07.91ID:VWyG2Rhs0
ジオメトリパイプラインを刷新。新設の「プリミティブシェーダ」
とは何か?
https://www.4gamer.net/games/337/G033714/20170804085/
https://www.4gamer.net/games/337/G033714/20170804085/TN/006.jpg

まず,機能面で重複する頂点シェーダとドメインシェーダを
プリミティブシェーダに統合し,
「ポジションシェーディング」(Position Shading)という機能
ブロックとして扱う。
 ドメインシェーダは「テッセレータ実行後の頂点シェーダ」
みたいなものなので,まとめることには合理性がある。

 次に,「ジオメトリパイプラインの後段に行けば行くほど,
頂点データと,付随する属性パラメータが爆発的に増えていく」
ことを防ぐため,ジオメトリパイプラインの上流で早期カリング
を行う機能ブロック
「プリミティブカリング」(Primitive Culling)を置く。

 加えて,複数ビューポートへ向けた投射のような,
ジオメトリシェーダが持つ特殊なジオメトリパイプライン機能は,
「アトリビュートシェーディング」(Attribute Shading)という
機能ブロックが担当する。

 以上の3ブロックが,プリミティブシェーダという新シェーダ
ステージを司るプログラマブルシェーダとなるのだ。

 しかも,話はこれで終わらない。
 従来はジオメトリパイプライン後段に位置し,ジオメトリ
シェーダと一部機能がダブる部分もあったテッセレーション
ステージは,最上流に再配置となり,頂点(≒ポリゴン)分割
機構であるテッセレータを制御するハルシェーダとともに,
「サーフェスシェーディング」(Surface Shading)という機能
ブロックとして再構成を果たした。
0658名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 20:58:02.92ID:8FUNVmqnM
>>656
IA相当ではないと思う PDがなんの略か書いてないが、ワークロード分配機能の概略かと
そもそもこのスライドは概略図としても結構雑で関係ない場所が1:1対応しているように見える
VSと違いTSに渡されるのはプリミティブではなく、入力へのポインタと自分が並列の中でどこを担当しているかなので意味合いも違う
0661名無しさん必死だな (ブーイモ MMb6-h0J+)
垢版 |
2020/07/04(土) 21:01:02.07ID:8FUNVmqnM
プリミティブシェーダーとメッシュシェーダーの意味をめちゃくちゃな形で紹介したの西川さんかよ・・
リファレンスとの不一致を感じたら西川さんの記事忘れたほうがいいよ
0662名無しさん必死だな (ワッチョイ 4aaa-Wiu6)
垢版 |
2020/07/04(土) 21:15:39.64ID:sbvtmeBw0
>>658
primitive distributorの略だね
ttps://www.4gamer.net/games/421/G042134/20180913178/

このpdfでもPDを不要にするのがmesh shaderという説明っぽいんだけどはっきりとは書かれてない
ttp://on-demand.gputechconf.com/gtc-eu/2018/pdf/e8515-mesh-shaders-in-turing.pdf
0664名無しさん必死だな (JPW 0H42-dBP2)
垢版 |
2020/07/04(土) 21:22:40.47ID:DLtVkgCfH
そろそろ世界中のエンジニアがメッシュシェーダ最適化に取り組んでその限界を知った頃だろう。
パイプラインの最適化ってハードウェアの進化なんかより余程センセーショナルなはずなのに、誰もその成果を自慢しないのは異常に思わないのかね。
成果を出したのはほぼ唯一、プリミティブシェーダーに最適化したUE5だけなんだよね。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況