現行drive px2はint8には対応してないし
tesla P4G(GP104)が50W
voltaではレジスタファイルの階層化、スケジューラーの多段か
実行演算粒度の小型化で電力効率はさらに上がる
電気食いのGDDRを使うわけでもない

GP104が72億
Xavierが70億(512core 2048SP相当)
GM104が52億(2048SP)


SM自体にはこれまで通り32スレッドで渡される
そっからさらにローカルコア向けにデータ準備できたものから4スレッドごとスケジューリングされていく
で、レジスタファイルはSMごとの遠いものじゃなく直近の階層化されたものを使う

お花畑でも何でもない