スイッチはfp16対応で、fp16とfp32ではデータサイズが半分なのでGPU内でのデータ転送コストも低くなる。
fp16で計算してもfp32で計算しても大して学習効果に差がなく、それをゲームにも反映するようになった。法線とか。
同じようなことはfp32とfp64でも起こった。
nvidiaのfp16押しの根拠と理解していただければ。