if文とかswitch文とかがあると、きっとストールするんだろうなぁと勝手に思っていて、使わない代わりに 32x32 の行列演算をさせていたんだけど、行列の要素の70%が0となってしまっていたので、そう言った場合は、素直に switch文で切り替えた方が良い感じ。というわけで、926.7Mbps -> 1.01Gbps に高速化!