next up previous
Next: 5 専用計算機 Up: 世界最高速の計算機を作る 超高速科学技術計算への「手作り」アプローチ Previous: 3 10倍はどこに消えたか

4 汎用並列処理の困難

80年代のベクトル機や 90 年代から現在までのマイクロプロセッサで、演算器 の数の増加が極めてゆるやかであった最大の理由は、メモリバンド幅の問題で ある。(Wilkes, 1995)単純な算術演算の場合、演算あたり読出し2語、書き 込み1語で3 語を読み書きできる必要がある。

最新の Intel Pentium 4 2.2 GHz プロセッサはクロックあたり 2 演算を行え る。つまり、 4.4 Gflops の理論ピーク速度を持つ。これに対応するメモリ転 送速度にくらべて、実際の主記憶の速度は 1/30 である。これでは、わずか2 個の演算器も有効に使うのは難しい。もちろん、実際にはレジスタファイルや キャッシュの利用によりある程度の効率は達成できるが、それでも多くの問題 でピーク性能からはほど遠い性能しか得られない。



Jun Makino
平成14年6月13日