80年代のベクトル機や 90 年代から現在までのマイクロプロセッサで、演算器 の数の増加が極めてゆるやかであった最大の理由は、メモリバンド幅の問題で ある。(Wilkes, 1995)単純な算術演算の場合、演算あたり読出し2語、書き 込み1語で3 語を読み書きできる必要がある。
最新の Intel Pentium 4 2.2 GHz プロセッサはクロックあたり 2 演算を行え る。つまり、 4.4 Gflops の理論ピーク速度を持つ。これに対応するメモリ転 送速度にくらべて、実際の主記憶の速度は 1/30 である。これでは、わずか2 個の演算器も有効に使うのは難しい。もちろん、実際にはレジスタファイルや キャッシュの利用によりある程度の効率は達成できるが、それでも多くの問題 でピーク性能からはほど遠い性能しか得られない。