まず、重力・クーロン相互作用に専用化した、ピーク性能100 テラフロップス程度の専用プロセッサを開発するとともに、粒子系に専用化し たアーキテクチャを持つが相互作用を計算するパイプラインを再構成可能論理 (FPGA、Field Programmable Gate Array)で実現した多用途粒子系プロセッ サを開発する。このプロセッサの性能は、応用にもよるがテラフロップス程度 となろう(図1)。さらに、これらと汎用の並列計算 機を組み合わせたヘテロジニアス・マルチコンピュータを実現し、天体シミュ レーション、分子動力学計算、粒子的アプローチでの流体計算などに応用する。
以下、重力・クーロン相互作用専用プロセッサと、多用途粒子系プロセッサに ついてその概略をまとめる。
計算速度の目標は 200 Tflops とする。このために、 50 Gflops 程度の演算速度 をもつプロセッサチップを 4096個並列に動作させる。プロセッサチップは、 粒子間相互作用を計算するパイプラインを6本格納する。当初の計画では 150 MHz程度 のシステムクロックを見込んでいたが、 1999年時点で得られた LSI は 100 MHz が安定動作の上限であり、また予想よりも製造コストがかかるこ とが判明したので、1999年末時点では 200Tflops の実現が可能かどうかは難 しくなっている。しかしながら、 100Tflops でも同時期の汎用計算機に比べ て 10倍程度の性能を実現できることには変わりない。現状の 100 MHz 動作では、プ ロセッサチップ単体のピーク性能は 36 Gflops、消費電力は 10W以下に収まっ た。
システム全体の構成等については昨年度の報告に詳しく述べたので、ここでは 省略する。
こちらは、計算速度などに明確な目標を設定することは難しい。これは、実効 性能が応用の種類、特に必要な計算精度によって大きく変わるからである。 本プロジェクトで開発する多用途粒子系プロセッサでは、以下を目標にする。
主要部の演算精度に単精度を要求した場合で、チップ単体の性能は1Gflops、 システム全体の性能は1Tflops程度となる。これはもっとも悪い場合で、例え ば実効的な精度が12ビット程度で良ければ4Tflops、さらに8ビット程度なら 10Tflops以上の速度が期待できる。