Previous ToC Next

18. 富士通 PSI プロジェクト(2006/2/14)

富士通 PSI プロジェクト

PSIプロジェクトとは、ペタフロップス超級スーパーコンピュータシステムの 構成において数千〜数十万規模の高速計算ノードを相互結合するシステムイン ターコネクト技術を対象に、現状のシステムよりもコスト対性能比で1桁上を目 指して、高性能化、高機能化、低コスト化を同時に達成するための3つの要素技 術、すなわち、(1)光パケットスイッチと超小型光リンク技術、(2)動的通信最適化に よるMPI高速化、(3)システムインターコネクトの総合性能評価技術を開発するプロ ジェクトです。

というものだそうです。2005 年度から 3 年間で、文部科学省の予算をもらっ てやっています。

イベントのページ を見ると、シンポジウムでの講演のスライドがいくつかあります。渡辺氏によ る 京速コンピュータへの挑戦も興味深いのですが、ここではサブプロジェクトについての講演である 光技術を用いた超高バンド幅スイッチング技術の開発 高機能・高性能システムインターコネクト技術の開発 をみてみましょう。

まず、「光技術を用いた超高バンド幅スイッチング技術の開発」ですが、スラ イド 10 を見ると、コストが原理的に半分にしかならないことがわかります。 その理由は簡単で、コストは基本的に全部電気・光の変換モジュールなので、 スイッチが光をそのまま通せるとスイッチの側の変換モジュールが無くなる 分コストが半分になる、というわけです。

これはなんとなく筋が通らない話で、それなら始めから光にしなければ 殆どただになるのか?というとこれがどうもそうのようです。問題があるとすれば クロスバーにして 30m も延ばすとすると結構すごい量のケーブルがいる、と いうことですが、これはこれまで考えてきたように、クロスバーなんてものを 使うのをやめれば済む話ではあります。メッシュ結合にすればケーブルの量は 1-2 桁はすぐに変わるわけですから。 LAN や WAN の長距離接続には光のメリッ トが大きいのですが、並列計算機で意味があるのか?というのはそんなに自 明ではなく、そこのところの検討が先であるように思います。

「高機能・高性能システムインターコネクト技術の開発」の目玉は総和等をネッ トワークでやる、というものです。 TMC の Connection Machine (以下 CM)で は 20年前にやっていた技術です。 スライド 4 に目標が書いてありますが、 「従来比5倍」といっても従来の数字がないので一体何が目標かわからない計 画になっています。これについては2005年9月にあったシンポジウムでの富士 通の講演の際に質問しましたが、その場では回答がありませんでした。とある 資料に数字がでていましたが、ちょっとありえないような遅い数字が書いてあっ たので何かの間違いだろうと思っています。

ただ、いくつか開発方針に気になるところがあるのでメモしておきましょう。 まず、スライド 11 に「マルチユーザ処理への対応が必須」とありますがこれ は並列計算機の実際の使いかたを考えてみるとばかげています。レイテンシが 小さい通信をしようと思ったら、実際には1つのプロセスが CPU を占有してい る必要があるからです。ハードウェアがどんなに速くても、マルチタスクで動 いていて通信が起こった瞬間に寝ている CPU が一つでもあれば、通信が終わ るまでには少なくともその CPU が復帰するまでの時間がかかることは明らか ですから、このような集団通信をサポートするネットワークがマルチタスクに 対応することには全く意味がありません。

その次のスライド 12 には「浮動小数点の場合には結果が演算順に依存しない 方法が必要」とありますが、別にこれは必要かどうかはアプリケーションによ るわけです。もっとも、スイッチノードで浮動小数点演算をやらせると回路規 模が大きいしレイテンシにも響きかねない、特にこのプロジェクトのように FPGA でごまかそうとしたら無視できなくなります。これを解決するには単に 最初に指数の最大値を取り、それを使って固定小数点表現に直したデータを操 作すればいい、というのはこれも CM でもやっていたことで、 20年前にはわ かっていたことです。

スライド 13を見ると、マルチコンテクストに対応が云々、とありますが、こ れも部分的には意味もなくマルチタスクに対応しようとしているためです。

スライド 14 では、 20 年前に調べられていることが、課題として列挙されて いる、ということになります。

これらは「要素技術の開発」となっているわけですが、結局全体システムの明 確なイメージがないまま「こんなのがあったらいいな」という程度の考えでプ ロジェクトを始めてしまった、というようにみえます。公共事業としては それでもいい、ということなのかもしれません。
Previous ToC Next