つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2010/11 2010/10 2010/09 2010/08 2010/07 2010/06 2010/05 2010/04 2010/03 2010/02 2010/01当面の予定
林: 巨星がどうしてふくれているのかというのさえも、なかなか理解できない 問題だったのです。これは林先生還暦の時だそうで。先週同じような場面が展開されていた。佐藤:簡単に説明しろと言われると、いまでもたいへん困るのです。
杉本:べつに困らないと思うけど(笑)。
佐藤: いやいや、しょっちゅうそれを考えている人には分かるのだけども、、、
ワタシは頭の中にできあがったものを打ち込むだけなので, タイトルを決めるのに一番時間がかかって, タイトル決めたら1週間くらいで書き上げます.
2位だった東京工大の「TSUBAME(ツバメ)2・0」は順位を一つ下げた。いやまあその、そうじゃないはずなんだけど、、、
同じBoardや同じPC、同じInterconnect等を使って、しかも推定されるLinpack性能にたいした差が無い2システムに於いて、これだけ消費電力に差があるというのは信じ難い事である。まあ、間違っている数字が信じられないとわかる判断力はあるということですね。 で、あえて、既に修正されている Top500 のほうの数字には触れていないところが 興味深い。もうちょっと上手くやる技術を磨いたほうがいいと思います。
AVX DGEMM (M, N, K=8Kx4Kx128) performs 1.8x over NHM. AVX DGEMM/SGEMM achieves 88-90% machine peak. The AVX/NHM speedup is 1.8x for radix-2 1D CFFTs with N=1024 The Intel Optimized LINPACK benchmark, using Intel AVX optimizations, performs over 1.86x (or over 80% overall efficiency) on 4 cores with N=20000.ピーク性能が倍、実効性能が1.8 倍上がって効率が90% なら元は効率 100% だっ たことになってなんかおかしい(これによると実際は 95% くらい)けど、 K=128 でそこまででるのは素晴らしい。 Xeon E3 だと4コア 2.4GHz TDP 45W で HPL 60Gflops くらいになるのか、、、 本当に 900Mflops/W くらいまではもうくるんだな。TSUBAME2 の Top500 にのっ てるほうの電力性能よりは上くらい(Green500 のよりは下かも)。もちろん K より上。
ssh-rsa (改行) **** (改行) foo@barと3行になってたんだけど、これでははいれなくて 1 行に直したら上手くいっ た。最近は 3行でも上手くいくのかな? sshd の man page には
Each line of the file contains one key.と書いてあるのか。
2010年現在、GPUの電力あたりの性能は5GFLOPS/W程度です。どの口がそんなことを、、、社長氏は ここによると9月に 1.5Gflops/W といったんだそうで。2ヶ月の間に数字が3倍になったのかな? CPU も Core i3 2390T とか Xeon E3-1260L とかだと CPU だけなら倍精度 1Gflops/W を 超えてたりして、、、というか 1.5 超えるのか、、、
責任者のマーク・バーネル氏によると、計算能力は世界で35位か36位で、今後数カ月の能力向上で20位程度となる予定だ。Top500 の倍精度の実効性能と PS3 の単精度のピーク性能を比べてるような気が、、、
日本のスーパーコンピュータは、他国のスーパーコンピュータのざっと10倍のコストがかかるようだが、関係者の誰も、これを問題としていない。問題にしている人は関係者ではない、と定義すればそうなるけど、、、
Echelonは、NVIDIAが開発中の次世代のコンピュータアーキテクチャで、今後8年以内の実現を目指して開発が進められているという。チップ単体で10TFLOPSの性能を実現することを目指しており、実現すれば現行製品であるFermiの100倍の性能を実現することになるという。Fermi は 100Gflops しかでない、という意味なのか、あるいはこれは 電力性能の話なのか?
Dally described a graphics core that can process a floating point operation using just 10 picojoules of power, down from 200 picojoules on Nvidia's current Fermi chips.といっていて電力性能は 20倍にしかなってない。 200 pJ/ops という のは 5Gflops/W なので、Fermi なら単精度での数値。なので、 10pJ も単精度だと思うと単精度 100Gflops/W、倍精度だとその 1/2 または 1/4 と、、、本当に 2018 年にここまでしかいかないんだと NVIDIA は その前に会社がなくなるんじゃないか?