つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2024/01 2023/12 2023/11 2023/10 2023/09 2023/08 2023/07 2023/06 2023/05 2023/04 2023/03 2023/02 2023/01 もっと昔LE で FA 一個できても、ゲート効率悪すぎてGPU(MN-Coreでも。まだFP8ないけど) Int4 とかFP8 の演算回路で1ビット計算のほうが速そう。
こういうの上手く使うためには、アプリケーションが使う並列度とハード ウェアの並列度が対応しないといけなくて、それは一杯スレッド作るという Cuda の理念とは逆なんだよね。
私の意見としてはこれは Cuda の SIMT の理念、というか元々の CM の仮 想プロセッサの理念がメモリバンド幅があまってた時代のもので現在の B/F=0.04 とかいうGPU にはあわないという話である。
じゃあどうすれば良かったのか?ということに対する回答は 基本的には CM-Fortran/HPF で、分散メモリ向け実装にすると 同時にキャッシュブロッキングというかオンチップメモリにブロッキングする。
ただ、それやるにはNVIDIA GPU の L2D$ は小さいのとバンド幅足りない のであんまり効果ないのが難しいところ。SM毎に MB オーダーの shared memory つけてそれを分散キャッシュとして、物理的に共有されたL2は廃止か 通信バッファくらいの大きさにしないと駄目。
なんというか、他と同じもの作って競争って大変そう。
引用:改善策では、大学組織特有の階層構造によって生じる差別や抑圧に「あまり注意が払われなかった」と指摘。「モノが言えない雰囲気があったり、まともに受け止めてくれる人がいなかったりした」などとし、大学の組織風土に問題があったとの見方を示した。
窓口の体制に問題があるところはまだまだ多い気が。
なんというか、ここでの「面白さ」って基本的にハードウェア、ソフトウェア、そのインターフェースに欠陥があるために発生するパズル解きな気がする。
今週色々ボケてた、、、
黒魔術を学んだ人々が新たに別の黒魔術を学ぶのはもういやだという気持ちはわかる。
ただ、黒魔術が必要なのは、複数SM、スレッドスケジューラ、共有メモリ、 キャッシュというハードウェア構成とCudaのプログラミングモデルの間に乖離 があって、ハードウェアをソフトウェアから適切に制御できないからだよ ね、、、
台風の予報、画像ベースのAI予測のほうが数値予報より上手くいくという発表があった。なんかすごい。
例えば有限要素法ででてくる疎行列って、物理的な節点配置と行列の非 ゼロ要素に必ず対応があるわけで、いい感じに空間分割すれば節点もいい感じ に分割されて、結合は領域内と隣接領域間だけになる。
そうすると、領域分割でシュアコンプリメントを使うみたいな感じの、内部を解いてから領域相互作用を解くみたいな方法がわりと使える。
これはもちろん、本質的にはPACS/PAX の川合先生の「自然現象は近接相互作用で並 列に進行している.これを計算機システムに直接写像するのが,自然の摂理に かなっている」という「直接写像」の主張である。
でも、そういう空間構造を知らないことにする「一般の疎行列」対応ではもちろんこういうのは上手くいかないということになる。いやそれはそうだけどさあみたいな。
もちろん重力とクーロン力は長距離相互作用なんだけど、ツリーとか FMM で階層的にできるとわかってるし。
まあ、実際には1コアで10GFくらいしかでてないので、さらにそれより落 ちるとは思うけど、 1コア当り 0.5GFまで落ちることはないと思うんだけ ど、、、
引用:「超巨大噴火の原因である巨大マグマの存在は可視化されていないので、噴火の予測は困難である。よって噴火が起きないという証拠を挙げることも難しい」と指摘。「原発の近くで巨大噴火が起きた場合、住民にどのようなリスクがあるかを示すべきだ」
元の論文は First Impressions of the NVIDIA Grace CPU Superchip and NVIDIA Grace Hopper Superchip for Scientific Workloads -- A64fx の FFT もうちょっとでる気が。でも富士通版FFTW使ってるんだよねこれ。
20年くらい前だと数理ファイナンスだったけど。
でもまあそういうわけで博士とった学生がそちらに、、、まあそもそも私がそっちにいるしね。
SF3まだ厳しそうだけどこれから改善するんじゃみたいに書いてある。あと、ナノシートの幅もオプションがあるとか。
話としては Samsung は27年に SF1.4 で、これは SF3, 2 とは全然違うと いうことになっててほんまかいな感。逆に SF2はSF3からマイナーチェンジな のか、 電力25%、面積5%改善とある。
面積はまあ色々なあるからなかなか難しい。
「変圧器は耐震クラスCの製品で、現状入手できるうち最も強い揺れに耐 える仕様だという。」でも、C って、 SABC の C で一番下だよね?
まあ、新規制規準では、非常用電源はクラス1なんだけど 外部電源系はクラス3であんまり重要じゃないことになっている これの91ページの表1とか。 これは、「外部電源は失われるもので非常用電源をあてにするんだ」という論理。
で、それで大丈夫かというと、志賀原発では1月16日に「非常用ディーゼル発電機の試運転中における自動停止」というものが起こっていてわりと駄目。非常用電源は地震で壊れませんでしたがはじめから動かない状態でしたと。
16時からのは今日はないはず。
と思ってたら13時からのがあったが忘れていた。なんか駄目である。
なんか色々遅れててすみませんみたいな。割とオーバーフローである。
引用:このほか、富岳に採用した技術を活用したスーパーコンピュータの「PRIMEHPCシリーズ」の開発、製造、販売、保守についても、引き続き富士通が担当することになる。