つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2024/08 2024/07 2024/06 2024/05 2024/04 2024/03 2024/02 2024/01 もっと昔H200/B200 どっちだろう?
Enumerate のなかでは \renewcommand{\labelenumi}{¥textcircled{\scriptsize \theenumi}} で。
まあインドはもう着工までいってるしねえ、、、台湾の P5 もこれから立ち上げだし、、、
公開ドキュメントに機械語の記載がなくて、要するに指定されてるのはマ ルチプレクサの入力と各記憶素子の WE であるというのが分からないのはよく ないよね。
まあ固定長ベクトル命令なのは、前の命令の結果を必ず次の命令で使える (フィードバック使えば)ので依存関係を満たすように命令並べるだけでパイプ ラインが完全に埋まるから。
なので、コンパイラは最適化するのに命令のスケジューリングをする必要 が基本的にはなくなってると。
まあそのかわり、マルチポートレジスタファイルじゃないからデータのあ る場所によってread/write ハザードが起こるので、中間変数とかをどのメモ リ要素に割り当てるかの最適化が必要になるけど。
それ以前に命令ストリームのバンド幅を小さくしたかったとかもある。
でもってこの辺の考え方は 2004年の元々の GRAPE-DR の設計からあんまり変わってなかったりする。
まだ Cuda もないころで、 GRAPE-DR のハードウェアも GPU のハードウェ ア・ソフトウェアも CM-2 と、GPU の場合には MasPar の影響が強い(MasPar の中の人がNVIDIA にいってるから)。
手元の Ubuntu 22 ではそもそもこのファイルがないんだけど、何をするとこれができるんだろう?
"Implementing comprehensive reduction in spending, including a more than 15% headcount reduction, to resize and refocus. " -- 従業員の 15% 以上の首を切ると。
Arm が出すコアの性能がすごく上がったので独自コア開発は厳しくなったよね、、、
と、こうやって荷物が増えていく。そのうちにこんなふうに、、、
大変いいかんじのホテルが会場なのはいいけど席に電源がない。この辺が 理工学系の学会との違いな気が。
なぜこんなところにというと岡野原さんにきた話がこっちにふってきたからなのであった。
私の主張は割と簡単で、台湾は半導体の大半とサーバーのほとんど全部を 作ってるのに AI 戦略がとかいう状況になるのは、要するに NVIDIA が TSMC か ら500ドル(もうちょっと高い?)で買ったGPUを3万ドルで売る商 売ができてるからであると。
まあHBM とかパッケージとかもあるけどパッケージも基板も大半台湾であ ろう。
なので、「NVIDIA GPU の次に世界を制覇するアーキテクチャ」をもつ、 というのが少なくとも戦略の1つでないといけないし、それにはどうすればい いかをちゃんとシステマティックに検討してないといけない。
「次に」であって NVIDIA GPU と対抗とかじゃないのはGPUアーキテクチャ はそろそろ限界だから。
まあアーキテクチャ検討を科学的にするアプローチがよくわかってない問 題はあるんだけど、深層学習さえ動けばいいならやりようはある。
本当にそれで次世代アーキテクチャになれるかというと疑わしいと私は思 うけど。シミュレーションの需要は今後増えると思う。