つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2022/04 2022/03 2022/02 2022/01 もっと昔昨今の日本だとこういうのにも中抜きがはいりそうというかそもそも開発できるところはどこ?問題はある。推論ハードやってるとこは一杯あると思うんだけど。
平野さんは First star(s) の話。なんかこの20年くらいで First star → multiple first stars → First star cluster とどんどん 1つの first star forming halo の中でできる星の数が増えている気が。
10年で5倍か10倍。
と思って調べたらすぐにわかって 2022/9/14 に Arm が発表したと
あれ、もらった URL じゃなくて公募の名前で検索したらつながる、というか今はつながるようになったかな。こちらも書かないと。
もう1つ送った。今日書かないといけないのはあと一つ。
もう1つ送った。今日書かないといけない推薦書はこれで終了のはず。なんか忘れてないかな?
登録された死亡数は 1500くらいなので 3-4倍。なので4月もこれくらいで5月はだいぶ増えそうではある。
あと推薦書が、今きているのは3つで大丈夫かな?なんか忘れてないかな?
なんかそういうふうに非公開になると進歩が止まってしまわないだろうか? まあ、公開されてる成果を取り込むことはできるんだろうけど。
というか富士通公式では富岳のメモリバンド幅は 163PB/sで、Frontier は 37888ノードで 3276.8GB/s とすると 124PB/s。HPCG は 16TF と 14TF なので名目では Frontier のほうが効率がいいの?そなの?
ツリー構築とか辿るとことかは(適切にパラメータ選べば)ボトルネックに ならない。まあそうすると相互作用カーネルの効率が今一つなのがみえるわけだが。
なんか前にもそういうことがあったような気が問題が解決してからしてきた。
Rmax は上がってるし電力も Total Cores も比例して増えてるので明らかに名目のピーク性能だけが半分になってる。なんだそれ?
ちょっと頑張れば H100 の上にいけそうなのになにもしないのが AMD のHPC に対する熱意の程度を感じさせる。
去年の11月の発表だと H100 80台で名目ピークが 5.42PF だったのが、お そらく 1.5倍の120台になって名目ピークは 2.88。あるいは 80台が嘘で 40台しかなくてピーク性能も半分だったと。
SR670 V2 に4枚いれても電力供給も冷却能力も足りない気がするのでそう いう問題かもしれない。
引用: Isambard 3 は FP 64 でのピーク性能で 2.7 ペタフロップスの処理能力を持ち、消費電力は 270 キロワット未満で、アクセラレーションを使用しないスーパーコンピューターとしては世界で最も環境に優しいシステムのトップ 3 に入ります。
10GF/W なのでピークの電力性能では A64fx より悪い。まあ、それでも、ねえ、みたいな。
まあラピダスとかも同じ。
「1Wあたり7.3TOPSの電力性能比」 「SRAMと演算部を一体化させたことで、超低レイテンシと超高計算密度を実現したとしており、INT8演算においてAI演算アーキテクチャ部に限定すれば、15TOPS/W」
演算部分以外と演算部分の電力がほぼ 1:1 なのは結構偉い。で、INT8 でこの数値は悪くないんだけど、今推論専用でINT8なのか問題はあるかな?カードにすると35Wが60Wと。
それはまあそうできればそれがいいんだろうけど、、、Samsung の GAA のデッドコピーとかならできるんじゃない?
なぜこんなものが必要になったかというと、元々将軍通交差点(の東行側) は交差点手前で2車線に右折専用レーンが発生して3車線になる構造(google map ではまだこの状態)だったのを変更したから。
何を血迷ったのか、2車線の 右側がそのまま右折専用になって左側に直進+左折レーンが発生する格好に なった。なので、昔通りと思って右側レーンにいると交差点直前で自分がいる のが右折レーンになっている。
で、「右折レーンから直進」する車が大量に発生したのではないかと思わ れる。 まあ今なんか工事しているので車線つけかえるのかな?
これは明らかに設計ミスなんだけど、何故こんなミスが発生したんだろう?
で、ぼちぼち修正してて、標本分散とか不偏分散の自由度が n-1 なのは そういえばどういう理屈だっけ?と。
導出はこれとか。大変美しい。
当たり前だが、これは母集団が正規分布、ということに依存する導出なん だけど、我々は t 検討を母集団が正規分布じゃなくて n が大きくもない時に も使っているような気が。あれ。
16FF+→N7→N5→N3Eで、トランジスタ密度はTSMC側の主張としては結局 3.3x, 1.8x, 3.3x で20倍近いという夢のような話(まあ 12FFCからだと15倍く らいかしら。それでも素晴らしい)
でも、SRAM は4倍くらいでしょ?みたいな。
というか、 A72 コアで結局N5からN3Eで1.6倍(エリア0.64x)にしかなってない。
L2 の B/F が 0.25 (write と合わせると 0.5?)、L1 の read BF が2、レ ジスタが8って、、、A64fx は4演算で 2load なので L1 の read BF は4ある。 まあ read/write が同時にに動かなかったような気がするのであんまりかわら ないか。
まあ電力バジェット内で実装できるように作るとこうなるのはわかるけど GEMM以外のアプリケーションカーネル評価したのか?という気が、、、、
L2 がちょっとこれでは、、、
姫野さんは「順天堂大学健康データサイエンス学部特任教授 」
10年前のなんだけどHPC Power Efficiency and the Green500 の消費電力のグラフみてて、なんかこれ数字が間違ってないかと、、、
1024 ノードの CM-5 は 5KW と書いてあるけどこんな少ないわけはなくて 300-500kW のはず。 NWT は 100KW と書いてあるけど1MW、ES は 18,000kWと あるけど 6MW だったような。
2048個 3132/3164 がついた CM-2 は28kW で、倍精度理論ピーク 20GF (まあ絶対でないけど)なので 0.7Mflops/W。1986年としては驚異的な電力性能 だったはず。 X/MP 4 が多分 200-300kW だったっぽい。
TMC がでは何故こけたかというと CM-5 が色々××だったからである。 と いうのは 2/6 に書いた。
つまりは、 B/F 優先でピーク性能あたりのコストが高いデザインだったから。
理研の研究系職員の非常勤 率は 77%で、10年前だと90%近い数字だったのに比べると改善しているが大半が非常勤なのは変わりない。
こういうのなんだろうね、、、
主要部分はこれだけ: COVID-19 is now an established and ongoing health issue which no longer constitutes a public health emergency of international concern
DeepL訳: COVID-19は現在、確立された継続的な健康問題であり、もはや国際的に懸念される公衆衛生上の緊急事態を構成するものではない。
要するになんかがんばって収束させるとかできそうになくてこれからもずっと続くよ、ということのようである。
なので、通常の対応にちゃんとコロナ対策を組み込んでね、というのが一応書いてはあるんだけど、もちろんそうではなくてもう何もしなくてもよいと受け取る人が政府上層を始めとして一杯でてくるんであろう。そういうものである。
これは、結局、科学コミュニケーションというのものが「科学的」でありえるか?という問題だし、そもそも「科学的」とは何かということでもあるんだけど、「科学的」というのを操作的にでも定義しようとすれば結局それは科学的と権威の側にあることを同一視するしかないということである。
そこから逃れなければ公害問題でも薬害問題でも原子力でもなんでも必ず権威の側に立つことになる。まあそれはそれで、自分が害をうけるのでなければ幸せなことであろう。
でも、科学は実際にはそういう権威に従っていれば現実に適応できるわけではない、ということを少なくとも情報としては社会の側に提示することが機能で、それを社会が受け入れなければ受け入れた社会に比べて不利になる、と、まあ、そういう話であろう。
まあ、今の学術会議すら受け入れられないような政府はじゃあどうなるの?という話なんだけど。
受講している学生さんにWslRegisterDistribution failed with error: 0x800701bcがでますがどうすればいいでしょうかと質問された。
私の担当は計算機演習ではないんだけど、、、で、これは解決してもさら に X がががとのことで、環境聞いたらもちろん Win10 だったので、Win11 に して WSL いれなおすのが簡単といってみた。
これはロジックだけの場合で、SRAM がある程度はいるとN7以降の増加率が半分く らいになる。これは厳しい話で、N2で28HPM の10倍しかはいらない。 NRE は 10倍くらいいきそうだし量産コストも結構10倍近く違う。
トランジスタコストでは N12e か N6e が最適、よほど大量生産でなけれ ば 22 が、となりそうだが、TSMC は FDSOI がないし GF の 22FDX はあん まり小規模生産対応しないっぽい。
つまりは凶悪なインフルエンザであるということである。
で、 m-RNA ワクチンを普通のインフルエンザワクチンのようにどんどん 新型対応して使うか、というと、何故そうしないのかというのが明快に 説明されていないがそれは推奨しない、というのが WHO の方針 だろうしそもそも新型対応の m-RNA ワクチンが作られてるかどうかが?である。
超過死亡をみると今年1月は記録的な数だし、2月もオミクロンのピークだっ た昨年並みであり、新型コロナが「終わった」どころではなくて日本では これまででは昨年が最悪であり、このままいくと今年はさらに大きな 被害をもたらすようにみえる。
東京の新規感染者数は4月の間にほぼ2倍に増えていて、このままの 割合遅いペースで増えるなら5000から1万人辺りで飽和するんじゃないかと 思う。但し、5月以降5類化でもう数がわからなくなるだろうからあんまり 意味がない。
オミクロン以降をみると、東京では波毎に概ね150万人が感染している。 実数は 2-3倍としてまあ例えば300万人、人口の 1/4程度が波毎に感染 していることになる。第8波はだいぶ少ないんだけど、これは報告の 割合がさがっているせいと考えられる。
これは、SIRS モデルのような、一様な人口と免疫減衰だけを考えた モデルでは説明できない。というのは、SIRS モデルでは人口のほとんどが 毎回感染するはずだからである。
この辺の振舞いをちゃんと説明できるモデルとかはどこからもでてきて ない気がする。
もちろん、一番簡単なのは人口を2つに分けることなんだけど、そうする と R ≫1 と R<1のグループに分かれてその間にそこそこカップリングがある みたいな話になってちょっと本当か?という気も。
まあでも、例えば学校で広がる、家庭では家族に感染しておしまい、みたいなの を考えるとそういう感じかも。
で、学校も、弱くカップリングした沢山のグループに分かれていると。 そうすると、グループ間でどれくらい伝播するかで感染の規模が決まる、 みたいことがでてくるはず。
とすると、旅行支援とか逆に行動規制の効果はそういうミクロスコピック なモデルで効果を考えないといけなくて、 SIR(S)で R が、とかいってもあま り意味がないのかもしれない。
つまり、こういうダイナミクスを考えると、1回の波では、感染しやすいグループのさらにに一部分だけが感染したところで飽和することになって、毎回の波ではある程度再感染と新規感染がまざりながら広がるみたいなことが起こる。
そうすると、そういう感染の波から距離をとる、という対策は依然として効果的でありえる、ということになる(といいなあという希望的観測ではある)
N3 は N5 に比べて 15%、30% は同じだが密度 70%、N5もN7に比べて 15%、 30% は同じだが密度 80% だったので N2 ってどうなの感はある。
3世代進んで電力 1/3 になるだけなわけで、、、値段はどうよ問題もあるし。
16FF+ からN7に電力削減はTSMCの主張的には 60%だったんだけど、そんな夢のよ うな話は二度とおこらないと。28HPMから16FFは48%。
何かこう、 0.1V とか 50mv くらいで動くスイッチング素子ってないもの?生物の神経みたいな化学反応使うとかでもいいから。