1
つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2022/03 2022/02 2022/01 もっと昔まだgithubにはいれてない。
そうすると今の実装では明らかな無駄があるので、これも直してから新しい版にするか。
元々のバージョンでは、サンプルとって境界値をみつけてから、ローカルのデータを全部ソートして境界を2分法でみつけて行き先決める、としている。で、最後にもう一度ソートしている。
これは無駄で、最初はソートしないで境界値を2分木にしてlog p (pはスレッド数)ステップで行き先決めるほうが計算量もメモリアクセスも少ない。これはサンプルソートの1ステージそのものなのでその部分を使うようにすればいい。
とかわざわざ書いてるのはこれ修正面倒だけどまあするかという気分をだすためである。
天文の理論のポストとかそうそうないのでこういうとこにひろってもらうとか考えましょうみたいな。
これまでの最多の86人(1/26-2/1) をあっさり突破。この間兵庫県の数字は減るかほぼ横這いなので、4月になって対面での授業が始まった結果というのが自然な解釈であろう。
「齊藤氏の脱税工作は本書で取り扱った事件としてだけでなく、私が取材した数々の脱税事件の中でも屈指の込み入った手口だ。こうした複雑な脱税スキームを考えつく頭脳は、できれば本業のほうで生かしてもらいたい。」
いやもう本当に。
台湾の半導体メーカーとしてリアルテックとパワーチップがでてきてちょっと?
関連して見つかったAsia Semiconductor Sector Taiwan IC design service: Advancing with China CPU substitution and AI acceleration すごく面白いんだけど、ASIC ベンダのカスタマーとしての日本の凋落ぶりが すごい(p42 Fig 97とか)。
本読むと現在日本で進んでいることがまさに民主主義の後退と権威主義化 であり、そこではポピュリストのレトリックが大きな役割を果たしていることがわかる。
まあ戦後日本の民主主義はそもそも擬制ではないかという気もしてくるが。
リファイル先の推測がデフォルトで上手くいかないものをどんどん登録す ればそのうちに99%以上正しい場所を出すようになるので基本的に "o" 押すだけで1メイル処理できる。
「3D実装技術で国内での主要プレーヤーとなる企業は、RaaSの加盟企業やパッケージング工程を担う関連企業になります。 例えば、パッケージ基板で世界のシェアを占めるイビデンや新光電気工業で す。」
京セラでてこないのはなぜ?と、それはともかく、この辺はパッケージとか有機基板の会社で、2.5Dには重要だけど多分これから重要な本当の3Dでは話が違う気が、、、
あと、GAAの時代に日本復活とか夢を見るのが悪いとはいわないけど、今後伸びる半導体って自動車とロボット、要するにエッジAIなわけで、それ本当にGAAとかでやるのかというと、、、まあチップレットでコア部分だけとかはあるかもだけど。
まあ、日本の超 過および過少死亡数ダッシュボードでも同じ2020-2021年で超過死亡は7万8千で大体4倍なのでそんなものである。2021年末までで日本のCOVID-19による死者はだいたい10万であると。
とか書いてたら DVD 送りますとメイルがはいってた。
西川善司の3DGE:IntelのノートPC向けGPU「Arc」とはいかなるGPUなのか。性能から機能までをひもといてみた によればFP32理論性能 13.5TF でTGP(って何?)150Wと。これ自体は悪くはないんだけど、わりと微妙。
RTX3070 が 220W FP32 20.4TF と資料にはあるので、Samsung 8nm の 3070 と TSMC N6 の Arc で同等なのか、、、みたいな。
単純に昨日の晩飯を大目に作って一部を弁当にしてもっていっただけ。味付けを好みにできるので特に疑問なく食べられる。学生多くて食堂も混むしお弁当買うのも大変なのでこっちにするか。
up to 70% logic density gain, up to 15% speed improvement at the same power and up to 30% power reduction at the same speed as compared with N5 technology. なので速度同じだと電力30%減。
N5 は N7 に比べて速度同じで電力40%減少、N7はN10に比べて40%、N10は 16FF に比べて35%と主張されている。N7 は N16 に比べてそこまで減ってる気 がしないが、計算上は全部掛けると N2 は同じ速度のN16の 1/6 の電力となる。
でもこれプロセス2つの比較は電圧違って、 N16 と N10 比べる時の N10 の電圧と N10 と N7 比べる時の N10の電圧違うよね、、、
まあ HPC だと別に速度が同じ必要もないので、N16のクロックが落ちてよければ電力性能の差は2倍かよくて3倍であろう。
トランジスタ当りの製造コストはあんまり変わらない(ウェファの値段はどんどん上がる)感じなので、まあ、同じ電力性能でクロック上がればメリットはあるんだけど、開発費用がねえ、、、
引用: さらに河野氏は、インターネットやGPSに代表されるような「軍事研究の民間転用」が過去にはあり、現在では逆に民間技術を防衛のために転用することも増えてきたと説明。
引用:研究に境界線がなくなってきている中で「学術会議がこんなこと(防衛費での研究否定)を言い続けているならば、科研費(科学研究費)は配分だけ各省庁に任せる、ということをやらなければいけないだろう」と持論を展開した。
科研費の配分は文科省がやって(学振に委託も)てすでに「任せ」られてるんじゃないかしら?学振と学術会議の区別ができてないとか?
複数プロセスで並列にアクセスするところでは、zlib 使って圧縮しちゃ うとSDD のI/O速度リミットになるところまでプロセス数増やしても落ちない。 まあなのでこれ使えばいいんだけど、zcat が落ちるのがちょっと困る。
引用:名古屋市は3月25日、「ワクチンの長期にわたる副反応」に悩む人向けの電話相談窓口を開設した。河村たかし市長は同28日の記者会見で、市医師会などと協力しサポート体制を構築したと説明。「(過去の)薬害(のよう)にならないよう、しっかり対応したい」と利用を呼びかけた。
引用:市によると、相談に対応する愛知県看護協会の専用回線には、初日から今月4日までに335件の相談が寄せられた。主な症状(複数回答)は関節痛や頭痛などが206件、発熱や倦怠感などが97件と、これまで本紙に声を寄せた多くの人たちの症状と共通する。
名古屋市というのがなかなか難しいが、人口230万の都市で10日間で300件って結構多い。
あんまりその傾向を日本は追いかけないほうがいいと思うけど現状ではなかなか日本も欧米の仲間入りである。
これまでで一番多かったのは 1/26-2/1 の86人と。
A64fx だと今までのより 30%くらい速くなった。Skylake だとあんまり効 果なし。SIMDsort 自体は1コアで 2倍くらい速いんだけど、コア数多いと結局 主記憶やLLCのバンド幅リミットになるからと思われる。
samplesort は並べかえたい構造体から sort key + index の構造体を作っ てこっちをソートして、で、並べかえた index を使って元の構造体を並べか えることで主記憶アクセスを減らしている。
A64fx だと(プリフェッチとかいれると)最後の元の構造体を並べかえると ころはわりと速いんだけど、Skylake ではこっちがリミットで sort 速くする 効果が小さい。まあこれは配列サイズが大きいと単純なメモリコピーと 構造体単位の間接アクセスなので、さすがに HBM2の効果がある。
というわけで、Intel Xeon Gold 6140 と A64fx で、同じコア数でSIMDsort 自体は Xeon が 1.5倍くらい速いんだけど、Samplesort 全体だと A64fx が 1.5倍く らい速い。
行列乗算以外のある程度複雑な計算で同じコア数で Xeon より A64fx が速いのって私は初経験である。まあメモリコピーが律速になるまで他を速くできたからだけど。
最後の並べかえで、今のコードは単純に元の配列を並べかえた新しい配列 を作ってそれをコピーバックするんだけど、なので2回読んで2回書くことになっ てる。
シーケンシャルなら行き先を順次書換えるみたいやり方で主記憶 のアクセスは1度読んで1度書くだけにできる気がするけど、並列でうまいこと できる方法あるかしら?
まあアプリケーションの側で新しい配列のほうを使うことにすればそれでいいという考え方はあるんだけど、、、まあ少しでも速くしたい時はそっち使ってね、でいいか。
あとは独立に行われるクィックソートがメモリバンド幅競合してスケールしないのをどうするかか。サンプルソートかヒープ使ったマージソートだけど、頑張れば速くできるのはサンプルソートか。
1語のやつから適当にいじって コード生成しているのであんまり効率よくないがとりあえず正しくソートはす る。192ビットの構造体を std::sort に渡すのに比べて、配列に変換してソー トして構造体に戻すオーバーヘッドいれても2倍以上速いのでまあいいか。
SVE版できたら FDPS にいれられる。
まあ結局、我々は国内で数えられている分だけで毎日5万人が感染し、100人が死亡する、という状態に「慣れた」ということなんであろう。
引用: 一方でMN-Coreが扱うのは主に深層学習の演算であり,計算グラフという形で事前に演算内容が得られるため,ソフトウェア側であらかじめ解析することが比較的容易である.
深層学習がそう、というのはそうなんだけど、大抵の HPC アプリケーショ ンもそうだし大抵の大規模並列アプリケーションがそうだというのは Hillis の博士論文で主張されている。来年で40年か。
7ページを見ると年俸制で常勤研究者は平均年齢 47.9 で給与総額 1100万、 任期付きだと 40.7歳で690万。
まあなので650万はまあそんなものな気が。査定をPIとかセンター長とかがやるのでばらつきは大きいと思うけど。
昔の理研もわりとそういうふうだった。
感染予防に対する効果は2回接種後3ヶ月たつとほぼゼロ。重症化・死亡に対する効果は6ヶ月以上でも 70-80%とのこと。
どうせ感染予防の効果はたいしてないんだったら8ヶ月とかおいてもいいんじゃないかみたいな。
こっちは Ububtu 18.04 の最新カーネルではそもそもブートしない。 5.4.0-99 generic で対応。