はてなキーワード: hpcとは
NVIDIAと、インテル・IBMはどうして差がついたのか、疑問に思う。
AIはニューラルネットワークを模倣していると言われ、ニューロモーフィックというチップを、IBMは作り、その後、メンバーが移籍してインテルも作った。
現在、ニューラルネットワークとは違うものになったが、勝っているのはNVIDIAになっている。
先日、1.58bitのBitNetが話題になったが、LLMではないが昔BinaryConnectで0.68bitまで下げる案を出したのもIBMのメンバーだ。
ハッカーニュースでBitNetについてIBMだった人がコメントしている。IBMはそれなりに早かったはずだ。
https://news.ycombinator.com/item?id=39544500
普通のGPUの会社だと、ゲーム用のGPUボードだけを作っていたと思うが、NVIDIAは色々と手を出している。
データ プロセシング ユニット (DPU)、InfiniBand、NVIDIA MetroXなど、
HPC向けで、インテルやAMD、IBMの方が得意だろうという分野まで手を出した。
RTX 4090はゲームするにはバカ高いがAI向けには性能不足で、単価が高いAI向けボードを売るという差別化も出来ている。
ファブレス企業だから、というだけでは説明不足で、TSMCにNVIDIA向けのカスタムプロセスを作らせることが出来ている点が差別化要因の1つだろう。
TSMCから出てくるデザインルールの通りにしか作らないと、どこの会社も似たりよったり性能になってしまう。
物理限界を他社(TSMC)に投げてしまうというのも、経営としては効いているのだろう。
そして物理限界のチップサイズを攻める。電力も物理限界を攻める。
日本の会社だと、電力のバカ食いで怒られるが、そこも攻めている。
インテルはGPUカードに参入したが、AI向けだけに限定した方が良かったのではないだろうか。
中国GPUメーカーがコケているのに対して、動いているだけでも流石インテルなのだが、競争力のあるGPUとは言えず、参入した意味とは?になってしまっている。
量産ではない先端プロセスは持っているし、特殊なチップも作れている。
CPUについてはPower関係の資産もあり、AI向けもユニークなのが作れているのに、ぱっとしなくなった。
RISC-Vが上手くいくのであれば、OpenPowerも上手くいくと思うのだが、そういう話も聞かない。
そもそも米中関係で、オープンソースのCPU/GPUが禁輸されそうな感じもしている。
結局、量子コンピュータについてもまだまだ先になりそうな雰囲気だ。
未だに「謎の半導体メーカー」程度の認識の方になぜNVIDIAが時価総額世界4位なのかをあれこれ説明する必要があるので短めにメモ。半導体業界のすみっこの人間なので機械学習まわりの説明は適当です
・~1993年 AI冬の時代。エージェントシステムがさほど成果を挙げられなかったり。まだ半導体やメモリの性能は現代とくらべてはるかに劣り、現代のような大規模データを用いた統計的処理など考えられなかった。2006年のディープラーニングの発明まで実質的な停滞は続く。
・1995年 NVIDIAが最初のグラフィックアクセラレータ製品NV1を発売。
・1999年 NVIDIAがGeForce 256発売。GPUという名が初めて使われる。以降、NVIDIAはGPU業界1位の座を守り続ける。
・2006年 GPGPU向け開発基盤CUDAを発表。以降、その並列計算に特化した性能を大規模コンピューティングに活用しようという動きが続く。
・2006年 ディープラーニングの発明。のちのビッグデータブームに乗り、これまでよりはるかに高性能なAIを模索する動きが始まる(第3次AIブームのおこり)
・2006年 CPU業界2位のAMDがGPU業界2位のATIを買収、チップセットにGPUを統合することで事実上自社製品をNVIDIAと切り離す戦略に出る。CPU業界1位のインテルも、同じく自社CPUに自社製GPUを統合する動きを強める。NVIDIAはこれまでの主力だったGPUチップセット製品の販売を終了し、データセンター向けGPGPUのTeslaシリーズ、ゲーム用外付けGPUのGeForceシリーズ、ARM系CPUと自社GPUを統合したTegraシリーズの3製品に整理する。このうちTeslaシリーズが性能向上やマイクロアーキテクチャ変更を経て現代のAIサーバ製品に直接つながる。GeForceシリーズはゲーマー向け需要や暗号通貨マイニング向け需要も取り込み成長。Tegraシリーズは後継品がNintendoSwitchに採用される。
・2012年 ディープラーニングが画像認識コンテストで圧倒的な成績を収め、実質的な第3次AIブームが始まる。
・2017年 Transformerモデル発表。これまでのNN・DLと異なり並列化で性能を上げるのが容易=デカい計算機を使えばAIの性能が上がる時代に突入。
・2018年 IBMがNVIDIAと開発した「Summit」がスパコン世界ランキング1位の座を5年ぶりに中国から奪還。全計算のうち96%がGPUによって処理され、HPC(ハイパフォーマンスコンピューティング)におけるGPUの地位は決定的になる。NVIDIAの開発したCPU-GPU間の高速リンク「NVLink」が大規模に活用される。「Summit」は2020年に「富岳」にトップを奪われるまで1位を維持。
・2018~2021年 BERTやXLNet、GPT2など大規模言語モデルの幕開け。まだ研究者が使うレベル。
・2019年 NVIDIA CEOジェスン・ファン(革ジャンおぢ)が「ムーアの法則は終わった」と見解を表明。半導体のシングルスレッド性能の向上は限界に達し、チップレットを始めとした並列化・集積化アーキテクチャ勝負の時代に入る。
・2022年 NVIDIAがH100発表。Transformerモデルの学習・推論機能を大幅に強化したサーバ向けGPUで、もはや単体でもスパコンと呼べる性能を発揮する。H100はコアチップGH100をTSMC N4プロセスで製造、SK Hynix製HBMとともにTSMC CoWoSパッケージング技術で集積したパッケージ。※N4プロセスは最新のiPhone向けSoCで採用されたN3プロセスの1つ前の世代だが、サーバ/デスクトップ製品向けプロセスとモバイル製品向けプロセスはクロックや電流量が異なり、HPC向けはN4が最新と言ってよい。
・2022年 画像生成AIブーム。DALL-E2、Midjourney、Stable Diffusionなどが相次いで発表。
・2022年 ChatGPT発表。アクティブユーザ1億人達成に2カ月は史上最速。
・2023年 ChatGPT有料版公開。Microsoft Copilot、Google Bard(Gemini)など商用化への動きが相次ぐ。各企業がNVIDIA H100の大量調達に動く。
・2024年 NVIDIAが時価総額世界4位に到達。半導体メーカー売上ランキング世界1位達成(予定)。
こうして見るとNVIDIAにとっての転換点は「ディープラーニングの発明」「GPGPU向けプログラミング環境CUDAの発表」「チップセットの販売からコンピューティングユニットの販売に転換」という3つが同時に起こった2006年であると言えそう。以降、NVIDIAはゲーマー向け製品やモバイル向け製品を販売する裏で、CUDAによってGPGPUの独占を続け、仮装通貨マイニングやスパコンでの活躍と言ったホップステップを経て今回の大きな飛躍を成し遂げた、と綺麗にまとめられるだろう。
2009年11月のいわいる事業仕分けから、もう13年も経った。「2位じゃダメなんですか?」の質問の発言で非常に曰く付きとなったアレだ。
ところが最近、13年も経ってまだなおナゼ「2位」という言葉が出てきたかが理解できてない人がかなりいる事を知った。それどころか、スーパーコンピュータの京は、事業仕分け時点で世界一になることが明白だったなどという認識まで飛び出す始末である。
ただ、資料もなしにどこが変だと言っても仕方あるまい。何がどうして「2位」なのか、少し語ろうじゃないか。
初期の次世代スーパーコンピュータ (この時点では名前が付いていなかったが、以下わかりやすく京と呼ぶ) 計画 は、補助金を投入してのHPC産業育成に目を向けられていた[1]。世界一の性能を出していた海洋研究開発機構の地球シミュレータが、NECのSXシリーズをベースにしたベクトル型であり、ベクトル型のスーパーコンピュータは日本のお家芸とみなされていた。これを育成することが一つの目標。そして、立ち遅れていた当時の世界のスーパーコンピュータの潮流、スカラ型の開発に追いつくこと。これがもう一つの目標となった。結果、世界でも類を見ないベクトル型とスカラ型のハイブリットなどという中途半端な方式になる。実に日本的な玉虫色の決定と言えるだろう。しかし、補助金の注ぎ込みが不足し、事業者持ち出しの負担が大きくなってしまった。結果、事業費負担が高額になることを嫌い、NECと日立の撤退する[2]。これにより、世界の潮流通りのスカラ型とならざるをえなくなった。
CPUはというと、世界のスーパーコンピュータの潮流では当時から既に汎用のx86アーキテクチャのCPUが既に多くなってきていた中、富士通はSPARC64VIIIfxを採用した。よく国産CPUと表現されているが、SPARCの名で分かる通り、当然命令セットは米国Sun Microsystems (現 Oracle) のセカンドソースであり、端から端まで国産というわけではない。更に、業務用UNIXをささえるマシンとして一世を風靡したSPARCではあるが、当時ですらもう下火となっていた。京の事業費の約半分、実に600億円が、この専用CPUに注ぎ込まれることになった。なぜその選択をしたのか。富士通のサイトには省電力と安定性が理由として書かれている[3]。しかし、その省電力という目標も、後述するように微妙な結果となってしまった。また、ソフトウェアの使いまわしも微妙となった。
計画は2005年に始まる。世界でも類を見ないベクトル型とスカラ型のハイブリットという構成もあり、概念設計にはしっかり時間を費やした。2007年9月には性能目標は10P FLOPSと示した[4]。稼働開始は2010年、2012年に完成という工程も同時に示されている。直前の2007年6月のTOP500を見ると[5]、1位のIBM BlueGene/Lが370TFLOPS。5年後に30倍という性能を目指したことになる。当時の発表としては、世界一が取れるような計画だったが、しかし日進月歩の分野で5年は結果的に長かった。
さて、前述のように、ベクトル陣営は2009年5月に撤退を決めた。10P FLOPSの性能と決定した時には、ベクトル側も居たのに、そこがぽっかり空いた状態。10P FLOPSのあてはいつついたのだろうか? 2009年7月の報告書[6]では、スカラ単体で10P FLOPSを達成できること、ベクトル部は存在していても接続まわりの性能が不足していて問題があったことが表明されている。結果的に、なくなってよかったというトホホな内容だ。さて、同報告書では、稼働開始前の2011年6月に、ベンチマークだけでも10P FLOPSを達成してTOP500の1位を目指すと書いてある。どうしてこうなったのだろうか。
遡ること半年の2009年2月3日、米国国家核安全保障局(NNSA)はIBMと新しいスーパーコンピュータ Sequoiaを展開すると発表した[7]。性能は20P FLOPS、京の予定性能の実に2倍を達成するという発表だ。しかも、提供開始は2011年~2012年。京の1年も前になる可能性があるという。
そう、双方が計画通りなら、京は2012年、提供を開始する時には既に2位になっているという話題が出ていたのだ。なるほど、それはあせって2011年にベンチマークだけでも「トップを取った」という実績を残したいわけである。
さて、その後のSequoiaはというと? ある意味計画通りだろう、2012年に提供が開始され、2012年6月のTOP500[8]では予定通り20P FLOPSを叩き出し、1位になる。しかし、2012年11月のTOP500[9]では、Crayとオークリッジ国立研究所が作ったTitanが叩き出した27P FLOPSという数字ににあっさりと抜き去られ、2位になる。まるで幽遊白書のラストのような展開だ。しかも、SequoiaはIBMのPower系アーキテクチャで構築されたA2プロセッサだったのに対して、TitanはAMD OpteronとNVIDIA K20Xの組み合わせ。汎用性でも差を開けられている。これはお手上げというものだろう。
さて、話は京に戻す。京が有名になったのは2009年11月13日の行政刷新会議、いわいる事業仕分けである(ここは参考文献は要るまい)。このときまで、そんな計画があることを知らなかった人の方が多かったのではないだろうか。どういうニュアンスで言ったかわからない、まるで日本を貶めているかのように聞こえる「2位じゃダメなんですか?」という言葉が非常にインパクトを与えたことだろう。
さて、じゃぁ何が2位なのか。だ。前述の通り、この時点ではIBMのSequoiaに追い抜かされることが見えていた。TitanはGPUの調達など細かい話が決まってきたのは2010年なので、この時点ではほとんど影がなかったはず。ということで、3位じゃなくて2位としたのは、Sequoiaを意識してのことだろう。つまり、「2位じゃダメなんですか?」というのは、1位を諦めて2位の性能で我慢するべきということではなく、客観的に見れば「2位になるのが見えているのだけど、何で1位と言ってるの?」という話になってくるのが見て取れる。蓮舫氏がそこを意識してたか知らんけど。
共同事業者が撤退し、一応強気に「大丈夫」と言ってはいるが、本当に達成できるかは周りからは疑問符が付くグダグダなプロジェクト状況、ほぼ専用設計で量産時にどういう問題が出るかわからないCPU、ソフトウェアも新規制作。税金の投入は中途半端で、産業を育成したいのか企業負担を増やしたいのかよくわからない(だから撤退する事業者が出る)。そもそもここで出来たスーパーコンピュータ、CPU抜きにしても売れるのか分からない。そりゃ、金田康正教授でなくても、京にはため息が出るというものだ。
さて、京は何を達成したのだろうか? 京は完成前ではあるもののベンチマークを実施し、見事11P FLOPSを叩き出し、2011年6月[10]と2011年11月[11]のTOP500でトップに躍り出る。この分野に日本ありと示した…かどうかはわからないが、一つの実績として言えるのは間違いない。いや、経緯のグダグダ感からして、見事なプロジェクト進行だったと称賛できる。しかし、前述の通り共用を開始した2012年9月[12]にはTOP500ではSequoiaに追い越されており、直後のTOP500ではTitanにも追い越されて3位となっていた。1位は、ベンチマークだけの存在だったと言える。
では目標の産業育成としてはどうだっただろうか。京をベースにしたスーパーコンピュータ PRIMEHPC FX10[13]やFX100は、東大[14]、名大[15]、キヤノン[16]、九大[17]、信大[18]、JAXA[19]、核融合科学研究所[20]、気象庁気象研究所と、調べるだけでも国内実績は多くある。国外実績は、台湾中央気象局[21]、シンガポールナショナルスパコンセンター、豪州 NCI、英国 HPC Walesと、それなりにある。ただどうだろう。産業としてうまくいったのだろうか。有価証券報告書を見ても、その他のセグメントに入ってしまっているため状況がつかめない[22]。謎ではある。とはいえもし、産業としてそれなりに育ったのならば、有価証券報告書で報告する事業セグメントとして独立したものを与えられてしかるべきだったのではなかろうか。少なくとも1000億も出したのだ。そのくらいではあってほしかった。更に言うなれば、特に競争の激しい国外市場をうまく取り込めたかというと、産業育成という視点では頑張ったとは思うものの心もとない結果だったように、少なくとも私には見える。
消費電力の面はどうだろうか。上述の通り、SPARCを使う理由には省電力が上げられていた。これをライバルのSequoia、Titanと比較してみよう。2012年11月のTOP500[9]で見ると、京は12.6MW消費するとある。Sequoiaは7.8MW、Titanは8.2MWだ。実はこの時の報告のあるスーパーコンピュータの中で、最大の電力消費量を誇っている。高いほうがいいのではなく、消費電力は低いほうがいいので、これはかなり問題がある。
費用面はどうだろうか。これもライバルと比較してみよう。京は日本円にして1120億円かかっている。対してSequoiaは2億5000万ドル[23]、Titanは9700万米ドル[24]だ。2012年11月で見るとドル円相場は82円なので、Sequoiaは約205億円、Titanは80億円となるだろうか。京のプロセッサ開発費を除いたとしても、数字が違いすぎるのだ。
纏めてみよう。京は、一時期でベンチマーク上だとしても、TOP500で1位を取った。これは「夢を与え」(平尾公彦氏)た結果だったろう。しかし、それは砂上の楼閣でもあった。しかしそれを実現するための費用は米国の5~10倍で、性能は実は半分、消費電力は1.5倍という結果になり、産業育成も盛り上がったかどうかは判然としない。こんなところだろうか。
近年のスーパーコンピュータを含めたHPC分野はどうなっているだろうか。近年のクラウドコンピューティングの流れを当然HPC分野も受けており、主要プレイヤーとしてAWSの名前が挙がっている[25]。またレポートでは挙がっていないものの、Google Cloudも猛追しており、円周率の計算では1位を叩き出している[26]。必要な時に、必要な規模で構築できるクラウドコンピューティングの波は、さてHPC分野でどこまで浸透していくのだろうか。産業育成の方向が、2009年時点では確かにハードウェア開発だったろう。しかし、事業仕分けへの反発により、日本は方向性を間違ってしまったのではないか。私は、そんな気がしてならない。
[1] ttps://www8.cao.go.jp/cstp/tyousakai/hyouka/kentou/super/haihu01/siryo2-3.pdf
[2] ttp://www.nec.co.jp/press/ja/0905/1402.html
[3] ttps://www.fujitsu.com/jp/about/businesspolicy/tech/k/whatis/processor/
[4] ttp://web.archive.org/web/20130207162431/https://www.riken.jp/r-world/info/release/press/2007/070914/index.html
[5] ttps://www.top500.org/lists/top500/2007/06/
[6] ttp://www.jaist.ac.jp/cmsf/meeting/14-3.pdf
[7] ttps://www.llnl.gov/news/nnsa-awards-ibm-contract-build-next-generation-supercomputer
[8] ttps://www.top500.org/lists/top500/2012/06/
[9] ttps://www.top500.org/lists/top500/2012/11/
[10] ttps://www.top500.org/lists/top500/2011/06/
[11] ttps://www.top500.org/lists/top500/2011/11/
[12] ttps://www.riken.jp/pr/news/2012/20120927/
[13] ttps://jp.reuters.com/article/idJPJAPAN-24020620111107
[14] ttps://pr.fujitsu.com/jp/news/2011/11/14.html
[15] ttps://pr.fujitsu.com/jp/news/2013/05/15.html
[16] ttps://pr.fujitsu.com/jp/news/2013/08/6.html
[17] ttps://pr.fujitsu.com/jp/news/2013/08/22.html
[18] ttps://pr.fujitsu.com/jp/news/2014/02/13.html
[19] ttps://pr.fujitsu.com/jp/news/2014/04/7.html
[20] ttps://nsrp.nifs.ac.jp/news/PS-next.html
[21] ttps://pr.fujitsu.com/jp/news/2012/06/25.html
[22] ttps://pr.fujitsu.com/jp/ir/secreports/2015/pdf/03.pdf
[23] ttps://arstechnica.com/information-technology/2012/06/with-16-petaflops-and-1-6m-cores-doe-supercomputer-is-worlds-fastest/
[24] ttps://web.archive.org/web/20120727053123/http://www.hpcwire.com/hpcwire/2011-10-11/gpus_will_morph_ornl_s_jaguar_into_20-petaflop_titan.html
[25] ttps://www.sdki.jp/reports/high-performance-computing-market/109365
[26] ttps://cloud.google.com/blog/ja/products/compute/calculating-100-trillion-digits-of-pi-on-google-cloud
https://anond.hatelabo.jp/20221016140905
2040 年前後、高度成長が一段落して成熟化した経済と喧伝される時節であっても
「バイデン老師は中国に於ける半導体産業興隆の父である」と大陸の業界関係者に
所謂、産業政策の観点からは 4 nm 以降の製造プロセス、製造や検査等の装置、
シリコンを代替可能な新素材の基礎研究に至るまで、純国産化を躊躇する理由が
arm や RISC-V の後継規格による SoC が HPC 、データセンタ、消費者向け端末等を
某社が PS3 Cell ブロードバンドエンジンで実現しようとしたことを具現化されますなぁ。
産業界と政治、官僚機構の回転ドア故の属人的な要素が悪い方向へ働き
ネガティブフィードバックを止められないといったところが、内実なのかもしれませんが
根拠のない皮算用 w で単年度 ¥ 8,000 億、20 年、短期的な成果を訴求せずに
It is really a bad sign when someone starts claiming HPC leadership with benchmarks that are skewed to certain classes of apps. That’s marketing and not proper engineering.
And if you cannot show any reason which can be widely accepted in the society, using the word "radioactive" here can be seen as just a racism. If you use the word "radioactive" for daily joke, please stop it.
半導体の設計に必要なものとしては、人によって分け方に意見があるだろうが、ここでは下のように分ける。
1チップ作るのにソフトライセンス料金で数億かかる時代になっており、それだけ売上が見込める市場がないといけない。
またEDAソフトの使い方はGoogleで検索すれば出てくるものではないため、人材育成に時間がかかる。
先端ロジックを使うゲート規模になると最新のインテルサーバーを買ってきても時間がかかる。
クラウドもEDAベンダー的には今では対応しているが、クラウド代金も馬鹿にならない金額になる。
ただEDAソフトを使いこなせば性能が良いチップが出来るかとそういうわけではなく、製造してどこまでだったら動くのかギリギリを攻めないと競争に勝てず、
プロセス知識が必要になる。ファブレス企業を立ち上げただけで勝てないのは、そのあたりにあろう。
(米国のファブレスは人材の流動性やら、お金と規約で殴っているので解決できているはず)
差別化の為の設計をしようとするとツールが対応してないと出来ない。
国内で設計ソフトを持てなかった時点で駄目だったのかもしれない。
工場と装置を持ったとしても、そこで製造するチップがなければ意味がない。
かつ工場に継続的に投資をし先端を維持するには、製造するチップが扱う分野が成長市場でなければならない。
Googleはサーバー分野だと、速ければ速いほどよく大量に持てばよく、自社で使えない分は社外に開放して稼げるので、
車はあるが、要求スペックが高いわりに数が売れなかったり、単価交渉で車メーカーに負けていたりと、ババを引きたい企業しかやりたくない。
兎にも角にも、わざわざ半導体を作る必要があって、かつ数年で次世代半導体が必要になるような、
そんな針の穴を通すような成長分野を見つけないことには、日本の半導体復活は起こらない。
CPUやGPUやAI向けのような汎用計算用に乗り出すのが手っ取り早いのだが、
CPUやGPUの種類以上に日本で作っていた半導体は種類が多い。
日経などで少量多品種絶賛されていて、客の要望に合わせて機能を組み合わせた物を作った。
ある一部の顧客しか使わないような種類のチップをわざわざ切り替えるほど工場に余裕がない。
そしてそういう顧客が高い価格で買ってくれるかというとそうではない。
機能が多すぎるので、ウチの製品にしか使わない機能だけのチップにして安くしろ、という要望に答えたものだからだ。
Appleですら先端ロジックを使うとなると、M1を複数カテゴリーに投入といったように、
設計に金がかかりすぎて出来ない。
グローバルで馬鹿みたいに個数が売れるApple製品ですら、そんな状況だ。
半導体業界は実務で何をしているのかわからない、というのが殆どではないだろうか。
人手が必要だが、教育するための教科書も、これを読んでおけばひとまず業務が回せるようになるといったネットの記事もない。
このあたりの整備も必要ではないだろうか。
TSMCで半導体を製造しようとすると、米国産設計ソフトを使用する必要があり、
米国技術を使っている以上、海外に輸出するには米国法が適用され、好き勝手に輸出出来ない。
(もっともオープンソースだと機能が足りておらず先端ロジックは設計出来ない)
中国はCPUは以前から自前で設計出来ていたが、GPUも設計できるようになった。
ゲーム市場に規制が入る中国だと、ゲーム向けに性能を特化していくのはリスクがあるはずで、
CAEやらのシミュレーションソフト関係、HPCの関係でどこまでいけるか、というのが重要だろう。
製造業全般、もうどれだけ高度なシミュレーションを行って設計できるかが重要になってくる。
当然、軍事への展開もある。
ハードだけでなく、システムも巨大になっているので膨大な計算資源を持っている方が勝つ。
日本の製造業も計算機とその上で動くCAEを諦めるべきじゃなかったのではないか。
市場に出したら解析されるのが当り前の時代、クラウド側で隠蔽するのが普通になったし、
重要なハードは国内に置いておいてネットワーク越しで海外から使ってもらうのは普通になった。
iFixitのような解析会社のデータがオープンになっているのも、米国以外に下手に解析技術つけられても困るって側面もあるはずだ。
インテルやAMDはサーバー用CPUをスパコンに使ってもらえる。ノウハウも残る。
NVIDIAも同様。汎用機からのスケールアップなので、研究室にあるパソコンで環境を整えやすい。
|因みに富嶽(富岳?)のCPUは命令デコーダをarm化したSparc64です。
|https://monoist.atmarkit.co.jp/mn/spv/1905/07/news013.html
フリーライターの立場でこんな学術的な記事書けるのすごいと思うけど
”CPUは命令デコーダをarm化したSparc64です。”とかフリーライターの書いた記事を参考にしゃちゃダメでしょ・・・・
スパコン京の時に聞いた話だけど、HPC用のプロセッサは特注品でSI用に作ってるやつとは
わかりやすいとこだと、HPC用はL3キャッシュが無くてSI用はL3まである。
HPC用がL2までしかない理由は、これまたHPC用特別カスタムのLinuxカーネルに合わせるため。
LinuxカーネルがHPC用特別カスタムなのはそうしないと勝てないかららしい(OSノイズ)。
だから全部作り直しだと思うよ
HPCの富岳のやつ
https://github.com/fujitsu/A64FX/blob/master/doc/A64FX_Microarchitecture_Manual_jp_1.1.pdf
勝手にジョークぶちあげて揚げ足取られたら話の筋道をそらすのは如何な論法かと思うけどね、ジョークならジョークで完結させろよと言いたいが、「それはジョークだじゃあ話を元に戻そう」、これでいいのでは?それとも子供に対してCPUのことを計算してくれる装置ですよと語りかけるが如く丁寧懇切に連立方程式の解き方からBLASの存在まで説明しろとおっしゃるのかな?
それは筋が通らない話だと思うし議論する気があるなら最低限・・そうだな大学がならう数値計算とか並列計算機の授業のレジュメをさらっと目を通すぐらいはしたらどうでしょうか?
https://www.cspp.cc.u-tokyo.ac.jp/hanawa/class/sp20180925.pdf
うーむHPCに対するアプローチは二通りあって情報工学的に計算機科学の一環(つまりスパコンを作る側)として見るか、1科学者としてのシミュレーションを行う場、仮想実験場(スパコンを使う側)としてる見る場合の2つのアプローチがあると思うのだけど・・・PEZY-SCを搭載したシステムに関しては前者、計算機科学の成果としてみるべきシステムだと思うのよ、これの成果としては「非GPUで超メニーコアシステムを実現すると共に高効率なシステムを構築することに成功した」って言う一つの事実に集約されると思う。
でここで高効率なシステムの基準はなんなのかとというと「HPL」と言うベンチマークですわな、HPL=LINPACKと言う認識で話を進行させるけど、HPLは本来連立方程式の求解を行う速度を競うベンチマークであって、これを皆が手放しで賞賛してるのはおかしいと言う批判が存在する。
これは一理あってすべての科学技術計算の性能向上に寄与する指標とは言いがたいからだ。
じゃあなんでこれが推されている居るかというと理由は何個かあるけど連立方程式の解を求める必要のある技術計算はとても多いから、昔からやっててデーターが揃ってるから
ここまででHPLが重要視されている理由がご理解いただけると幸いなんだけど・・じゃあ具体的に連立方程式を使用する場面を示せよと言われると腐るほどあってどれを示せばいいのかわあらんのですが・・
http://www.cs.kyoto-u.ac.jp/wp-content/uploads/2012/07/05hori.pdf
まああんまり人様の研究をあれこれ紹介して間違った説明しても申し訳ないので中身には触れないでおくけど実際に連立方程式は最もシェア率が高い問題であると言う認識は持ってくれると
話が早い
まあさっきのXeonでいいじゃんって話も一理あって性能が低くてもx86_64時代のコードそのまま使いまわせるし、さっきあげたユーザー側から見た時楽ちんであるのは事実だ。
なによりintel C++/Fortranコンパイラと言うクソ便利なものがあってライセンス料払うとある程度勝手に高速化してくれたりするし使いまわせるコードも多い
まあPEZY-SCよりXeonのほうが計算機を研究してるわけじゃない物理学者とかの各種研究者エンジニアからすれば魅力的な点が多いのは事実だと思う
だからと言って計算機科学としての計算機の純粋な性能向上を主とする研究・開発成果を邪険にしていいわけないしまた別の問題、確かに商業ベースで考えたとき
これらの問題をどうにかしないといけないのは事実だし改善して行かねばならないのはPEZYやエクサスケーラーの各位に残された課題であるのは間違いない。
だが少なくともまだこの世に銀の弾丸となりうる万能システムは存在しない。
もしあるなら俺にくれ あといい加減なこと言ってたらゴメン、強いひとに殴ってもらうと筋トレになる
時間 | 記事数 | 文字数 | 文字数平均 | 文字数中央値 |
---|---|---|---|---|
00 | 115 | 18697 | 162.6 | 52 |
01 | 116 | 13602 | 117.3 | 65.5 |
02 | 35 | 5976 | 170.7 | 108 |
03 | 40 | 8965 | 224.1 | 69 |
04 | 24 | 6838 | 284.9 | 50.5 |
05 | 26 | 1487 | 57.2 | 30.5 |
06 | 32 | 2535 | 79.2 | 43.5 |
07 | 42 | 4325 | 103.0 | 40.5 |
08 | 63 | 5337 | 84.7 | 36 |
09 | 96 | 7935 | 82.7 | 43 |
10 | 184 | 13091 | 71.1 | 39.5 |
11 | 264 | 17253 | 65.4 | 36 |
12 | 249 | 22234 | 89.3 | 39 |
13 | 254 | 18766 | 73.9 | 39 |
14 | 170 | 12210 | 71.8 | 34.5 |
15 | 127 | 10992 | 86.6 | 42 |
16 | 139 | 9182 | 66.1 | 36 |
17 | 254 | 13125 | 51.7 | 28 |
18 | 247 | 18928 | 76.6 | 38 |
19 | 156 | 10534 | 67.5 | 27.5 |
20 | 127 | 9410 | 74.1 | 33 |
21 | 147 | 10907 | 74.2 | 30 |
22 | 147 | 12587 | 85.6 | 41 |
23 | 189 | 14122 | 74.7 | 35 |
1日 | 3243 | 269038 | 83.0 | 38 |
人(273), 増田(179), 自分(178), 女(143), 男(140), 話(130), 仕事(114), 今(101), 日本(87), 問題(86), ー(84), 前(73), 子供(73), クロちゃん(71), 人間(67), テレビ(63), 女性(58), 普通(56), 時間(55), 関係(53), あと(53), 好き(53), 世界(52), 意味(52), 他(52), 気持ち(51), 結婚(51), 必要(51), 最近(50), しない(49), 相手(47), バカ(46), 気(46), 今日(44), 結果(44), オタク(44), 感じ(43), アニメ(42), 馬鹿(41), ゴミ(40), 別(39), ゲーム(39), 一人(39), 場合(38), ネット(38), 親(38), 人生(38), 手(38), 全部(37), 最初(37), 嫌(37), 社会(37), 理由(36), ワイ(36), 横(35), 理解(35), 昔(34), KKO(34), 頭(34), 扱い(34), 目(33), いや(33), 逆(32), 存在(31), 自体(31), 一番(31), 番組(31), 金(31), 差別(30), 男性(30), 事実(29), 批判(29), 猫(29), フェミ(29), 絶対(29), レベル(28), 話題(28), 情報(28), 無理(28), 結局(27), 顔(27), 子(27), 計算(27), ただ(27), 状態(26), 会社(26), スパコン(26), コンビニ(26), じゃなくて(26), 興味(26), 説明(25), 時点(25), 言葉(25), 周り(25), 一つ(25), 全て(24), 迷惑(24), 時代(24), 認識(24), 現実(24), 元増田(24)
増田(179), 日本(87), クロちゃん(71), ワイ(36), KKO(34), フェミ(29), じゃなくて(26), 元増田(24), ラズパイ(20), 可能性(20), イケメン(19), w(18), なんだろう(17), ブコメ(16), ツイッター(16), 下方婚(16), 中国(16), ネトウヨ(16), なのか(15), マジで(15), わからん(15), としまえん(15), はてブ(14), モンスターハウス(14), いない(14), キモ(13), 水曜日のダウンタウン(13), 東京(13), twitter(12), 視聴者(12), …。(12), 普通に(12), 韓国(12), ぶっちゃけ(12), ブクマ(11), 分からん(11), まとめサイト(11), hatena(11), アレ(11), スマホ(11), Twitter(11), ダウンタウン(11), E(10), 具体的(10), HPC(10), ニート(10), ja(10), 女に(10), SNS(10), 5ch(10), 娘(10), 非正規(10), やらおん(9), 10年(9), ババア(9), いいんじゃない(9), キモい(9), 仕事納め(9), いいね(9), HPL(9), トラバ(9), キツ(9), 悪いこと(9), 7%(8), 人狼(8), NHK(8), はてなー(8), 孤独死(8), 5%(8), CPU(8), 2018年(8), wikipedia(8), 関西弁(8), wiki(8), 笑(7), ガチ(7), FFT(7), ブログ(7), 中国共産党(7), アプリ(7), ホッテントリ(7), 2回(7), 6%(7), 藁人形(7), 基本的(7), ネット上(7), 社会人(7), テラハ(7), E3(7), 8%(7), ???(7), 艦これ(7), 大阪(7), 個人的(7), 何度(7), 3人(7), どんだけ(7), 24時間(7), 夫婦(7), 81%(7), 自分たち(7), 4%(7)
HPL(9), テラハ(7), HPC(10), スーパーコンピュータ(6), ノード(17), 仕事納め(9), クロちゃん(71), としまえん(15), モンスターハウス(14), 帯域(13), 水曜日のダウンタウン(13), 指標(11), 関西弁(8), 綺麗事(9), メモリ(14), スコア(8), おば(19), CPU(8), 自演(16), アルゴリズム(7), 年末(12), 非正規(10), まとめサイト(11), 妊婦(8), 無限(16), 将棋(10), 視聴者(12), 企画(17), 番組(31), 計算(27), テレビ(63), 体力(20), ワイ(36), ランキング(14), おばさん(20), KKO(34), 妊娠(19)
■クロちゃん監禁投票に思うこと /20181227015207(22), ■水曜日のダウンタウン・モンスターハウスについて /20181227044913(15), ■何度も観た映画のシーンを繰り返し観てる /20181226221214(13), ■だいたい三社くらいに寡占された業界 /20181224023255(13), ■キモくて金のないおじさん ↗↗↗ 小奇麗な金のないおじさん にワンアップした。 /20181227171051(11), ■妹ほしい /20181227132556(11), ■孤独死の何が悪いのおじさんが大量に沸いてるけど /20181226164417(10), ■はてブさぁ、「Vtuber」って「アニメとゲーム」か? /20181225161346(10), ■都会でぶつかるのは仕方ないだろ /20180527151441(8), ■この件全く知らなかったとかいうやつ /20181227135735(8), ■ /20181227143926(7), ■娘が生理になった※追記 /20181227135838(7), ■発達ガイジだが /20181227090144(7), ■流石に水曜日のダウンタウンはやりすぎ /20181227010023(6), ■ステーキ以外にいきなり出てきてほしい奴 /20181227141135(6), ■男女の友情は成立しないという話 /20181226204847(6), ■女性差別の始まり /20181227223028(6), ■「彼女がたばこ吸ってるかもしれない」のその後 /20181227104610(6), ■としまえんクロちゃん大騒動まとめ /20181227141107(6), ■なんで男って段取り悪いの? /20181227173643(6)
5908505(3192)
Green500がその辺のソフトウェアポータビリティだったりを勘案したランキング「ではない」ってことは一応理解はするからそれはそれで認めるよ。
だが、HPCの経済性を評価する際はその辺容赦なく評価されね? ってのは当然受け入れるべきなのでは。「消費電力あたりの処理能力が高い」だけではエコではないのでは? っていうのは真じゃろ。
そもそもパソコンの世界がx86による統一が図られたあとだから、ほぼすべての端末で艦これが動くのであって、HPCの世界にあっては、なにかを動かすためにはアーキテクチャごとに書き換える必要があるというのは、少し考えれば分かることだろうに…
おっと、いちいち書き換えるなんてコストが高すぎるとかその手の批判は過去数十年繰り返されてきたし、今更そんなものに答えたくないからやめてくれ。
ありがとう。LINPACKというものが何者なのかはこれから調べることではあるが、おそらくのところHPLが動作するマシンであればLINPACKも動くはずなので結果ある程度のソフトウェアも動くという証査にはなるってことね。
しかし、やはりソフトウェア的に汎用性があるわけではなくソースがあれば良いというものでも無いのでHPLのスコアイコール動かしたいソフトウェアの性能にはなかなかならない、ってのは理解した。
ま、そっから先はソフトウェア最適化なりにどれだけお金をかけるかってレイヤーになるって話だからHPC単体の性能とは別だよね? ってイメージなんだろうな。
ジョークの部分を掬い上げるならちゃんと掬って話を一歩進めようぜ。
HPCっていう世界においてのみんながよく使うソフトウェアって例えばどういうものがあって、それはこのGreen500でランク入りしたぱそこんで動かしたりすることはできるのか? ってところは「何も知らない子供に説明するつもりで」書いてみて。
結構よくまとまっているとは思うんですけど、博士学生だからか少し偏りがあるので、もし参考にする学生が居たときのために、少し補足させてください(ちなみに私は本職です)。
挙げられている分野は、いわゆる古典的なCGの分野の一部で、そこに当てはまらないものも沢山あります。例えば、3Dプリンタに関する技術とか(fabrication)、建築関係、VR/AR、HCI、HPC/ハードウェア、computational photography、アート、数値計算、言語処理(CUDAの元はSIGGRAPHの論文ですよ)などです。実際のところ、かなり色々なトピックがあり、この分野の研究者でも全てを挙げられる人は居ないと思います。トピックが違うと同じCGの研究者でも話が通じない事もあります。他分野の専門家と組んで研究している人も多いので、かなり懐が広い分野だと思います。自分の興味のあるもの+CG、という研究をしている人が多数居ます。
なお、西田先生は日本では有名なのかもしれませんが、国際的に著名な研究者は各分野で違います。SIGGRAPH/SIGGRAPH AsiaなどのTechnical Paper Committteeの名前をチェックすれば、最近勢いがある若手や著名な人がだいたい分かると思います。自分の興味のある分野の研究者が海外に居れば、留学しましょう。
これは訂正された点を含めると、だいたい合ってます。訂正にあるように、基本的には、大きな学会のProceedingの論文 = ジャーナル論文なので、その場合ジャーナル論文としてカウントする人が多いです。ジャンル別の会議に理論的な研究が発表されるかどうかというと、そうでもないでしょう。どちらかといえば、研究としてのインパクトが小さいが発表したいとか、SIGGRAPH/SIGGRAPH Asiaに落ちたので、再投稿というケースが多いです。国内の学会・雑誌はアレなので、英語で文章が書けないと死にます。
CGではIFを気にする人はあまり居ません。研究者としてのアウトプットは、国際的にはSIGGRAPH/SIGGRAPH Asia/TOGを含めた、主要な学会での論文の本数が重要です。Pacific GraphicsおよびEurographicsは、それぞれの地域ではそれなりに評価されますが、国際的には評価されない場合があります。あと、勘違いされているケースが多いので強調しますが、SIGGRAPH/SIGGRAPH AsiaでカウントされるのはTechnical Papersだけです。その他のプログラムは、参加したいなら出してもいいけど、研究業績にはカウントされません。その他のプログラムばかりで発表していて、Technical Papersで論文が出て無いのに、SIGGRAPHで活躍していると強調している研究室(国内外にあります)は注意しましょう。分野全体の業績評価の実態と違います。
学位取得難易度は、研究室および大学によって大きく違います。上記の著名な国際会議に通すことを期待している研究室だと、アイデアが重要な分(データやモデルを少し変えて、少し性能が良くなったぐらいでは論文は通りません)、他の分野より要求される能力は高めです。ただ、懐が広い分野なので、自分の得意なことを生かして研究ができれば、研究に没頭できて楽しく過ごせると思います。実際、活躍している人はそういう人です。標準的なアウトプットとしては、1年あたり、ジャーナルになる学会に1本ぐらいでしょう。博士課程が3年なら3本ですね。リジェクトされるので、その倍ぐらいはプロジェクトをこなす必要があります。
実装力は超重要です。アイデアを形にして実験出来ない人は苦労します。言及元に書いてあるものの3倍は実装します。
研究の歴史が長いトピックは既存の研究に対して新規性を出すのが難しいので、その分論文を書くのは難しいという、ごく当たり前な状況です。書かれているように、レンダリングや流体は難しいと認識はされていますが、それは歴史が比較的長く、劇的な性能向上が難しいからです。逆に最近出てきたトピックの中だと、新しい応用を見つけてそれを古典的な方法で解く感じの研究が多いです(3Dプリンタ向けのデザインの最適化など)。そのようなトピックであれば、面白い応用さえ思いつけば、既存研究との比較をあまりしなくても通る論文が書けるでしょう。いずれにしても、如何にして新しいアイデア(新しい理論・手法であったり、新しい応用であったり)を思いつくかが重要です。
各分野の所感については、言及元は一学生の感想で、それが分野全体としての共通認識かというと、そうではないように思います。一口にCGと言っても研究分野が多岐にわたるので、それぞれの分野の専門家に話を聞くのがベストです。
研究室で育ててきたエンジンがあるかどうかは(そしてそれを弟子に使わせるかどうかは)研究者によります。進学する際には、その辺をチェックしましょう。ただ、現在活躍している人には、自分で書きたがる人が多いです。「レンダリスト」という言葉は聞いたことがありません。
だいたい正しいと思います。応用的な研究と言うと、表面的な印象を受ける人がいるかもしれませんが、ただ何かを達成すればいいというよりは、実際の問題を解けて理論的にも面白いという研究を目指す人が多い分野です。査読ではその両面が評価されるので、査読者によってどちらに重きを置くかも違い、皆を納得させる成果を出すのはなかなか大変です。
CGは、研究を頑張って学会等に論文を沢山出せれば就職先も引く手あまただし、研究成果は専門外の人(例えば家族とか)にも分かりやすいし、自分の興味のある事をコアにして研究できる懐の広さがあり、とても楽しい研究分野です。どの分野で研究しようか迷っている人はぜひ!