これらの軸に沿って、改善の「OOMを数える」ことができる。つまり、有効計算量の単位でそれぞれのスケールアップをトレースするのだ。3倍は0.5OOM、10倍は1OOM、30倍は1.5OOM、100倍は2OOMといった具合だ。2023年から 2027年まで、GPT-4の上に何を期待すべきかを見ることもできる。

ひとつひとつ見ていくが、OOMの数を急速に増やしていることは明らかだ。データの壁には逆風が吹いている可能性があり、それについては後述するが、全体的には、2027年までにGPT-4の上に、GPT-2から GPT-4規模のジャンプがもう1回起こると予想される。

コンピュート

まず、最近の進歩の原動力として最もよく議論されている、モデルへの（大量の）コンピュート投入について説明します。

多くの人は、これは単にムーアの法則によるものだと考えている。しかし、ムーアの法則が全盛期を迎えていた昔でさえ、その進歩は比較的緩やかなものでした。しかし、ムーアの法則が全盛期だった昔でさえ、10年で1～1.5OOMと、比較的ゆっくりとしたスピードだった。(かつては1つのモデルに100万ドルを費やすことさえ、誰も考えもしないことだった。）

モデル	推定コンピュート	成長率
GPT-2 (2019)	~4e21 FLOP
GPT-3 (2020)	~3e23 FLOP +	~2 OOMs
GPT-4 (2023)	8e24～4e25 FLOP +	~1.5～2 OOMs

エポック AIによるGPT-2から GPT-4までの計算量の推定値

エポック AI（AI トレンドの優れた分析で広く尊敬されている情報源）の公開推定値を使用して、2019年から 2023年までのコンピュートスケールアップを追跡することができます。GPT-2から GPT-3へのスケールアップは迅速で、小規模な実験から大規模な言語モデルを訓練するためにデータセンター全体を使用するまでにスケールアップし、コンピュートのオーバーハングが大きくなりました。GPT-3から GPT-4へのスケールアップでは、次のモデルのためにまったく新しい（はるかに大きな）クラスタを構築しなければならないという、最新の体制に移行しました。それでも劇的な成長は続いています。エポック AIの試算によると、GPT-4のトレーニングでは、GPT-2の3,000倍から 10,000倍の計算量を使用しています。

大雑把に言えば、これは長期的なトレンドの継続に過ぎない。過去 10年半の間、主に投資（およびGPUやTPUの形でAIワークロードに特化したチップ）の幅広いスケールアップのため、フロンティア AI システムに使用されるトレーニング計算量は、およそ〜0.5OOM/年で成長してきた。

https://situational-awareness.ai/wp-content/uploads/2024/06/compute_long_run_trend-1024x968.png

注目すべきディープラーニング・モデルのトレーニング・コンピュートの経年変化。出典エポック AI

GPT-2から GPT-3への1年間のスケールアップは異例のオーバーハングであったが、長期的なトレンドが続くことは間違いない。SF-rumor-millは、巨額のGPU受注の劇的な話で一杯だ。その投資は並大抵のものではないが、動き始めている。

この分析によれば、2027年末までにさらに2OOMsのコンピュート（数十億ドル規模のクラスター）が実現する可能性は非常に高いと思われる。さらに＋3OOMsのコンピュート（1,000億ドル規模以上）に近いクラスターも可能性がありそうだ（マイクロソフト／OpenAIで計画中と噂されている）。

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute-1024x866.png

続き I.GPT-4からAGIへ：OOMを数える(5) https://anond.hatelabo.jp/20240605205449

Permalink | 記事への反応(1) | 20:50

■anond:20240605135855

つまりお前は負けたことに気づく権利すら無いってわけだ。間抜けは見つかったようだな。

Permalink | 記事への反応(0) | 14:00

■anond:20240605092555

対等に稼いでる前提でもお姫様ポーズの待ちの姿勢で間抜けに口を開けているだけのメスさん…

これは確かに失敗ですなあ

Permalink | 記事への反応(0) | 09:51

2024-06-02

■anond:20240602195712

公的な会話と私的な通話が同じとでも思ったか間抜けがｗ

Permalink | 記事への反応(1) | 19:59

■anond:20240602194640

まぁ論文すら書けないようじゃ大学も所詮有料体験版だったってわけよ　間抜けは見つかったようだなｗ？

Permalink | 記事への反応(0) | 19:50

■anond:20240602193913

んで玉取りたくないですと。間抜けは見つかったようだな？

Permalink | 記事への反応(0) | 19:40

■シンクタンク レポートを見たはてなー「よくまとまっている」だとさ

三菱UFJ リサーチが出したサマリレポートにブクマが集まっているのだが、

『地政学リスクの全体像の整理 | 三菱UFJ リサーチ&コンサルティング』

https://b.hatena.ne.jp/entry/s/www.murc.jp/library/economyresearch/analysis/research/report_240528/

そこで「よくまとまっている」とかコメントしてるブクマカが数人いて失笑するするしかない。なんだよそのエラソーな態度はｗ

そもそもネットで国際関係に関して調べる時、膨大なゴミ情報が掛かり易いわけだ。だからこういう金融系シンクタンクのレポートが出てくるまで検索を続ける、出てくるまで検索式を変えてみるっていう風に一定の基準とされる事が多いもんだろ。

大学のレポートでどっかのインフルエンサの動画を参照したとかネットで活躍する誰それのメルマガ参照とか書いたらリジェクトされるし、仕事でやったら馬鹿のレッテル貼られて渉外的な仕事からは一生干される。そういう意味で安牌なのがこういう金融系シンクタンクなわけだ。

仮にその予想や分析が間違っていても格好はつく。

特に今回みたいな「地政学リスク」を論じる時には重要だ。何しろこの10年の日本で「地政学」と来たら新聞も読まない馬鹿向けコンテンツとして有名だ。

なんでそうなるかというと、元々日本での地政学アゲの元祖は90年代の福田和也で、反米＋知的スノビズムなのよ。

一方で80年代末に急な円高による海外旅行ブームと対米貿易摩擦があった。これに刺激されて「国際的」というのがバズワード化して、多くの大学に「国際学科」なんかが雨後の筍のように出来たのだが、元が必要に迫られた国際化なのでこれ以後特にビジネス教養として国際関係が重要視されるようになった。

この「国際政治と国際経済を中核とした常識化した教養」が無い人にとって「地政学」とやらはもの凄く魅惑的で、それらの踏まえなきゃならん常識を無視して、他国の本質も見えるし物事が明瞭に見える。

なんでそんなに明瞭に見えるかって言えば、白紙だからだ。白紙に線引きゃ明瞭だし自由に引ける、A国の隣にB国がある、とか中国の概要進出をブロックする形で日本列島がある、とかそういう目で見て直ぐに判るような事ばかりで構成される。

「本質が見える」「よくわかる」というのは、単純にその対象の事を全く知らないという事はしばしばである。

でも普通の人にはそうは出来ない。各国の産業の構成グラフとか、輸出入品目の図、国の成長度合いと関税品税率、航路、貿易協定の線とか、世界地図上はごちゃごちゃしてる。そこでカッコ付き「地政学」で使われてる地図図示されても「今は帝国主義じゃねーし」で終わりだ。「中国の海外進出の蓋になってる日本列島」の図を見ても「いや、中国は海洋条約に対して大陸棚方式を主張してるし」とか「11段線の元は民国の9段線とかなんとかでそれを一国主義に基づいて反射的に主張したのが最初だから…」とか余計な事を考えてしまう。