「ジャンプ」を含む日記 RSS

はてなキーワード: ジャンプとは

2024-06-06

   平成30年の夏にペガサス浮間舟渡の向こうの赤羽ゴルフ場で叫んでいたといっても抽象的にそう言っているだけで当時の様子は全く具体的には確定できないので、当時の教科書

   書いて次第に確定していくしかない。  記憶されているのは次の程度の事である

     (1)  雨が降っていた日であり、糞警部補が、向こうからライトで照らしていた。

     (2)  男? 歌を歌っている。意見を言っている、意味不明、という通報しか残っていない。 志村庁舎がどのように扱ったについても、平成30年分は何も記録されていない。

   副島真のバッタ問題、  バッタ整数列のジャンプの着地しないところがあるという問題を解いたことになっている3人の警察官   熊谷永華 戸田勇哉 本官

    難しかった理由     整数ではなく組み合わせの問題で、しかも、誰も体験したことがない、 Strong-Inductionが登場する問題だったこ

    熊 戸田 本官   帰納法専門家。  3次元事件現場で、 強く、帰れ帰れ、と言うことで、有名。

   副島真   強いinduction の n<k の仮定の中身に、4つのClaimをして、 強い帰納法を出してバッタ問題を作ったキチガイ</p>

    問題:  バッタが数直線0の点におり、条件の順番でジャンプをする。このときバッタが一度も着地しないような点が存在することを示せ。

2024-06-05

状況認識:今後10年の展望 -- はじめに

X (twitter) で SITUATIONAL AWARENESS: The Decade Ahead https://situational-awareness.ai/ というのが回ってきて非常に示唆に富むものだったので、DeepL (無料API経由) で訳してみた。

レオポルド・アッシェンブレナ2024年6月

サンフランシスコに行けば、まず未来が見える。

この1年で、街の話題100億ドルコンピュート・クラスターから1000億ドルクラスター、そして1兆ドルクラスターへと移り変わってきた。半年ごとに、役員室の計画にまたゼロが追加される。その裏では、残りの10年間に利用可能なすべての電力契約と、調達可能なすべての電圧変圧器を確保しようとする熾烈な争いが繰り広げられている。アメリカ大企業は、アメリカ産業力を結集させるために、何兆ドルもの資金を注ぎ込む準備を整えている。ペンシルベニア州シェールフィールドからネバダ州太陽光発電所まで、何億ものGPUが稼働する。

AGI競争が始まったのだ。私たち思考し、推論できるマシンを作りつつある。2025年から26年にかけて、これらのマシンは多くの大学卒業生凌駕するだろう。10年後までには、これらのマシンは私やあなたよりも賢くなり、本当の意味での超知性を手に入れるだろう。その過程で、この半世紀には見られなかったような国家安全保障の力が解き放たれ、やがて「プロジェクト」が始動する。運が良ければ、中国共産党との全面的競争になり、運が悪ければ全面戦争になる。

今、誰もがAIについて話しているが、何が自分たちを襲おうとしているのか、かすかな光明を感じている人はほとんどいない。Nvidiaアナリストは、まだ2024年ピークに近いと考えている。主流派評論家たちは、「次の言葉予測するだけだ」という故意盲目に陥っている。彼らが見ているのは誇大広告といつも通りのビジネスだけで、せいぜいインターネット規模の新たな技術革新が起こるのを楽しむ程度なのだ

やがて世界は目を覚ますだろう。しかし、今現在、状況認識を持っているのはおそらく数百人で、そのほとんどはサンフランシスコAI研究所にいる。運命不思議な力によって、私はその中に身を置くことになった。数年前、このような人々はクレイジーだと揶揄されたが、彼らはトレンドラインを信頼し、過去数年間のAI進歩を正しく予測することができた。この人たちが今後数年についても正しいかどうかはまだわからない。しかし、彼らは非常に賢い人々であり、私がこれまでに会った中で最も賢い人々である。おそらく、彼らは歴史の中で奇妙な脚注となるか、あるいはシラードやオッペンハイマーテラーのように歴史に名を残すだろう。もし彼らが未来を正しく見ているとしたら、私たちはとんでもないことになる。

私たちが見ているものを教えよう。

目次

エッセイはそれぞれ独立したものですが、シリーズ全体として読むことを強くお勧めします。全エッセイPDF版はこちら。

はじめに 【このページ】

歴史サンフランシスコで生きている

I.GPT-4からAGIへOOM(Orders of Magnitude)を数える

2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは~未就学児から~賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドライントレースすると、2027年までに再び未就学児から高校生サイズ質的ジャンプが起こると予想される。

II.AGIから超知能へ:知性の爆発

AI進歩人間レベルでは止まらない。何億ものAGIがAI研究自動化し、10年に及ぶアルゴリズム進歩(5以上のOOM)を1年以下に圧縮することができる。私たちは、人間レベルから超人的なAIシステムへと急速に進化することになる。超知能の威力危険性は劇的なものとなるだろう。

III.課題
IIIa.兆ドルクラスタへの競争

驚異的な技術資本の加速が始まっている。AI収益が急増するにつれ、10年末までに何兆ドルもの資金GPUデータセンター、電力の増強に投入されるだろう。米国の電力生産を数十%増加させるなど、産業界の動員は激しくなるだろう。

IIIb.研究所の封鎖AGIのセキュリティ

米国の主要なAI研究所は、セキュリティを後回しに扱っている。現在、彼らは基本的にAGIの重要な機密を銀の皿に載せて中国共産党に渡している。AGIの秘密とウェイトを国家機関の脅威から守るには膨大な努力必要であり、我々はその軌道に乗っていない。

IIIc.スーパーアライメント

我々よりもはるかに賢いAIシステムを確実に制御することは、未解決技術問題である解決可能問題ではあるが、急速な知能の爆発が起きれば、物事簡単にレールから外れてしまう。これを管理することは非常に緊張を強いられるだろう。

IIId.自由世界勝利しなければならない

スーパーインテリジェンスは、経済的にも軍事的にも決定的な優位性をもたらすだろう。中国はまだゲームから抜け出してはいない。AGIをめぐる競争では、自由世界の存亡がかかっている。我々は権威主義的な大国に対する優位性を維持できるのか?そして、その過程で自滅を避けることができるのだろうか?

IV.プロジェクト

AGIへの競争が激化するにつれ、国家安全保障が関与してくる。アメリカ政府は眠りから覚め、27~28年までに何らかの形で政府によるAGIプロジェクトが立ち上がるだろう。どんな新興企業も超知能を扱うことはできない。SCIFのどこかで、終盤戦が始まるだろう。

V.おわりに

もし我々が正しかったら?

――――――――

私はかつてOpenAIで働いていたが、これはすべて一般に公開されている情報私自身のアイデア一般的な現場知識、あるいはSFゴシップに基づいている。

Collin Burns、Avital Balwit、Carl Shulman、Jan Leike、Ilya Sutskever、Holden Karnofsky、Sholto Douglas、James Bradbury、Dwarkesh Patel、その他多くの方々の有益議論感謝する。初期の草稿にフィードバックをくれた多くの友人に感謝する。グラフィックを手伝ってくれたジョー・ローナン出版を手伝ってくれたニック・ウィテカーに感謝する。

イリヤスーツバーに捧ぐ。

続き I.GPT-4からAGIへ:OOMを数える(1) https://anond.hatelabo.jp/20240605203849

I.GPT-4からAGIへ:OOMを数える (9)

3.コンピュータ使用

これはおそらく3つの中で最も簡単方法だ。現在のChatGPTは、基本的に、テキスト入力できる孤立した箱の中に座っている人間のようなものだ。初期のアンホブリング改良では、個々の孤立したツールの使い方をモデルに教えていましたが、マルチモーダルモデルでは、近いうちにこれを一挙にできるようになると期待しています

まりZoomでの通話に参加したり、オンラインで調べ物をしたり、メッセージ電子メールを送ったり、共有されたドキュメントを読んだり、アプリや開発ツールを使ったりといったことだ。(もちろん、より長いホライゾン・ループモデルがこれを最大限に活用するためには、テスト時間コンピューティングをアンロックする必要がある。)

最終的には、ドロップイン・リモートワーカーのようなものができると期待している。エージェントは、あなた会社入社し、新しい人間雇用のようにオンボードされ、Slackあなたや同僚にメッセージを送り、あなたソフトウェア使用し、プルリクエストを行い、大きなプロジェクトがあれば、人間独立してプロジェクト完了するために数週間留守にするのと同等のことができる。これを実現するためには、GPT-4よりもいくらか優れたベースモデル必要だろうが、おそらくそれほどでもないだろう。

https://situational-awareness.ai/wp-content/uploads/2024/06/devin.gif

Devinは、完全に自動化されたソフトウェアエンジニアを作るために、モデル上の「エージェンシーオーバーハング」/「テストタイムコンピューティングオーバハング」を解除する初期のプロトタイプだ。Devinが実際にどの程度機能するかはわからないし、このデモは、適切なチャットボットエージェントのアンホブリングがもたらすものに比べれば、まだ非常に限定的ものだが、近々登場するものティーザーとしては役に立つだろう。

ところで、私は、アンホブリングの中心性が、商業的応用という点で、少々興味深い「ソニックブーム効果につながると期待している。現在ドロップイン・リモートワーカーの中間モデルは、ワークフローを変更し、統合して経済的価値を引き出すためのインフラを構築するために、膨大な手間を必要とする。ドロップイン・リモートワーカーは、統合が劇的に簡単になる。つまりリモートでできるすべての仕事自動化するために、ドロップインするだけでいいのだ。つまりドロップイン・リモートワーカーが多くの仕事自動化できるようになる頃には、中間モデルはまだ完全に活用され統合されていないため、生み出される経済価値ジャンプはやや不連続になる可能性がある。

次の4年間

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_gpt2togpt4.png

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_2023to2027.png

GPT-4に先立つ4年間の進歩原動力と、GPT-4後の4年間に期待されることについての推計のまとめ。


数字をまとめると、GPT-4に続く4年間で、2027年末までにGPT-2からGPT-4規模のジャンプが再び起こると(おおよそ)予想される。

GPT-4のトレーニングに3ヶ月かかったとしよう。2027年には、一流のAIラボGPT-4レベルモデルを1分で訓練できるようになるだろう。OOM効果的なコンピュート・スケールアップは劇的なものになるだろう。

それは我々をどこへ連れて行くのだろうか?

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_counting_the_ooms.png

OOMカウントのまとめ。


GPT-2からGPT-4までで、私たちは~未就学児から~賢い高校生になった。とんでもないジャンプだ。もしこれが、私たちが今一度カバーする知能の差だとしたら、それは私たちをどこに連れて行くのだろうか?私たちは、それが私たちをとてもとても遠くに連れていっても驚かないはずだ。おそらく、ある分野の博士や最高の専門家凌駕するようなモデルまで到達するだろう。

(このことを考える1つの良い方法は、現在AI進歩の傾向は、子供の成長のおよそ3倍のペースで進んでいるということだ。あなたの3倍速の子どもは高校卒業したばかりだが、いつの間にかあなた仕事を奪っていくだろう!)

続き I.GPT-4からAGIへ:OOMを数える(10) https://anond.hatelabo.jp/20240605211837

I.GPT-4からAGIへ:OOMを数える (7)

アンホブリング

最後に、定量化するのが最も難しいが、それに劣らず重要改善カテゴリーを紹介しよう。

難しい数学問題を解くように言われたとき、頭に浮かんだことを即座に答えなければならないとしたらどうだろう。最も単純な問題を除いて、苦労するのは明らかだろう。しかしつい最近まで、LLMにはそうやって数学問題を解かせていた。その代わり、私たちほとんどはスクラッチパッドで段階的に問題を解いていき、その方法はるかに難しい問題を解くことができる。「思考連鎖プロンプトは、LLMのそれを解き放った。生の能力は優れているにもかかわらず、明らかな足かせがあるため、LLMは数学が苦手なのだ

私たちはここ数年で、モデルの「足かせを外す」ことに大きな進歩を遂げました。これは単に優れたベースモデルトレーニングするだけでなく、アルゴリズムの改良によってモデル能力を引き出すものです:

足場作り。CoT++について考えてみよう:ただ問題を解くようモデルに求めるのではなく、あるモデル攻撃計画を立てさせ、別のモデル可能性のある解決策をたくさん提案させ、別のモデルにそれを批評させる、といった具合だ。例えば、HumanEval(コーディング問題)では、単純な足場作りによってGPT-3.5が足場なしのGPT-4を上回った。SWE-Bench(実世界ソフトウェアエンジニアリングタスクを解くベンチマーク)では、GPT-4は~2%しか正しく解くことができませんが、Devinのエージェントの足場があれば14-23%に跳ね上がります。(後ほど詳しく説明するが、エージェントのアンロックはまだ初期段階に過ぎない。)

ツール:もし人間電卓コンピュータを使うことを許されなかったらと想像してみてほしい。まだ始まったばかりだが、ChatGPTウェブブラウザを使ったり、コードを実行したりできるようになった。

エポックAIによる研究によると足場作りやツール使用など、これらのテクニックのいくつかを調査したところ、このようなテクニックは多くのベンチマークで通常5~30倍の効果的な計算量の向上をもたらすことがわかった。METR(モデル評価する組織)も同様に、同じGPT-4ベースモデルからのアンホブリングによって、エージェントタスクのセットで非常に大きなパフォーマンスの向上を発見しました。

https://situational-awareness.ai/wp-content/uploads/2024/06/metr_gains_over_time-1024x597.png

METRのエージェントタスクパフォーマンス。出典モデル評価と脅威研究


これらをコンピュートとアルゴリズム効率統一した実効的なコンピュート規模に当てはめることは困難ですが、少なくともコンピュート規模の拡大やアルゴリズム効率とほぼ同規模の大きな進歩であることは明らかです。(また、アルゴリズム進歩が中心的な役割を担っていることも浮き彫りになっています。0.5OOM/年の計算効率は、すでに重要ものではありますが、ストーリーの一部に過ぎません。)

「アンホブリング」こそが、実際にこれらのモデル有用になることを可能にしたのであり、今日多くの商業アプリケーションの足かせとなっているものの多くは、この種のさらなる「アンホブリング」の必要であると私は主張したい。実際、今日モデルはまだ信じられないほど足かせが多い!例えば

ここでの可能性は非常に大きく、私たちはここで急速に低空飛行の果実を摘んでいる。これは非常に重要です。"GPT-6 ChatGPT "を想像するだけでは完全に間違っていますGPT-6+RLHFと比べれば、進歩は段違いだ。2027年までには、チャットボットというより、エージェントのような、同僚のようなものが登場するだろう。

続き I.GPT-4からAGIへ:OOMを数える(8) https://anond.hatelabo.jp/20240605210232

I.GPT-4からAGIへ:OOMを数える (5)

アルゴリズム効率

コンピュートへの大規模な投資が注目される一方で、アルゴリズム進歩も同様に重要進歩原動力であると思われる(そして、これまで劇的に過小評価されてきた)。

アルゴリズム進歩がどれほど大きな意味を持つかを理解するために、MATHベンチマーク高校生競技数学)において、わずか2年間で~50%の精度を達成するために必要価格が下がったことを示す次の図を考えてみてください。(比較のために、数学特に好きではないコンピュータサイエンスの博士課程の学生が40%のスコアを出したので、これはすでにかなり良いことです)。推論効率は2年足らずで3OOMs-1,000倍近く向上した。

https://situational-awareness.ai/wp-content/uploads/2024/06/math_inference_cost-1024x819.png

MATHのパフォーマンスを〜50%にするために必要な推論コストの概算。


これは推論効率だけの数字だが(公開データから推論するのが難しいトレーニング効率の向上と一致するかどうかはわからない)、アルゴリズム進歩は非常に大きく、また実際に起こっている。

この記事では、アルゴリズム進歩を2種類に分けて説明します。まず、「パラダイム内」でのアルゴリズムの改良を取り上げることにしま す。例えば、より優れたアルゴリズムによって、同じパフォーマンスを達成しながら、トレーニング計算量を10倍減らすことができるかもしれません。その結果、有効計算量は10倍(1OOM)になります。(後ほど「アンホブリング」を取り上げますが、これはベースモデル能力を解き放つ「パラダイム拡張/アプリケーション拡張」的なアルゴリズム進歩と考えることができます)。

一歩下がって長期的な傾向を見ると、私たちはかなり一貫した割合で新しいアルゴリズムの改良を発見しているようです。しかし、長期的なトレンドライン予測可能であり、グラフ上の直線であるトレンドラインを信じよう。

アルゴリズム研究ほとんど公開されており、10年前にさかのぼデータがある)ImageNetでは、2012年から2021年までの9年間で、計算効率が一貫して約0.5OOM/年向上しています

https://situational-awareness.ai/wp-content/uploads/2024/06/pareto_frontiers_imagenet_epoch-1024x349.png

アルゴリズム進歩を測定することができます。同じ性能のモデルを訓練するために必要計算量は、2012年比較して2021年にはどれくらい少なくなっているのでしょうか?その結果、アルゴリズム効率は年間0.5 OOMs/年程度向上していることがわかります。出典Erdil and Besiroglu 2022.

これは非常に大きなことです。つまり、4年後には、~100倍少ない計算量で同じ性能を達成できるということです(同時に、同じ計算量ではるかに高い性能も達成できます!)。

残念ながら、研究室はこれに関する内部データ公表していないため、過去4年間のフロンティアLLMのアルゴリズム進歩を測定することは難しい。EpochAIは、言語モデリングに関するImageNetの結果を再現した新しい研究を行っており、2012年から2023年までのLLMのアルゴリズム効率トレンドは、同様に~0.5OOM/年である推定しています。(しかし、これはエラーバーが広く、また、主要なラボアルゴリズム効率公表を停止しているため、最近の上昇を捕捉していません)。

https://situational-awareness.ai/wp-content/uploads/2024/06/llm_efficiency_epoch-1-1024x711.png

Epoch AIによる言語モデリングにおけるアルゴリズム効率推定。この試算によると、私たちは8年間で~4OOM効率向上を達成したことになります

より直接的に過去4年間を見ると、GPT-2からGPT-3は基本的に単純なスケールアップでした(論文によると)が、GPT-3以降、公に知られ、公に干渉可能な多くの利益がありました:

最近リリースされたGemini 1.5 Flashは、"GPT-3.75レベル "とGPT-4レベルの間の性能を提供する一方で、オリジナルGPT-4よりも85倍/57倍(入力/出力)安い(驚異的な利益!)。

公開されている情報総合すると、GPT-2からGPT-4へのジャンプには、1-2 OOMアルゴリズム効率向上が含まれいたことになります

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute_algos-1024x866.png

GPT-4に続く4年間はこの傾向が続くと予想され、2027年までに平均0.5OOMs/年の計算効率、つまりGPT-4と比較して~2OOMsの向上が見込まれます計算効率の向上は、低空飛行の果実を摘み取るようになるにつれて難しくなる一方、新たなアルゴリズムの改良を見出すためのAIラボ資金人材への投資は急速に増加しています。 (少なくとも、公開されている推論コスト効率化は、まったく減速していないようだ)。ハイエンドでは、より根本的な、トランスフォーマーのようなブレークスルーが起こり、さらに大きな利益が得られる可能性さえある。

これらをまとめると、2027年末までには(GPT-4と比較して)1~3OOMアルゴリズム効率向上が期待できることになります

続き I.GPT-4からAGIへ:OOMを数える(6) https://anond.hatelabo.jp/20240605205754

I.GPT-4からAGIへ:OOMを数える (4)

OOMを数える

どうしてこうなったディープラーニング魔法は、それがただ機能するということであり、あらゆる場面で否定的意見にもかかわらず、その傾向線は驚くほど一貫している。

https://situational-awareness.ai/wp-content/uploads/2024/06/sora_scaling-1024x383.png

OpenAI Soraの例 計算量のスケーリング効果

効果的な計算OOMが増えるごとに、モデル予測通り、確実に良くなっていく。OOMを数えることができれば、能力の向上を(大まかに定性的に)推定することができる。そうやって、先見の明のある数人がGPT-4の到来を予見したのだ。

GPT-2からGPT-4までの4年間の進歩を、スケールアップの3つのカテゴリーに分解することができる:

1. コンピュート:計算:これらのモデルを訓練するために、より大きなコンピューターを使うようになった。

2.アルゴリズム効率化:アルゴリズム進歩には継続的な傾向がある。これらの多くは「コンピュート・マルチプライヤ」として機能し、有効コンピュート量の増加という統一された尺度に乗せることができます

3.「趣味のない」利益デフォルトでは、モデルは多くの素晴らしい生の能力学習しますが、あらゆる種類の間抜け方法で足かせとなり、実用的な価値制限されます人間フィードバックから強化学習(RLHF)、思考連鎖(CoT)、ツール、足場などの単純なアルゴリズム改善により、潜在的能力を大きく引き出すことができる。

これらの軸に沿って、改善の「OOMを数える」ことができる。つまり有効計算量の単位でそれぞれのスケールアップをトレースするのだ。3倍は0.5OOM10倍は1OOM、30倍は1.5OOM100倍は2OOMといった具合だ。2023年から2027年まで、GPT-4の上に何を期待すべきかを見ることもできる。

ひとつひとつ見ていくが、OOMの数を急速に増やしていることは明らかだ。データの壁には逆風が吹いている可能性があり、それについては後述するが、全体的には、2027年までにGPT-4の上に、GPT-2からGPT-4規模のジャンプがもう1回起こると予想される。

コンピュート

まず、最近進歩原動力として最もよく議論されている、モデルへの(大量の)コンピュート投入について説明します。

多くの人は、これは単にムーアの法則によるものだと考えている。しかし、ムーアの法則が全盛期を迎えていた昔でさえ、その進歩比較的緩やかなものでした。しかし、ムーアの法則が全盛期だった昔でさえ、10年で1~1.5OOMと、比較ゆっくりとしたスピードだった。(かつては1つのモデル100万ドルを費やすことさえ、誰も考えもしないことだった。)

モデル推定コンピュート 成長率
GPT-2 (2019) ~4e21 FLOP
GPT-3 (2020) ~3e23 FLOP + ~2 OOMs
GPT-4 (2023) 8e24~4e25 FLOP + ~1.5~2 OOMs

エポックAIによるGPT-2からGPT-4までの計算量の推定

エポックAIAIトレンドの優れた分析で広く尊敬されている情報源)の公開推定値を使用して、2019年から2023年までのコンピュートスケールアップを追跡することができますGPT-2からGPT-3へのスケールアップは迅速で、小規模な実験から大規模な言語モデルを訓練するためにデータセンター全体を使用するまでにスケールアップし、コンピュートのオーバーハングが大きくなりました。GPT-3からGPT-4へのスケールアップでは、次のモデルのためにまったく新しい(はるかに大きな)クラスタを構築しなければならないという、最新の体制に移行しました。それでも劇的な成長は続いていますエポックAIの試算によると、GPT-4のトレーニングでは、GPT-2の3,000倍から10,000倍の計算量を使用しています

大雑把に言えば、これは長期的なトレンド継続に過ぎない。過去10年半の間、主に投資(およびGPUやTPUの形でAIワークロードに特化したチップ)の幅広いスケールアップのため、フロンティアAIシステム使用されるトレーニング計算量は、およそ〜0.5OOM/年で成長してきた。

https://situational-awareness.ai/wp-content/uploads/2024/06/compute_long_run_trend-1024x968.png

注目すべきディープラーニングモデルトレーニングコンピュートの経年変化。出典エポックAI

GPT-2からGPT-3への1年間のスケールアップは異例のオーバーハングであったが、長期的なトレンドが続くことは間違いない。SF-rumor-millは、巨額のGPU受注の劇的な話で一杯だ。その投資は並大抵のものではないが、動き始めている。

この分析によれば、2027年末までにさらに2OOMsのコンピュート(数十億ドル規模のクラスター)が実現する可能性は非常に高いと思われる。さらに+3OOMsのコンピュート(1,000億ドル規模以上)に近いクラスターも可能性がありそうだ(マイクロソフト/OpenAI計画中と噂されている)。

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute-1024x866.png

続き I.GPT-4からAGIへ:OOMを数える(5) https://anond.hatelabo.jp/20240605205449

I.GPT-4からAGIへ:OOMを数える (1)

2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは〜未就学児から〜賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドライントレースすると、2027年までに再び未就学児から高校生規模の質的ジャンプが起こると予想される。


見て。モデルたちはただ学びたいだけなんだ。あなたはこれを理解しなければならない。モデルたちは、ただ学びたいだけなんだ。

イリヤスーツバー2015年頃、ダリオ・アモデイ経由)

GPT-4の能力は、多くの人に衝撃を与えた。コードエッセイを書くことができ、難しい数学問題を推論し、大学試験突破することができるAIシステムである。数年前までは、これらは難攻不落の壁だと思っていた。

しかGPT-4は、ディープラーニングにおける10年間の猛烈な進歩の延長線上にあった。その10年前、モデル犬猫の単純な画像識別するのがやっとだった。4年前、GPT-2は半可通な文章をつなぎ合わせるのがやっとだった。今、私たちは思いつく限りのベンチマークを急速に飽和させつつある。しかし、この劇的な進歩は、ディープラーニングスケールアップにおける一貫した傾向の結果に過ぎない。

ずっと以前から、このことを見抜いていた人々がいた。彼らは嘲笑されたが、彼らがしたのはトレンドラインを信じることだけだった。トレンドラインは強烈で、彼らは正しかった。モデルはただ学びたいだけなのだ

私は次のように主張する。2027年までには、モデルAI研究者エンジニア仕事をこなせるようになるだろう、と。SFを信じる必要はなく、グラフ上の直線を信じるだけでいいのだ。

https://situational-awareness.ai/wp-content/uploads/2024/06/base_scaleup-1024x790.png

過去と将来の有効計算量(物理計算量とアルゴリズム効率の両方)の大まかな見積もりモデルスケールアップすればするほど、モデルは一貫して賢くなり、"OOMを数える "ことによって、(近い)将来に期待されるモデルインテリジェンスの大まかな感覚を得ることができます。(このグラフベースモデルスケールアップのみを示している。)

この記事で取り上げた一般的推定に基づく、効果的な計算物理的な計算アルゴリズム効率の両方)の過去と将来のスケールアップの概算。モデルスケールアップするにつれ、モデルは一貫して賢くなり、「OOMを数える」ことで、(近い)将来に期待されるモデルインテリジェンスの大まかな感覚を得ることができる。(このグラフベースモデルスケールアップのみを示している。"unobblings "は描かれていない)。

この作品では、単純に「OOMを数える」(OOM = order of magnitude10x = 1 order of magnitude)ことにします。1)計算、2)アルゴリズム効率(「効果的な計算」の成長として考えることができるアルゴリズム進歩)、3)「アンホブリング」(モデルデフォルトで足かせとなっている明らかな方法修正し、潜在的能力を引き出し、ツールを与えることで、有用性を段階的に変化させること)の傾向を見ますGPT-4以前の4年間と、GPT-4後の2027年末までの4年間に期待されるそれぞれの成長を追跡する。ディープラーニング効率的な計算のすべてのOOMで一貫して向上していることを考えると、将来の進歩予測するためにこれを使うことができる。

世間では、GPT-4のリリースから1年間、次世代モデルオーブンに入ったままであったため、ディープラーニングは停滞し、壁にぶつかっていると宣言する人もいた。しかし、OOMカウントすることで、私たちは実際に何を期待すべきかを垣間見ることができる。

結果は非常にシンプルだ。GPT-2からGPT-4への移行は、時々まとまりのある文章を並べることに感動的だったモデルから高校入試エースになるモデルへの移行であり、一度だけの進歩ではない。私たちOOMsを極めて急速に克服しており、その数値は、4年以上かけてGPT-2からGPT-4への質的ジャンプさらに~100,000倍の効果的なコンピュート・スケールアップが期待できることを示している。さらに、決定的なことは、それは単にチャットボットの改良を意味しないということだ。"unhobbling "利益に関する多くの明らかな低空飛行の果実を選ぶことで、チャットボットからエージェントへ、ツールからドロップイン・リモートワーカーの代替のようなものへと我々を導いてくれるはずだ。

推論は単純だが、その意味するところは注目に値する。このような別のジャンプは、私たちをAGIに、博士号や同僚として私たちそばで働くことができる専門家と同じくらい賢いモデルに連れて行く可能性が非常に高い。おそらく最も重要なことは、これらのAIシステムAI研究のもの自動化することができれば、次回のテーマである強烈なフィードバックループが動き出すということである

現在でも、このようなことを計算に入れている人はほとんどいない。しかし、AIに関する状況認識は、一歩下がってトレンドを見てみれば、実はそれほど難しいことではない。AI能力に驚き続けるなら、OOMを数え始めればいい。

続き I.GPT-4からAGIへ:OOMを数える (2) https://anond.hatelabo.jp/20240605204240

2024-06-04

世の中のうまくいってないこと

2024-06-03

anond:20240525131214

俺は全く逆。雑誌連載リアルタイム読者なんだが、最初普通ギャグ漫画だったときはまあ突出して面白くはないが「普通ジャンプギャグ漫画」としてそれなりに楽しんで読んでた。でもプロレス漫画になったら急速に興味を失って全くスルーするようになった。元々ジャンプギャグをメインに読んでたし、プロレスに限らず「誰が一番強いか」っていうことに一切興味無いので。『北斗の拳』をはじめとするストーリーものあくまで「ズリネタとして消費できるかどうか」にしか価値を感じなかったし。ていうか別に今この漫画新たに読む必要なくね?プロレス好きのジジイ読者が昔を懐かしんで読むマンガでしょ。

なんで2ch漫画系板で腐女子を叩くのが批判されたん?

住民おっさんばかりの今ならともかく

20年前くらいの2ch中学生高校生も沢山いた

週刊少年漫画板はジャンプマガジンサンデーチャンピオンのどの漫画面白いかでムキになる中学生も沢山いた

俺もそうだった(ダメ中学生だね)

から思うんだけど何でその当時にBLカップリングするような女オタクを叩いてたのが今になって批判されるんだろうな?

オッサンが女オタクを叩くのを批判するならともかく、何で20年前のオッサンにもなってない男子まで批判対象にされるんだろうな

例えばさ、小学生女子プリキュア見てる男オタクキモいって言うのは男女差別か?

自分が楽しんでるコンテンツオタク達が邪な目で見てるのを気持ち悪がるのは仕方ない事だろう

一方で少年ジャンプ等は20年前には既に小学生というより中学生以上の男子想定読者としていたが

その中学生男子BLカップリングするような女オタク達を気持ち悪いと思うのって

プリキュア見てる小学生女子が邪な目で見てる男オタク達を気持ち悪いと思うのとどんだけ違うんだろうね

あぁプリキュアは実際は幼稚園女子が想定視聴者だったって違いくらいはあるかもね

あとプリキュア見てる男子少年漫画見てる女子もいるけど、どっちにしろ邪な目で見るオタク気持ち悪いと思うのは変わらんけどな

さて、「小学生気持ち悪いと言ってもいいけど中学生気持ち悪いと他人に言っては良くない」って意見もあるだろうけど

その場合中学生向けの少女漫画を見る男オタクはどんな奴も気持ち悪いと言ってはいけない事になるけど

それでいいなら別にいいけどな

こういう事言ってると「20年前から週間少年漫画板はオッサンだらけだった」って言い張る人達が出るかもな

もしくは「何でも1か0かで考えられねえのか」みたいな便利な論理で煙に巻く人も出るかもな

それを言う人達の中には2ch腐女子批判を片っ端から男女差別と断定するのには何も思わない人もいるんだろうな

ホント凄いよな

何があっても女が被害者で男が加害者って考えが腐女子批判にもキレる人を生むのかねぇ

2024-06-02

書き直して持って来てね

おちこぼれが異世界努力根性修行パワーアップ! 古い古い!平成ジャンプかよww 昔も今もトレンドは「楽してお金稼ぎ」なの。ハイ書き直し

もう楽したい小学生ばかりだから今の世の中。大人になったら本当に日本終わるかもね

anond:20240601110639

コイツの言ってる事自体にも一理あるな。

穴がガバガバチャートガバガバの間にはちょっとした思考ジャンプ必要でそうそ一般化するようなものとは思えないのに今はもう皆普通に使ってる。

それに対して穴がガバガバという表現昭和の頃から普通に使われていたぞドヤァ参ったかとしてホルホルしてるのはだいぶ頭がおかしいよな。

2024-06-01

8番のりばくんジャンプケアゲームって魔剤ですか?

NOTFORMEやね😔

anond:20240601053019

親なんかになめられてんじゃねえよ

俺はそういう強気な親にはわからせてやったぞ

まず親の前で軽くしゃがんで

「黙れクソボケ雑魚親!何にもできねえアホが!悔しかったらかかってこい!」

つって煽って殴りかかってきたところで

ジャンプしながらからだを反転させる渾身のキックをぶちかましてやったぞ

そのあとは音速を超えるような勢いで両手でぶん殴る

これで親はKO

俺には二度と逆らわなくなった

2024-05-31

快活クラブ裏技7選



それを使って毎週1回行くと、毎週30分200円くらいで行ける。

30分あればジャンプの読みたい漫画だけ読んでコーヒーも飲める。

しかソフトクリームドリンク飲み放題





みんなも快活クラブを楽しもう!

プラチナ会員の増田より。

(※プラチナ会員には、毎月10,000円使えばなれるよ。安いね!)

引っ越しマンションの床、ちょっとジャンプするとたわんでる感じがある

デブじゃないよ

2024-05-30

なんで大成功したルートと比べてんだよw

https://anond.hatelabo.jp/20240530143405

大学友達鳴かず飛ばずの地味な作家業だけど

それでもあいつのひたむきな創作人生が羨ましく思えた

俺も一般的生活など求めずああしたかったのかも…

とかならまあわかる。

 

でもお前が比べてるの漫画家のなかでも滅多にない成功者じゃん。

お前が漫画家目指してもそんな風になった確率は限りなくゼロだよ。

からうらやむこと自体がが虚像だよ。

  

 

何年か前にジャンプの超ヒット漫画チーフアシが2ちゃん降臨してお前みたいなこと愚痴ってたよ。

  

自身漫画家目指してたのに先生チーフアシとして慰留され続けて中年アシスタントになってしまった。

給料は高いし(年数千万)家も車も妻子も持てたけどでも、俺は自分マンガを描きたかったはずだし

自分漫画でヒットしてもっと幸せになれたはずなのにこうなってしまった。

引き留め続けた先生のせいで。それに甘んじたおれ自身のせいで。悔やんでも悔やみきれない。

  

みたいな。

  

 

で、その超ヒット漫画はその後まもなく大団円を迎えたんだが、そこまで言ってたそのチーフアシは晴れて独立して自分漫画描くのかと思うじゃん?

描きやしねえ。描けなかったんだろうな。

 

結局超ヒット漫画スピンオフ続編みたいなの描いてるよ。そんなに面白くないし絵も癖があるからファンの反応も微妙

 

超ヒット漫画もっと上手く絵や作風エミュレート出来る新人がいたりするし、チーフアシじゃない方のアシの方が絵が素直でうまいこともわかった。

 

チーフアシももう変な夢から醒めたと思うよ。

チーフアシとしての地位サラリーを捨てて漫画家一本に賭けてても高い確率でなにも手に入らず、チーフアシルートとは比べることすら出来ないひどい人生になってたなってたってことをさ。

   

  

身近に大成功者が出たとき

それが実力も運もある超レア存在だとわからなくなって

「あっちを選んでさえいれば俺だって」ってなっちゃうんだよな。

勘違いから安心しろ

お前の選択は正しかったんだよ。

  

つかそもそもそのチーフアシの新人時代漫画

一部ではハイセンスとか言ってもてはやされてたけど

実は設定も決めゴマ鉄コン筋クリートのパクりだったんだわ。

少年漫画ファン松本大洋なんか読まないかあんまばれてなかっただけ。

見慣れた景色聖地になった心持ち

 

かつて通学路として毎日のように通っていた場所が、アニメポスターになって、ターミナル駅など色々なところにに貼られてるような事態となった。

最初に見たときは、まじで?となって、二度見した。

パット見はどこにあるのかわからない景色から、他の人がみればどこだろう?となるところだが、自分からすればピンポイント特定可能だった。

  

今でも、その風景日常の一部に組み込まれている。

  

自分にとって、オタク文化は、常に日陰者である

学校アニメ話題したことはないし、漫画ジャンプ限定に絞って会話していた。

サンデー異端であり、アフタヌーンモーニングは、禁忌である

文化部の隣の部室でルリルリ~とラノベ愛を語っていた中学時代の友人は、疎遠になってしまい、大学に進んだ後に、若くして亡くなったと聞いている。

彼の性格理由なのか、オタク趣味理由なのかは、知るすべもない。

 

ただオタク的な話をしていると、イジメにつながる可能性がある。

その一点において、避けるべき話題としていまでも認識している。

話すことが許されるオタク趣味と、一線を越えたオタク趣味の間には、未だに大きな壁がそびえ立っている。

 

今回のアニメは、線の向こう側にあるアニメだ。

フリーレンや鬼滅なら良い。子供が見てるアニメからゆるキャンギリギリセーフ。ただ、このアニメは声には出せない。

 

誇らしいのだけど、誇れない。

自分が住んでる町は、アニメ舞台になったぐらい良いところ。とは口には出せない。

アニメの完全に外側から人気あやかってありがとうございます。とも言えない。

 

それでも、この景色を綺麗と思ってもらえるなら、嬉しい限りあり、できるかぎり長く続くよう願っている。

anond:20240530102019

手元にすぎやま先生インタビューがあるのでまとめてみた

エニックスとの縁は、エニックスが出していた森田将棋アンケートハガキCPUの駒組みについて文句を書いて本名で送ったら「あのすぎやまこういち先生ですよね?エニックスゲーム音楽を作ってくれませんか」と連絡が来た。それからウイングマン2とかガンダーラとか一緒にやるようになった

ドラクエ音楽はすぎやま先生が参加する前にすでにできていたが、千田Pの強い意向で全部すぎやま先生の曲に差し替えることに。1週間で全曲をファミコン上で鳴らせるようにしろということなので、数日で全部作った。ここでいう全曲というのは「レベルアップの音」「階段を降りる音」「鍵を開ける音」といったME(Music Effect)も含む

序曲は5分でできた。作曲というのは「出物腫れ物」のようなもので、あの時は私もたまたま調子が良かったんでしょう。ただ、それまでの蓄積があったからできたわけで、「54年と5分でできた」という言い方もできる(※ドラクエ1開発時のすぎやま先生は54歳)

ドラクエの初期は開発現場毎日行って、サウンドプログラマーと直接やり取りをしながら作っていた。すぎやま先生自身PCマニアで、PC-8801を使い実装までできた。プログラマー楽器無知だったため、アーティキュレーションの微調整は全部すぎやま先生PC-8801上でやっていた

・よく「ファミコン用にシンプルアレンジを~」と言われるが、ハードウェアに合わせて曲を作ったことなんて一度もない。ドラクエの曲も、1の頃からルオーケストラのつもりで作曲していた。サイン波や矩形波でも、例えばホルンホルンの音形で鳴らしているので、ピコピコ音でも何の楽器かは伝わる

・よく「少ない同時発音数で~」と言われるが、別に2音あればなんとでもできる。音数が作曲の制約になったことは一度もない。制約の中での作曲がどうとか言われる理由がわからない

作曲は頭の中でやる。仕事場ピアノは一応置いてあるが、ほとんど触ることはない。頭の中で鳴らした曲を直接、Overture(序曲)という譜面ソフトDTMソフトに打ち込んでいく

・(頭の中でフルオーケストラを鳴らすのはどういう訓練をしたのかと問われ)いえ、何も訓練なんかしてませんよ。今、貴方インタビュアー)は日本語を話しているが、日本語の訓練なんかしましたかベートーベンや素晴らしい音楽を浴びるように吸収し続ければ、できるようになりますよ(※すぎやま先生東大卒で、音楽専門教育を受けていない独学作曲である

ドラクエは発売前から当時の黄金ジャンプが総力を挙げて毎週巻頭で宣伝していたAAAタイトルで、

そのためにわざわざ(ゲーム会社社員ではなく外部の大物である鳥山先生とすぎやま先生を呼んだんだから元増田の「大ヒットを狙ってなかった」は明らかな間違い。

当時、堀井雄二毎日のようにジャンプ編集部に入り浸ってマシリトと一緒に英語版Wizardlyなど海外RPGを遊びまくっていた。そういう中からまれ企画ファミコンでもRPGを出そう!ジャンプの力でRPG布教しよう!)がドラクエ

説明書イラスト土居孝幸ドラクエロゴデザイン榎本一夫というジャンプ放送局・ファミコン神拳の面々という座組みで、鳥山明の担当編集マシリト

鳥山の起用を含めたジャンプバックアップなくして、あそこまでの爆発的ヒットはなかっただろう。

だいたい数分で作ったから手抜きみたいな論法意味わからん

高度な技術よりも労働時間価値を置くっていう、はてブでよく叩かれてる発想では?

及川眠子さんも残酷な天使のテーゼ資料に目を通して2時間ぐらいで書いたって話と「エヴァアニメは興味ないので未だに見てない」という発言から手抜きだのやっつけだの言われるが、手抜きでもやっつけでもねえのよ。

ドラクエエヴァプロプロとしての技術を尽くし本気出して作ったものではある。たまたまそのときは何かのシナプスが繋がって短時間でできたってだけの話だろう

id:shirabekun

文脈を読み取る能力を身につけてくれよ

俺は唐突に発作を起こして「ドラクエができるまで」を語り始めたわけじゃないの

元増田が「大ヒットを狙ったわけじゃないのにウケちゃった」みたいなボケ発言をしてるので、

それが間違っている根拠として

「当時の黄金ジャンプが全面バックアップしたゲームが大ヒット狙ってないわけないだろ」

という情報提示したんだよ

これが「文脈」というやつな

ジャンプの話をしてるんだからジャンプ関係ない話はどれだけ重要でも触れる必要がない

野村克也日本捕手リード信仰を生み出したという話をしてるとき

「エアプか?王や長嶋に触れないのは~」とか絡まれたら

ちゃん文脈読めよ~」ってなるだろ?

それは今の主題じゃないし、主題じゃないことまで語られてないと気がすまないのはオタクの悪い癖

2024-05-29

人間飛ぶのは大変だけど

ザクみたいに足と背中バーニア付けてジャンプと着地の時に吹かしたら大ジャンプくらいはできるんじゃない?

一番簡単そうだが

2024-05-28

漫画アプリ広告って納得感あるよね

俺が見てるのはジャンプラ、マガポケ、サンデーうぇぶり、要するに出版社公式アプリだけど、

一つ広告動画を見れば、その後で一話読める(1日の広告数に上限あり)って感じで筋が通ってるから

納得して広告再生できるんだよな。

同じゲーム広告何回見せられるんだよって感じでも、ゲーム内容と関係ない詐欺動画でも、不思議と腹は立たない。


ブロックしたくなる広告って、広告の内容そのものというより

コンテンツ見てる最中に突然再生が始まったり

記事読んでる最中に誤クリック誘うやつみたいに

「筋を通さずに不意打ちで表示してくる」形式が嫌。


ユーザーに納得感ある形で広告表示できれば、広告単価も上げられて、三方よしにできるんじゃないかな。

漫画アプリはできてるんだから

ログイン ユーザー登録
ようこそ ゲスト さん