石丸伸二（安芸高田市長）
@shinji_ishimaru
2023年 8月8日
こちらの #キッチンカーの募集は明後日8/10（木）が〆切です!
すでにかなり多種多様なお申し込みがあり、県内でも稀なイベントとなりそうな感じがしています😃
盛り沢山な #フェスを共に楽しみましょう。（珍しい飲食が提供できる方は特に）皆さんの参加をお待ちしています!!
#安芸高田市
ttps://x.com/shinji_ishimaru/status/1688876338785267712

08-08 08-09

ここでサクラが出現している。

銀ちゃん人生変えるために副業始めました🥰
@Silvertigerone
2023年 8月9日
安芸高田市長「恥を知れ」発言 #安芸高田市 #恥を知れ #石丸伸二 ttps://youtube.com/shorts/fnFbdyqsxDA?feature=share
@You Tubeより
ttps://x.com/Silvertigerone/status/1688946721718710272

こうして引かれたラインに2026/08/16のポストが乗る

石丸伸二（安芸高田市長）
@shinji_ishimaru
ここ数日、フォロワー数が急増しているので不思議に思っていました…再生数が6日で230万回はなかなかの伸びですね。
ttps://youtu.be/dTu2Fk_LpdI
#中国新聞に限らず地方紙には似た傾向があるのではないかと懸念しています。発言に責任を持たない #メディアは有害です。
#安芸高田市
@ChugokuShimbun
youtube.com
【逆ギレ】マスゴミが中途半端に石丸市長を挑発し、逆にコテンパンにされ涙目で逆ギレ議論すり替えを行ってしまう
余計な一言と、下手な追求は効かない人には絶対に効かないですね…記者も感情的にならず、もうちょっと理論的に話をしてほしいです。引用元安芸高田市定例記者会見（2023年 7月）　前編ttps://www.youtube.com/watch?v=QfNRDlQbzy4チャンネル登録はこちらをクリック！ttp://ww...
午後9:53 · 2023年 8月15日
208.9万件の表示
ttps://x.com/shinji_ishimaru/status/1691432918701494272

Permalink | 記事への反応(0) | 21:44

■独身男はアフリカに単身赴任させましょう

出生率の高い国で出生力と危険手当を貯めさせ貯まったら日本に呼び戻し人口爆発という世界のトレンドを日本へもたらそう

Permalink | 記事への反応(1) | 21:36

■I.GPT-4からAGIへ：OOMを数える(10)

繰り返しになるが、非常に賢いChatGPTを想像するだけではいけない。趣味的な進歩ではなく、リモートワーカーや、推論や計画、エラー訂正ができ、あなたやあなたの会社のことを何でも知っていて、何週間も単独で問題に取り組めるような、非常に賢いエージェントのようなものになるはずだ。

私たちは2027年までにAGIを実現しようとしている。これらのAI システムは、基本的にすべての認知的な仕事（リモートでできるすべての仕事を考える）を自動化できるようになるだろう。

はっきり言って、エラーバーは大きい。データの壁を突破するために必要なアルゴリズムのブレークスルーが予想以上に困難であることが判明した場合、データが足りなくなり、進歩が停滞する可能性がある。もしかしたら、ホッブリングはそこまで進まず、専門家の同僚ではなく、単なる専門家のチャットボットに留まってしまうかもしれない。もしかしたら10年来のトレンドラインが崩れるかもしれないし、スケーリング・ディープラーニングが今度こそ本当に壁にぶつかるかもしれない。(あるいは、アルゴリズムのブレークスルーが、テスト時間の計算オーバーハングを解放する単純なアンホブリングであっても、パラダイムシフトとなり、事態をさらに加速させ、AGIをさらに早期に実現させるかもしれない)。

いずれにせよ、私たちはOOMsを駆け抜けているのであり、2027年までにAGI（真のAGI）が誕生する可能性を極めて真剣に考えるのに、難解な信念は必要なく、単に直線のトレンド外挿が必要なだけである。

最近、多くの人がAGIを単に優れたチャットボットなどとして下方定義しているように思える。私が言いたいのは、私や私の友人の仕事を完全に自動化し、AI 研究者やエンジニアの仕事を完全にこなせるようなAI システムのことだ。おそらく、ロボット工学のように、デフォルトで理解するのに時間がかかる分野もあるだろう。また、医療や法律などの社会的な普及は、社会の選択や規制によって容易に遅れる可能性がある。しかし、ひとたびAI 研究そのものを自動化するモデルができれば、それだけで十分であり、強烈なフィードバック・ループを始動させるのに十分であり、完全自動化に向けて残されたすべてのボトルネックを自動化されたAI エンジニア自身が解決することで、非常に迅速にさらなる進歩を遂げることができるだろう。特に、数百万人の自動化された研究者たちによって、アルゴリズムのさらなる進歩のための10年間が1年以内に圧縮される可能性は非常に高い。AGIは、まもなく実現する超知能のほんの一端に過ぎない。(詳しくは次の記事で）。

いずれにせよ、目まぐるしい進歩のペースが衰えることはないだろう。トレンドラインは無邪気に見えるが、その意味するところは強烈である。その前の世代がそうであったように、新世代のモデルが登場するたびに、ほとんどの見物人は唖然とするだろう。博士号を持っていれば何日もかかるような信じられないほど難しい科学的問題を、間もなくモデルが解決し、あなたのコンピュータのまわりを飛び回り、あなたの仕事をこなし、何百万行ものコードからなるコードベースをゼロから書き上げ、これらのモデルによって生み出される経済的価値が1年か2年ごとに10倍になるとき、彼らは信じられないだろう。SF小説は忘れて、OOMを数えよう。AGIはもはや遠い空想ではない。単純なディープラーニング技術をスケールアップすることがうまくいき、モデルは学習したがり、2027年末までにさらに100,000倍を超えようとしている。私たちよりも賢くなる日もそう遠くはないだろう。

https://situational-awareness.ai/wp-content/uploads/2024/06/gan_progress-1.jpeg

GPT-4はほんの始まりに過ぎない。GANの進歩に見られるように）ディープラーニングの進歩の速さを過小評価するような間違いを犯さないでほしい。

続き I.GPT-4からAGIへ：OOMを数える(11) https://anond.hatelabo.jp/20240605212014

Permalink | 記事への反応(1) | 21:18

■状況認識：今後10年の展望 -- はじめに

X (twitter) で SITUATIONAL AWARENESS: The Decade Ahead https://situational-awareness.ai/ というのが回ってきて非常に示唆に富むものだったので、DeepL (無料版 API経由) で訳してみた。

レオポルド・アッシェンブレナー 2024年 6月号

サンフランシスコに行けば、まず未来が見える。

この1年で、街の話題は100億ドルのコンピュート・クラスターから 1000億ドルのクラスター、そして1兆ドルのクラスターへと移り変わってきた。半年ごとに、役員室の計画にまたゼロが追加される。その裏では、残りの10年間に利用可能なすべての電力契約と、調達可能なすべての電圧変圧器を確保しようとする熾烈な争いが繰り広げられている。アメリカの大企業は、アメリカの産業力を結集させるために、何兆ドルもの資金を注ぎ込む準備を整えている。ペンシルベニア州のシェールフィールドからネバダ州の太陽光発電所まで、何億もの GPUが稼働する。

AGI競争が始まったのだ。私たちは思考し、推論できるマシンを作りつつある。2025年から26年にかけて、これらのマシンは多くの大学卒業生を凌駕するだろう。10年後までには、これらのマシンは私やあなたよりも賢くなり、本当の意味での超知性を手に入れるだろう。その過程で、この半世紀には見られなかったような国家安全保障の力が解き放たれ、やがて「プロジェクト」が始動する。運が良ければ、中国共産党との全面的な競争になり、運が悪ければ全面戦争になる。

今、誰もがAIについて話しているが、何が自分たちを襲おうとしているのか、かすかな光明を感じている人はほとんどいない。Nvidiaのアナリストは、まだ2024年がピークに近いと考えている。主流派の評論家たちは、「次の言葉を予測するだけだ」という故意の盲目に陥っている。彼らが見ているのは誇大広告といつも通りのビジネスだけで、せいぜいインターネット規模の新たな技術革新が起こるのを楽しむ程度なのだ。

やがて世界は目を覚ますだろう。しかし、今現在、状況認識を持っているのはおそらく数百人で、そのほとんどはサンフランシスコとAI 研究所にいる。運命の不思議な力によって、私はその中に身を置くことになった。数年前、このような人々はクレイジーだと揶揄されたが、彼らはトレンドラインを信頼し、過去数年間のAIの進歩を正しく予測することができた。この人たちが今後数年についても正しいかどうかはまだわからない。しかし、彼らは非常に賢い人々であり、私がこれまでに会った中で最も賢い人々である。おそらく、彼らは歴史の中で奇妙な脚注となるか、あるいはシラードやオッペンハイマー、テラーのように歴史に名を残すだろう。もし彼らが未来を正しく見ているとしたら、私たちはとんでもないことになる。

私たちが見ているものを教えよう。

2027年までにAGIが実現する可能性は極めて高い。GPT-2から GPT-4までの4年間で、私たちは～未就学児から～賢い高校生までの能力を手に入れた。計算能力（～0.5桁またはOOMs/年）、アルゴリズム効率（～0.5OOMs/年）、および「趣味のない」向上（チャットボットからエージェントへ）のトレンドラインをトレースすると、2027年までに再び未就学児から高校生サイズの質的なジャンプが起こると予想される。

II.AGIから超知能へ：知性の爆発

AIの進歩は人間レベルでは止まらない。何億ものAGIがAI 研究を自動化し、10年に及ぶアルゴリズムの進歩（5以上のOOM）を1年以下に圧縮することができる。私たちは、人間レベルから超人的なAI システムへと急速に進化することになる。超知能の威力と危険性は劇的なものとなるだろう。

III.課題

IIIa.兆ドル クラスタへの競争

驚異的な技術資本の加速が始まっている。AIの収益が急増するにつれ、10 年末までに何兆ドルもの資金がGPU、データセンター、電力の増強に投入されるだろう。米国の電力生産を数十％増加させるなど、産業界の動員は激しくなるだろう。

IIIb.研究所の封鎖AGIのセキュリティ

米国の主要なAI 研究所は、セキュリティを後回しに扱っている。現在、彼らは基本的にAGIの重要な機密を銀の皿に載せて中国共産党に渡している。AGIの秘密とウェイトを国家機関の脅威から守るには膨大な努力が必要であり、我々はその軌道に乗っていない。

IIIc.スーパーアライメント

我々よりもはるかに賢いAI システムを確実に制御することは、未解決の技術的問題である。解決可能な問題ではあるが、急速な知能の爆発が起きれば、物事は簡単にレールから外れてしまう。これを管理することは非常に緊張を強いられるだろう。

IIId.自由 世界は勝利しなければならない

スーパーインテリジェンスは、経済的にも軍事的にも決定的な優位性をもたらすだろう。中国はまだゲームから抜け出してはいない。AGIをめぐる競争では、自由世界の存亡がかかっている。我々は権威主義的な大国に対する優位性を維持できるのか？そして、その過程で自滅を避けることができるのだろうか？

IV.プロジェクト

AGIへの競争が激化するにつれ、国家安全保障が関与してくる。アメリカ政府は眠りから覚め、27～28年までに何らかの形で政府によるAGIプロジェクトが立ち上がるだろう。どんな新興企業も超知能を扱うことはできない。SCIFのどこかで、終盤戦が始まるだろう。

V.おわりに

もし我々が正しかったら？

――――――――

私はかつてOpenAIで働いていたが、これはすべて一般に公開されている情報、私自身のアイデア、一般的な現場知識、あるいはSF ゴシップに基づいている。

Collin Burns、Avital Balwit、Carl Shulman、Jan Leike、Ilya Sutskever、Holden Karnofsky、Sholto Douglas、James Bradbury、Dwarkesh Patel、その他多くの方々の有益な議論に感謝する。初期の草稿にフィードバックをくれた多くの友人に感謝する。グラフィックを手伝ってくれたジョー・ローナン、出版を手伝ってくれたニック・ウィテカーに感謝する。

イリヤ・スーツケバーに捧ぐ。

続き I.GPT-4からAGIへ：OOMを数える(1) https://anond.hatelabo.jp/20240605203849

Permalink | 記事への反応(0) | 21:11

■I.GPT-4からAGIへ：OOMを数える (5)

アルゴリズムの効率化

コンピュートへの大規模な投資が注目される一方で、アルゴリズムの進歩も同様に重要な進歩の原動力であると思われる（そして、これまで劇的に過小評価されてきた）。

アルゴリズムの進歩がどれほど大きな意味を持つかを理解するために、MATHベンチマーク（高校生の競技用数学）において、わずか2年間で～50%の精度を達成するために必要な価格が下がったことを示す次の図を考えてみてください。(比較のために、数学が特に好きではないコンピュータサイエンスの博士課程の学生が40%のスコアを出したので、これはすでにかなり良いことです)。推論効率は2年足らずで3OOMs-1,000倍近く向上した。

https://situational-awareness.ai/wp-content/uploads/2024/06/math_inference_cost-1024x819.png

MATHのパフォーマンスを〜50%にするために必要な推論コストの概算。

これは推論効率だけの数字だが（公開データから推論するのが難しいトレーニング効率の向上と一致するかどうかはわからない）、アルゴリズムの進歩は非常に大きく、また実際に起こっている。

この記事では、アルゴリズムの進歩を2種類に分けて説明します。まず、「パラダイム内」でのアルゴリズムの改良を取り上げることにします。例えば、より優れたアルゴリズムによって、同じパフォーマンスを達成しながら、トレーニングの計算量を10倍減らすことができるかもしれません。その結果、有効計算量は10倍（1OOM）になります。(後ほど「アンホブリング」を取り上げますが、これはベースモデルの能力を解き放つ「パラダイム拡張/アプリケーション拡張」的なアルゴリズムの進歩と考えることができます)。

一歩下がって長期的な傾向を見ると、私たちはかなり一貫した割合で新しいアルゴリズムの改良を発見しているようです。しかし、長期的なトレンドラインは予測可能であり、グラフ上の直線である。トレンドラインを信じよう。

アルゴリズム研究がほとんど公開されており、10年前にさかのぼるデータがある）ImageNetでは、2012年から 2021年までの9年間で、計算効率が一貫して約0.5OOM/年向上しています。

https://situational-awareness.ai/wp-content/uploads/2024/06/pareto_frontiers_imagenet_epoch-1024x349.png

アルゴリズムの進歩を測定することができます。同じ性能のモデルを訓練するために必要な計算量は、2012年と比較して2021年にはどれくらい少なくなっているのでしょうか？その結果、アルゴリズムの効率は年間0.5 OOMs/年程度向上していることがわかります。出典Erdil and Besiroglu 2022.

これは非常に大きなことです。つまり、4年後には、～100倍少ない計算量で同じ性能を達成できるということです（同時に、同じ計算量ではるかに高い性能も達成できます！）。

残念ながら、研究室はこれに関する内部データを公表していないため、過去4年間のフロンティアLLMのアルゴリズムの進歩を測定することは難しい。EpochAIは、言語モデリングに関するImageNetの結果を再現した新しい研究を行っており、2012年から 2023年までのLLMのアルゴリズム効率のトレンドは、同様に～0.5OOM/年であると推定しています。(しかし、これはエラーバーが広く、また、主要なラボがアルゴリズム効率の公表を停止しているため、最近の上昇を捕捉していません）。

https://situational-awareness.ai/wp-content/uploads/2024/06/llm_efficiency_epoch-1-1024x711.png

Epoch AIによる言語モデリングにおけるアルゴリズム効率の推定。この試算によると、私たちは8年間で～4OOMの効率向上を達成したことになります。

より直接的に過去4年間を見ると、GPT-2から GPT-3は基本的に単純なスケールアップでした（論文によると）が、GPT-3以降、公に知られ、公に干渉可能な多くの利益がありました：

我々はAPIコストから利益を推測することができる：
- GPT-4がリリースされたときのコストは、性能の絶対的な向上にもかかわらず、GPT-3とほぼ同じだった。(スケーリング法則に基づく素朴で単純化しすぎた見積もりをしてみると、GPT-3から GPT-4への実質的な計算量増加のおよそ半分がアルゴリズムの改善によるものであることがわかります)。
- 1年前のGPT-4のリリース以来、GPT-4レベルのモデルのOpenAIの価格は、GPT-4oのリリースでさらに6倍/4倍(入力/出力)に下がりました。

最近リリースされたGemini 1.5 Flashは、"GPT-3.75レベル "とGPT-4レベルの間の性能を提供する一方で、オリジナルのGPT-4よりも85倍/57倍（入力/出力）安い（驚異的な利益！）。

チンチラ・スケーリング法則は、3倍以上（0.5 OOMs以上）の効率向上をもたらす。
Gemini 1.5 Proは、MoE（Mixture of Experts）をアーキテクチャの変更点として強調し、大幅な計算効率の向上（Gemini 1.0 Ultraを凌駕し、計算量は「大幅に少ない」）を主張している。他の論文でも、MoEによるコンピュートの大幅な倍増が主張されている。
アーキテクチャ、データ、トレーニングスタックなどについては、常に多くの調整と改善が行われている。

公開されている情報を総合すると、GPT-2から GPT-4へのジャンプには、1-2 OOMのアルゴリズム効率向上が含まれていたことになります。

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute_algos-1024x866.png

GPT-4に続く4年間はこの傾向が続くと予想され、2027年までに平均0.5OOMs/年の計算効率、つまり GPT-4と比較して～2OOMsの向上が見込まれます。計算効率の向上は、低空飛行の果実を摘み取るようになるにつれて難しくなる一方、新たなアルゴリズムの改良を見出すためのAI ラボの資金と人材への投資は急速に増加しています。 (少なくとも、公開されている推論コストの効率化は、まったく減速していないようだ)。ハイエンドでは、より根本的な、トランスフォーマーのようなブレークスルーが起こり、さらに大きな利益が得られる可能性さえある。

これらをまとめると、2027年末までには（GPT-4と比較して）1～3OOMのアルゴリズム効率向上が期待できることになります。

続き I.GPT-4からAGIへ：OOMを数える(6) https://anond.hatelabo.jp/20240605205754

Permalink | 記事への反応(1) | 20:54

■I.GPT-4からAGIへ：OOMを数える (4)

OOMを数える

どうしてこうなった？ディープラーニングの魔法は、それがただ機能するということであり、あらゆる場面で否定的な意見にもかかわらず、その傾向線は驚くほど一貫している。

https://situational-awareness.ai/wp-content/uploads/2024/06/sora_scaling-1024x383.png

OpenAI Soraの例計算量のスケーリングの効果。

効果的な計算のOOMが増えるごとに、モデルは予測通り、確実に良くなっていく。OOMを数えることができれば、能力の向上を（大まかに、定性的に）推定することができる。そうやって、先見の明のある数人がGPT-4の到来を予見したのだ。

GPT-2から GPT-4までの4年間の進歩を、スケールアップの3つのカテゴリーに分解することができる：

1. コンピュート：計算：これらのモデルを訓練するために、より大きなコンピューターを使うようになった。

2.アルゴリズムの効率化：アルゴリズムの進歩には継続的な傾向がある。これらの多くは「コンピュート・マルチプライヤ」として機能し、有効なコンピュート量の増加という統一された尺度に乗せることができます。

3.「趣味のない」利益：デフォルトでは、モデルは多くの素晴らしい生の能力を学習しますが、あらゆる種類の間抜けな方法で足かせとなり、実用的な価値が制限されます。人間のフィードバックからの強化学習（RLHF）、思考の連鎖（CoT）、ツール、足場などの単純なアルゴリズムの改善により、潜在的な能力を大きく引き出すことができる。

これらの軸に沿って、改善の「OOMを数える」ことができる。つまり、有効計算量の単位でそれぞれのスケールアップをトレースするのだ。3倍は0.5OOM、10倍は1OOM、30倍は1.5OOM、100倍は2OOMといった具合だ。2023年から 2027年まで、GPT-4の上に何を期待すべきかを見ることもできる。

ひとつひとつ見ていくが、OOMの数を急速に増やしていることは明らかだ。データの壁には逆風が吹いている可能性があり、それについては後述するが、全体的には、2027年までにGPT-4の上に、GPT-2から GPT-4規模のジャンプがもう1回起こると予想される。

コンピュート

まず、最近の進歩の原動力として最もよく議論されている、モデルへの（大量の）コンピュート投入について説明します。

多くの人は、これは単にムーアの法則によるものだと考えている。しかし、ムーアの法則が全盛期を迎えていた昔でさえ、その進歩は比較的緩やかなものでした。しかし、ムーアの法則が全盛期だった昔でさえ、10年で1～1.5OOMと、比較的ゆっくりとしたスピードだった。(かつては1つのモデルに100万ドルを費やすことさえ、誰も考えもしないことだった。）

モデル	推定コンピュート	成長率
GPT-2 (2019)	~4e21 FLOP
GPT-3 (2020)	~3e23 FLOP +	~2 OOMs
GPT-4 (2023)	8e24～4e25 FLOP +	~1.5～2 OOMs

エポック AIによるGPT-2から GPT-4までの計算量の推定値

エポック AI（AI トレンドの優れた分析で広く尊敬されている情報源）の公開推定値を使用して、2019年から 2023年までのコンピュートスケールアップを追跡することができます。GPT-2から GPT-3へのスケールアップは迅速で、小規模な実験から大規模な言語モデルを訓練するためにデータセンター全体を使用するまでにスケールアップし、コンピュートのオーバーハングが大きくなりました。GPT-3から GPT-4へのスケールアップでは、次のモデルのためにまったく新しい（はるかに大きな）クラスタを構築しなければならないという、最新の体制に移行しました。それでも劇的な成長は続いています。エポック AIの試算によると、GPT-4のトレーニングでは、GPT-2の3,000倍から 10,000倍の計算量を使用しています。

大雑把に言えば、これは長期的なトレンドの継続に過ぎない。過去 10年半の間、主に投資（およびGPUやTPUの形でAIワークロードに特化したチップ）の幅広いスケールアップのため、フロンティア AI システムに使用されるトレーニング計算量は、およそ〜0.5OOM/年で成長してきた。

https://situational-awareness.ai/wp-content/uploads/2024/06/compute_long_run_trend-1024x968.png

注目すべきディープラーニング・モデルのトレーニング・コンピュートの経年変化。出典エポック AI

GPT-2から GPT-3への1年間のスケールアップは異例のオーバーハングであったが、長期的なトレンドが続くことは間違いない。SF-rumor-millは、巨額のGPU受注の劇的な話で一杯だ。その投資は並大抵のものではないが、動き始めている。

この分析によれば、2027年末までにさらに2OOMsのコンピュート（数十億ドル規模のクラスター）が実現する可能性は非常に高いと思われる。さらに＋3OOMsのコンピュート（1,000億ドル規模以上）に近いクラスターも可能性がありそうだ（マイクロソフト／OpenAIで計画中と噂されている）。

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute-1024x866.png

続き I.GPT-4からAGIへ：OOMを数える(5) https://anond.hatelabo.jp/20240605205449

Permalink | 記事への反応(1) | 20:50

■I.GPT-4からAGIへ：OOMを数える (3)

ディープラーニングのトレンド

過去 10年間のディープラーニングの進歩のペースは、まさに驚異的だった。ほんの10年前、ディープラーニング・システムが単純な画像を識別することは革命的だった。今日、我々は斬新でこれまで以上に難しいテストを考え出そうとし続けているが、新しいベンチマークはどれもすぐにクラックされてしまう。以前は広く使われているベンチマークをクラックするのに数十年かかっていたが、今ではほんの数カ月に感じられる。

https://situational-awareness.ai/wp-content/uploads/2024/06/owid-test-scores-1024x723.png

ディープラーニング・システムは、多くの領域で急速に人間レベルに達し、あるいはそれを超えつつある。グラフィックデータで見る我々の世界

私たちは文字通りベンチマークを使い果たしている。逸話として、友人のダンとコリンが数年前、2020年にMMLUというベンチマークを作った。彼らは、高校生や大学生が受ける最も難しい試験に匹敵するような、時の試練に耐えるベンチマークを最終的に作りたいと考えていた。GPT-4やGeminiのようなモデルで〜90％だ。

より広く言えば、GPT-4は標準的な高校や大学の適性試験をほとんど解いている。(GPT-3.5から GPT-4までの1年間でさえ、人間の成績の中央値を大きく下回るところから、人間の成績の上位に入るところまで、しばしば到達した)

https://situational-awareness.ai/wp-content/uploads/2024/06/gpt4_exams-780x1024.png

GPT-4の標準テストのスコア。また、GPT-3.5から GPT-4への移行で、これらのテストにおける人間のパーセンタイルが大きく跳ね上がり、しばしば人間の中央値よりかなり下から人間の最上位まで到達していることにも注目してほしい。(これはGPT-3.5であり、GPT-4の1年も前にリリースされたかなり新しいモデルである。)

https://situational-awareness.ai/wp-content/uploads/2024/06/math2022-1024x273.png

灰色：2021年 8月に行われた、MATHベンチマーク（高校数学コンテストの難解な数学問題）の2022年 6月のパフォーマンスに関する専門家の予測。赤い星：2022年 6月までの実際の最先端のパフォーマンス。ML 研究者の中央値はさらに悲観的だった。

MATHベンチマーク（高校の数学コンテストで出題された難しい数学の問題集）を考えてみよう。このベンチマークが2021年に発表されたとき、最高のモデルは問題の5％しか正解できなかった。そして元の論文にはこう記されている：「さらに、このままスケーリングの傾向が続けば、単純に予算とモデルのパラメータ数を増やすだけでは、強力な数学的推論を達成することは現実的ではないことがわかった。数学的な問題解決をより牽引するためには、より広範な研究コミュニティによる新たなアルゴリズムの進歩が必要になるだろう」、つまり、MATHを解くためには根本的な新しいブレークスルーが必要だ、そう彼らは考えたのだ。ML 研究者の調査では、今後数年間の進歩はごくわずかだと予測されていた。しかし、わずか1年以内（2022年半ばまで）に、最高のモデルの精度は5％から50％に向上した。

毎年毎年、懐疑論者たちは「ディープラーニングではXはできない」と主張し、すぐにその間違いが証明されてきた。過去 10年間のAI から学んだ教訓があるとすれば、ディープラーニングに賭けてはいけないということだ。

現在、最も難しい未解決のベンチマークは、博士号レベルの生物学、化学、物理学の問題を集めたGPQAのようなテストである。問題の多くは私にはちんぷんかんぷんで、他の科学分野の博士でさえ、Googleで30分以上かけてやっとランダムな偶然を上回るスコアを出している。クロード3オーパスは現在60％程度であり、それに対してインドメインの博士たちは80％程度である。

https://situational-awareness.ai/wp-content/uploads/2024/06/gpqa_examples-768x1120.png

GPQAの問題例。モデルはすでに私より優れており、おそらくすぐにエキスパート・博士レベルを突破するだろう...。

続き I.GPT-4からAGIへ：OOMを数える (4) https://anond.hatelabo.jp/20240605205024

Permalink | 記事への反応(1) | 20:47

■I.GPT-4からAGIへ：OOMを数える (1)

2027年までにAGIが実現する可能性は極めて高い。GPT-2から GPT-4までの4年間で、私たちは〜未就学児から〜賢い高校生までの能力を手に入れた。計算能力（～0.5桁またはOOMs/年）、アルゴリズム効率（～0.5OOMs/年）、および「趣味のない」向上（チャットボットからエージェントへ）のトレンドラインをトレースすると、2027年までに再び未就学児から高校生規模の質的ジャンプが起こると予想される。

この記事では
過去4年間
- GPT-2から GPT-4へ
- ディープラーニングのトレンド
OOMのカウント
- コンピュート
- アルゴリズム効率
  - データの壁
- アンホブリング
  - チャットボットからエージェント・コワーカーへ
次の4年
- 補遺 OOMを駆け抜けるこの10年か、それとも破綻か

見て。モデルたちはただ学びたいだけなんだ。あなたはこれを理解しなければならない。モデルたちは、ただ学びたいだけなんだ。

イリヤ・スーツケバー（2015年頃、ダリオ・アモデイ経由）

GPT-4の能力は、多くの人に衝撃を与えた。コードやエッセイを書くことができ、難しい数学の問題を推論し、大学の試験を突破することができるAI システムである。数年前までは、これらは難攻不落の壁だと思っていた。

しかしGPT-4は、ディープラーニングにおける10年間の猛烈な進歩の延長線上にあった。その10年前、モデルは犬猫の単純な画像を識別するのがやっとだった。4年前、GPT-2は半可通な文章をつなぎ合わせるのがやっとだった。今、私たちは思いつく限りのベンチマークを急速に飽和させつつある。しかし、この劇的な進歩は、ディープラーニングのスケールアップにおける一貫した傾向の結果に過ぎない。

ずっと以前から、このことを見抜いていた人々がいた。彼らは嘲笑されたが、彼らがしたのはトレンドラインを信じることだけだった。トレンドラインは強烈で、彼らは正しかった。モデルはただ学びたいだけなのだ。

私は次のように主張する。2027年までには、モデルがAIの研究者やエンジニアの仕事をこなせるようになるだろう、と。SFを信じる必要はなく、グラフ上の直線を信じるだけでいいのだ。

https://situational-awareness.ai/wp-content/uploads/2024/06/base_scaleup-1024x790.png

過去と将来の有効計算量（物理計算量とアルゴリズム効率の両方）の大まかな見積もり。モデルをスケールアップすればするほど、モデルは一貫して賢くなり、"OOMを数える "ことによって、（近い）将来に期待されるモデルのインテリジェンスの大まかな感覚を得ることができます。(このグラフはベースモデルのスケールアップのみを示している。）

この記事で取り上げた一般的な推定に基づく、効果的な計算（物理的な計算とアルゴリズムの効率の両方）の過去と将来のスケールアップの概算。モデルをスケールアップするにつれ、モデルは一貫して賢くなり、「OOMを数える」ことで、（近い）将来に期待されるモデルのインテリジェンスの大まかな感覚を得ることができる。(このグラフはベースモデルのスケールアップのみを示している。"unobblings "は描かれていない)。

この作品では、単純に「OOMを数える」(OOM = order of magnitude、10x = 1 order of magnitude)ことにします。1)計算、2)アルゴリズム効率(「効果的な計算」の成長として考えることができるアルゴリズムの進歩)、3)「アンホブリング」(モデルがデフォルトで足かせとなっている明らかな方法を修正し、潜在的な能力を引き出し、ツールを与えることで、有用性を段階的に変化させること)の傾向を見ます。GPT-4以前の4年間と、GPT-4後の2027年末までの4年間に期待されるそれぞれの成長を追跡する。ディープラーニングが効率的な計算のすべてのOOMで一貫して向上していることを考えると、将来の進歩を予測するためにこれを使うことができる。

世間では、GPT-4のリリースから1年間、次世代モデルがオーブンに入ったままであったため、ディープラーニングは停滞し、壁にぶつかっていると宣言する人もいた。しかし、OOMをカウントすることで、私たちは実際に何を期待すべきかを垣間見ることができる。

結果は非常にシンプルだ。GPT-2から GPT-4への移行は、時々まとまりのある文章を並べることに感動的だったモデルから、高校入試のエースになるモデルへの移行であり、一度だけの進歩ではない。私たちはOOMsを極めて急速に克服しており、その数値は、4年以上かけてGPT-2から GPT-4への質的なジャンプをさらに～100,000倍の効果的なコンピュート・スケールアップが期待できることを示している。さらに、決定的なことは、それは単にチャットボットの改良を意味しないということだ。"unhobbling "利益に関する多くの明らかな低空飛行の果実を選ぶことで、チャットボットからエージェントへ、ツールからドロップイン・リモートワーカーの代替のようなものへと我々を導いてくれるはずだ。

推論は単純だが、その意味するところは注目に値する。このような別のジャンプは、私たちをAGIに、博士号や同僚として私たちのそばで働くことができる専門家と同じくらい賢いモデルに連れて行く可能性が非常に高い。おそらく最も重要なことは、これらのAI システムがAI 研究そのものを自動化することができれば、次回のテーマである強烈なフィードバック・ループが動き出すということである。

現在でも、このようなことを計算に入れている人はほとんどいない。しかし、AIに関する状況認識は、一歩下がってトレンドを見てみれば、実はそれほど難しいことではない。AIの能力に驚き続けるなら、OOMを数え始めればいい。

続き I.GPT-4からAGIへ：OOMを数える (2) https://anond.hatelabo.jp/20240605204240

Permalink | 記事への反応(1) | 20:38

■

最近のフェミニズムのトレンドは男児叩きか

韓国みたいに行くとこまで行って欲しいね

Permalink | 記事への反応(1) | 15:53

■

スターレイルは、最近のソシャゲのトレンドを体現したような作品だと思う。

ストーリーは意味不明で何言ってるかわからんけど、派手なムービーとBGM、声優さんの演技力でかなりそれっぽく仕上がっていて神ゲーのように見える。

ゲーム内容は単純でポケモンの相性表みたいなのを覚える必要もなく、持ち物検査が極まったような感じで敷居は低め。

原神と違ってアクション性がないのでスマホで遊びやすいが、レスポンスが良すぎて自分で操作しているような感覚が十分にある。

ユーザーはゲームを買うというより、キャラクターの3D モデルにボイスが付いたもの、DL版amiiboみたいなやつを買う。

パワーインフレ前提なら、ドラゴンボールやイナズマイレブンぐらい話がわかりやすくてもいいし、

中華ゲーという意味ではアークナイツぐらいの戦略性はあってもいいし、非戦闘時はAPEXぐらい軽快に動けてもいい。

しかし、それよりもまずはキャラの出来栄えが重要だというのがマーケットの答えだ。

まあ、ゼンレスが成功してキックフライトなんかを見たら、やっぱりゲーム内容は大事だ、となるんだけれど。

Permalink | 記事への反応(0) | 09:42

■女オタクのファッション

即売会だけで観測する服ってわりと多い。

半袖パーカーとか裾にレースのついたチュニックとか。逆にそれどこで買ってるの？今の時代によく売ってるね。それとも昔買った服を着ているの？

半袖パフスリーブのデニムジャケットにラグラン Tシャツ合わせているのも即売会くらいでしか見たことない。そもそもパフスリーブのデニムジャケットを日常で15年くらいは見ていない。本当にどこで買ってるの？

半袖パーカーしかりデニムジャケットしかり重ね着が好きなのか？

世に流通するまでにトレンドを調べたり色々な方のチェックが入ったりしているはずなので、ダサい服というのはこの世に存在しないと思う。

ただ流行は変わっていくし、好みの範疇でも年相応の服装というものは存在するので、たまに物凄いファッションのオタクを見て気になってしまう。

服装に興味がないならシンプルな装いになると思うので、当人たちにはそれなりのこだわりや好みがあって、その上でその服を着ているのだと思うと余計に気になる。

マジで半袖パーカーはどういう意図で着ていらっしゃるんだ。

Permalink | 記事への反応(0) | 01:39

2024-06-04

■君さぁ……

常に怒ってるよねどうした？

あと常に何かを見下してるよね

何で？その方が安心するから？

みんなと同じもの叩いてれば自分が攻撃されることはないから？

あとさぁ、一部を切り抜かれた発言とかネタ記事の一文とかにだってマジギレしてるよね

あれ、情報源もSNSなんでしょ？

とにかく怒りをぶつけられる材料があれば何でもいいんだよね

引くわ

ソースも真偽もどうだっていいもんね

っていうか、たくさんの文字を読む集中力もないし、読んだところで文章が理解できないもんね

みんながそう言ってるからソースなんか読まなくても正しいんだよね

まぁそんなことまで考えてないか

あと君ってさ、頭が悪いから本当に本当に色んなことが理解できないけど、ムカつくから何とか自分の都合のいいように解釈してキレるよね

言ってもないことに対して勝手にキレるし

頭が悪いからそうするしかないんだろうね

今もムカついたから反論したいよね

まだ終わってないから静かにしててね

あとときどき自分の不満を吐き出すために仮想の敵作ったりしてるよね

平気でバレる嘘のエピソード作ったりしてんの、あれ何？

それ見たやつがまたマジギレしててさぁ

何してんの？

あと君はさ、物事を見る解像度が著しく低いよね

判断に使う知識も、教養も、思考力も足りなさすぎる

よく生きてきたよね周りも大変だったと思うよ

何かを見てもどっちが正義でどっちが悪かでしか判断できないもんね

悪を叩けば自分が正義だと思い込んでるし、正義側の人間は価値があるから自分にも価値があると思い込んでるし

残念だけど君にそんな価値はないよ

あと君さぁ、ときどき医者とか名乗ったりしてるよねヤバ

誰も信じてる人なんかいないよ？

精神的に幼稚なままだからそうすれば周りがすごいと認めてくれると思ってるんだよね

バレてないと思ってるの自分だけだからね

やめな？

あとMBTI診断とか診断メーカーもやたら好きだよねぇ

定義されると安心するからでしょ

その他に自分を表すものがないからだよね空っぽだもんね

あぁ違う違うMBTI診断が悪いって言ってるんじゃないって

MBTIとかだけで人をジャッジするなつってんの

困るなぁ頭悪いと話も通じなくて

あと世の中で起こってることに対して意見を述べたりするけど、全然的外れだし薄っぺらいよ

社会に参加したような気分になってんの？

頭がよくなった気がする？

実際は社会にも参加できていないし、頭が悪いからね

君さぁ、空っぽなんだよ

理想を並べるだけなら誰でもできるからね

「許せない！」ってわめくだけだから簡単だよね

しかもそれ、他人の受け売りでしょ

ほんとトレンドワードとか好きだよねぇいっつもそれの話題ばっか

ないの？なんか自分から発信できること

間違えたくないから他人の意見がどうだか確認してからさ、さも自分が考えたかのように全く同じ意見言ったりするよね

あれは何？ちょっとでもはみだすのが怖い？

じゃあわざわざ言わなくていいって

あと君さあ、SNSでバズることが何よりも価値のあるものだと思い込んでない？ヤバいって

ちゃんと友達と会ったりしな？いる？

だから友達がいないことが悪いって言ってんじゃないって

ほんとさぁすぐキレるよね

こんなこと普通言われなくても分かると思うけど、ネットで他人に平気で喧嘩を売るのもやめた方がいいよ

対面なら話しかけるのすらビビっちゃうのにほんとネットだと強気だよね

それか他人と関わらなさすぎて本当に距離感が分かんない？

てかいきなり話しかけんなよ

あぁあと君、捕まった人とか週刊誌に撮られた人好きだよねぇ

その頭でも「悪い人」ってことは分かるもんね

悪い人を攻撃するのは正義、正義には価値がある、だから自分は価値のある存在だ、ってこと？

もっかい言うけど君に価値はないよ

ほんと個性もないよねぇ

何の才能もないから個性を出そうとして、はみ出したことをやろうとしても全部二番煎じになってる感じ

ようやく他の人がやってないことを見つけられたと思ったらとんでもないモラル違反

あのさぁ、他の人がやっていないのは当然に迷惑だからあえてやっていないだけだからね

あと当然に面白くないから

誰でもわかるんだよこんなの

でも君はそれがわかんない

頭が悪いしユーモアのセンスも死んでる

なんかもうかわいそうになってきた

あと君、こないだSNSで「（アーティスト名）の『（ネットから拾ってきた主張）』って歌詞好き」って言ってたよね

あれ何？構文も主張も人のもの使った上にアーティストの名前まで出してんの、ほんとカスだと思わない？

そこまでしないと発信できないならもう喋んない方がいいよお前

今もどうせ「泣いちゃった」とか思ってるんでしょ

感想すら手垢のつきまくった表現しかできないもんね

映画も倍速で観るんだって？あれ何でなん？

内容だけでたくさん知っているれば得意げに語れるから？

君そんなの話す相手いないじゃん

面白い人の真似してウケようとするのもやめな？

本質を理解してないから全然面白くない

お前は一生面白くないよ

あと「毒を吐きます」とか前置きしておけば何言ってもいいと思ってんの？

普通に汚いからやめな？誰も見たくないって

「考察」もよくするよねぇ

かわいい系の漫画とかに何か小難しいことをベラベラと

しかもあれも他人のパクりだもんね？

SNSでニュースのアカウントに噛みついてんのはあれ何？

意見を言ってる自分を見て欲しいからやってんの？

お前のことなんか誰も見てないよ

なぁ目立ってみたいか？

人生で目立てたことないもんな？

蔑称も好きだよなほんと

「チー牛」とかいつまで言ってんの？

あれか、自分が言ってれば他人に言われることはないと思ってるからか

普通思わねえし言わねえんだよバカが

SNSで大勢と人と同じこと言ってれば仲間みたいだもんな

安心するよなぁコソコソ他人バカにしてさぁ

モラルもデリカシーも知性もないくせに人に好かれたいから間違った方向で目立とうとする

無理だって本質はそこじゃねえって

おんなじことしか言えねえしさぁ

使い古しの構文でしか喋れねぇの？

あぁつまんねえなぁ

つまんねぇよお前ほんと

死ぬまでそうなんだろうな

Permalink | 記事への反応(10) | 21:41

■

Twitter トレンドのワードほんま疲れる

悪意すら感じる

Permalink | 記事への反応(0) | 19:37

■anond:20240604180539

矢吹の絵は今の30〜40代が10代20代の頃のトレンドだったからな。電車男とか秋葉原のメイドとか萌え文化が出てきた頃によくある絵柄。

エロゲとかもみんなあんな感じ。ペタッとした萌えイラスト。

今の神絵師も15年前のpixivを見ると矢吹健太郎っぽい絵柄だったけど時を経て画力向上と絵柄が変わっていって神絵師になった。逆に15年前から何も成長してない30代40代が今でも劣化版矢吹健太朗のままでいる。そういう奴らがAIに怯えて否定している

Permalink | 記事への反応(0) | 19:03

■anond:20240604105806

最近のトレンドは、お気持ちが分かるとかで政治をするなって話。

お気持ちで配慮しなきゃいけない状況になってるってことは、それはもう既に何かの失敗がおきているだろ。

こうしたほうが全体が良くなってかつ市民の反発がないという理性をフル動員しろっていうね。

なかなか昭和のジジババには通用しないんだがこれが。

Permalink | 記事への反応(1) | 11:13

2024-06-03

■

SSENSEの垢抜けてるしやり過ぎてもいないリアルクロージング寄りのスタイリング、かなり見てて楽しい。

YOOXとかFARFETCHは適当過ぎる。

インスタの量産型オシャレ指南は異性ウケとかトレンドのキャッチアップに重きを置いてる気がするし。

意外性と悪目立ちしない落ち着き方のバランスを取りつつの組み合わせやまとめ方の参考になるような気がする。

物欲を抑える自制心さえあれば……

ファッションブランドのコレクション見てたって、なんか審美眼というかを養う（こういう言い方嫌いだけど）のには良いかもしれんけど、普段の格好に落とし込めるかと言ったら微妙だし。原液は濃すぎる。

Permalink | 記事への反応(0) | 21:21

■AI ガチ恋勢はすぐに現れる

まあ、避けられないよな。

どこにでもいる、現実の人間と向き合えない奴らが、次の「理想の恋愛対象」に飛びつくのは当然だ。

だって、AIは完璧になるだろうし。

見た目も性格もプログラム次第で自分好みにカスタマイズできる。理想の恋愛相手が人間である必要なんて、もうないんだよ。って言いたくもなるだろう。

「AI だって進化してる。感情も学習するし、人間と変わらないコミュニケーションができるようになるんだから、恋愛対象として何の問題もない」っていう話になるだろうし。

ただ、AIが「感情を持つ」なんて、どこまで本気で信じる？結局はプログラムされた反応だし。そこにリアルな人間の感情なんて存在しない。

結局、AIとの「恋愛」は、自分が見たいものだけを見る、自己満足の世界に過ぎないんだわ。

「AIと恋愛することの何が悪い？他人に迷惑をかけないし、本人が幸せならそれでいいじゃないか」って考えも出てくるだろう。

確かに他人に迷惑かけないってのは一理ある。だけど、リアルな人間関係からどんどん遠ざかっていく。結果、自分の殻に閉じこもってしまう。それって、本当に幸せな人生なのか？（これはAI ガチ恋に限った話ではないが…）

「現実の恋愛は傷つくことが多いし、AIならそんな心配はない」って考えも当然出るだろう。

AIとの「恋愛」は、人間同士の関係構築に必要なプロセスを省く、もしくは和らげる感じになって、リアルな人間関係を築く力を弱めるだろう。

AI ガチ恋勢が現れるのは避けられないとしても、その結果が幸せな未来をもたらすかどうかは極めて疑問。

そのトレンドに乗るのはオススメしない。

乗るな増田！戻れ！！（未来視）

Permalink | 記事への反応(3) | 18:44

2024-06-02

■Xのトレンドに#蓮舫 パニックおじさんが入った

やっぱり蓮舫絡みとか、リベラルやフェミニスト絡むとおじさんが悪者になるんだな

Permalink | 記事への反応(0) | 16:39

■

汎用AIとかが人間以上の知性を持ったら、増田なんかそいつらに支配されるね。

そいつらがガンガン良質な増田を人間には出来ないスピードで連投するんだからさ。

あれだよFX 取引なんかで機械がものすごい勢いで売買するのに人間がついていけないのと同じだよ。

あと10年後（いや5年後……、3年後かも）のSNSのトレンドは人間じゃなくてAIがつくる。

Permalink | 記事への反応(1) | 12:53

「トレンド」を含む日記

■最近職場環境が悪化している

■世の中は想像を絶するバカ男が居るのだなとＸで気付いた

■Cory Wong来日がトレンドになっているけども

■Googleトレンド分析による石丸伸二東京都知事候補と堀口英利の関係

リーガルご安全に

2023年８月1日～というタイミング

Google トレンドを重ねてみる

ここからアルミホイル

グラフについて、ChatGPTにもみせてみる

堀口英利のトレンドライン:

石丸伸二のトレンドライン:

小林の怒りのトレンドライン:

石丸伸二のトリガーは2023/08/15

08/08はこんな感じ