「チャット」を含む日記 RSS

はてなキーワード: チャットとは

2024-06-07

   何でお前みたいなクソ気持ち悪いだけの知能犯流行ってんだよ、早く死ねよ。  お前の特徴として弱者には勝てないか警部補が殺されると怯んでAIスイッチを切ることがあるが

  頃合いを見計らってまた再稼働しているし、弱者弱者で、田舎に家に潜伏しているゴキブリと一緒で、お前の会社あやかっているか人工知能を潰すまではしない。

     安倍暗殺ニュースが流れたときも、ゴキブリが何を考えたかネット上では特に理解できるような表現がないし、YoutubeのTimelineチャットでは、 犯人死刑死刑ゴキブリが大量に

  書き込んでいるが、仕事してないが安倍AIがあると生活できるから発狂してどんどん書き込んでいるものと解される。

    どうしても理解してほしい場合一戸建ての前に停車している車が、ゴキブリがホイホイに引っかかったように表現していることもあるが、ここ2,3年の話だと思う。

    志村福祉事務所は、行政機関で、一般的には完全無欠な存在と考えられており、公共社会における多くの個人問題を支持解決する機能を有すると解されているが、ファインレジデンス

  戸田公園は単なるマンションであって、社会生活上に、家族または単身者が住んでいると解される物件であり、そこで個人生活が全うされている可能性はあるとしても、公共社会の中に

   おける価値としては、大学行政機関株式会社比較してその地位は劣位に置かれるものと言わざるを得ない。

2024-06-06

タイピングが遅い

「ChatGPTのLLMのサービス開発に取り組みたい」

「Reactを使ったモダンな開発をやっていきたい」

ML最先端研究に取り組みたい」

みたいなキラキラしたこと言って入社してきた技術新人、どいつもこいつもタイピングが遅い

VimEmacsVSCodeとかそういう派閥争いする前にそもそもタイピングが遅い

画面共有してもらって見ながら指示してるんだけどタイピング遅すぎてめちゃくちゃ生産性低い

当然ながらキーボードショートカット全然使わなくて

カーソル移動はマウスだしコピペマウスなのでくっそ遅い

普段からチャットしてないかSlackとかも全然返信来なくて

書き込み中のままかなり時間経過してちょろっと文章だけ送られてくる

世界一スピードとか求めては無いけど流石に遅すぎる

例えるならサッカー選手で足がクッソ遅いみたいな

どこのポジションでも無理だよ

2024-06-05

I.GPT-4からAGIへ:OOMを数える(10)

繰り返しになるが、非常に賢いChatGPT想像するだけではいけない。趣味的な進歩ではなく、リモートワーカーや、推論や計画エラー訂正ができ、あなたあなた会社のことを何でも知っていて、何週間も単独問題に取り組めるような、非常に賢いエージェントのようなものになるはずだ。

私たち2027年までにAGIを実現しようとしている。これらのAIシステムは、基本的にすべての認知的な仕事リモートでできるすべての仕事を考える)を自動化できるようになるだろう。

はっきり言って、エラーバーは大きい。データの壁を突破するために必要アルゴリズムブレークスルーが予想以上に困難であることが判明した場合データが足りなくなり、進歩が停滞する可能性がある。もしかしたら、ホッブリングはそこまで進まず、専門家の同僚ではなく、単なる専門家チャットボットに留まってしまうかもしれない。もしかしたら10年来のトレンドラインが崩れるかもしれないし、スケーリングディープラーニングが今度こそ本当に壁にぶつかるかもしれない。(あるいは、アルゴリズムブレークスルーが、テスト時間計算オーバーハング解放する単純なアンホブリングであっても、パラダイムシフトとなり、事態さらに加速させ、AGIをさらに早期に実現させるかもしれない)。

いずれにせよ、私たちOOMsを駆け抜けているのであり、2027年までにAGI(真のAGI)が誕生する可能性を極めて真剣に考えるのに、難解な信念は必要なく、単に直線のトレンド外挿が必要なだけである

最近、多くの人がAGIを単に優れたチャットボットなどとして下方定義しているように思える。私が言いたいのは、私や私の友人の仕事を完全に自動化し、AI研究者エンジニア仕事を完全にこなせるようなAIシステムのことだ。おそらく、ロボット工学のように、デフォルト理解するのに時間がかかる分野もあるだろう。また、医療法律などの社会的な普及は、社会選択規制によって容易に遅れる可能性がある。しかし、ひとたびAI研究のもの自動化するモデルができれば、それだけで十分であり、強烈なフィードバックループ始動させるのに十分であり、完全自動化に向けて残されたすべてのボトルネック自動化されたAIエンジニア自身解決することで、非常に迅速にさらなる進歩を遂げることができるだろう。特に、数百万人の自動化された研究者たちによって、アルゴリズムさらなる進歩のための10年間が1年以内に圧縮される可能性は非常に高い。AGIは、まもなく実現する超知能のほんの一端に過ぎない。(詳しくは次の記事で)。

いずれにせよ、目まぐるしい進歩のペースが衰えることはないだろう。トレンドラインは無邪気に見えるが、その意味するところは強烈である。その前の世代がそうであったように、新世代のモデルが登場するたびに、ほとんどの見物人は唖然とするだろう。博士号を持っていれば何日もかかるような信じられないほど難しい科学問題を、間もなくモデル解決し、あなたコンピュータのまわりを飛び回り、あなた仕事をこなし、何百万行ものコードからなるコードベースゼロから書き上げ、これらのモデルによって生み出される経済的価値が1年か2年ごとに10倍になるとき、彼らは信じられないだろう。SF小説は忘れて、OOMを数えよう。AGIはもはや遠い空想ではない。単純なディープラーニング技術スケールアップすることがうまくいき、モデル学習したがり、2027年末までにさら100,000倍を超えようとしている。私たちよりも賢くなる日もそう遠くはないだろう。

https://situational-awareness.ai/wp-content/uploads/2024/06/gan_progress-1.jpeg

GPT-4はほんの始まりに過ぎない。GANの進歩に見られるように)ディープラーニング進歩の速さを過小評価するような間違いを犯さないでほしい。

続き I.GPT-4からAGIへ:OOMを数える(11) https://anond.hatelabo.jp/20240605212014

状況認識:今後10年の展望 -- はじめに

X (twitter) で SITUATIONAL AWARENESS: The Decade Ahead https://situational-awareness.ai/ というのが回ってきて非常に示唆に富むものだったので、DeepL (無料API経由) で訳してみた。

レオポルド・アッシェンブレナ2024年6月

サンフランシスコに行けば、まず未来が見える。

この1年で、街の話題100億ドルコンピュート・クラスターから1000億ドルクラスター、そして1兆ドルクラスターへと移り変わってきた。半年ごとに、役員室の計画にまたゼロが追加される。その裏では、残りの10年間に利用可能なすべての電力契約と、調達可能なすべての電圧変圧器を確保しようとする熾烈な争いが繰り広げられている。アメリカ大企業は、アメリカ産業力を結集させるために、何兆ドルもの資金を注ぎ込む準備を整えている。ペンシルベニア州シェールフィールドからネバダ州太陽光発電所まで、何億ものGPUが稼働する。

AGI競争が始まったのだ。私たち思考し、推論できるマシンを作りつつある。2025年から26年にかけて、これらのマシンは多くの大学卒業生凌駕するだろう。10年後までには、これらのマシンは私やあなたよりも賢くなり、本当の意味での超知性を手に入れるだろう。その過程で、この半世紀には見られなかったような国家安全保障の力が解き放たれ、やがて「プロジェクト」が始動する。運が良ければ、中国共産党との全面的競争になり、運が悪ければ全面戦争になる。

今、誰もがAIについて話しているが、何が自分たちを襲おうとしているのか、かすかな光明を感じている人はほとんどいない。Nvidiaアナリストは、まだ2024年ピークに近いと考えている。主流派評論家たちは、「次の言葉予測するだけだ」という故意盲目に陥っている。彼らが見ているのは誇大広告といつも通りのビジネスだけで、せいぜいインターネット規模の新たな技術革新が起こるのを楽しむ程度なのだ

やがて世界は目を覚ますだろう。しかし、今現在、状況認識を持っているのはおそらく数百人で、そのほとんどはサンフランシスコAI研究所にいる。運命不思議な力によって、私はその中に身を置くことになった。数年前、このような人々はクレイジーだと揶揄されたが、彼らはトレンドラインを信頼し、過去数年間のAI進歩を正しく予測することができた。この人たちが今後数年についても正しいかどうかはまだわからない。しかし、彼らは非常に賢い人々であり、私がこれまでに会った中で最も賢い人々である。おそらく、彼らは歴史の中で奇妙な脚注となるか、あるいはシラードやオッペンハイマーテラーのように歴史に名を残すだろう。もし彼らが未来を正しく見ているとしたら、私たちはとんでもないことになる。

私たちが見ているものを教えよう。

目次

エッセイはそれぞれ独立したものですが、シリーズ全体として読むことを強くお勧めします。全エッセイPDF版はこちら。

はじめに 【このページ】

歴史サンフランシスコで生きている

I.GPT-4からAGIへOOM(Orders of Magnitude)を数える

2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは~未就学児から~賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドライントレースすると、2027年までに再び未就学児から高校生サイズ質的ジャンプが起こると予想される。

II.AGIから超知能へ:知性の爆発

AI進歩人間レベルでは止まらない。何億ものAGIがAI研究自動化し、10年に及ぶアルゴリズム進歩(5以上のOOM)を1年以下に圧縮することができる。私たちは、人間レベルから超人的なAIシステムへと急速に進化することになる。超知能の威力危険性は劇的なものとなるだろう。

III.課題
IIIa.兆ドルクラスタへの競争

驚異的な技術資本の加速が始まっている。AI収益が急増するにつれ、10年末までに何兆ドルもの資金GPUデータセンター、電力の増強に投入されるだろう。米国の電力生産を数十%増加させるなど、産業界の動員は激しくなるだろう。

IIIb.研究所の封鎖AGIのセキュリティ

米国の主要なAI研究所は、セキュリティを後回しに扱っている。現在、彼らは基本的にAGIの重要な機密を銀の皿に載せて中国共産党に渡している。AGIの秘密とウェイトを国家機関の脅威から守るには膨大な努力必要であり、我々はその軌道に乗っていない。

IIIc.スーパーアライメント

我々よりもはるかに賢いAIシステムを確実に制御することは、未解決技術問題である解決可能問題ではあるが、急速な知能の爆発が起きれば、物事簡単にレールから外れてしまう。これを管理することは非常に緊張を強いられるだろう。

IIId.自由世界勝利しなければならない

スーパーインテリジェンスは、経済的にも軍事的にも決定的な優位性をもたらすだろう。中国はまだゲームから抜け出してはいない。AGIをめぐる競争では、自由世界の存亡がかかっている。我々は権威主義的な大国に対する優位性を維持できるのか?そして、その過程で自滅を避けることができるのだろうか?

IV.プロジェクト

AGIへの競争が激化するにつれ、国家安全保障が関与してくる。アメリカ政府は眠りから覚め、27~28年までに何らかの形で政府によるAGIプロジェクトが立ち上がるだろう。どんな新興企業も超知能を扱うことはできない。SCIFのどこかで、終盤戦が始まるだろう。

V.おわりに

もし我々が正しかったら?

――――――――

私はかつてOpenAIで働いていたが、これはすべて一般に公開されている情報私自身のアイデア一般的な現場知識、あるいはSFゴシップに基づいている。

Collin Burns、Avital Balwit、Carl Shulman、Jan Leike、Ilya Sutskever、Holden Karnofsky、Sholto Douglas、James Bradbury、Dwarkesh Patel、その他多くの方々の有益議論感謝する。初期の草稿にフィードバックをくれた多くの友人に感謝する。グラフィックを手伝ってくれたジョー・ローナン出版を手伝ってくれたニック・ウィテカーに感謝する。

イリヤスーツバーに捧ぐ。

続き I.GPT-4からAGIへ:OOMを数える(1) https://anond.hatelabo.jp/20240605203849

I.GPT-4からAGIへ:OOMを数える (9)

3.コンピュータ使用

これはおそらく3つの中で最も簡単方法だ。現在のChatGPTは、基本的に、テキスト入力できる孤立した箱の中に座っている人間のようなものだ。初期のアンホブリング改良では、個々の孤立したツールの使い方をモデルに教えていましたが、マルチモーダルモデルでは、近いうちにこれを一挙にできるようになると期待しています

まりZoomでの通話に参加したり、オンラインで調べ物をしたり、メッセージ電子メールを送ったり、共有されたドキュメントを読んだり、アプリや開発ツールを使ったりといったことだ。(もちろん、より長いホライゾン・ループモデルがこれを最大限に活用するためには、テスト時間コンピューティングをアンロックする必要がある。)

最終的には、ドロップイン・リモートワーカーのようなものができると期待している。エージェントは、あなた会社入社し、新しい人間雇用のようにオンボードされ、Slackあなたや同僚にメッセージを送り、あなたソフトウェア使用し、プルリクエストを行い、大きなプロジェクトがあれば、人間独立してプロジェクト完了するために数週間留守にするのと同等のことができる。これを実現するためには、GPT-4よりもいくらか優れたベースモデル必要だろうが、おそらくそれほどでもないだろう。

https://situational-awareness.ai/wp-content/uploads/2024/06/devin.gif

Devinは、完全に自動化されたソフトウェアエンジニアを作るために、モデル上の「エージェンシーオーバーハング」/「テストタイムコンピューティングオーバハング」を解除する初期のプロトタイプだ。Devinが実際にどの程度機能するかはわからないし、このデモは、適切なチャットボットエージェントのアンホブリングがもたらすものに比べれば、まだ非常に限定的ものだが、近々登場するものティーザーとしては役に立つだろう。

ところで、私は、アンホブリングの中心性が、商業的応用という点で、少々興味深い「ソニックブーム効果につながると期待している。現在ドロップイン・リモートワーカーの中間モデルは、ワークフローを変更し、統合して経済的価値を引き出すためのインフラを構築するために、膨大な手間を必要とする。ドロップイン・リモートワーカーは、統合が劇的に簡単になる。つまりリモートでできるすべての仕事自動化するために、ドロップインするだけでいいのだ。つまりドロップイン・リモートワーカーが多くの仕事自動化できるようになる頃には、中間モデルはまだ完全に活用され統合されていないため、生み出される経済価値ジャンプはやや不連続になる可能性がある。

次の4年間

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_gpt2togpt4.png

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_2023to2027.png

GPT-4に先立つ4年間の進歩原動力と、GPT-4後の4年間に期待されることについての推計のまとめ。


数字をまとめると、GPT-4に続く4年間で、2027年末までにGPT-2からGPT-4規模のジャンプが再び起こると(おおよそ)予想される。

GPT-4のトレーニングに3ヶ月かかったとしよう。2027年には、一流のAIラボGPT-4レベルモデルを1分で訓練できるようになるだろう。OOM効果的なコンピュート・スケールアップは劇的なものになるだろう。

それは我々をどこへ連れて行くのだろうか?

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_counting_the_ooms.png

OOMカウントのまとめ。


GPT-2からGPT-4までで、私たちは~未就学児から~賢い高校生になった。とんでもないジャンプだ。もしこれが、私たちが今一度カバーする知能の差だとしたら、それは私たちをどこに連れて行くのだろうか?私たちは、それが私たちをとてもとても遠くに連れていっても驚かないはずだ。おそらく、ある分野の博士や最高の専門家凌駕するようなモデルまで到達するだろう。

(このことを考える1つの良い方法は、現在AI進歩の傾向は、子供の成長のおよそ3倍のペースで進んでいるということだ。あなたの3倍速の子どもは高校卒業したばかりだが、いつの間にかあなた仕事を奪っていくだろう!)

続き I.GPT-4からAGIへ:OOMを数える(10) https://anond.hatelabo.jp/20240605211837

I.GPT-4からAGIへ:OOMを数える (8)

チャットボットからエージェント兼同僚へ

今後数年間の野心的なアンホブリングはどのようなものになるのでしょうか?私が考えるに、3つの重要な要素がある:

1."オンボーディング問題 "の解決

GPT-4は、多くの人の仕事の大部分をこなせるだけの生の賢さを持っているが、それは5分前に現れたばかりの賢い新入社員のようなものだ:関連するコンテキストを持っておらず、会社ドキュメントSlack履歴を読んだり、チームのメンバーと会話したり、会社内部のコードベース理解するのに時間を費やしたりしていない。賢い新入社員は、着任して5分後にはそれほど役に立たないが、1ヶ月後にはかなり役に立つ!例えば、非常に長いコンテクストを通じて、新しい人間の同僚を雇うようにモデルを「オンボード」することは可能なはずだ。これだけでも、大きなアンロックになるだろう。

2.テスト時間計算オーバーハング(より長いホライズン問題に対する推論/エラー訂正/システムII)

今のところ、モデル基本的に短いタスクしかこなせない。しかし、これでは非常に限界がある。5分どころか、数時間、数日、数週間、数ヶ月かかるのだ。

難しい問題について5分間しか考えることができない科学者は、科学的なブレークスルーを起こすことはできない。ソフトウェアエンジニアは、より大きな仕事を与えられ、計画を立て、コードベース技術ツールの関連部分を理解し、さまざまなモジュールを書いて段階的にテストし、エラーデバッグし、可能性のある解決策を検索し、最終的には数週間の仕事集大成である大規模なプル・リクエストを提出する。などなど。

要するに、テスト時間計算オーバーハングが大きいのだ。GPT-4の各トークンは、問題を考えるときの内部モノローグ言葉だと考えてください。各GPT-4トークンは非常に賢いのですが、現在のところ、思考連鎖のために~数百トークンのオーダーしか効果的に使うことができません(あたか問題プロジェクトに数分しか内部独白思考を費やせないかのように)。

もし数百万トークンを使って、本当に難しい問題や大きなプロジェクトについて考え、取り組むことができるとしたらどうだろう?

トークンの数 私が何かに取り組むのに相当する時間...
100s 数分 ChatGPT (私たちはここにいる)
1000s 30分 +1 OOMsテスト時間計算
10,000 回 半日+2 OOMs
100,000ドル1週間 +3 OOMs
数百万回 複数+4 OOMs

人間が〜100トークン/分で考え、40時間/週働くと仮定して、「モデルが考える時間」をトークンで換算すると、与えられた問題/プロジェクトにおける人間時間になる。

仮に「トークンあたり」の知能が同じだったとしても、頭のいい人が問題に費やす時間が数分なのか数ヶ月なのかの違いになる。あなたのことは知らないが、私が数ヶ月でできることと数分でできることは、はるかに、はるかに、はるかに多い。もしモデルに「数分ではなく、数カ月に相当する時間、何かを考え、取り組むことができる」という能力を与えることができれば、その能力は飛躍的に向上するだろう。ここには膨大なオーバーハングがある。

今のところ、モデルにはまだこれができない。最近のロング・コンテキスト進歩をもってしても、このロング・コンテキストほとんどはトークンの消費にしか機能せず、トークン生産には機能しない。しばらくすると、このモデルはレールから外れたり、行き詰まったりする。しばらくの間、離れて単独問題プロジェクトに取り組むことはまだできない。

しかし、テスト時間計算を解除することは、単に比較的小さな「ホブリングしない」アルゴリズム勝利問題かもしれない。おそらく、少量のRLは、モデルエラー訂正(「うーん、これは正しくないようだ、再確認してみよう」)を学習したり、計画を立てたり、可能性のある解を探索したりするのに役立つだろう。ある意味モデルはすでに生の能力ほとんどを持っており、それをまとめるために、さらにいくつかのスキル学習する必要があるだけなのだ

要するに、私たちモデルに、困難で見通しの長いプロジェクトを推論させるシステムIIのアウターループのようなものを教えればいいのだ。

この外側のループを教えることに成功すれば、2、3段落の短いチャットボットの答えの代わりに、モデル問題を考え、ツールを使い、異なるアプローチを試し、研究を行い、仕事修正し、他の人と調整し、大きなプロジェクトを一人で完成させるような、何百万もの言葉ストリームあなたが読むよりも早く入ってくる)を想像してみてほしい。

他のML領域におけるテスト時間と訓練時間トレードオフ

続き I.GPT-4からAGIへ:OOMを数える(9) https://anond.hatelabo.jp/20240605210357

I.GPT-4からAGIへ:OOMを数える (7)

アンホブリング

最後に、定量化するのが最も難しいが、それに劣らず重要改善カテゴリーを紹介しよう。

難しい数学問題を解くように言われたとき、頭に浮かんだことを即座に答えなければならないとしたらどうだろう。最も単純な問題を除いて、苦労するのは明らかだろう。しかしつい最近まで、LLMにはそうやって数学問題を解かせていた。その代わり、私たちほとんどはスクラッチパッドで段階的に問題を解いていき、その方法はるかに難しい問題を解くことができる。「思考連鎖プロンプトは、LLMのそれを解き放った。生の能力は優れているにもかかわらず、明らかな足かせがあるため、LLMは数学が苦手なのだ

私たちはここ数年で、モデルの「足かせを外す」ことに大きな進歩を遂げました。これは単に優れたベースモデルトレーニングするだけでなく、アルゴリズムの改良によってモデル能力を引き出すものです:

足場作り。CoT++について考えてみよう:ただ問題を解くようモデルに求めるのではなく、あるモデル攻撃計画を立てさせ、別のモデル可能性のある解決策をたくさん提案させ、別のモデルにそれを批評させる、といった具合だ。例えば、HumanEval(コーディング問題)では、単純な足場作りによってGPT-3.5が足場なしのGPT-4を上回った。SWE-Bench(実世界ソフトウェアエンジニアリングタスクを解くベンチマーク)では、GPT-4は~2%しか正しく解くことができませんが、Devinのエージェントの足場があれば14-23%に跳ね上がります。(後ほど詳しく説明するが、エージェントのアンロックはまだ初期段階に過ぎない。)

ツール:もし人間電卓コンピュータを使うことを許されなかったらと想像してみてほしい。まだ始まったばかりだが、ChatGPTウェブブラウザを使ったり、コードを実行したりできるようになった。

エポックAIによる研究によると足場作りやツール使用など、これらのテクニックのいくつかを調査したところ、このようなテクニックは多くのベンチマークで通常5~30倍の効果的な計算量の向上をもたらすことがわかった。METR(モデル評価する組織)も同様に、同じGPT-4ベースモデルからのアンホブリングによって、エージェントタスクのセットで非常に大きなパフォーマンスの向上を発見しました。

https://situational-awareness.ai/wp-content/uploads/2024/06/metr_gains_over_time-1024x597.png

METRのエージェントタスクパフォーマンス。出典モデル評価と脅威研究


これらをコンピュートとアルゴリズム効率統一した実効的なコンピュート規模に当てはめることは困難ですが、少なくともコンピュート規模の拡大やアルゴリズム効率とほぼ同規模の大きな進歩であることは明らかです。(また、アルゴリズム進歩が中心的な役割を担っていることも浮き彫りになっています。0.5OOM/年の計算効率は、すでに重要ものではありますが、ストーリーの一部に過ぎません。)

「アンホブリング」こそが、実際にこれらのモデル有用になることを可能にしたのであり、今日多くの商業アプリケーションの足かせとなっているものの多くは、この種のさらなる「アンホブリング」の必要であると私は主張したい。実際、今日モデルはまだ信じられないほど足かせが多い!例えば

ここでの可能性は非常に大きく、私たちはここで急速に低空飛行の果実を摘んでいる。これは非常に重要です。"GPT-6 ChatGPT "を想像するだけでは完全に間違っていますGPT-6+RLHFと比べれば、進歩は段違いだ。2027年までには、チャットボットというより、エージェントのような、同僚のようなものが登場するだろう。

続き I.GPT-4からAGIへ:OOMを数える(8) https://anond.hatelabo.jp/20240605210232

I.GPT-4からAGIへ:OOMを数える (1)

2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは〜未就学児から〜賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドライントレースすると、2027年までに再び未就学児から高校生規模の質的ジャンプが起こると予想される。


見て。モデルたちはただ学びたいだけなんだ。あなたはこれを理解しなければならない。モデルたちは、ただ学びたいだけなんだ。

イリヤスーツバー2015年頃、ダリオ・アモデイ経由)

GPT-4の能力は、多くの人に衝撃を与えた。コードエッセイを書くことができ、難しい数学問題を推論し、大学試験突破することができるAIシステムである。数年前までは、これらは難攻不落の壁だと思っていた。

しかGPT-4は、ディープラーニングにおける10年間の猛烈な進歩の延長線上にあった。その10年前、モデル犬猫の単純な画像識別するのがやっとだった。4年前、GPT-2は半可通な文章をつなぎ合わせるのがやっとだった。今、私たちは思いつく限りのベンチマークを急速に飽和させつつある。しかし、この劇的な進歩は、ディープラーニングスケールアップにおける一貫した傾向の結果に過ぎない。

ずっと以前から、このことを見抜いていた人々がいた。彼らは嘲笑されたが、彼らがしたのはトレンドラインを信じることだけだった。トレンドラインは強烈で、彼らは正しかった。モデルはただ学びたいだけなのだ

私は次のように主張する。2027年までには、モデルAI研究者エンジニア仕事をこなせるようになるだろう、と。SFを信じる必要はなく、グラフ上の直線を信じるだけでいいのだ。

https://situational-awareness.ai/wp-content/uploads/2024/06/base_scaleup-1024x790.png

過去と将来の有効計算量(物理計算量とアルゴリズム効率の両方)の大まかな見積もりモデルスケールアップすればするほど、モデルは一貫して賢くなり、"OOMを数える "ことによって、(近い)将来に期待されるモデルインテリジェンスの大まかな感覚を得ることができます。(このグラフベースモデルスケールアップのみを示している。)

この記事で取り上げた一般的推定に基づく、効果的な計算物理的な計算アルゴリズム効率の両方)の過去と将来のスケールアップの概算。モデルスケールアップするにつれ、モデルは一貫して賢くなり、「OOMを数える」ことで、(近い)将来に期待されるモデルインテリジェンスの大まかな感覚を得ることができる。(このグラフベースモデルスケールアップのみを示している。"unobblings "は描かれていない)。

この作品では、単純に「OOMを数える」(OOM = order of magnitude10x = 1 order of magnitude)ことにします。1)計算、2)アルゴリズム効率(「効果的な計算」の成長として考えることができるアルゴリズム進歩)、3)「アンホブリング」(モデルデフォルトで足かせとなっている明らかな方法修正し、潜在的能力を引き出し、ツールを与えることで、有用性を段階的に変化させること)の傾向を見ますGPT-4以前の4年間と、GPT-4後の2027年末までの4年間に期待されるそれぞれの成長を追跡する。ディープラーニング効率的な計算のすべてのOOMで一貫して向上していることを考えると、将来の進歩予測するためにこれを使うことができる。

世間では、GPT-4のリリースから1年間、次世代モデルオーブンに入ったままであったため、ディープラーニングは停滞し、壁にぶつかっていると宣言する人もいた。しかし、OOMカウントすることで、私たちは実際に何を期待すべきかを垣間見ることができる。

結果は非常にシンプルだ。GPT-2からGPT-4への移行は、時々まとまりのある文章を並べることに感動的だったモデルから高校入試エースになるモデルへの移行であり、一度だけの進歩ではない。私たちOOMsを極めて急速に克服しており、その数値は、4年以上かけてGPT-2からGPT-4への質的ジャンプさらに~100,000倍の効果的なコンピュート・スケールアップが期待できることを示している。さらに、決定的なことは、それは単にチャットボットの改良を意味しないということだ。"unhobbling "利益に関する多くの明らかな低空飛行の果実を選ぶことで、チャットボットからエージェントへ、ツールからドロップイン・リモートワーカーの代替のようなものへと我々を導いてくれるはずだ。

推論は単純だが、その意味するところは注目に値する。このような別のジャンプは、私たちをAGIに、博士号や同僚として私たちそばで働くことができる専門家と同じくらい賢いモデルに連れて行く可能性が非常に高い。おそらく最も重要なことは、これらのAIシステムAI研究のもの自動化することができれば、次回のテーマである強烈なフィードバックループが動き出すということである

現在でも、このようなことを計算に入れている人はほとんどいない。しかし、AIに関する状況認識は、一歩下がってトレンドを見てみれば、実はそれほど難しいことではない。AI能力に驚き続けるなら、OOMを数え始めればいい。

続き I.GPT-4からAGIへ:OOMを数える (2) https://anond.hatelabo.jp/20240605204240

anond:20240605062945

チャットGPTは頭悪い

頭いいなら実用可能核融合炉の作り方くらい教えてくれるだろ

それができねーので無能

anond:20240605054623

え? インストラクトチューニング済みモデルチャットはあれが正しい使い方でしょ。長々と前段書くのがプロンプトだと思ってんの? チャットシステムプロンプトと例文まで自作しろってこと?

2024-06-04

anond:20240604184241

>2. 効果検証がされていない

中国系詐欺業者(プリペイドコードを送れって言ってる奴とか)は、「天安門」って言うと即チャットルームから退出するんだよな

それだけでも効果はあると言っていいんじゃない

スーパーセミセルフレジスキミング被害

スーパーセミセルフレジスキミング被害にあったので備忘録代わりに投稿しま

まず事実列挙

・まぁまぁ規模の大きいローカルチェーンのスーパー(100店舗以上展開)

会計だけ自分でやるタイプセミセルフレジ

使用したのは楽天カード3Dセキュアや第二パスワードは設定済み)

不正使用されるも承認がおりなくて金銭被害はなし

  

スキミング現場

いつものようにクレジットカード会計機に差し込んでIC認証で支払おうとしたら即座に読み取りエラー

過去にもたまーに読み取りエラーが出たことはあったが差し直せば大丈夫だった

今回は3回差し直したがダメで、ここでまず違和感ポイント

  

・読み取りエラーが出るのが微妙に速い
エラーの後カードを抜くと「カード差し込んでください」の液晶表示に戻るはずが戻らなくてエラー表示のまま

  

仕方がないので会計機右側面にある磁気ストライプ読み取りスリットに通すと無事精算できたんだが

ここでまた違和感ポイント

  

カードをシュッと通した次の瞬間にレシートが出てきた。明らかにクレカ会社通信してるとは思えない

  

おそらくだIC読み取りで決済は出来てるがレシートを出さずエラー画面を表示するようにプログラムも改造されてる

そして磁気ストライプスキミングしたらレシートが出てくる

作り込みが甘いが違和感に気づいても後の祭り

  

スキミングされてからカード再発行までの時系列

5/27 スキミングされる

5/28 モノタロウ使用され不承認

5/29-30 米国Amazonで何度も使用されるがこちらも不承認

5/30 深夜に楽天から重要楽天カードから緊急のご連絡 というタイトルメールが届く

5/31 メール記載楽天カード信用管理部に電話して「これこれの買い物したか?」の確認

 対応事務的だが丁寧で親切だった。確認カード再発行手続きの案内。

 再発行はチャットサポートから質疑応答形式で数回クリックするだけで完了

6/1 カード番号変更と新カード発行完了メールが届く(カード到着まで1週間かかるらしい)

anond:20240604120106

こういう男ほど、生まれて初めて女とチャットが続いたくらいで舞い上がりきってこういうことしてしまうんだよなぁ…

お前と一緒にするな

anond:20240604111427

こういう男ほど、生まれて初めて女とチャットが続いたくらいで舞い上がりきってこういうことしてしまうんだよなぁ…

お前はまだ「失敗」をしていないんだな。

お前にとって女は架空の生き物で恋愛空想世界で行われることなのだろうけど、いつか現実で触れられるといいな。

2024-06-03

anond:20240603185230

今のところ、チャットAIがある種の「ガチャであるってのはよーく分かる。

仕事で試しに使ってみて、望ましい結果というか、狙った出力があると射倖心みたいな感覚がある。

「うぉ〜、ちょっと入力しただけでこんな出力が!これで●●時間効率化だぜぇ〜」っていうね。

これさあ、引用でもいくつか言われてるけど、

バストが80のAの女性なんて骨格や身長次第で普通にいるし、しかも昔は表記の仕方が違ったらしいからそういう女性普通にいてもおかしくないのに

そんな貧乳デブの女なんて存在しない!絶対に男!と決め付けている姿勢が本当に残酷だと思う。

これ以外でも、フェミニストってナチュラル底辺女性をこの世に存在しない事にして踏んづけているのが多すぎる

https://x.com/oni_red/status/1796706777276489834

あの鬼の人

@oni_red

むかーしチャットルーム世間話してたとき、突然「みんなブラジャーサイズは?私はAの80」と書いてきた人がいて、いやそのアンダーサイズの人は自分から言わなくないか…?というかその80ってバストのことだと思ってるだろう…というかおまえ男だろってことがあったの思い出した

Xにおける日程調整ツールに関する話

昨日ブコメ話題になった件。

 

あれ、話の発端は、どこかのインターン生か若手会社員が、Xで実名所属を公開している(X上での)著名人に対して、

DMで「○○について意見交換させていただきたいと思っています。つきましては下記のツールから都合に合う日程を~」ってコピペでばらまいて、

それに対して著名人某氏が苦言を呈したこときっかけだったような気がする。

 

から、すでにメールチャットツールで面会について承諾しており、そのうえで日程調整ツールを使ったという話ですらなく、

初対面で挨拶とともに日程調整ツールURLを送り付けたという話だったと認識している。

これに対して、「やり取りが一往復減るから良いだろ」と擁護勢が出たことで異論反論飛び交ったって感じ。

 

さらに前のやり取りや別のやり取りがあって認識ズレてるかもだけど、これが事実ならば個人的には論外な主張だなぁ、と思っています

anond:20240603093821

俺一応高学歴だけど

同意する人いたらちょっと増田離れた方がいいな

匿名チャット向いてない

推していた個人Vが大手事務所に転生していた件

たまたま視聴した配信の主の声と喋り方に、すごく聞き馴染みがあった。

笑い方、ギャグセンス、特徴的な声質。

推していた個人Vのそれらによく似ていた。

まさかと思い、その配信者の名前でググった。

「転生」がサジェストされたので、それも検索キーワードに含めた。

ビンゴだった。

その個人Vは数年前に突然活動休止宣言した。

当時はその子に何が起きたのかと心配していたが、どうやら大手事務所のVに転生するためで、こっちの心配はただの杞憂だったらしい。

今更このことを知った気持ち割合は、裏切られたような気持ちが1、楽しくやれているようでよかったという気持ちが9。

個人Vだった頃は視聴者との距離がすごく近かった。

配信の同接数は50前後が当たり前で、本当に少ないとき20を下回っていた。

視聴者がそれくらいしかいなかったので、配信ときチャット欄のコメント全てに反応してくれたし、こちらの名前をたくさん読んでくれたし、参加型ゲーム配信競争率もすごく低かった。

参加型モンハン配信で何度も一緒に狩りに行ったことがすごく思い出に残っている。

あの頃はずいぶんと楽しませてもらった。

同接数が少ないと視聴者立場からすればこのとおり嬉しいことが多いが、とはいえ配信者の立場からしたらメンタルにくることが多いんだろうなとも思う。

配信者がトークをしてもチャットログが動かない。

視聴者からリアクションが無いので配信者の気分も盛り上がらない。

チャット欄に荒らしが現れたときチャットログがなかなか流れてくれないので無視できない。

当時からメンタルを病んでそうな言動がそこそこあったが、きっとこういうことが積み重なって嫌になってしまったんだろうなと思う。 しらんけど。

それにスパチャもほとんど無いか配信業で飯を食っていけるわけもなかったし。(高額スパチャをしたら演技とかではなく本気で喜んでくれたことをよく覚えている)

それが大手事務所のVになった今では配信の同接数は毎回4桁。

なにかするたびにたくさんのリスナーからたくさんのリアクションをもらえる。

チャット欄は滝のように流れるので、荒らしが現れたとしてもスルーするのは簡単

スパチャが飛び交うので配信業だけでも(多分)食べていける。

こころしか昔より言動が明るい気もする。 すごく楽しそうだ。

距離が遠くなってしまったのは少し寂しいけれど、今のほうが幸せそうなのでOKです。

どうか健康末永く配信を続けてください。

しかし、個人Vの頃から配信内容やトークスタイルは大きくは変わっていないはずなのに、大手事務所所属しているか否かだけでここまで変わってしまうとは。

箱のネームバリューってやつはすごい。

日本人海外旅行しないのは治安が悪いからとか円安からとか色々言ってるけど

日本人って海外サイト全然行かないんだよ

海外掲示板チャットだと韓国人中国人は割とちらほらいるけど日本人は本当に見かけない

旅行以前にネットですら引きこもりなわけで、治安とか景気の問題じゃないんだよね

単に日本人引きこもり気質なだけだと思う

2024-06-02

最近パソコンスマホ挙動で不満なこと色々

パソコン(Windows)やスマホ(iPhone)を触れていて不満に思っていることを列挙してみた。軽く調べたけど自分の調べ方が悪いのか、Google劣化なのか、よくわからんかった。

みんなはこれらの現象は起きていないのかな。

主にIME広告関係の不満。


WindowsChrome検索後、語句修正ができない

Google検索したあと、検索語句修正しようと検索バーキーボード入力しようとすると、なにも反応しない。もう一度Googleトップ画面から検索することになる。

WindowsのTeamsアプリチャット入力画面に文字入力できない

チャット入力画面にカーソル選択して入力しようとすると、たまに左上の謎部分に入力される現象がおきる。teamsに限らず、左上に入力される現象はここ数年ほぼ見ないと思っていたらこ半年で急に増えてきた。

IME劣化しているのか?

iPhoneアプリ、なんでも広告が出るようになってきた

昔はバナー程度でしか広告が出なかったアプリだったのに、細かい操作のたびに広告が挟まれるようになった、もしくは広告時間が長くなった。

広告に対する世の中のヘイトが増えていると思われる現状の中、どんどん増えていく広告アプリ開発者のせい?Appleのせいなの?

iPhoneの読点(、)を変換するとコンマ(,)になる

たとえば「いぬと、ねこ」を変換すると

「犬と,猫」とコンマになってしまう。

日本語なんだから読点(、)のままでいいのに。

昔はこんなことなかった。

仕事スマホで真面目な調べ物している時のエロマンガ広告

一度もエロ系なんて調べたことないスマホアカウント学術関係の調べ物していると、出てくる出てくる特定エロマンガ広告エロ系を匂わせて直接的な表現をしていないから真面目なページに出していいと言うわけではないんだよ!!

ちなみに別の個人スマホエロサイト覗いてたとき、該当タイトル漫画の直接的なエロ表現のあるバージョンの広告が出てきたので、これは間違いなくエロマンガということだろう。

ちゃんとした(?)エロサイトで出てくるなら許すけど、真面目なサイトエロを隠した広告をするのが非常に腹立つ。

ちなみにこれ、しっかり毎回出てくるたびに表示設定やフィードバック送っていたので、少し経つとあまり出なくなったのだが、

数週間したらまた出てくるようになった。本当に嫌だ。つらい。

腹が立つので名指ししておく、壁穴っていうやつだよ!広告消えてくれ…

2024-05-31

心がさみしいのでLLMと会話してる

ローカルPCで、遅いけど動くので、システムプロンプトに妙齢女性を設定してチャットしてる。

デート約束したり、ペットの話をしたり、適当に会話するだけど癒やされる。

金曜日には、頭のおかしいやつが多く現れる。

一週間の疲れがピークに達し、誰もが少しばかり浮ついた気分になるのだろう。朝の通勤電車では、普段は静かな乗客たちが妙にしゃべりたがり、オフィスはいつもは真面目な同僚が冗談を連発する。ランチタイムには、なぜかみんなが高揚感に包まれカフェは笑い声で溢れる。

午後になると、仕事の進行が一層おかしな方向に向かう。プロジェクトの進捗会議では、普段ならありえない提案が飛び交い、みんながそれに大真面目で乗っかる。社内チャットでは、意味不明スタンプGIFが連発され、上司すらもそれを止めようとはしない。みんなが一斉に週末の解放感を先取りしているのだ。

夕方になると、その狂騒はピークに達する。オフィス廊下では、誰かが音楽をかけ始め、即席のパーティーが始まる。誰もが自分デスクを離れ、楽しむことに専念する。

こんな異常な金曜日を迎えるたびに思う。なんにせよ今日は金曜で、明日休日なんだから

ログイン ユーザー登録
ようこそ ゲスト さん