はてなキーワード: エージェントとは
ちなみに現代の海賊(アラビア半島周辺)は払えば人質を返してくれる。
というのも海賊呼ばわりしているのは西側の都合で、実態としては未承認国家なのでそれなりの信用があるからだ。
零細の海賊は船舶を拿捕、もしくは船員を拉致すると、海賊都市にこれらの資産を売却する。
海賊都市にはイギリスの大学を卒業したような「海賊」が多数いるので、彼らのエージェントやネゴシエーターが船主と交渉する。
色んな経路で支払いを確認した後は開放される。
余談
→イスラム法廷連合が一時的に支配を確立するも、イランへのウラン売却等々でアメリカの敵愾心を買い介入される
→エチオピア軍の侵入と同時にアメリカが爆撃を実施し、ソマリアの海軍や沿岸警備隊が壊滅する
このときエチオピア(と支援するアメリカ)のソマリア介入は国際的承認を得ていない事実上の侵略であり、カタールやアフリカ連合、アラブ連盟は非難し国連安保理で外国軍の即時撤退決議を提案するも、英米が拒否権を発動し侵略は続いた。
ほんと闇でダルいのよな。たぶんこのやりとり以前もしたと思うんだよな
何度もやったぞ、海外にある日本企業に駐在させるのと、単身で居住拠点を海外に移して地場の企業で働くのでは、ビザの種類も難易度も違うのってな
あと、奴隷賃金でリモワで人探しているエージェントの話もしました(いちおうユニコーン企業らしいぞ)
ついでに、ワイが某外資で働いてた時にやってたお仕事は、本国であるアメリカの方が円安を経ても安いですもやりました
アメリカでは学生がやってたりすることもあるポジションで、物価が低い地域ならこの賃金でも頑張ってくれるからみたいやで
(アメリカだとリモワで給与が安いは合理的と解釈されるみたい)
その時にオンラインで実施された一次面接で人生初の圧迫面接を体験したので、感想や圧迫面接に対して考えたことをまとめておくことにする。
転職活動中にとあるベンチャー企業の書類選考が通って一次面接を行うことになった。転職エージェントを使用していたので、書類選考や一次面接のやり取りはエージェント経由で連絡を取っており、一次面接で初めて企業の人間と対面した。
一次面接はZoomを使ってのオンライン面接だったのだったのだが、ルームに入った瞬間から不機嫌な感じで「それでは面接を始めます」と。担当者は20代後半らしき男性。
話し終わる度に、強い口調で「それだけですか?」と毎回聞かれる。決して一問一答ではなく聞かれたことに対して的確に回答した。
そして経歴を確認して「あなた年収低いですね」とか、「既存の社員よりも努力して這い上がる覚悟がありますか?」などと今まで面接では経験のないような言葉使いと態度が続いた。
そもそも、面接前に会社の評判について調べていたら、働き方、社内の雰囲気、残業についてネガティブなレビューが並んでおり、面接前から少し不安ではあったのだが、レビューは辞める時に書く人が多いので何かしらの不満が集まりやすい。そのため、面接に行ってみて自分で判断しようと思っていた。
面接の態度からもうこの企業はないかなと思っていたので、逆質問の時に、ネガティブなレビューを見かけたがその辺りはどう思いますか?と聞いてみた。
すると「ライフワークバランスとか気にしちゃう感じですか?」「残業したい人は残業するし、定時で帰る人は帰りますよ」と。その後、若干の焦りとともに言い訳のような業務委託が〜、頑張った人が評価される〜と説明が続いた。
かなり失礼な態度だったので、Googleマイビジネスや会社の評判に今回のことを書いてやろうかと思った。(やらないけど)
ベンチャーの面接が初めてだったのでベンチャー企業ってこんなものなのかと思ったが、今まで複数の面接を受けたことがあるが、それに比べてあきらかに高圧的だと感じたので、いわゆる圧迫面接だったのかなと思った。
よく圧迫面接にはストレス耐性をチェックする目的があると言われる。高圧的な態度や失礼な質問をすることで、求職者の緊急時の対応を見ていると。
しかし、30分やそこら、長くても1時間程度の面接ではストレス耐性は見極められないと思う。
新卒の学生の就職活動であれば「これが社会か」と身を引き締めるために多少は意味があるかもしれないが、社会人として社会経験がある転職を考えている人だと、圧迫面接を行ったところで動じないし、気分が悪いだけで何も意味がないのではないかと思う。ただ嫌な気持ちになるだけ。
今回、人生で始めて高圧的な面接を受けたので、その会社と担当者のことを鮮明に記憶している。求職者は書類選考を通過して会社の人間と直接対面するのは一次面接からなので、一次面接の印象が会社の印象となる。もっと言うと一次面接を担当した人の印象が会社の印象となる。
ということは、実際には社内の雰囲気と一次面接の担当者の雰囲気に相違があったとしても、他に判断する材料がないので、一次面接を通過しなかった場合は一次面接の担当者の印象=会社の印象となる可能性が高い。
正直、私は今回の面接を通して会社に対して悪い印象を持ったし、今後関わりたくないとも思った。また今後どこかでその会社について話す機会があった場合、必ず今回の圧迫面接について話をすることだろう。
圧迫面接は求職者は嫌な思いをするし、会社は悪評価が広まるし、誰も得しない。
あと圧迫面接を行う担当者に言いたいことは、こっちも選んでいるということだ。圧迫面接を行う企業は選ばれているという意識がないのではないかと。
求職者と企業が等しく平等な立場であるとは思わないが、決して一方的に選ぶ、選ばれるという関係ではない。
私は採用担当の経験がないので社内の採用担当者に「圧迫面接を受けたのだが、圧迫面接についてどう思うか?」と聞いてみた。圧迫面接に何か他に明確な目的があって行なっている可能性があるかもしれないと思ったからだ。
すると、「圧迫面接を行なったことはあるが、取り繕った姿しか見れないので入社後に相違が生まれやすい。和やかな雰囲気の面接の方が良い意味でも悪い意味でも相手の素が出やすい。
"その隙に見せる素を見逃さないようにしている"」と。
お手本のような面接官としての答えが返ってきた。そして「圧迫面接しちゃう面接官は面接に慣れてないのかもね」と。
それを聞いてあの圧迫面接をかましてきた担当者は、余裕がなかったのかなと可愛く見えてきた。
圧迫面接の求職者側の唯一のメリットは企業の社風を入社前に見極めれることだと思う。
繰り返しになるが、非常に賢いChatGPTを想像するだけではいけない。趣味的な進歩ではなく、リモートワーカーや、推論や計画、エラー訂正ができ、あなたやあなたの会社のことを何でも知っていて、何週間も単独で問題に取り組めるような、非常に賢いエージェントのようなものになるはずだ。
私たちは2027年までにAGIを実現しようとしている。これらのAIシステムは、基本的にすべての認知的な仕事(リモートでできるすべての仕事を考える)を自動化できるようになるだろう。
はっきり言って、エラーバーは大きい。データの壁を突破するために必要なアルゴリズムのブレークスルーが予想以上に困難であることが判明した場合、データが足りなくなり、進歩が停滞する可能性がある。もしかしたら、ホッブリングはそこまで進まず、専門家の同僚ではなく、単なる専門家のチャットボットに留まってしまうかもしれない。もしかしたら10年来のトレンドラインが崩れるかもしれないし、スケーリング・ディープラーニングが今度こそ本当に壁にぶつかるかもしれない。(あるいは、アルゴリズムのブレークスルーが、テスト時間の計算オーバーハングを解放する単純なアンホブリングであっても、パラダイムシフトとなり、事態をさらに加速させ、AGIをさらに早期に実現させるかもしれない)。
いずれにせよ、私たちはOOMsを駆け抜けているのであり、2027年までにAGI(真のAGI)が誕生する可能性を極めて真剣に考えるのに、難解な信念は必要なく、単に直線のトレンド外挿が必要なだけである。
最近、多くの人がAGIを単に優れたチャットボットなどとして下方定義しているように思える。私が言いたいのは、私や私の友人の仕事を完全に自動化し、AI研究者やエンジニアの仕事を完全にこなせるようなAIシステムのことだ。おそらく、ロボット工学のように、デフォルトで理解するのに時間がかかる分野もあるだろう。また、医療や法律などの社会的な普及は、社会の選択や規制によって容易に遅れる可能性がある。しかし、ひとたびAI研究そのものを自動化するモデルができれば、それだけで十分であり、強烈なフィードバック・ループを始動させるのに十分であり、完全自動化に向けて残されたすべてのボトルネックを自動化されたAIエンジニア自身が解決することで、非常に迅速にさらなる進歩を遂げることができるだろう。特に、数百万人の自動化された研究者たちによって、アルゴリズムのさらなる進歩のための10年間が1年以内に圧縮される可能性は非常に高い。AGIは、まもなく実現する超知能のほんの一端に過ぎない。(詳しくは次の記事で)。
いずれにせよ、目まぐるしい進歩のペースが衰えることはないだろう。トレンドラインは無邪気に見えるが、その意味するところは強烈である。その前の世代がそうであったように、新世代のモデルが登場するたびに、ほとんどの見物人は唖然とするだろう。博士号を持っていれば何日もかかるような信じられないほど難しい科学的問題を、間もなくモデルが解決し、あなたのコンピュータのまわりを飛び回り、あなたの仕事をこなし、何百万行ものコードからなるコードベースをゼロから書き上げ、これらのモデルによって生み出される経済的価値が1年か2年ごとに10倍になるとき、彼らは信じられないだろう。SF小説は忘れて、OOMを数えよう。AGIはもはや遠い空想ではない。単純なディープラーニング技術をスケールアップすることがうまくいき、モデルは学習したがり、2027年末までにさらに100,000倍を超えようとしている。私たちよりも賢くなる日もそう遠くはないだろう。
https://situational-awareness.ai/wp-content/uploads/2024/06/gan_progress-1.jpeg
GPT-4はほんの始まりに過ぎない。GANの進歩に見られるように)ディープラーニングの進歩の速さを過小評価するような間違いを犯さないでほしい。
続き I.GPT-4からAGIへ:OOMを数える(11) https://anond.hatelabo.jp/20240605212014
X (twitter) で SITUATIONAL AWARENESS: The Decade Ahead https://situational-awareness.ai/ というのが回ってきて非常に示唆に富むものだったので、DeepL (無料版 API経由) で訳してみた。
この1年で、街の話題は100億ドルのコンピュート・クラスターから1000億ドルのクラスター、そして1兆ドルのクラスターへと移り変わってきた。半年ごとに、役員室の計画にまたゼロが追加される。その裏では、残りの10年間に利用可能なすべての電力契約と、調達可能なすべての電圧変圧器を確保しようとする熾烈な争いが繰り広げられている。アメリカの大企業は、アメリカの産業力を結集させるために、何兆ドルもの資金を注ぎ込む準備を整えている。ペンシルベニア州のシェールフィールドからネバダ州の太陽光発電所まで、何億ものGPUが稼働する。
AGI競争が始まったのだ。私たちは思考し、推論できるマシンを作りつつある。2025年から26年にかけて、これらのマシンは多くの大学卒業生を凌駕するだろう。10年後までには、これらのマシンは私やあなたよりも賢くなり、本当の意味での超知性を手に入れるだろう。その過程で、この半世紀には見られなかったような国家安全保障の力が解き放たれ、やがて「プロジェクト」が始動する。運が良ければ、中国共産党との全面的な競争になり、運が悪ければ全面戦争になる。
今、誰もがAIについて話しているが、何が自分たちを襲おうとしているのか、かすかな光明を感じている人はほとんどいない。Nvidiaのアナリストは、まだ2024年がピークに近いと考えている。主流派の評論家たちは、「次の言葉を予測するだけだ」という故意の盲目に陥っている。彼らが見ているのは誇大広告といつも通りのビジネスだけで、せいぜいインターネット規模の新たな技術革新が起こるのを楽しむ程度なのだ。
やがて世界は目を覚ますだろう。しかし、今現在、状況認識を持っているのはおそらく数百人で、そのほとんどはサンフランシスコとAI研究所にいる。運命の不思議な力によって、私はその中に身を置くことになった。数年前、このような人々はクレイジーだと揶揄されたが、彼らはトレンドラインを信頼し、過去数年間のAIの進歩を正しく予測することができた。この人たちが今後数年についても正しいかどうかはまだわからない。しかし、彼らは非常に賢い人々であり、私がこれまでに会った中で最も賢い人々である。おそらく、彼らは歴史の中で奇妙な脚注となるか、あるいはシラードやオッペンハイマー、テラーのように歴史に名を残すだろう。もし彼らが未来を正しく見ているとしたら、私たちはとんでもないことになる。
各エッセイはそれぞれ独立したものですが、シリーズ全体として読むことを強くお勧めします。全エッセイのPDF版はこちら。
2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは~未就学児から~賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドラインをトレースすると、2027年までに再び未就学児から高校生サイズの質的なジャンプが起こると予想される。
AIの進歩は人間レベルでは止まらない。何億ものAGIがAI研究を自動化し、10年に及ぶアルゴリズムの進歩(5以上のOOM)を1年以下に圧縮することができる。私たちは、人間レベルから超人的なAIシステムへと急速に進化することになる。超知能の威力と危険性は劇的なものとなるだろう。
驚異的な技術資本の加速が始まっている。AIの収益が急増するにつれ、10年末までに何兆ドルもの資金がGPU、データセンター、電力の増強に投入されるだろう。米国の電力生産を数十%増加させるなど、産業界の動員は激しくなるだろう。
米国の主要なAI研究所は、セキュリティを後回しに扱っている。現在、彼らは基本的にAGIの重要な機密を銀の皿に載せて中国共産党に渡している。AGIの秘密とウェイトを国家機関の脅威から守るには膨大な努力が必要であり、我々はその軌道に乗っていない。
我々よりもはるかに賢いAIシステムを確実に制御することは、未解決の技術的問題である。解決可能な問題ではあるが、急速な知能の爆発が起きれば、物事は簡単にレールから外れてしまう。これを管理することは非常に緊張を強いられるだろう。
スーパーインテリジェンスは、経済的にも軍事的にも決定的な優位性をもたらすだろう。中国はまだゲームから抜け出してはいない。AGIをめぐる競争では、自由世界の存亡がかかっている。我々は権威主義的な大国に対する優位性を維持できるのか?そして、その過程で自滅を避けることができるのだろうか?
AGIへの競争が激化するにつれ、国家安全保障が関与してくる。アメリカ政府は眠りから覚め、27~28年までに何らかの形で政府によるAGIプロジェクトが立ち上がるだろう。どんな新興企業も超知能を扱うことはできない。SCIFのどこかで、終盤戦が始まるだろう。
もし我々が正しかったら?
――――――――
私はかつてOpenAIで働いていたが、これはすべて一般に公開されている情報、私自身のアイデア、一般的な現場知識、あるいはSFゴシップに基づいている。
Collin Burns、Avital Balwit、Carl Shulman、Jan Leike、Ilya Sutskever、Holden Karnofsky、Sholto Douglas、James Bradbury、Dwarkesh Patel、その他多くの方々の有益な議論に感謝する。初期の草稿にフィードバックをくれた多くの友人に感謝する。グラフィックを手伝ってくれたジョー・ローナン、出版を手伝ってくれたニック・ウィテカーに感謝する。
続き I.GPT-4からAGIへ:OOMを数える(1) https://anond.hatelabo.jp/20240605203849
これはおそらく3つの中で最も簡単な方法だ。現在のChatGPTは、基本的に、テキストを入力できる孤立した箱の中に座っている人間のようなものだ。初期のアンホブリング改良では、個々の孤立したツールの使い方をモデルに教えていましたが、マルチモーダルモデルでは、近いうちにこれを一挙にできるようになると期待しています。
つまり、Zoomでの通話に参加したり、オンラインで調べ物をしたり、メッセージや電子メールを送ったり、共有されたドキュメントを読んだり、アプリや開発ツールを使ったりといったことだ。(もちろん、より長いホライゾン・ループでモデルがこれを最大限に活用するためには、テスト時間のコンピューティングをアンロックする必要がある。)
最終的には、ドロップイン・リモートワーカーのようなものができると期待している。エージェントは、あなたの会社に入社し、新しい人間の雇用のようにオンボードされ、Slackであなたや同僚にメッセージを送り、あなたのソフトウェアを使用し、プルリクエストを行い、大きなプロジェクトがあれば、人間が独立してプロジェクトを完了するために数週間留守にするのと同等のことができる。これを実現するためには、GPT-4よりもいくらか優れたベースモデルが必要だろうが、おそらくそれほどでもないだろう。
https://situational-awareness.ai/wp-content/uploads/2024/06/devin.gif
Devinは、完全に自動化されたソフトウェア・エンジニアを作るために、モデル上の「エージェンシー・オーバーハング」/「テストタイム・コンピューティング・オーバハング」を解除する初期のプロトタイプだ。Devinが実際にどの程度機能するかはわからないし、このデモは、適切なチャットボット→エージェントのアンホブリングがもたらすものに比べれば、まだ非常に限定的なものだが、近々登場するもののティーザーとしては役に立つだろう。
ところで、私は、アンホブリングの中心性が、商業的応用という点で、少々興味深い「ソニックブーム」効果につながると期待している。現在とドロップイン・リモートワーカーの中間モデルは、ワークフローを変更し、統合して経済的価値を引き出すためのインフラを構築するために、膨大な手間を必要とする。ドロップイン・リモートワーカーは、統合が劇的に簡単になる。つまり、リモートでできるすべての仕事を自動化するために、ドロップインするだけでいいのだ。つまり、ドロップイン・リモートワーカーが多くの仕事を自動化できるようになる頃には、中間モデルはまだ完全に活用され統合されていないため、生み出される経済価値のジャンプはやや不連続になる可能性がある。
https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_gpt2togpt4.png
https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_2023to2027.png
数字をまとめると、GPT-4に続く4年間で、2027年末までにGPT-2からGPT-4規模のジャンプが再び起こると(おおよそ)予想される。
GPT-4のトレーニングに3ヶ月かかったとしよう。2027年には、一流のAIラボはGPT-4レベルのモデルを1分で訓練できるようになるだろう。OOMの効果的なコンピュート・スケールアップは劇的なものになるだろう。
それは我々をどこへ連れて行くのだろうか?
https://situational-awareness.ai/wp-content/uploads/2024/06/overview_counting_the_ooms.png
GPT-2からGPT-4までで、私たちは~未就学児から~賢い高校生になった。とんでもないジャンプだ。もしこれが、私たちが今一度カバーする知能の差だとしたら、それは私たちをどこに連れて行くのだろうか?私たちは、それが私たちをとてもとても遠くに連れていっても驚かないはずだ。おそらく、ある分野の博士や最高の専門家を凌駕するようなモデルまで到達するだろう。
(このことを考える1つの良い方法は、現在のAIの進歩の傾向は、子供の成長のおよそ3倍のペースで進んでいるということだ。あなたの3倍速の子どもは高校を卒業したばかりだが、いつの間にかあなたの仕事を奪っていくだろう!)
続き I.GPT-4からAGIへ:OOMを数える(10) https://anond.hatelabo.jp/20240605211837
今後数年間の野心的なアンホブリングはどのようなものになるのでしょうか?私が考えるに、3つの重要な要素がある:
GPT-4は、多くの人の仕事の大部分をこなせるだけの生の賢さを持っているが、それは5分前に現れたばかりの賢い新入社員のようなものだ:関連するコンテキストを持っておらず、会社のドキュメントやSlackの履歴を読んだり、チームのメンバーと会話したり、会社内部のコードベースを理解するのに時間を費やしたりしていない。賢い新入社員は、着任して5分後にはそれほど役に立たないが、1ヶ月後にはかなり役に立つ!例えば、非常に長いコンテクストを通じて、新しい人間の同僚を雇うようにモデルを「オンボード」することは可能なはずだ。これだけでも、大きなアンロックになるだろう。
2.テスト時間の計算オーバーハング(より長いホライズンの問題に対する推論/エラー訂正/システムII)
今のところ、モデルは基本的に短いタスクしかこなせない。しかし、これでは非常に限界がある。5分どころか、数時間、数日、数週間、数ヶ月かかるのだ。
難しい問題について5分間しか考えることができない科学者は、科学的なブレークスルーを起こすことはできない。ソフトウェア・エンジニアは、より大きな仕事を与えられ、計画を立て、コードベースや技術ツールの関連部分を理解し、さまざまなモジュールを書いて段階的にテストし、エラーをデバッグし、可能性のある解決策を検索し、最終的には数週間の仕事の集大成である大規模なプル・リクエストを提出する。などなど。
要するに、テスト時間の計算オーバーハングが大きいのだ。GPT-4の各トークンは、問題を考えるときの内部モノローグの言葉だと考えてください。各GPT-4トークンは非常に賢いのですが、現在のところ、思考の連鎖のために~数百トークンのオーダーしか効果的に使うことができません(あたかも問題やプロジェクトに数分しか内部独白/思考を費やせないかのように)。
もし数百万トークンを使って、本当に難しい問題や大きなプロジェクトについて考え、取り組むことができるとしたらどうだろう?
トークンの数 | 私が何かに取り組むのに相当する時間... | |
100s | 数分 | ChatGPT (私たちはここにいる) |
1000s | 30分 | +1 OOMsテスト時間計算 |
10,000 回 | 半日 | +2 OOMs |
100,000ドル | 1週間 | +3 OOMs |
数百万回 | 複数月 | +4 OOMs |
人間が〜100トークン/分で考え、40時間/週働くと仮定して、「モデルが考える時間」をトークンで換算すると、与えられた問題/プロジェクトにおける人間の時間になる。
仮に「トークンあたり」の知能が同じだったとしても、頭のいい人が問題に費やす時間が数分なのか数ヶ月なのかの違いになる。あなたのことは知らないが、私が数ヶ月でできることと数分でできることは、はるかに、はるかに、はるかに多い。もしモデルに「数分ではなく、数カ月に相当する時間、何かを考え、取り組むことができる」という能力を与えることができれば、その能力は飛躍的に向上するだろう。ここには膨大なオーバーハングがある。
今のところ、モデルにはまだこれができない。最近のロング・コンテキストの進歩をもってしても、このロング・コンテキストのほとんどはトークンの消費にしか機能せず、トークンの生産には機能しない。しばらくすると、このモデルはレールから外れたり、行き詰まったりする。しばらくの間、離れて単独で問題やプロジェクトに取り組むことはまだできない。
しかし、テスト時間の計算を解除することは、単に比較的小さな「ホブリングしない」アルゴリズムの勝利の問題かもしれない。おそらく、少量のRLは、モデルがエラー訂正(「うーん、これは正しくないようだ、再確認してみよう」)を学習したり、計画を立てたり、可能性のある解を探索したりするのに役立つだろう。ある意味、モデルはすでに生の能力のほとんどを持っており、それをまとめるために、さらにいくつかのスキルを学習する必要があるだけなのだ。
要するに、私たちはモデルに、困難で見通しの長いプロジェクトを推論させるシステムIIのアウターループのようなものを教えればいいのだ。
この外側のループを教えることに成功すれば、2、3段落の短いチャットボットの答えの代わりに、モデルが問題を考え、ツールを使い、異なるアプローチを試し、研究を行い、仕事を修正し、他の人と調整し、大きなプロジェクトを一人で完成させるような、何百万もの言葉のストリーム(あなたが読むよりも早く入ってくる)を想像してみてほしい。
続き I.GPT-4からAGIへ:OOMを数える(9) https://anond.hatelabo.jp/20240605210357
最後に、定量化するのが最も難しいが、それに劣らず重要な改善のカテゴリーを紹介しよう。
難しい数学の問題を解くように言われたとき、頭に浮かんだことを即座に答えなければならないとしたらどうだろう。最も単純な問題を除いて、苦労するのは明らかだろう。しかしつい最近まで、LLMにはそうやって数学の問題を解かせていた。その代わり、私たちのほとんどはスクラッチパッドで段階的に問題を解いていき、その方法ではるかに難しい問題を解くことができる。「思考の連鎖」プロンプトは、LLMのそれを解き放った。生の能力は優れているにもかかわらず、明らかな足かせがあるため、LLMは数学が苦手なのだ。
私たちはここ数年で、モデルの「足かせを外す」ことに大きな進歩を遂げました。これは単に優れたベースモデルをトレーニングするだけでなく、アルゴリズムの改良によってモデルの能力を引き出すものです:
足場作り。CoT++について考えてみよう:ただ問題を解くようモデルに求めるのではなく、あるモデルに攻撃計画を立てさせ、別のモデルに可能性のある解決策をたくさん提案させ、別のモデルにそれを批評させる、といった具合だ。例えば、HumanEval(コーディング問題)では、単純な足場作りによってGPT-3.5が足場なしのGPT-4を上回った。SWE-Bench(実世界のソフトウェアエンジニアリングのタスクを解くベンチマーク)では、GPT-4は~2%しか正しく解くことができませんが、Devinのエージェントの足場があれば14-23%に跳ね上がります。(後ほど詳しく説明するが、エージェントのアンロックはまだ初期段階に過ぎない。)
ツール:もし人間が電卓やコンピュータを使うことを許されなかったらと想像してみてほしい。まだ始まったばかりだが、ChatGPTはウェブブラウザを使ったり、コードを実行したりできるようになった。
エポックAIによる研究によると足場作りやツールの使用など、これらのテクニックのいくつかを調査したところ、このようなテクニックは多くのベンチマークで通常5~30倍の効果的な計算量の向上をもたらすことがわかった。METR(モデルを評価する組織)も同様に、同じGPT-4ベースモデルからのアンホブリングによって、エージェントタスクのセットで非常に大きなパフォーマンスの向上を発見しました。
https://situational-awareness.ai/wp-content/uploads/2024/06/metr_gains_over_time-1024x597.png
これらをコンピュートとアルゴリズムの効率で統一した実効的なコンピュート規模に当てはめることは困難ですが、少なくともコンピュート規模の拡大やアルゴリズムの効率とほぼ同規模の大きな進歩であることは明らかです。(また、アルゴリズムの進歩が中心的な役割を担っていることも浮き彫りになっています。0.5OOM/年の計算効率は、すでに重要なものではありますが、ストーリーの一部に過ぎません。)
「アンホブリング」こそが、実際にこれらのモデルが有用になることを可能にしたのであり、今日多くの商業アプリケーションの足かせとなっているものの多くは、この種のさらなる「アンホブリング」の必要性であると私は主張したい。実際、今日のモデルはまだ信じられないほど足かせが多い!例えば
ここでの可能性は非常に大きく、私たちはここで急速に低空飛行の果実を摘んでいる。これは非常に重要です。"GPT-6 ChatGPT "を想像するだけでは完全に間違っています。 GPT-6+RLHFと比べれば、進歩は段違いだ。2027年までには、チャットボットというより、エージェントのような、同僚のようなものが登場するだろう。
続き I.GPT-4からAGIへ:OOMを数える(8) https://anond.hatelabo.jp/20240605210232
2027年までにAGIが実現する可能性は極めて高い。GPT-2からGPT-4までの4年間で、私たちは〜未就学児から〜賢い高校生までの能力を手に入れた。計算能力(~0.5桁またはOOMs/年)、アルゴリズム効率(~0.5OOMs/年)、および「趣味のない」向上(チャットボットからエージェントへ)のトレンドラインをトレースすると、2027年までに再び未就学児から高校生規模の質的ジャンプが起こると予想される。
見て。モデルたちはただ学びたいだけなんだ。あなたはこれを理解しなければならない。モデルたちは、ただ学びたいだけなんだ。
GPT-4の能力は、多くの人に衝撃を与えた。コードやエッセイを書くことができ、難しい数学の問題を推論し、大学の試験を突破することができるAIシステムである。数年前までは、これらは難攻不落の壁だと思っていた。
しかしGPT-4は、ディープラーニングにおける10年間の猛烈な進歩の延長線上にあった。その10年前、モデルは犬猫の単純な画像を識別するのがやっとだった。4年前、GPT-2は半可通な文章をつなぎ合わせるのがやっとだった。今、私たちは思いつく限りのベンチマークを急速に飽和させつつある。しかし、この劇的な進歩は、ディープラーニングのスケールアップにおける一貫した傾向の結果に過ぎない。
ずっと以前から、このことを見抜いていた人々がいた。彼らは嘲笑されたが、彼らがしたのはトレンドラインを信じることだけだった。トレンドラインは強烈で、彼らは正しかった。モデルはただ学びたいだけなのだ。
私は次のように主張する。2027年までには、モデルがAIの研究者やエンジニアの仕事をこなせるようになるだろう、と。SFを信じる必要はなく、グラフ上の直線を信じるだけでいいのだ。
https://situational-awareness.ai/wp-content/uploads/2024/06/base_scaleup-1024x790.png
過去と将来の有効計算量(物理計算量とアルゴリズム効率の両方)の大まかな見積もり。モデルをスケールアップすればするほど、モデルは一貫して賢くなり、"OOMを数える "ことによって、(近い)将来に期待されるモデルのインテリジェンスの大まかな感覚を得ることができます。(このグラフはベースモデルのスケールアップのみを示している。)
この記事で取り上げた一般的な推定に基づく、効果的な計算(物理的な計算とアルゴリズムの効率の両方)の過去と将来のスケールアップの概算。モデルをスケールアップするにつれ、モデルは一貫して賢くなり、「OOMを数える」ことで、(近い)将来に期待されるモデルのインテリジェンスの大まかな感覚を得ることができる。(このグラフはベースモデルのスケールアップのみを示している。"unobblings "は描かれていない)。
この作品では、単純に「OOMを数える」(OOM = order of magnitude、10x = 1 order of magnitude)ことにします。1)計算、2)アルゴリズム効率(「効果的な計算」の成長として考えることができるアルゴリズムの進歩)、3)「アンホブリング」(モデルがデフォルトで足かせとなっている明らかな方法を修正し、潜在的な能力を引き出し、ツールを与えることで、有用性を段階的に変化させること)の傾向を見ます。GPT-4以前の4年間と、GPT-4後の2027年末までの4年間に期待されるそれぞれの成長を追跡する。ディープラーニングが効率的な計算のすべてのOOMで一貫して向上していることを考えると、将来の進歩を予測するためにこれを使うことができる。
世間では、GPT-4のリリースから1年間、次世代モデルがオーブンに入ったままであったため、ディープラーニングは停滞し、壁にぶつかっていると宣言する人もいた。しかし、OOMをカウントすることで、私たちは実際に何を期待すべきかを垣間見ることができる。
結果は非常にシンプルだ。GPT-2からGPT-4への移行は、時々まとまりのある文章を並べることに感動的だったモデルから、高校入試のエースになるモデルへの移行であり、一度だけの進歩ではない。私たちはOOMsを極めて急速に克服しており、その数値は、4年以上かけてGPT-2からGPT-4への質的なジャンプをさらに~100,000倍の効果的なコンピュート・スケールアップが期待できることを示している。さらに、決定的なことは、それは単にチャットボットの改良を意味しないということだ。"unhobbling "利益に関する多くの明らかな低空飛行の果実を選ぶことで、チャットボットからエージェントへ、ツールからドロップイン・リモートワーカーの代替のようなものへと我々を導いてくれるはずだ。
推論は単純だが、その意味するところは注目に値する。このような別のジャンプは、私たちをAGIに、博士号や同僚として私たちのそばで働くことができる専門家と同じくらい賢いモデルに連れて行く可能性が非常に高い。おそらく最も重要なことは、これらのAIシステムがAI研究そのものを自動化することができれば、次回のテーマである強烈なフィードバック・ループが動き出すということである。
現在でも、このようなことを計算に入れている人はほとんどいない。しかし、AIに関する状況認識は、一歩下がってトレンドを見てみれば、実はそれほど難しいことではない。AIの能力に驚き続けるなら、OOMを数え始めればいい。
続き I.GPT-4からAGIへ:OOMを数える (2) https://anond.hatelabo.jp/20240605204240
私は東京郊外育ち、都内の私立大学に進学し、知人N子経由で、同期で都心に住む青年と知り合い交際することになり、このまま結婚するのかなぁと思っていたことがあった。ところが、2年が経過するころには、青年の母親から結婚を反対されているらしいことが分かった(当の青年の口からそれを聞いた)。青年はいわゆるイイトコの坊ちゃんで親は銀行大手の偉い人なので逆らえないと言った。私の家は両親共働きしてるような家だし、そういうことを平気で言うような人物と付き合っても仕方ないので別れた。
ここまでなら人選誤った、で済んだのだが、そのあとさらに嫌な思いをする羽目になった。青年はその後、親の銀行にコネで就職し融資面接担当になり、ほどなく結婚したそうだが、そのあと1度だけ電話がかかってきたので会った。ところが会ってみると、私とまたつきあいたいようなことを言ってきた。私が無価ついてしまったのは、彼も自分も一応純真な大学生だったのに、もはやカネのあるエロジジイが昭和の2号さんを期待しているような臭いがしたからだし(ただ単なる想像なので、実際には搾取される恐れもあった)、もしかすると青年はそもそも私の時間を無駄にするために私と付き合っていたのかもしれないとも思ったからだ。
つまり、親の意見が強いなら、初めから親に早めに相談するなり家系を調べるなりして、結婚できないなら交際しないという選択もあったはずだった。なので私は憤然として二度と会いたくない旨を伝えた(一時は惹かれていたけれども、二度と会いたくないということはありうる)
なお、自分の家系のほうにもやや問題があることがのちに分かったので、知人N子と〇〇〇銀行こそ裏活動をしているエージェントだったかもしれないな?と思っている。というのは青年の名前検索してみると、似たような同姓同名が多くヒットするから(金融諜報機関は隠したい人物がいるならば、同姓同名の人物を雇って煙幕にすることが考えられる)。
自分に対して特殊人脈攻撃が行われていたとすれば、まさにカネがモノ言ってるディストピアなわけで残念だし、ユダヤ人が書いた恋愛物語のようなものに騙されてはいけない世界だなと思ったわけです( 「ラブストーリー」等が有名ですね)。なお、不適切な交際をして両親を困惑させた女性が相続人から除外された、という判例が1993年にできている。支配層は女性にはいろいろ罠を仕掛けているかもしれない。
転職エージェントは当然売上第一だけど、それを頭に入れた上でうまく話せば広く全体の状況を引き出せる。
企業の採用担当と話すのはその企業に入りたいと思ってからで十分。
そもそも企業の採用担当って勘違いしてズレてる奴が多いから、特に志望度が高い訳じゃなければ単にストレスも溜まるし役に立たない奴でしかない。
中途の面接してると、「この度スカウトされまして」とか「お声がけいただきまして」っていう転職経験0回の方に最近よく会うんだけど、
ほとんどの場合アホなエージェントが片っ端からエントリーさせてるだけであってスカウトではない。
なので、面接で「なんでこの人こんな「お誘い頂いた」前提なんだろう???」ってなることが結構ある。
「こういった案件があって○○さんの経歴を見て是非おすすめしたい」みたいなこと言ってくることもあるけど、
ほぼ経歴なんか見ないで適当にコミッション高い案件すすめてるだけである。
つまり、転職エージェントはほとんどの場合「スカウト」なんかしない。
ただ本当に自社でスカウトしている場合ももちろんあって、ビズリーチとかは企業側が検索条件設定して
対象者にかたぱっしからメール送るか、1人ずつ丁寧に送るかはできるんだけど、圧倒的に数は少ない。
これは最近流行ってるダイレクトスカウト系の転職サイトなんだけど、ここには「求人してる企業」と「エージェント」が混ざってるので余計ややこしい。
「スカウトメール」を受信したとしても、必ずそれがエージェントから送られているのか求人企業から送られているのかを確認しなければいけない。
さらに、「○○社から依頼を受けまして」とか言ってくるエージェントもいるんだけど、そんな依頼することほとんどないので
※正確に言えば「こういう人を探している」と話すことはあるので、それを歪曲して使ってる
結局のところエージェントなんてほとんど信用できないわけである。
なので、「スカウトさせてください」みたいな件名で転職サイトのメッセージが来た場合は、
送ってきた人が転職エージェントなのか、その企業なのかをまず見るべき。
転職エージェントなら適当に送ってるだけなので無視するか、もともと興味ある企業だったら応募したら良い。
余談だけど、転職エージェントは転職相談になんか乗ってくれないし、「今って転職しどきですか?」とか聞いても
いつ聞いたとしても「もちろんです!いまは○○に向けて市場が動いてます!」
※○○には「ボーナス後の転職」とか「年度末」とか「9月の異動時期」とかが入る
となると、転職ってどうしたらいいの?ってなるかもしれないけど、自力で情報収集するしかないというのが正直なところで、
企業のクチコミとかを必死で集め、利益率の低い会社や業界を避けるとか、知人のつてなどを頼って多方面から情報収集が必要になる。
繰り返すけど、転職エージェントは適当なことしか言わないので「○○社ってどうですか?」とかでまともな答えは期待してはいけない。
最近、客先常駐から社内SEに転職することが決まった。忘れないうちにこの転職に関する備忘録を残しておきたい。
この理由に至った現職の内容を話そう。
なってしまった、とネガティブに書いているが全否定するつもりはない。新卒で入った会社は客先常駐であることだけが悪かった。COBOLも別に悪い言語とか思っているわけじゃあない。
ただし『客先常駐とCOBOL』という組み合わせは、将来の展望を描けなかった。これから新卒の人にはあまりお勧めできない。
なぜか。
まず、『客先常駐』。
これは全くもって良くない。責任が少ない仕事で十分で、人間関係を適度にリセットしたい人には向いていると思う。もしくは、よっぽどのニッチかつ高スキル保持者くらいだろうか。
問題点を述べていこう。
問題点そのいち。
常駐先ガチャが待っている。どんな地獄の案件が待っているか行かないと分からない。しかも、客先と戦わない営業マンの方が給料が高いなんてやっていられない。最近はSier側が強気に出られるパターンも小耳に挟むが、まだ稀な印象である。
問題点そのに。
上流工程に携われるかは運である。そもそも要件定義とか予算とかを他所から来た人間に任せることは難しい。底辺下請けにはもってのほかである。よって、下流工程のみの経験でスキルは身につかないまま、30代に突入する可能性すらある。
問題点そのさん。
契約形態によるが1ヶ月の勤務時間が決まっている。1ヶ月最低〇〇時間以上勤務となっている。これがネックとなり連休を取ることが非常に難しい。さらに、GWや年末年始休暇があると残業必須になる月が発生する。勤務時間縛りプレイ未経験者は大したことではないと思うかもしれないが、ワークライフバランスにおいてストレスになる。
次に、『COBOL』。
先ほども書いたが悪い言語だとは思っていない。
ただし、大型新規開発は今後ないと思えと言いたい。必然的にCOBOLを書き書きしていた時代のおじさま方には、技術の点で一生勝つことはない。彼らがくたばるまでは。
それと、たまに聞く「コボラーはこれからずっと需要があるし、新規参入者も減っているから将来安定だよ」なんて話。この嘘、ほんと?
確かにCOBOLは自分が死んだ後も生き残るだろうが、それほど大きなパイが残るだろうか。元請けか自社の社員にしか仕事が残らないのではないか。あったとしても金がどの程度分配されるというのだ。
個人的には、将来の選択肢を増やすためにCOBOL以外"も"経験した方がいいのではないかと思った。加えて、COBOLしか経験がないと求人が少なく30代以降の転職のハードルが高いため、その前に一度足抜けした方が安牌だと判断した。まあ、逃げ切れる世代には関係ございませんけれども。
悪魔合体させるといけない。
まず、COBOLはほぼ金融業界でのみ生き残っておりコボラーの生息範囲は限られることとなる。結果的に、客先常駐していると別の常駐先で出会った人かその関係者とかち合う可能性が非常に高くなる。個人情報や噂が一気に広まってしまうわけであり、一回でも社会からすってんころりんしたら戻りにくい。
なにより、両者ともに揃うと別業界や別ポジションに転職しにくくなる。客先常駐コボラーから客先常駐コボラーに転職する人が結構いるのが現実。コボラーになりたいなら最初からIT土方ピラミッドの頂点コボラーにならなければならない。
という様々な思いがあって、
客先常駐の働き方はこの先これ以上は無理だなとなり、COBOLだけではない肩書きを持ちたいと思って転職を決意したわけである。
現職の忙しさで心も身体もすり減っており、スケジュール管理や企業とのやり取りなんてとても無理だったからである。
さて、ステマなし・エージェント会社名無記載の個人的なエージェントの印象を述べていく。
まず、当初は大手のエージェントに登録していたが、こいつは全く使えなかった。自社開発か社内SEを希望しても、客先常駐とずっと求人出している営業職と介護職の求人票を寄越してくる。
最終的には、客先常駐コボラーは美味しくないため全くフォローされなくなり、ついにはエージェントの気配が消えた。
経歴に自信がある人か自主的に転職活動を進められる人以外は、大手向きではない。
次に中規模のエージェントに登録した。疲れて自主的に動けない自分向きであった。
エージェントの対応としては、大手より転職希望者が少ないためか連絡が頻繁かつ口調が砕けたものであり、転職活動の並走者感を演出することを意識されていたように感じた。
そのため、マメに連絡欲しくない人には向いていないと思う。
なお、結果的にこちらで内定まで到達したが、登録してから内定まで平均より1ヶ月ほど長かったようである。これも客先常駐コボラーの呪いか。
面接対策については、2つ目の中規模エージェントで書類添削及び面接対策の申し出があって実施していただいた。それに従えばおよそ間違いないと思うが、参考として面接経験を書き残す。
面接での質問は、これまでの仕事のことを深掘りされることが多かった。
一問一答で準備しておけるようなものではないため、成功したこと・失敗したこと・仕事中に心がけていることなどを整理しておくことが必須である。新卒からコボラーの人間に技術は期待されないから、アピールできるところが仕事の進め方や考え方だけだからだ。
また、気になるITの話題や自己研鑽の質問への回答をそれぞれ2〜3くらい用意しておくとベスト。
志望理由は、表向きの転職理由と求人票の職務内容を結びつけて言えばいい。ここを起点に他の話に発展していくことも多く、嘘の理由であっても結びつきをブレさせない意識を持つといいだろう。
企業研究はインターネットで調べて、事業内容と今後数年の計画を口で語れれば十分かと思われる。新卒と違って会社説明会なんてものはなかったが、面接担当者が面接中にどのような会社か親切に語ってくれるから、そこから志望動機にも繋げていくことができた。
そして、自分と同じく経歴がクソだと思う転職希望者たちには次のことを言いたい。
たとえ転職先で希望のキャリアや待遇が手に入れられなくても足がかりになるような経験が得られるか、でエントリーしていくといいと思う。
もしかしたら、転職した後に「失敗した」「隣の芝生が青いだけだった」なんてことになっているかもしれないが、そのときはまた転職活動を頑張る所存。
採用と教育のコストを考えろよというご意見には、退職されないように経営しろと回答させていただく。
ここまで来て一点大きな訂正をさせて欲しい。
コボラーを名乗っているが、実際はCOBOLよりJCLに触る時間の方が多かった。なんなら、JCLで一番動かしたものは読めないアセンブラのツールだったかもしれない。汎用機バンザイ。