「SWE」を含む日記 RSS

はてなキーワード: SWEとは

2024-06-05

I.GPT-4からAGIへ:OOMを数える (7)

アンホブリング

最後に、定量化するのが最も難しいが、それに劣らず重要改善カテゴリーを紹介しよう。

難しい数学問題を解くように言われたとき、頭に浮かんだことを即座に答えなければならないとしたらどうだろう。最も単純な問題を除いて、苦労するのは明らかだろう。しかしつい最近まで、LLMにはそうやって数学問題を解かせていた。その代わり、私たちほとんどはスクラッチパッドで段階的に問題を解いていき、その方法はるかに難しい問題を解くことができる。「思考連鎖プロンプトは、LLMのそれを解き放った。生の能力は優れているにもかかわらず、明らかな足かせがあるため、LLMは数学が苦手なのだ

私たちはここ数年で、モデルの「足かせを外す」ことに大きな進歩を遂げました。これは単に優れたベースモデルトレーニングするだけでなく、アルゴリズムの改良によってモデル能力を引き出すものです:

足場作り。CoT++について考えてみよう:ただ問題を解くようモデルに求めるのではなく、あるモデル攻撃計画を立てさせ、別のモデル可能性のある解決策をたくさん提案させ、別のモデルにそれを批評させる、といった具合だ。例えば、HumanEval(コーディング問題)では、単純な足場作りによってGPT-3.5が足場なしのGPT-4を上回った。SWE-Bench(実世界ソフトウェアエンジニアリングタスクを解くベンチマーク)では、GPT-4は~2%しか正しく解くことができませんが、Devinのエージェントの足場があれば14-23%に跳ね上がります。(後ほど詳しく説明するが、エージェントのアンロックはまだ初期段階に過ぎない。)

ツール:もし人間電卓コンピュータを使うことを許されなかったらと想像してみてほしい。まだ始まったばかりだが、ChatGPTウェブブラウザを使ったり、コードを実行したりできるようになった。

エポックAIによる研究によると足場作りやツール使用など、これらのテクニックのいくつかを調査したところ、このようなテクニックは多くのベンチマークで通常5~30倍の効果的な計算量の向上をもたらすことがわかった。METR(モデル評価する組織)も同様に、同じGPT-4ベースモデルからのアンホブリングによって、エージェントタスクのセットで非常に大きなパフォーマンスの向上を発見しました。

https://situational-awareness.ai/wp-content/uploads/2024/06/metr_gains_over_time-1024x597.png

METRのエージェントタスクパフォーマンス。出典モデル評価と脅威研究


これらをコンピュートとアルゴリズム効率統一した実効的なコンピュート規模に当てはめることは困難ですが、少なくともコンピュート規模の拡大やアルゴリズム効率とほぼ同規模の大きな進歩であることは明らかです。(また、アルゴリズム進歩が中心的な役割を担っていることも浮き彫りになっています。0.5OOM/年の計算効率は、すでに重要ものではありますが、ストーリーの一部に過ぎません。)

「アンホブリング」こそが、実際にこれらのモデル有用になることを可能にしたのであり、今日多くの商業アプリケーションの足かせとなっているものの多くは、この種のさらなる「アンホブリング」の必要であると私は主張したい。実際、今日モデルはまだ信じられないほど足かせが多い!例えば

ここでの可能性は非常に大きく、私たちはここで急速に低空飛行の果実を摘んでいる。これは非常に重要です。"GPT-6 ChatGPT "を想像するだけでは完全に間違っていますGPT-6+RLHFと比べれば、進歩は段違いだ。2027年までには、チャットボットというより、エージェントのような、同僚のようなものが登場するだろう。

続き I.GPT-4からAGIへ:OOMを数える(8) https://anond.hatelabo.jp/20240605210232

2024-04-15

anond:20240415084839

そのアメリカの話だし

学歴コンプ炸裂してるのは君では?

アメリカデータサイエンティスト高等教育受けてないなんて通常ありえないよ

トップテックSWECS学位持ってない人もほとんどいないし

2024-04-14

anond:20240414125453

味噌汁にクソを入れるかミソを入れるかはどうでも良くないよ

デザインパターンというのは言語フレームワークを超えて使うものだよ

GAFASWE面接言語フレームワークなんか聞かれないよ

好きな言語で答えてくださいって言われる

あっちも別にその言語が得意とも全然限らない

俺は知ってるんだよ

2回落ちたから笑

2024-04-01

anond:20240401101416

Sales Engineerは日本でいうプリセールスです

ソフトウェア設計コーディングをする人はSWESoftware Engineer)と言います

Systems Engineerというのも無くはないけど一般的ではないし日本SEシステムエンジニア)とは違います

2024-03-04

anond:20240304112959

偏屈ジジイプログラマーがよくそういった主張をしているけど、今の若い世代の優秀なSWEは大体陽キャコミュニケーションを通じて知識習得しているんやでという話。

2024-02-27

anond:20240227225534

前職でWeb制作出身CEOSWEに期限厳守させて大失敗したのを思い出した。

自分ソフトウェア開発の専門家だと思いこんでいるみたいで更にたちが悪かった。(Web制作ソフトウェアの開発と良いでよいのかは微妙なところだと思う)

2024-02-07

anond:20240207222720

いやあ、SWEコミュ力重要視されるからまず面接で落ちる(自分は重度の吃音症)し、機械学習エンジニア修士卒以上じゃないと厳しい(自分学部卒)だから詰んでるんだよな。

AtCoder jobsに助けを求めたが、職業紹介を断られた。理由不明

2023-12-23

ここに居る奴らって本当にエンジニアとして働いているんか?

ワイは事業会社SWEとして働いているけど、営業からの無茶な要望なんて来たことがないぞ。

そもそも要件を決めるのはPdMだしな。

2023-12-21

anond:20231221193720

ワイは事業会社SWEとして働いているけど、どの会社でも大体Macやぞ。

理由分からん

2023-11-26

anond:20231126011012

Kinda odd you said SO is '公式の焼き直し'. You rarely see questions/answers that could be answered by the official documents on SO, in English anyways. That usually happens when you search in Japanese. As you worked for one of GAFA in the states, I believe you are proficient in English. I don't know anybody who searches in Japanese except for special occasion like Japanese specific law or something when it comes to programming. I'm not convinced you were a SWE at GAFA. I'd be happy to be proved wrong though. Go ahead.

2023-11-23

anond:20231123183828

スクール卒はスクールであることを隠すからからないんだよな。

情報科以外の大学卒で、大学生の頃にスクールで学んでいたSWEは見たことがある。

2023-11-18

anond:20231118122919

これの原因は、SIerPMをやっている人やコーダーが何故か「エンジニア」を自称しているからやで。

事業会社外資SWEとして働いている人の技術水準はそこまで低くない。(英語圏の人と比べると、どうしても情報量の差で不利だけど。)

日本ソフトウェアエンジニア海外に比べると無能な割

2023-11-17

anond:20231117095130

設計書を下に流す仕事って今日日淘汰されてるんだけど、それすら知らなかったんだな。常識20年前で止まってる感じ。

あとswe年収2000万てgoogleコミュニケーションデザインとかawsリードテックとかのサラリーレベルなんだよね。

いないわけではないけど日系じゃない。その辺も嘘っぽい。KDDI課長級(の高い方)で1200万だよ。これは本人から聞いた。

ちなみにNTTからGAFA人材吸われて問題になったのが2011年あたりだけど、今は現場改善して定着率上がってるよ。

この辺も結構疎いんだね。

2023-10-08

anond:20231008214048

sweじゃなくプログラマーだったりattending doctorでなく医者だったりすると、どこに居ても肩身はせまいね

2023-10-02

年配のソフトウェアエンジニア

SWE界隈でそれなりに有名な人でも、年配の人は経験則を元に何かと断言しがちで違和感がある。何らかのデータを元に発言することが殆ど無い。

加齢のせいでああなってしまったのか、それともかつてはSWE底辺がする仕事だったからなのか...

2023-08-17

俺の前職がサービスリニューアルしたんだけどボロボロになってて草生える

代表根性論しか言わないのが原因でSWEがほぼ全員退職し、SESリニューアルさせた結果やばいことになってて草生える

2023-08-12

anond:20230812125449

日本しかいたことがない上に大した貯金も無い俺がアメリカで働く方法を教えてくれ。

アメリカ短大入学する→その間はフリーランスSWEとして働きつつ学校に通う→卒業後にアメリカIT企業にこれまでのSWEとしての経験英語を学んだことについてアピールして就職する

とかか?

2023-08-11

anond:20230811112141

ソフトウエアエンジニアに関しては東京では「名もなき」スタートアップ(実際には本国ではかなりの規模)にくらいにしかマトモな職がなくてガチ勢大手外資SWE職がほぼ無いのは知ってる

ログイン ユーザー登録
ようこそ ゲスト さん