はてなキーワード: エンジニアリングとは
やはり休日は暇つぶしが必要だと思い、Kaggleでmovielensデータセットで実験を行った。
最もシンプルなモデルとして、ユーザー×アイテムの行列に対する類似度を算出する方法で、類似ユーザーTop n人のレートの平均値を算出し、Top mのアイテムを出す。
これでNDCG@100で0.36ぐらいなので、ベースラインとしてはまあそのぐらいだろう。
実際、SOTAモデルを見ても、NDCG@100=0.4253ぐらいしか達成していない。
https://paperswithcode.com/sota/collaborative-filtering-on-movielens-1m?metric=nDCG%40100
Kaggleでのコンペは、精神を疲弊しそうだし、自信もないので参加する気はない。
こう、なんというか、それなりの精度のベースラインモデルをササッと作るぐらいで丁度いい。
ところで、自分の7年の業務経験のスキルセットがどの程度なのかというのを視覚化してみたら、多分以下のようになると思う。
genre | level |
コーディング | ★★★★ |
アルゴリズム | ★★★ |
インフラ | ★★ |
機械学習 | ★★★ |
コミュニケーション | ★★ |
ビジネス理解 | ★ |
データ視覚化 | ★★ |
統計学 | ★★ |
実のところ「機能要件をどう実現するか」というエンジニア思考なので、あまり統計科学的な思考は身についていない。
といっても薬学研究の発表があれば「薬の作用・副作用の効果なのか、病気の症状によるものなのか区別がついていない」ということを指摘できる程度の批判的思考は持っているので、
「科学」と名のつくところに科学とは程遠い政治が存在することは知っている。
つまりエンジニアリングが好きで、科学が嫌いなのは、その政治性である。エンジニアリングは、作って見せればそれで実証できるのが好きである。
最後に、定量化するのが最も難しいが、それに劣らず重要な改善のカテゴリーを紹介しよう。
難しい数学の問題を解くように言われたとき、頭に浮かんだことを即座に答えなければならないとしたらどうだろう。最も単純な問題を除いて、苦労するのは明らかだろう。しかしつい最近まで、LLMにはそうやって数学の問題を解かせていた。その代わり、私たちのほとんどはスクラッチパッドで段階的に問題を解いていき、その方法ではるかに難しい問題を解くことができる。「思考の連鎖」プロンプトは、LLMのそれを解き放った。生の能力は優れているにもかかわらず、明らかな足かせがあるため、LLMは数学が苦手なのだ。
私たちはここ数年で、モデルの「足かせを外す」ことに大きな進歩を遂げました。これは単に優れたベースモデルをトレーニングするだけでなく、アルゴリズムの改良によってモデルの能力を引き出すものです:
足場作り。CoT++について考えてみよう:ただ問題を解くようモデルに求めるのではなく、あるモデルに攻撃計画を立てさせ、別のモデルに可能性のある解決策をたくさん提案させ、別のモデルにそれを批評させる、といった具合だ。例えば、HumanEval(コーディング問題)では、単純な足場作りによってGPT-3.5が足場なしのGPT-4を上回った。SWE-Bench(実世界のソフトウェアエンジニアリングのタスクを解くベンチマーク)では、GPT-4は~2%しか正しく解くことができませんが、Devinのエージェントの足場があれば14-23%に跳ね上がります。(後ほど詳しく説明するが、エージェントのアンロックはまだ初期段階に過ぎない。)
ツール:もし人間が電卓やコンピュータを使うことを許されなかったらと想像してみてほしい。まだ始まったばかりだが、ChatGPTはウェブブラウザを使ったり、コードを実行したりできるようになった。
エポックAIによる研究によると足場作りやツールの使用など、これらのテクニックのいくつかを調査したところ、このようなテクニックは多くのベンチマークで通常5~30倍の効果的な計算量の向上をもたらすことがわかった。METR(モデルを評価する組織)も同様に、同じGPT-4ベースモデルからのアンホブリングによって、エージェントタスクのセットで非常に大きなパフォーマンスの向上を発見しました。
https://situational-awareness.ai/wp-content/uploads/2024/06/metr_gains_over_time-1024x597.png
これらをコンピュートとアルゴリズムの効率で統一した実効的なコンピュート規模に当てはめることは困難ですが、少なくともコンピュート規模の拡大やアルゴリズムの効率とほぼ同規模の大きな進歩であることは明らかです。(また、アルゴリズムの進歩が中心的な役割を担っていることも浮き彫りになっています。0.5OOM/年の計算効率は、すでに重要なものではありますが、ストーリーの一部に過ぎません。)
「アンホブリング」こそが、実際にこれらのモデルが有用になることを可能にしたのであり、今日多くの商業アプリケーションの足かせとなっているものの多くは、この種のさらなる「アンホブリング」の必要性であると私は主張したい。実際、今日のモデルはまだ信じられないほど足かせが多い!例えば
ここでの可能性は非常に大きく、私たちはここで急速に低空飛行の果実を摘んでいる。これは非常に重要です。"GPT-6 ChatGPT "を想像するだけでは完全に間違っています。 GPT-6+RLHFと比べれば、進歩は段違いだ。2027年までには、チャットボットというより、エージェントのような、同僚のようなものが登場するだろう。
続き I.GPT-4からAGIへ:OOMを数える(8) https://anond.hatelabo.jp/20240605210232
社会人になってからのぼんやりした目標でITを極めたいという思いがある。
一分野に特化したタイプではなくIT領域におけるオールラウンダーのような総合格闘家のような存在。
まずITを極めるとは具体的にどういう状態なのか。そのためには何をすればいいのかを考察する。
まずITを主要トピックに大別する。必ずしもMECEではない。
そしてどういうことができたらITを極めたと言えるかを思いつく限り列挙してみる
次は具体的に列挙した例について解像度を上げてどの要素に分類されるものかを考えた上で、それを極めるには何をすればいいかを考える。
あまりに理不尽なことでクライアントと言い合いになったので、多少ボカして顛末を記す。
私の会社でとある商品をオンライン販売しており、その在庫管理システムのようなものを必要としていた。
それでネットで検索して「システム構築はお任せください」というシステムインテグレータに見積もりを依頼し、発注することになった。
概ね順調にシステムが出来てきたころ、私と先方のシステムエンジニアとの会話でこのようなことがあった。
先「それなら良かったです」
私「一点いいかな?受注してから発送作業者が作業に取り掛かるまで、現状だと手動で見に行かなければならない。ここも改善したいのだがいけるかな?」 ※特定を避けるためボカしてます
先「なるほど・・・その場合は人が常駐している必要がありますね」
私「その作業、君がやってくれるかな?」
先「えっ?」
私「えっ?」
となって空気がおかしくなった。私の言い分はこうである。「システム」は業務の工程全体を表すのであって、ソフトウェア的な部分だけを表すワードではない。
だから「システムエンジニア」を名乗るなら、ソフトウェア面以外の箇所も改善するのが当然ではないか、というのが私の理屈である。
しかし先方の言い分はそうではない。システムエンジニアはソフトウェアシステムだけを改善し、それ以外は関与しない。
だからソフトウェア改善で対応できない箇所は「システムエンジニア」だから対応しないというわけである。
私にとっては、一体何を言っているんだという話である。システムという言葉を軽視しているというか、濫用しているのではないか。
ソフトウェアも立派なシステムであるが、これは株式会社と株式会社のやりとりである。
ビジネスがシステムの根幹であって、ソフトウェアはその内部のいち部分でしかないことは明白ではないのか?
結局そのシステムインテグレータは、ソフトウェア以外のシステムは対応しませんということだった。私にとっては片手落ちの気分である。
インパラ・・・ウシ科に分類される偶蹄類。本種のみでインパラ属を構成する。
インパラ・・・ゼネラルモーターズ (GM) がシボレーブランドで販売している大型乗用車
インペラ・・・液体・気体用の遠心力ポンプや発電機等に使用される羽根車
インペラトル・・・ローマにおける軍指揮者、凱旋将軍・大将軍、元首・皇帝
オンプレ・・・オンプレミス(自社サーバーでシステムを運用する形態)
(追記)
現代分類学の秘孔を突く新機軸エントリに思いのほかトラバブクマ集まったな。みんなサンキュー。
みんな知ってるか?インパラってめちゃ育てるのが難しくてどうもたぶんおそらくだけど日本の動物園にはいないっぽいぞ!?
「あーインパラねハイハイ見たことあるある」みたいに思ってるあなたのそのインパラっぽいイメージのやつ!、それ、「オリックス」ですから!!「アラビアオリックス」ですから!!「シロオリックス」ですから!!!「エランド」ですから!!!!
どうせ想像の中では雑魚モンス扱いなんだろ?ライオンチーターゴリラゴリラゴリラに見劣りするからな。でもな、敢えて言う実物を見てみろ!もも肉の感じとかサア!マジで生命感ハンパないぞ!見たことないが。
フリーレンが集めてるしょーもない魔法は、pipとかnpmに上がってるしょーもないパッケージ
っていうのを集めてる
魔法の解析はリバースエンジニアリングのことで、フリーレンはその天才
で、魔法は単純なプログラミングコードではなくてLLMをベースにしたコードになっていて
魔力っていうのはそのLLMのモデルの大きさ
長い年月をかけてLLMを追加学習させることで魔力を増やしていくが人間はそのモデルの大きさを誇ろうとしない
魔力の揺らぎはLLMの出力の微妙な違いのことで、LLMのモデルが大きいと
「単純な答えのように見えるけど微妙に違っていて実は大きなモデルなのでは?」
と気付く
AIなのでLLMしか取り柄が無く、モデルの大きさでマウントを取り合うのが魔族
ただ人間と違って死ぬことがないので魔族の使うプロンプトエンジニアリングはまるで理解できず
人間が再現できないLLMベースのプログラミングコードは「呪い」として扱われてる
大手SIerも状況は同じ。どんどん踏み台にして転職してるよ。
ソフトウエアエンジニアリング会社と違う所は、いわゆる「DX」を目指して高給でエンジニアを集めている非IT系の企業へ転身も増えてる点かもね。
業界知識+ITスキルで転職。そういった企業は、ちゃんとIT業種向けに水準の高い給与を設定しつつ、日本企業の手厚い福利厚生が利用できるので幸せにやってる連中がけっこういる。
企業目線で言えば、人手不足を背景に、ソフトウエアエンジニアリングが専門かどうかとかは関係なく人材流出してるってことなんだよな。
ちょっと前にNTTがgoogle予備校なんて呼ばれたことがあったけど、まだまだそんな状況が続いている。
やたらとキャリア採用増やして新卒採用を減らしてるけど、あれは人材流動化とか綺麗事じゃ無い部分も多くてね。
新卒は来なくなって、実働部隊がどんどん流出してるからだ。それをより条件の悪い会社から人材を吸い上げてなんとか帳尻を合わせてる。
それがあるから、SIerも変革を求められてて、給与水準も上がっているし、社内改革も進んでいる。最悪の状況は脱しつつある。
部署によっては脱していて高い利益率を出しているところもあるが、しがらみを抱えてうまくいってない所も多い。
出奔して別の会社にいけない出がらしみたいな人たちと、表向きのきらきら求人・上澄みの上手くいっている所の宣伝で転職してきた人たちとの間で意識のずれがあって結構カオス。
100人の凡才より1人の天才の方が生産性が高いから論、これよく言われるけど疑問なんだよなあ。
同じソフトを100個売るのと1000万個売るのでコストがほとんど変わらない。
サービスだともうちょっと事情が違うにしても、そこが圧倒的に違うような。
1人の天才の方が100人の凡人より生産性が高いのが当たり前の世界、ってのは、尖った機能を持ったソフトウエアライブラリや、単機能モジュールなんかは確かにそうだと思う。けど、一定以上の規模があると1人の天才じゃ物理的に対応ができなくなるよね。
例えば、超優秀なAIを開発したとして、それをサービス化するための作業はひとりじゃ無理。天才的能力は必要ないが、時間がかかる仕事は山のように発生する。
だから、ソフトウエアも労働集約型の性質を持っているんだよ。(もちろん例外はある)
そこで、ひとりの天才はソフトウエアアーキテクトは超高給を得られるのは当然としても、それ以外の凡人も他の産業よりも高給になっているのは何故か?
それは、限界費用がゼロに近いからだよ。それで収益力が高いからだよ。
超優秀な1人の生産性が凡人100人に勝るのは、エンジニアリングの世界ではわりと不変的な事で、ソフトウエアに限らないと思う。
その証拠に、数が出ないサービス、フルスクラッチのサービスの制作に従事する人々(増田が言う「SIerとかいうガラパゴスビジネスは労働集約型産業」のやつ)はお給料が安い訳よ。有象無象の中小企業よりはそりゃ出てるけど、大手製造業に比べると見劣りする。
そういったガラパゴスSIerので今何が起こっているかというと、収益力の高いビジネスの影響を受けた、ソフトウエア技術者の人件費高騰と人材不足。
自社はそんな収益力の高いビジネスをできているわけではないのにね。
で、SIerが一品モノの開発ビジネスから脱却して、オファリングだのルマーダだのユーバンスだのもがき苦しんでるってのが最近の話だよな。
従来はパッケージは最小限のモジュールしかなくて、、受注したら各社ごとにカスタマイズして売るって商売だった。そのカスタマイズこそが人月商売で安定した利益が望めるってんで、SE部隊と関連する下請け会社を食わせてたわけだ。各社導入時に必ず追加するような機能までコードを流用せず別開発したりして、それで商売していた。
一方で、人口減少の時代と需要爆発による人材不足に、更にカスタマイズ大杉問題によるシステムの肥大化、各種コスト上昇に加えて、株主に物言う株主、アクティビストが増えて、高収益を求められる時代に。そこで、
に行こうとしているわけだよ。
うまくいってないけどな!
うまくいってないけどな!!
うまくいってないけどな!!!
あと、パッケージ化のしようがなくてフルスクラッチで作り続けなければいけないシステムってのはどうしても存在するのも各社頭痛の種だよな。収益率低くてリスクが高いわりに儲からないし、優秀な若い人ほどやりたがらない。アクセンチュアとかが絶対手を出さない領域。
切りたいけど切れないやつ。
仕事で扱うインフラの技術についてのO'Reillyの書籍を先日購入しました。
はい、フリーランスのWebエンジニアとして働いている場合、仕事に関連する技術書や資料の購入費用は経費として申請することができます。日本の税法では、仕事のために必要な費用は、所得から差し引くことが認められています。これには、書籍、オンラインでの学習資料、ソフトウェア、ハードウェア、その他の業務に直接関連する資材やサービスの費用が含まれます。
経費として認められるものの具体的な条件や方法は、事業の形態や収入の状況によって異なる場合があるため、確定申告の際には、税理士や税務署の指導に従うことをお勧めします。また、経費として申請する際には、購入した書籍や資料が仕事に関連するものであることを証明できるよう、領収書や購入記録を保管しておくことが重要です。
ChatGPT
グラップラー刃牙全巻を経費として申請することは、一般的には困難です。経費として認められるものは、仕事上必要なもの、または事業運営に直接関連するものに限られます。たとえば、Webエンジニアリングの技術書やプログラミングに関する書籍などは、その知識を業務に活かすことができるため、経費として認められやすいです。
一方で、グラップラー刃牙のような漫画全巻は、一般的に趣味や娯楽の範疇に入ります。仮にその内容が仕事のインスピレーションになったとしても、税務上は業務必要性が直接的でないと見なされることが多いです。そのため、趣味やエンターテイメント関連の出費は、経費として申請するのが難しいと考えられます。
ただし、特定の業種や職種で、例えばクリエイティブな仕事やコンテンツ制作など、漫画が直接的な仕事のインスピレーションとなり、その内容が業務に密接に関連している場合は、経費としての申請が可能なケースもあり得ます。このような場合でも、その必要性を明確に説明し、文書化することが求められます。
結論として、一般的なWebエンジニアリングの業務においては、グラップラー刃牙全巻を経費として認められる可能性は低いでしょう。確定申告や税務処理について不明点がある場合は、税理士などの専門家に相談することをお勧めします。
文化の盗用ならぬ、活動家による手柄の横取りを礼賛する内容になっている。
「わきまえない人たちが敢えてコンフリクトを起こすことでマジョリティは不承不承マイノリティの要求に対応してきた。今日では皆がその積み重ねの恩恵に与っている」
それは本当か?
例えば男女同権を推し進めてきたのは何ものの力か。戦争や産業に従事する上での、腕力の重要度の低下。家事専従者が必須でなくなったこと。そして法改正。ハードウェアの進歩と制度的な裏書きが社会を動かしてきたのだ。
フェミニストによる道義的非難に耐えかねて、あるいはその啓蒙に感激して動くほどに社会はヤワでも腰軽くもない。イズムにイズムをぶつけても1ミリも動きはしないのである。
バリアフリーのためのインフラ整備だって同じだ。増田は利用者の視点のみから「先人の闘争のおかげ」としているがただの想像でしかない。商業上の要請や建築法規に基づき、あるいは単に業務の一環として、少しずつ尽力してきた無名の貢献者はいなかったものとされている。
繰り返すがマジョリティは非難に耐えかねたり説教に感激して動くほどナイーブではない(へりくだって情を乞えではなく、マジョリティの冷たさ薄情さをナメるなと言っている)。活動家のおかげ説はそのフィクションに立脚している。その結果として何が起きるか。
小さなコンフリクトを平熱で改善につなげるべきところ、常にこうして感情的な分断ネタとして消費される「型」が出来上がってしまうのだ。施設側が100%悪い!いや車椅子の側が100%悪い!と。
「日本社会はいまだこんなに遅れているから、こういう機会を捉えて燃やさないと変わらない」というのは因果が逆で、無駄に燃やしてばかりだから協働の文化の成熟がスポイルされているのだ。
誰かが白眼視を恐れずいきなりギャーって騒いでくれたら「正直助かるわけよ〜」って言ってるが普通に恥ずかしい発想だと思わないか?
そうやって物理的/道徳的に担当者を責めたてるという要望の仕方が本当に合理的だと思うか?社会は基本的に事なかれ主義で、ノイジークレーマーには「特別あつかい」でお茶を濁すのだ。
「クレーマーがほどほどに騒いでくれると有り難い」ってバカみたいな結論だぞ。
ーーーーーーーーーーーー
共産党赤旗、コンビニで見かけた成人誌の密告フォームを作成「国連に持ち込んで問題にする」ヤングジャンプ、ヤングキング、ヤングアニマルなどが対象
こういうのも同工。
とっくにエロ本が完全撤退したあとでヤンジャンとか燃やそうとしてんの。
「ワシが育てたムーブ」にコロっと引っかかってんじゃねえよ
ーーーーーーーーーーーー
法律の制定が権利主張なしに良心に満ちた人々によって行われるとでも信じているのだろうか。大したお花畑。激しくない権利主張は現実として黙殺されるだけ。差別者が被差別者の大人しい主張に傾聴すると思うかい?
法整備はエンジニアリングを後追いするという本質論を主張する上で全然重要でないから詳論してない所に、隙があると思いこんでこうしてバカが頭をねじ込んでくる。
まあいったん対立のパターンができてしまうことの弊害はこういうことなんだ。それぞれの陣営の正義の能無しが問題の周りを固めてしまい、手つかずにさせてしまう。
実際にコツコツ手を動かす人を遠ざけ、吊し上げが好きな奴ばかりが集まってくる。
ーーーーーーーーーーーー
「穏当に地道に“活動”してる人もいる」
そらそうよ。みなまで言わなかったけど。
自由な市民としての矜持を持ち、選挙にいく以外でもあらゆるチャンネルを探って社会の運営/改善に参画しようとする、リベラルであるとはそういうことだ。そこには当然にして摩擦が生じることもある。
くだんの車椅子インフルエンサーのことも別に迷惑100%とは評価していない。施設側のモノの言いようにカチンと来たのも想像はできる。
そんなに難しいこと言ってないが、まあはてな界隈にもうなんも期待してないのはある
ーーーーーーーーーーーー
毎たび最後に同じようなこと言ってるが、一言マウンティングじゃなくてトラバで字数気にせず堂々反論すれば?でもお前らは絶対に自分の発言に責任持たないんだよな。ピンポンダッシュに最適化したカス連中