「モデリング」を含む日記

2024-06-14

■https://anond.hatelabo.jp/20240614204953 の勝手にタグ付けソースだよ

1996年（第1巻）	5月号	特集：脳の科学とこころの問題	医療・人間
1996年（第1巻）	11月号	特集：高齢者と介護	医療・人間
1996年（第1巻）	4月号	(創刊号）特集：戦略研究と高度研究体制	学術・教育
1996年（第1巻）	6月号	特集：第3回アジア学術会議	学術・教育
1996年（第1巻）	8月号	特集：日本国際賞受賞記念講演会から	学術・教育
1996年（第1巻）	9月号	特集：若手研究者	学術・教育
1996年（第1巻）	12月号	特集：第124回日本学術会議総会	学術・教育
1996年（第1巻）	7月号	特集：地球環境問題を考える	環境
1996年（第1巻）		特集：転換期にある工業と産業	工学
1996年（第1巻）	10月号	特集：女性科学研究者	ジェンダー
1997年（第2巻）	2月号	特集：パラダイムの転換	学術・教育
1997年（第2巻）	3月号	特集：大学改革と任期制	学術・教育
1997年（第2巻）	6月号	特集：伝統と新しい地平 ―第4回アジア学術会議	学術・教育
1997年（第2巻）	7月号	特集：第125回日本学術会議総会	学術・教育
1997年（第2巻）	8月号	特集：第16期から第17期へ	学術・教育
1997年（第2巻）	9月号	特集：第17期の発足 ―第126回日本学術会議総会	学術・教育
1997年（第2巻）	10月号	特集：高度研究体制の確立を目指して	学術・教育
1997年（第2巻）	11月号	特集：地域における学術の活性化を目指して	学術・教育
1997年（第2巻）	12月号	特集：第127回日本学術会議総会	学術・教育
1997年（第2巻）		特集：2国間学術交流マレイシア派遣団報告	学術・教育
1997年（第2巻）	4月号	特集：地球と食料問題を考える	環境
1997年（第2巻）	1月号	特集：平和と共生	歴史・政治・国際
1997年（第2巻）	5月号	特集：グローバリゼーションと産業空洞化	歴史・政治・国際
1998年（第3巻）	3月号	特集：クローン羊"ドリー"：遺伝子科学のはかり知れないインパクト	化学・生物
1998年（第3巻）		特集：クローン羊"ドリー"：バイオテクノロジーの最先端で今、何が、どうなっているか	化学・生物
1998年（第3巻）	2月号	特集：二国間学術交流スイス及びスウェーデン派遣団報告	学術・教育
1998年（第3巻）	6月号	特集：21世紀の科学への視点 ―第128回日本学術会議総会	学術・教育
1998年（第3巻）	7月号	特集：アジアにおける学術の直面する課題 ―第5回アジア学術会議	学術・教育
1998年（第3巻）	12月号	特集：新たなる研究理念を求めて ―第129回日本学術会議総会	学術・教育
1998年（第3巻）	1月号	特集：地球の未来～人間の存続	環境
1998年（第3巻）	5月号	特集：地球・惑星・宇宙の科学の現状	環境
1998年（第3巻）	11月号	特集：食品研究の新領域をさぐる ―食とからだの科学を中心に	環境
1998年（第3巻）	4月号	特集：ジェンダー　 ―社会的･文化的｢性別｣と現代	ジェンダー
1998年（第3巻）	8月号	特集：日本経済の課題と展望 ―日本版ビックバンに向けて	社会
1998年（第3巻）	9月号	特集：行政改革の課題と展望	社会
1998年（第3巻）	10月号	特集：ライフスタイルの転換と新しい倫理 ―21世紀型社会に向けて	社会
1999年（第4巻）	4月号	特集：生殖医療とその社会的受容	医療・人間
1999年（第4巻）	1月号	特集：21世紀に向けた学術の新たな改革	学術・教育
1999年（第4巻）	3月号	特集：国民の期待に応えて ―科学の最前線から	学術・教育
1999年（第4巻）	6月号	特集：IGBPの研究成果の統合に向けて ―第130回日本学術会議総会	学術・教育
1999年（第4巻）	10月号	特集：日本学術会議創立50周年	学術・教育
1999年（第4巻）	12月号	特集：わが国の大学等における研究環境の改善について（勧告）－第131回日本学術会議総会	学術・教育
1999年（第4巻）	2月号	特集：ごみを考える	環境
1999年（第4巻）	8月号	特集：海洋	環境
1999年（第4巻）	11月号	特集：科学･技術と社会	社会
1999年（第4巻）		特集：少子化の問題点	社会
1999年（第4巻）	5月号	特集：学会とインターネット	情報
1999年（第4巻）	9月号	特集：学術からみた｢美しさ｣について	人文
1999年（第4巻）	7月号	特集：人口と環境 ―持続的発展に不可欠なアジアの役割 ― 第6回アジア学術会議	歴史・政治・国際
1999年（第4巻）		特集：科学技術の発展と新たな平和問題	歴史・政治・国際
2000年（第5巻）	1月号	特集：学術研究の国際ネットワーク	学術・教育
2000年（第5巻）	3月号	特集：第7回アジア学術会議	学術・教育
2000年（第5巻）	4月号	特集：世界科学会議「21世紀のための科学」	学術・教育
2000年（第5巻）	7月号	特集：第17期を締めくくる成果 ―第132回日本学術会議総会	学術・教育
2000年（第5巻）	8月号	特集：第17期から第18期へ	学術・教育
2000年（第5巻）	9月号	特集：第18期始まる	学術・教育
2000年（第5巻）	10月号	特集：俯瞰型研究プロジェクトへのアプローチ	学術・教育
2000年（第5巻）	11月号	特集：研究業績評価 ―実態と問題	学術・教育
2000年（第5巻）	12月号	特集：第18期活動計画の全容	学術・教育
2000年（第5巻）		特集：各部の抱負	学術・教育
2000年（第5巻）		特集：第8回アジア学術会議	学術・教育
2000年（第5巻）		特集：世界科学アカデミー会議	学術・教育
2000年（第5巻）	2月号	特集：安全	災害
2000年（第5巻）	6月号	特集：男女共同参画社会における日本の学術	ジェンダー
2000年（第5巻）	5月号	特集：司法改革の課題と展望	社会
2001年（第6巻）	2月号	特集：21世紀とヒトゲノム	医療・人間
2001年（第6巻）	4月号	特集：21世紀と新エネルギー	エネルギー
2001年（第6巻）	1月号	特集：21世紀の科学の役割を問う	学術・教育
2001年（第6巻）	3月号	特集：21世紀の科学アカデミーをデザインする	学術・教育
2001年（第6巻）	5月号	特集：学術的活動のための次世代育成	学術・教育
2001年（第6巻）	6月号	特集：「科学技術」の概念を人文・社会科学へと拡張	学術・教育
2001年（第6巻）	7月号	特集：大衆化された大学での教育はいかにあるべきか	学術・教育
2001年（第6巻）	11月号	特集：日本学術会議の改革に向けて	学術・教育
2001年（第6巻）		特集：常置委員会の目指すもの	学術・教育
2001年（第6巻）		特集：日本社会の変容と教育の将来	学術・教育
2001年（第6巻）		特集：第1回アジア学術会議	学術・教育
2001年（第6巻）		特集：特別委員会の活動経過	学術・教育
2001年（第6巻）	8月号	特集：遺伝子組換え食品をめぐる最近の動向	環境
2001年（第6巻）	10月号	特集：食から見た21世紀の課題	環境
2001年（第6巻）	9月号	特集：10代は変わったか!	こども
2001年（第6巻）	12月号	特集：データベースの新たな保護権利制度導入反対への初の声明	情報
2001年（第6巻）		特集：21世紀とIT 社会	情報
2002年（第7巻）	5月号	特集：医療の最先端	医療・人間
2002年（第7巻）	8月号	特集：ナノテクノロジー	化学・生物
2002年（第7巻）	9月号	特集：動物実験	化学・生物
2002年（第7巻）	1月号	特集：新世紀の日本学術会議	学術・教育
2002年（第7巻）	3月号	特集：科学技術の新世紀	学術・教育
2002年（第7巻）	6月号	特集：新しい日本学術会議に向けて!	学術・教育
2002年（第7巻）	7月号	特集：ノーベル賞 100周年記念国際フォーラム「創造性とは何か」	学術・教育
2002年（第7巻）	11月号	特集：変革をめざす国立大学　―学長たちは考える	学術・教育
2002年（第7巻）	12月号	特集：日本学術会議の今後の方向に向けて！	学術・教育
2002年（第7巻）		特集：「大学の自立」と「学術経営」のあり方を探る	学術・教育
2002年（第7巻）		特集：第2回アジア学術会議（SCA）	学術・教育
2002年（第7巻）		特集：学術（科学）研究の成果と社会	学術・教育
2002年（第7巻）	4月号	特集：学術の再点検　 ―ジェンダーの視点から（1）	ジェンダー
2002年（第7巻）	2月号	特集：創造性と日本の社会	社会
2002年（第7巻）	10月号	特集：「身体障害者との共生社会」の構築に向けて	社会
2002年（第7巻）		特集：日本の計画	社会
2002年（第7巻）		特集：グローバル化時代に対応する高等教育の課題	歴史・政治・国際
2003年（第8巻）	2月号	特集：研究・教育の現場から見た国立大学改革	学術・教育
2003年（第8巻）	3月号	特集：科学と社会　―いま科学者とジャーナリストが問われている―	学術・教育
2003年（第8巻）	7月号	特集：私立大学のさらなる発展	学術・教育
2003年（第8巻）	8月号	特集：第18期から第19期へ	学術・教育
2003年（第8巻）	9月号	特集：第19期始まる	学術・教育
2003年（第8巻）	10月号	特集：新しい学術の体系	学術・教育
2003年（第8巻）	12月号	特集：第19期活動計画	学術・教育
2003年（第8巻）		特集：活動計画と各部の抱負	学術・教育
2003年（第8巻）		特集：第3回アジア学術会議（SCA）	学術・教育	Permalink \| 記事への反応(0) \| 20:52 ツイートシェア

2024-06-10

■anond:20240318165802

俺も数年前まではそうだったふと見た切り抜きからそこそこｖを見るようになった

好きになりたいならまずは切り抜きを見ろ

いろんなｖの切り抜きを

それで自分にささったやつの本人の動画を見に行けばいい

最初から雑談とかゲーム配信とかの長時間のを見ようとするのは無理だしタイパ悪すぎる

つきのみと

俺がみるようになったきっかけはつきのみとの切り抜きだった　増田でもつきのみとからはまったって人いたけどあんな感じだった

ふみのたまき

ふみのたまきも切り抜きから入った　こいつはいろいろ常識とか衛生観念やばいのが面白くてみるようになった

でも一線こえるとかvtuberの世界観・キャラ設定をぶっちゃけるほどではなくてそこはわきまえてる

雑談でもほんとにてきとーに話す奴もあるけど、きっちり話すネタをいくつも用意してきて話すこともあるから、きいてて面白い

着眼点も新鮮で、ありきたりな観点とずれてるからきいてておもろい

会社に無断でゆたぼんとコラボして怒られたりしたらしい

6年目とからしいけど、最近の配信は声に元気なくて引退しそうだなって思ってる

ヘアピンまみれ

DIY系ユーチューバーとして他の追随を許さない

ユーチューバーあるあるネタをやるんじゃなくてこいつ独自の観点でいろいろ工作したり考察したり語ったりするからすげーおもろい

モデリングとかも全部じまえでやっちまうやばいやつ

配信でしゃべってる内容からするとまだはたちそこそこみたいなんだけど生物に関する知識もやばい

図鑑をたくさんもってるからマジですきなんだなって

昔から YouTubeでそういう工作系のやつとか見るのが好きだったらしいけど

基本動画（配信ではない・きっちり編集した動画）が多いけど、

めっちゃ見やすいし聞きやすい

着眼点とそこからの考察　実験　反省とかの流れは子供に見せたくなるレベル　

チビデブハゲ童貞だから無塩バターだけどね

はははしにたい

Permalink | 記事への反応(0) | 20:38

2024-06-09

■Perplexityのテスト: アルゴリズムの提案

質問

コンテンツ集合Xがあります。各々の要素x∈ Xは特徴量f_1(x)∈Y_1 を持っています。
同様にユーザーu ∈ Uが存在し、特徴量f_2(u)∈Y_2を持っています。
コンテンツには単価P(x)が存在し、ユーザーuがコンテンツをm回消費することをg(u, x, m)=m*P(x)_uで表し、全てのユーザーU, 全てのコンテンツXに対して行列M∘P = g(U, X, M) が存在します。
目的関数M∘Pを最大化したいのですが、どんなアルゴリズムが考えられるでしょうか。

回答

この問題は、コンテンツとユーザーの特徴量を考慮して、ユーザーがコンテンツを消費する回数を最大化するものです。このような問題は、推薦システムの分野で広く研究されており、協調フィルタリングと呼ばれるアプローチが一般的に使われています。
協調フィルタリングアルゴリズム
協調フィルタリングには、以下のようなアルゴリズムが考えられます。
1. 行列因子分解 (Matrix Factorization)
行列因子分解は、ユーザー・コンテンツ行列を低ランク近似することで、ユーザーとコンテンツの潜在的な特徴を抽出します。具体的には、ユーザー行列Uとコンテンツ行列Vを求め、その内積U^TVで元の行列を近似します。この手法は、Netflix Prizeで優れた成績を収めました。[1]
2. ニューラルコラボレーティブフィルタリング (Neural Collaborative Filtering)
ニューラルネットワークを用いて、ユーザーとコンテンツの非線形な関係を学習します。入力としてユーザー IDとコンテンツ IDを与え、出力として評価値を予測します。この手法は、従来の行列因子分解よりも高い精度が期待できます。[2]
3. 階層的ベイズモデル (Hierarchical Bayesian Model)
ユーザーとコンテンツの特徴量を階層ベイズモデルに組み込むことで、より柔軟なモデリングが可能になります。この手法は、Cold-Start問題(新規ユーザー・コンテンツの推薦が困難)の解決に有効です。[3]
4. 強化学習 (Reinforcement Learning)
ユーザーの行動履歴を環境として捉え、報酬最大化のためのアクションを学習します。この手法は、長期的な利益最大化に適しています。[4]
これらのアルゴリズムは、ユーザーとコンテンツの特徴量を考慮しながら、目的関数を最大化するように設計されています。実装の際は、データセットの特性やモデルの複雑さ、計算リソースなどを考慮する必要があります。[5]
Citations:
[1] https://aicontentfy.com/en/blog/understanding-algorithms-behind-content-distribution
[2] https://marketbrew.ai/optimizing-your-websites-content-with-genetic-programming
[3] https://sproutsocial.com/insights/social-media-algorithms/
[4] https://surferseo.com/blog/the-new-algorithm-for-content-analysis/
[5] https://www.linkedin.com/advice/0/what-best-ways-measure-content-relevance-x6apf

Permalink | 記事への反応(0) | 12:51

2024-06-05

■I.GPT-4からAGIへ：OOMを数える (6)

データの壁

これらすべての重要な変動要因になりうるものがあります。つまり、より多くのスクレイピング・データでより大きな言語モデルをプリ・トレーニングするという素朴なアプローチが、まもなく深刻なボトルネックにぶつかり始める可能性があるということだ。

フロンティア・モデルはすでにインターネットの多くで訓練されている。例えば、Llama 3は15T以上のトークンで学習された。LLMのトレーニングに使用されたインターネットの多くのダンプである Common Crawlは、生で100Tトークンを超えるが、その多くはスパムや重複である（例えば、比較的単純な重複排除は30Tトークンにつながり、Llama 3はすでに基本的にすべてのデータを使用していることになる）。さらに、コードのようなより特殊な領域では、トークンの数はまだまだ少ない。例えば、公開されているgithubのリポジトリは、数兆トークンと推定されている。

データを繰り返すことである程度遠くまで行くことができるが、これに関する学術的な研究は、16エポック（16回の繰り返し）の後、リターンは非常に速く減少し、ゼロになることを発見し、繰り返しはそこまでしか得られないことを示唆している。ある時点で、より多くの（効果的な）計算を行ったとしても、データ制約のためにモデルをより良いものにすることは非常に難しくなる。私たちは、言語モデリング-プレトレーニング-パラダイムの波に乗って、スケーリングカーブに乗ってきた。大規模な投資にもかかわらず、私たちは停滞してしまうだろう。すべての研究室が、新しいアルゴリズムの改善や、これを回避するためのアプローチに大規模な研究の賭けに出ていると噂されている。研究者たちは、合成データからセルフプレー、RLアプローチまで、多くの戦略を試していると言われている。業界関係者は非常に強気のようだ：ダリオ・アモデイ（Anthropic社CEO）は最近、ポッドキャストでこう語った：「非常に素朴に考えれば、我々はデータ不足からそれほど遠くない[...]私の推測では、これが障害になることはない[...]。もちろん、これに関するいかなる研究結果も独占的なものであり、最近は公表されていない。

インサイダーが強気であることに加え、サンプル効率をはるかに向上させたモデルをトレーニングする方法（限られたデータからより多くのことを学べるようにするアルゴリズムの改良）を見つけることが可能であるはずだという強い直感的な理由があると思う。あなたや私が、本当に密度の濃い数学の教科書からどのように学ぶかを考えてみてほしい：

現代のLLMが訓練中に行うことは、基本的に、教科書を非常に素早く読み飛ばすことであり、単語はただ通り過ぎていくだけで、それに頭を使うことはあまりない。
そうではなく、あなたや私が数学の教科書を読むときは、2、3ページゆっくり読み、その内容について頭の中で独白し、何人かの勉強仲間と話し合う。
あなたや私も、もしLLMのように、密度の濃い数学の教科書をさらっと読むだけなら、そこから多くを学ぶことはできないだろう。
しかし、限られたデータからモデルがより多くのことを学べるようにするために、人間がどのように密度の高い数学の教科書を消化するかを取り入れる方法があるのかもしれない。単純化すれば、このようなこと、つまり、教材について内部で独白すること、勉強仲間と議論すること、理解できるまで問題に挑戦して失敗することが、多くの合成データ／セルフプレイ／RLアプローチがやろうとしていることなのだ。

モデルをトレーニングする昔の技術は単純で素朴なものだったが、それでうまくいっていた。今、それがより大きな制約となる可能性があるため、すべての研究室が数十億ドルと最も賢い頭脳を投入して、それを解読することを期待すべきだろう。ディープラーニングの一般的なパターンは、細部を正しく理解するためには多くの努力（そして多くの失敗プロジェクト）が必要だが、最終的には明白でシンプルなものが機能するというものだ。過去 10年間、ディープラーニングがあらゆる壁をぶち破ってきたことを考えると、ここでも同じようなことが起こるだろう。

さらに、合成データのようなアルゴリズムの賭けの1つを解くことで、モデルを劇的に改善できる可能性もある。直感的なポンプを紹介しよう。Llama 3のような現在のフロンティアモデルは、インターネット上でトレーニングされている。多くのLLMは、本当に質の高いデータ（例えば、難しい科学的問題に取り組む人々の推論チェーン）ではなく、このようながらくたにトレーニング計算の大半を費やしている。もしGPT-4レベルの計算を、完全に極めて質の高いデータに費やすことができたらと想像してみてほしい。

AlphaGo（囲碁で世界チャンピオンを破った最初のAI システム）を振り返ることは、それが可能だと考えられる何十年も前に、ここでも役に立つ。

ステップ1では、AlphaGoは熟練した人間の囲碁の対局を模倣して学習させた。これで基礎ができた。
ステップ2では、アルファ碁は自分自身と何百万もの対局を行った。イ・セドルとの対局での有名な37手目を思い出してほしい。極めて珍しい、しかし人間には決して打てない見事な手だ。

LLMのステップ2に相当するものを開発することは、データの壁を乗り越えるための重要な研究課題である（さらに言えば、最終的には人間レベルの知能を超える鍵となるだろう）。

以上のことから、データの制約は、今後数年間のAIの進歩を予測する際に、どちらに転んでも大きな誤差をもたらすと考えられる。LLMはまだインターネットと同じくらい大きな存在かもしれないが、本当にクレイジーなAGIには到達できないだろう）。しかし、私は、研究所がそれを解読し、そうすることでスケーリングカーブが維持されるだけでなく、モデルの能力が飛躍的に向上する可能性があると推測するのは妥当だと思う。

余談だが、このことは、今後数年間は現在よりも研究室間のばらつきが大きくなることを意味する。最近まで、最先端の技術は公表されていたため、基本的に誰もが同じことをやっていた。(レシピが公開されていたため、新参者やオープンソースのプロジェクトはフロンティアと容易に競合できた）。現在では、主要なアルゴリズムのアイデアはますます専有されつつある。今はフロンティアにいるように見えるラボでも、他のラボがブレークスルーを起こして先を急ぐ間に、データの壁にはまってしまうかもしれない。そして、オープンソースは競争するのがより難しくなるだろう。それは確かに物事を面白くするだろう。(そして、ある研究室がそれを解明すれば、そのブレークスルーはAGIへの鍵となり、超知能への鍵となる。）

続き I.GPT-4からAGIへ：OOMを数える(7) https://anond.hatelabo.jp/20240605210017

Permalink | 記事への反応(1) | 20:57

■I.GPT-4からAGIへ：OOMを数える (5)

アルゴリズムの効率化

コンピュートへの大規模な投資が注目される一方で、アルゴリズムの進歩も同様に重要な進歩の原動力であると思われる（そして、これまで劇的に過小評価されてきた）。

アルゴリズムの進歩がどれほど大きな意味を持つかを理解するために、MATHベンチマーク（高校生の競技用数学）において、わずか2年間で～50%の精度を達成するために必要な価格が下がったことを示す次の図を考えてみてください。(比較のために、数学が特に好きではないコンピュータサイエンスの博士課程の学生が40%のスコアを出したので、これはすでにかなり良いことです)。推論効率は2年足らずで3OOMs-1,000倍近く向上した。

https://situational-awareness.ai/wp-content/uploads/2024/06/math_inference_cost-1024x819.png

MATHのパフォーマンスを〜50%にするために必要な推論コストの概算。

これは推論効率だけの数字だが（公開データから推論するのが難しいトレーニング効率の向上と一致するかどうかはわからない）、アルゴリズムの進歩は非常に大きく、また実際に起こっている。

この記事では、アルゴリズムの進歩を2種類に分けて説明します。まず、「パラダイム内」でのアルゴリズムの改良を取り上げることにします。例えば、より優れたアルゴリズムによって、同じパフォーマンスを達成しながら、トレーニングの計算量を10倍減らすことができるかもしれません。その結果、有効計算量は10倍（1OOM）になります。(後ほど「アンホブリング」を取り上げますが、これはベースモデルの能力を解き放つ「パラダイム拡張/アプリケーション拡張」的なアルゴリズムの進歩と考えることができます)。

一歩下がって長期的な傾向を見ると、私たちはかなり一貫した割合で新しいアルゴリズムの改良を発見しているようです。しかし、長期的なトレンドラインは予測可能であり、グラフ上の直線である。トレンドラインを信じよう。

アルゴリズム研究がほとんど公開されており、10年前にさかのぼるデータがある）ImageNetでは、2012年から 2021年までの9年間で、計算効率が一貫して約0.5OOM/年向上しています。

https://situational-awareness.ai/wp-content/uploads/2024/06/pareto_frontiers_imagenet_epoch-1024x349.png

アルゴリズムの進歩を測定することができます。同じ性能のモデルを訓練するために必要な計算量は、2012年と比較して2021年にはどれくらい少なくなっているのでしょうか？その結果、アルゴリズムの効率は年間0.5 OOMs/年程度向上していることがわかります。出典Erdil and Besiroglu 2022.

これは非常に大きなことです。つまり、4年後には、～100倍少ない計算量で同じ性能を達成できるということです（同時に、同じ計算量ではるかに高い性能も達成できます！）。

残念ながら、研究室はこれに関する内部データを公表していないため、過去4年間のフロンティアLLMのアルゴリズムの進歩を測定することは難しい。EpochAIは、言語モデリングに関するImageNetの結果を再現した新しい研究を行っており、2012年から 2023年までのLLMのアルゴリズム効率のトレンドは、同様に～0.5OOM/年であると推定しています。(しかし、これはエラーバーが広く、また、主要なラボがアルゴリズム効率の公表を停止しているため、最近の上昇を捕捉していません）。

https://situational-awareness.ai/wp-content/uploads/2024/06/llm_efficiency_epoch-1-1024x711.png

Epoch AIによる言語モデリングにおけるアルゴリズム効率の推定。この試算によると、私たちは8年間で～4OOMの効率向上を達成したことになります。

より直接的に過去4年間を見ると、GPT-2から GPT-3は基本的に単純なスケールアップでした（論文によると）が、GPT-3以降、公に知られ、公に干渉可能な多くの利益がありました：

我々はAPIコストから利益を推測することができる：
- GPT-4がリリースされたときのコストは、性能の絶対的な向上にもかかわらず、GPT-3とほぼ同じだった。(スケーリング法則に基づく素朴で単純化しすぎた見積もりをしてみると、GPT-3から GPT-4への実質的な計算量増加のおよそ半分がアルゴリズムの改善によるものであることがわかります)。
- 1年前のGPT-4のリリース以来、GPT-4レベルのモデルのOpenAIの価格は、GPT-4oのリリースでさらに6倍/4倍(入力/出力)に下がりました。

最近リリースされたGemini 1.5 Flashは、"GPT-3.75レベル "とGPT-4レベルの間の性能を提供する一方で、オリジナルのGPT-4よりも85倍/57倍（入力/出力）安い（驚異的な利益！）。

チンチラ・スケーリング法則は、3倍以上（0.5 OOMs以上）の効率向上をもたらす。
Gemini 1.5 Proは、MoE（Mixture of Experts）をアーキテクチャの変更点として強調し、大幅な計算効率の向上（Gemini 1.0 Ultraを凌駕し、計算量は「大幅に少ない」）を主張している。他の論文でも、MoEによるコンピュートの大幅な倍増が主張されている。
アーキテクチャ、データ、トレーニングスタックなどについては、常に多くの調整と改善が行われている。

公開されている情報を総合すると、GPT-2から GPT-4へのジャンプには、1-2 OOMのアルゴリズム効率向上が含まれていたことになります。

https://situational-awareness.ai/wp-content/uploads/2024/06/stacked_compute_algos-1024x866.png

GPT-4に続く4年間はこの傾向が続くと予想され、2027年までに平均0.5OOMs/年の計算効率、つまり GPT-4と比較して～2OOMsの向上が見込まれます。計算効率の向上は、低空飛行の果実を摘み取るようになるにつれて難しくなる一方、新たなアルゴリズムの改良を見出すためのAI ラボの資金と人材への投資は急速に増加しています。 (少なくとも、公開されている推論コストの効率化は、まったく減速していないようだ)。ハイエンドでは、より根本的な、トランスフォーマーのようなブレークスルーが起こり、さらに大きな利益が得られる可能性さえある。

これらをまとめると、2027年末までには（GPT-4と比較して）1～3OOMのアルゴリズム効率向上が期待できることになります。

続き I.GPT-4からAGIへ：OOMを数える(6) https://anond.hatelabo.jp/20240605205754

Permalink | 記事への反応(1) | 20:54

2024-05-29

■おすすめの散財方法（100万円くらいまで）

追記

トラバもはてブも色々コメントありがとうございます！一番刺さったのは「男ともセックスしてみる」でした。考えたこともなかったし体験した後の風景が一番想像できない。人生経験として体験してみるという発想に衝撃を受けました。なかなか勇気出ないだろうけど死ぬまでにやることリストにメモしました！

追記ここまで

Die with zeroを読んでとても感銘を受けた。子供の頃貧しかったのでお金が増えるのがただただ嬉しく、仕事ばっかりやっててお金が溜まる一方だったが、これではいかんことにようやく気づいた。一度贅沢しちゃうと戻れなくなるーとか思って抑圧してたけど、よく考えたら贅沢で破産するほど人生残ってないし、お金を気にせず経験を積みまくろうと決意。やってみたことは以下の通り。性的欲望も抑圧してきたのでこちらも存分に解放していく所存。

まだ数百万円くらいは使いたいので、経験値の観点でなんかオススメできる散財方法があれば教えて欲しいです！（自宅はあります）

ニューヨーク旅行（100万円）→夏休みに行くためチケット購入済み。円安でやばいけどそんなこと言ってたらいつまでも行けないので決断。ミュージカルやメジャーリーグ観戦など滞在中も躊躇なくお金使う予定。
ビジネスクラスでシンガポール（30万円）→さすがに欧米まで行くのはビビったので近場でトライ。座席は本当に広いのね。全然疲れなくて快適だったけどほとんど寝てるだけだしコスパは微妙。これなら行き先で良いホテル泊まった方がいいね。
車購入（300万円）→Cセグのスバル車買ってみた。乗れる時間短すぎるのでコスパは微妙だが、ディーラーで新車を買うという人生の実績は解除できたので目的は果たした感。あとはてブにたまに現れるスバル信者の気持ちはよく分かった笑
パパ活（100万円）→とりあえず女子大生とエステティシャンとアパレル店員とお花屋さんと立ちんぼを抱いてみた。正直これは肉体的快楽というよりトロコン感覚でやるものな気がする。30万くらい使ったけどもう少し経験積んだら楽しみ方わかる気がするので総額100万円まではやってみる予定。
ゲーミングPC（20万円）→アーマードコアは初代しかやってないんだけど新作がやりたすぎて購入。楽しすぎる。今はアイマスにmod入れて楽しんでる。3D モデリングも勉強して自分でmod作りたい
スキューバ（30万円）→ライセンスとってスクール主催のツアーに何度か参加。潜ってる最中はまさに異世界でかなり楽しいんだけど、終わった後の宴会のノリとか他の客層が合わない感じ。来年も続けるかは悩みどころ。
高級ホテルステイ（20万円）→行く前は何で帰れる距離で宿泊するんだ感は否めなかったが思ったより楽しかった。あの広い空間を特別感持たせてトータルコーディネートする技術はすごい。これはハマるかもしれない。
風俗で3p（6万円）→最初お姉さんが2人入ってくる所が興奮のマックスで、最中は微妙。もういいかな
バイアグラ（0.2万円）→すごい効果。ビビった。これは現代の魔法では。
ジムでパーソナルインストラクター付ける（10万円予定）→まだこれから。

Permalink | 記事への反応(34) | 13:32

オフトピだがね。

オブジェクト指向が栄華を極めたあの時代、責任、関心、主体性、凝集、アイデンティティ、is-a has-a、… 研究者やギーク、仙人らによって、あらゆる説明がされたが、結局、オブジェクト指向は現実世界を捉える人間の感覚の応用でしかなかった。

「モノ」と思える奴をクラスにすればいい。

それ以上でも以下でもなく、あとはプログラミングの構造を整理するために有効に使えるケース・バイ・ケースの妥協点を探すことになる。どうモデリングすべきかの議論は収穫が少ない。いや、極めれば霧の向こうで信じがたい洞察を垣間見れる可能性はあるにはあるが…、しかし多人数でソフトウェアを維持管理するのが正解だと分かった今、属人性を排除するためには霊感を説明するよりシンプルに留めるのがベスト・プラクティスだ。

プログラマーの関心が関数型に移ったのは、そういう経緯もある。数学をバックグラウンドに持つ関数型言語をバックグラウンドにする方が、ミーハーな技術屋連中の興味を引けた。

Permalink | 記事への反応(0) | 20:54

■[廃人日記] 2024-05-18

githubでなにか作ったものをアップロードするのは、自分向きではないことに気がついた。

私が仕事で作っているようなweb アプリケーションというのは、誰でも使える一般性の高いものではなく、もっと特定のビジネスに依存した特殊なものである。

だから一般的な誰でも使えるようなものを作るというのにはあまり慣れていないのだ。

なにか作る場合はkaggleのほうが遊び場として向いていると思っている。

kaggleで「コンペ」に参加するつもりはないし、あれはBERTが出現したぐらいからは、少なくともNLP(自然言語処理)界隈は不毛な場となってしまった。

指標があれば不毛なハックがある。それが現実というものである。

それに業務で実用レベルで使えるモデルというのは、もっと運用のしやすいシンプルなモデルである。

モンスターアンサンブルで精度がSOTAでーすピロローン！なんてことには興味がないが、コンペはそれを目指している。

ではなぜkaggleが良いかと言うと、データセットが転がっていて、notebookも簡単に作成できるからである。

「このデータをこうやって使うとこういうツールが作れる」「このデータをこうやって分析するとこういう知見が得られる」というのは、「web開発用のMVC フレームワークを作ります」よりも具体性がある。

そして特定のデータに対するモデリングをするために論文を調べるようなことになった場合は、勉強にもなる。

私は昔、自然言語処理のブログを書いていたが、実験したことのコードを載せるタイプの記事が多かった。

ところが自称データサイエンティストや自称 NLP エンジニアがツイッター上で「ゴミのようなブログを書くな」と言っていて、自分が言われている気がして怖くなったのでブログを閉鎖した。

そういう「政治おじさん」との接触を最大限減らすには、ブログというフォーマットではダメだと思うわけである。

私のマグカップには"Talk is cheap, show me the code."と書かれている。

これはリーナストーバルズの名言だが、政治おじさんが近寄らない場所というのは、具体的なコードが存在する場所であると言えよう。

Permalink | 記事への反応(0) | 17:15

2024-05-17

■アイドル プロデュース ものがどうしても駄目…

アイマス派生は全部駄目だったし、カスメも今のバージョンで駄目になったし、ウマもその路線がきつくなって辞めた。ゾンサガもラブライブも駄目だったし、他も全部ちょっと手を付けては投げている。多分、これだけで三割位のマンガ・アニメ・ゲームを駄目にしているので、なんとか克服したく、学マスをはじめてみたが、やはりアイドルとプロデューサーと言う関係性がどうにも駄目でしんどい。モデリングの作り込みとか凄いと思うんだけどね。

Permalink | 記事への反応(4) | 16:15

2024-05-03

■マルチな能力持つ人が増えた

プログラミングできてイラスト描けて曲も作れてモデリングもできてデザインもできます、みたいな人が稀にいる

常人じゃ考えられない努力したのは間違い無いと思うけど努力だけでここまでいけるものなのか？

1つくらい他の人に分けてあげても良くない？

Permalink | 記事への反応(2) | 22:07

2024-04-27

■ガールズバンドクライの余計な嘘

最初に断っておくと、これは個人的なリアリティラインと制作側の演出のリアリティラインが合ってない、結果として「嫌なら見るな」でしかない話。ちょっと期待してた分のガッカリした気持ちを吐き出したいだけだ。

ガールズバンドクライは、何らかの問題を抱えた少女たちが出会いバンド活動を通じて自己実現していく系の作品だろうと思って視聴し始めた。まあそこは実際どうだかはおいといて

タイトルに「バンド」が入ってる
キャストが演技より音楽面の能力から選ばれている
CG 作画で楽器や機材などのモデリングが細部までしっかり描かれている

といったことからも、バンドにまつわる描写にはとくに本腰入れてリアリティ出そうとしてるんだと思った。音楽周り中心に周辺事情はちゃんと描くからこそ、ぶっ飛んだキャラ設定などのフィクションならではの部分に対して嘘くささを忘れられてドラマ性が高まる、そういうもんだと思ってる。

が、実際には1〜2話では逆の、とくにバンド関連の嘘が、演出だとしてもひどい印象だった。

許し難いライン

いないパートの音が鳴るライブ
ギターをスタンドに立てない桃香（3話からスタンド使い始めた）

フィクションとして許せなくはないが納得し難いライン

ぶん回しても傘しか壊れず蛍光灯が無事なシーリングライト
路上ライブ乗っ取られたのに協力的な上に即興で合わせられるドラムとギター
電池切れスマホで地図も使えないのに、見知らぬ土地のこれから住む物件に辿り着ける（どっかで充電した？）
東京駅で乗り換え検索もできない（しない）が推しの路上ライブ情報は調べられる

なんかこの辺、要らん嘘って感じで、ストーリー展開のための嘘にしか思えず、演出だとしても筋が悪いように感じられて、視聴のノイズでしかなかった。

1話で仁菜のギターの扱いが酷いのは単にど素人だから別にいい。仕方ない。「他人の」「楽器」ってだけで大事に扱う常識的な感覚、を持ち合わせていないキャラで構わない。あと1話は、仁菜の住む予定の部屋の隣、そんなアパートに小さな子いる家族で住む？みたいのも気になったがあり得なくはない。2話での、壊れたシーリングライトをスイッチもブレーカーも落とさず着けるシーンは危ないのでやめて欲しいが、そこが無知なのは仕方ないというか全然有り得る。ちょっとした家電の知識すらない大人も現実にいる。そういうのよりスマホリテラシーの偏りの方が不自然に思える。ストーリー都合過ぎる感じがとてもした。

3、4話ではノイズになる嘘が減ってきた。3話の歩いてない鳩の首リズムも嘘だが、ストーリー展開が絡まないギャグ演出みたいなもんなのでそこは許せる。

冒頭にも書いたけど結局は個人のリアリティラインと作品のリアリティラインがズレてるだけの話。気にならない人には気にならない。

こういうこと書くとダブルスタンダードっぽいが、例えばバンド活動を主軸に扱った作品でも、以下のようなものはフィクションとして気にならない。

練習量のわりに、むしろ練習ほぼしてなくてもなぜかうまい
↑と近いが、主人公とその仲間たちは打ち合わせなしにいきなり曲を高い精度で合わせられる
作詞作曲編曲 MDのセンスがよすぎてすでにプロ級
練習スタジオ代や、楽器そのものや高価な機材やソフトウェアにかけるお金がなぜかある
そもそも全員かわいい

少なくともガールズバンドクライという作品で描きたいであろうテーマからすれば、上記に挙げたようなところはフィクションで構わないと思える。まあチートというか。例えば「バンドって金かかるし貧乏生活になるよね、そこをどうあがいて脱していくかを描きたい」ってんなら話は別だけど。なんか「いないパートの楽器の音が鳴る」のはチートじゃなくて、シンプルに嘘なんだよね。