「テスト」を含む日記

はてなキーワード: テストとは

2024-06-08

■anond:20240608183206

もちろん舞踏会の仮面かぶったエデュケーションで、もっと上手にロボットが踊れた場合、ワクチンスムージー必須だよ。特に HPVのワクチンスムージーは婦人科のロケットをハレルヤ状態にする。あれら文句タレの人たち、性教ドラマの演出とシンクロナイズしてるね？

HPV ワクチンは一例。もし未来へのバルーンがポッポと飛んでいき、学生たちのプロスペリティをアシストする教育になったとするなら、読者さん達にはちょっと苦い薬になるかもね。でもまぁ、普通のピーポーなら出てくるダストを気にしないかも。

はてなのブクマカ的耐久テスト、果たして通るのか？それとも言うだけハーモニー、変わる信念ゼロ、そんな種族？

Permalink | 記事への反応(0) | 18:32

■[今日知った単語]ドッグフィーディング

ドッグフーディング (英: dogfooding) または「自社のドッグフードを食べる」「ドッグフードする」(Eating your own dog food、Drinking your own champagneとも言う)は、コンピュータ業界において、自社製品を開発して利用する組織の習慣で[1]、組織が実際の使用法で日々自分たちで製品を利用しながら製品テストを行うことである。日本語では単に「ドッグフード」ということもある。そのため、ドッグフーディングは品質管理として機能し、開発者自身による製品の自信を表す証言広告となる[2][3]。尚、日本企業では自社実践(じしゃじっせん)という言葉が相当する意味の言葉として使われている。 https://b.hatena.ne.jp/entry/4754599923450771872/comment/tor4kichi

20年位前にJTCのIT 理解ゼロ経営層おじさんが、「新しい社内端末を優先的に使わせろ」とか言ってたの思い出して共感性羞恥を感じたのを思い出した

あーはずかしい

Permalink | 記事への反応(0) | 17:54

■

anond:20240608163618

[芦原ブログ魚拓コピペ]2014.2.2〜2024.1.26

https://web.archive.org/web/20240127104246/http://ashihara-hina.jugem.jp/

ドラマ『セクシー 田中さん』について

2024.01.26 Friday14:31

ドラマ「セクシー田中さん」をご視聴いただいた皆様、

ありがとうございました。

色々と悩んだのですが、今回のドラマ化で、

私が9話、10話の脚本を書かざるを得ないと判断するに至った経緯や事情を、

きちんとお伝えした方が良いのではと思い至りました。

この文章を書くにあたって、私と小学館で改めて時系列にそって事実関係を再確認し、

文章の内容も小学館と確認して書いています。

ただ、私達は、ドラマの放送が終了するまで、脚本家さんと一度もお会いすることは

ありませんでしたし、監督さんや演出の方などドラマの制作スタッフの皆様とも、

ドラマの内容について直接、お話させていただく機会はありませんでした。

ですから、この文章の内容は私達の側で起こった事実ということになります。

「セクシー田中さん」は一見奇抜なタイトルのふざけたラブコメ漫画に見えますが…。

自己肯定感の低さ故生きづらさを抱える人達に、優しく強く寄り添える様な作品にしたい

という思いが強くあり、ベリーダンスに纏わる方々の思いにも共鳴しながら、

担当編集と共に大切に描いてきた漫画です。

ドラマ化のお話をいただき、当初の数話のプロットや脚本をチェックさせていただきながら、

最終的に私が10月のドラマ化に同意させて頂いたのは6月上旬でした。

「セクシー田中さん」は連載途中で未完の作品であり、また、漫画の結末を定めていない

作品であることと、当初の数話のプロットや脚本をチェックさせていただいた結果として、

僭越ではありましたが、ドラマ化にあたって、

・ドラマ化するなら「必ず漫画に忠実に」。

漫画に忠実でない場合はしっかりと加筆修正をさせていただく。

・漫画が完結していない以上、ドラマなりの結末を設定しなければならないドラマオリジナルの終盤も、

まだまだ未完の漫画のこれからに影響を及ぼさない様「原作者があらすじからセリフまで」用意する。

原作者が用意したものは原則変更しないでいただきたいので、ドラマオリジナル部分については、

原作者が用意したものを、そのまま脚本化していただける方を想定していただく必要や、

場合によっては、原作者が脚本を執筆する可能性もある。

これらを条件とさせていただき、小学館から日本テレビさんに伝えていただきました。

また、これらの条件は脚本家さんや監督さんなどドラマの制作スタッフの皆様に対して

大変失礼な条件だということは理解していましたので、

「この条件で本当に良いか」ということを小学館を通じて日本テレビさんに

何度も確認させていただいた後で、スタートしたのが今回のドラマ化です。

ところが、毎回、漫画を大きく改編したプロットや脚本が提出されていました。

・漫画で敢えてセオリーを外して描いた展開を、よくある王道の展開に変えられてしまう。

・個性の強い各キャラクター、特に朱里・小西・進吾は原作から大きくかけ離れた

別人のようなキャラクターに変更される。

・「性被害未遂・アフターピル・男性の生きづらさ・小西と進吾の長い対話」等、

私が漫画「セクシー田中さん」という作品の核として大切に描いたシーンは、

大幅にカットや削除され、まともに描かれておらず、その理由を伺っても、

納得のいくお返事はいただけない。

といったところが大きなところですが、他にも細かなところは沢山ありました。

「枠にハマったキャラクターに変えないでいただきたい。

私が描いた「セクシー田中さん」という作品の個性を消されてしまうなら、

私はドラマ化を今からでもやめたいぐらいだ」と、何度も訴え、

どうして変更していただきたくないのかということも丁寧にご説明し、

粘りに粘って加筆修正し、やっとの思いでほぼ原作通りの1〜7話の脚本の

完成にこぎつけましたが…。

脚本家さん、監督さんといったドラマ制作スタッフの皆様と、私達を繋ぐ窓口は

プロデューサーの方々のみでしたから、プロデューサーの方々が当初「ドラマ化の条件」として

小学館から日本テレビさんに伝えていただいた内容を、

どのように脚本家さんや監督さん、ドラマ制作スタッフの皆様に伝えていらっしゃったのか、

残念ですが私達には知る術はなく、

当初お伝えした「ドラマ化の条件」はどうなってしまったのだろう？という

疑問を常に抱えた状態での加筆修正の繰り返しとなって、

その頃には私も相当疲弊していました。

そして、私があらすじ、セリフを準備する終盤のドラマオリジナル展開は

8話〜10話となりましたが、ここでも当初の条件は守られず、

私が準備したものを大幅に改変した脚本が8話〜10話まとめて提出されました。

特に9話、10話の改変された脚本はベリーダンスの表現も間違いが多く、

ベリーダンスの監修の方とも連携が取れていないことが手に取るように分かりましたので、

「当初の約束通り、とにかく一度原作者が用意したあらすじ、セリフを

そのまま脚本に落としていただきたい」

「足りない箇所、変更箇所、意見はもちろん伺うので、脚本として改変された形ではなく、

別途相談していただきたい」

といったことを、小学館から日本テレビさんへ申し入れをしていただきましたが、

その後も、大幅な改編がされたプロットや脚本が提出され、

それを小学館サイドが「当初の約束通りに」と日本テレビさんにお戻しするという作業が

数回繰り返されたと聞いています。

最終的に、日本テレビのチーフプロデューサーの方から「一度そのまま書くように」との

指示が出たとも伺っていましたが、状況は変わらぬまま約4週間が過ぎてしまいました。

ドラマの制作スケジュールのリミットもどんどん迫っていましたので、

本当はドラマオリジナルとなる8話〜10話全ての脚本を拝見してオリジナル部分全体で、

加筆修正をさせていただきたかったのですが、8話だけ、

何とか改変前の内容に修正させて頂いて、日本テレビさんにお渡しすることになってしまいました。

9話、10話に関する小学館と日本テレビさんのやりとりを伺い、

時間的にも限界を感じましたので、小学館を通じて9話、10話については、

当初の条件としてお伝えしていた通り、

「原作者が用意したものをそのまま脚本化していただける方」に交代していただきたいと、

正式に小学館を通じてお願いしました。

結果として、日本テレビさんから8話までの脚本を執筆された方は

9話、10話の脚本には関わらないと伺ったうえで、

9話、10話の脚本は、プロデューサーの方々のご要望を取り入れつつ、私が書かせていただき、

脚本として成立するよう日本テレビさんと専門家の方とで内容を整えていただく、

という解決策となりました。

何とか皆さんにご満足いただける9話、10話の脚本にしたかったのですが…。

素人の私が見よう見まねで書かせて頂いたので、私の力不足が露呈する形となり反省しきりです。

漫画「セクシー田中さん」の原稿の〆切とも重なり、相当短い時間で脚本を

執筆しなければならない状況となり、推敲を重ねられなかったことも悔いてます。

9話、10話の脚本にご不満をもたれた方もいらっしゃるかと思います。

どのような判断がベストだったのか、今も正直正解が分からずにいますが、

改めて、心よりお詫び申し上げます。

最後となりましたが、素敵なドラマ作品にして頂いた、素晴らしいキャストの皆さんや、

ドラマの制作スタッフの皆様と、「セクシー田中さん」の漫画とドラマを愛してくださった

読者と視聴者の皆様に深く感謝いたします。

2024.1.26

芦原妃名子

※こちらのブログ、10年も放置してしまったため、1日の訪問者数が既に一桁でして…

なので今回、X（旧Twitter）新規アカウントを作って、同時にご報告させていただいてます。

芦原妃名子

@ashihara_hina

お仕事---

お知らせです

2014.12.06 Saturday01:20

ものすごいブログ放ったらかしっぷりを、、スミマセン、、。

実は今発売中の『cocohana 1月号』予告にミスがありまして。

次号２月号カラー予告に私の名前が載ってますが、間違いです。

一色予告にはキチンと訂正されていますが、２月号・3月号の

「Bread&Butter」はお休みです。

バタバタしていて間違えたまま載ってしまったみたいで、、

本当に申し訳ないです。

夏くらいから体調崩してばっかりなので、しっかりリセット出来ると良いなあ～。

あとは、ずっとお世話になってたcocohanaの担当さんが他誌に異動されて

cocohanaでの初めての担当替えがありました。さすがに寂しいなあ～。

色々有難うございました！

お仕事---

「Bread&Butter;」２巻☆「芦原妃名子傑作集」１・２巻

2014.09.26 Friday12:35

３冊同時に発売中です～！！

「Bread&Butter]２巻は、水色に近いエメラルドグリーンの表紙です。

可愛く仕上げて頂いて、とても嬉しい。

２巻は「フレンチ･トースト」「イースト菌」「プレッツエル」「パン・サプライズ」ですよ～。

あと、「芦原妃名子傑作集・１・記憶」と「芦原妃名子傑作集・２・祈り」も同時発売です。

こちらは小学館から出てます。

これ、一応私の２０周年記念本なのですよ。なのでほぼ過去作で構成されてます。既刊コミックス未収録の新作は「乞う女」と「スゴロク」のみなので、どうぞお間違えの無い様、お気をつけくださいませ～。

途中お休みもしてるので、２０周年といっても若干サバ読んでる気がしないでもないですが、、

一作一作コメントも書いてますので、興味のある方は手にとってみてくださいね。

よろしくお願い致します。

お仕事---

ぷるぷる

2014.07.16 Wednesday02:13

編集さんに頂いたゼリーが超キレイきぷるぷる

原稿終わった～～！　とりあえず、いっぱい遊ぶ！

おやつ---

「ビッグコミック　 オリジナル」１５号

2014.07.06 Sunday00:36

「ビッグコミック　オリジナル」１５号

７月１９日（土)発売です！

「乞う女（こうひと）」ってタイトルの３０P読みきりです。

どうぞよろしく～。

「cocohana」８月号も発売中ですよ～☆

あと、９月末にコミックスが３冊同時に出ます。

詳細はまた後ほど。

わりと仕事ばっかりしてます。遊びたい。

お仕事---

ずいぶん。。

2014.06.08 Sunday04:44

ほったらかしてました。ごめんなさい、、、。

ずっと調子のおかしかったPCを買い換えて、すさまじくメカオンチの私は

ますますチンプンカンプンです。脳みそ足りてなくって、嫌！

えーーっと、まず・・今発売中のCocohanaには、私のパン漫画は載っていないのですが、

私自身は特にお休みを取っていたわけではなくって、小学館さんでの別の読み切りを描いておりました。

ベツコミでもプチコミでもフラワーズでもなくって、、、

なぜか、、なぜか、、「ビッグコミック　オリジナル」に載りますよ！！

少女マンガ絵ど真ん中の、私の漫画が！なぜか！オリジナルに、、！！

昔、うちのお父ちゃんが読んでたよ、、。今も読んでるか知らないけど、黙っとこ。

なんでオリジナルに描くことになったかは、たいした理由もないんですけど、省略。

ちょっとした珍事件ですので、興味のある方は是非読んでみてくださいね。

昼ドラ感満載の３０P読みきりです。

パン漫画は、なるべく「業」とか「欲」とかを排除しながら描いてるのですけど

（出来るだけ「優しいモノ」を、、との注文を頂いてスタートした漫画なので）

こちらの読みきりは「業」「欲」オンリーです。

掲載号は、また後日お知らせしますねー。

「Bread&Butter」は、6月28日発売Cocohana 8月号より巻頭カラーで再開です！

あ、あと、「砂時計」1～3巻（デジタル版）が、6月18日まで無料で読めるみたいです。

未読の方は是非、この機会にご覧くださいませー。

少し前、小学館の編集さんに、美味しいパンを沢山いただきました。

美味しい、、。へんしゅうさん皆やさしい、、悲しス。

お仕事---

「Ｂｒｅａｄ＆Ｂｕｔｔｅｒ」☆第1巻

2014.03.22 Saturday05:07

「Ｂｒｅａｄ＆Ｂｕｔｔｅｒ」第1巻☆3月25日発売です！

宜しくお願い致します

＊しばらくこの記事トップに上げておきますね～。

お仕事---

「ダラス・バイヤーズクラブ」

2014.03.09 Sunday17:09

悲しい出来事がありました。。

土曜の最終で「ダラス・バイヤーズクラブ」を観て、余韻冷めやらぬまま売店のレジに行き

「パンフレットください、、」とつぶやいたら不透明の袋に入ったパンフレットをお姉さんに手渡され

中身を確かめないまま自宅に帰って袋から取り出してみましたら。。

なんでやねーーーーん！（５００円返して～～～！）

せっかくなので「マチューテ・キルズ」のパンフレット読みましたけども、

私が観たのは「ダラス・バイヤーズクラブ」です。ハイ。

マシュー・マコノヒーもジャレッド・レトも凄かった。

描かれるのは、「生」に対するあまりに真っ直ぐな執着心。

「執着心」って、あまり聞き心地の良い言葉ではないけど、やっぱりもの凄いエネルギーを生むんですよね。

屈折してると痛々しく映るけど、ストレートな執着が爆発する様は、むしろ爽快。

主人公はあくまで自己中で自業自得で貪欲で、だけど彼のエネルギーが周囲を巻き込んで救済し感謝され、そのこと自体に戸惑いながら少しづつ他者との絆を得て行く描かれ方が、とても良かった。

自堕落な過去の自分を全て否定して、綺麗に生まれ変わったわけではないんですよね。

差別する側だった人間が、差別される側に転げ落ちる様は、「第９地区」と被るな。

最近観た映画の中で、一番良かった。

パンフレット、、、。声が、小さかったのかな。

もっと腹の底から声を出して、強くたくましく生きようと思います。

可愛い画像も貼っとこ

うちのお姉ちゃん家に子ニャンコがやって来ました！

「小豆（アズキ）ちゃん」です。

かわいい

本・映画---

１巻！

2014.02.02 Sunday01:25

「オンリー・ゴッド」観てきました。

「復讐モノ」だと思ってたけど、違ってた。「親殺し」が主軸。

「ドライヴ」より私は好きでした。

母親より更に偉大な「神」が、新たな依存先に見えなくもないけれど。。

戦いを挑んでコテンパンにやられて裁かれて赦されて、救われたのかな？

「親殺し」はどうしてもパターン化してしまうけど、それほど普遍的なテーマなのかもしれないです。

バイオレンス描写より、KARAOKEシーンのがインパクトでかかった。

一人殺したら、腕一本。マイルールに則って無感情に淡々と人を裁いていく様は、

「神様」って言うよりも、「法」とか「規則」とか、そんな感じ。

人に勧めにくい。私は好きだけど。 <h3>o- **</h3>

今、コミックス作業をしていますー。

パンをチマチマいっぱい描きました。

原画はもう編集部に送っちゃったので、これはコピーですけど。

デザイナーさんが考えてくれたカバーデザインがとっても可愛いので、

仕上がりが楽しみです♪

「Bread&Butter」コミックス第１巻は、３月末発売予定です！

また、改めてお知らせしますね。

Permalink | 記事への反応(0) | 15:27

2024-06-07

■Twitterで見かけるガイジのネトウヨ率高すぎ問題

Twitterで訳わからん思考回路のリプでウザ絡みしてるガイジのツイート見たら

高確率でアンチ立憲共産で自民をアクロバティック擁護してるネトウヨなの笑う

日本でも海外でもそうだけどガイジのバカウヨ率高すぎてもう知能レベルを知る有力な指標の一つと化してる

IQ テストの代わりにここらへん見た方が一番そいつの人間性分かるまである

Permalink | 記事への反応(2) | 23:42

■石丸伸二の「政策を論じろ」ってまだ政策発表してないじゃねーか

石丸伸二という都知事に立候補した政治家がゲンダイに叩かれている記事のブクマで「政策を論じていない記事なので意味がない」というような主張を複数人がしている。

https://b.hatena.ne.jp/entry/s/gendai.media/articles/-/131178

ところがだ。石丸自身は都政に関して具体的な政策を語ったことあったっけ？無いのだ。「人口過密を何とかしたい」という漠然とした思いくらいだ。

しかも石丸はインタビューでは「その具体策はまだない」と言っているのである。

https://youtu.be/vaTcxZFc0e4?si=WAPX4ZdwpUuUjcdd

おい、これは「この記事は政策を論じてない」と言ってた連中も石丸の「政策」なんて聞いてなかったって事だろ。

「閉じた社会的クラスタの中で符牒化された答えを言えば反論した事になる」そういう事だろ。

そしてゲンダイの元記事はまさにその事を指摘して、その支持のされ方がヤバい、延いては石丸という人物がヤバいと指摘する記事なのだろう？

するとまさにゲンダイが指摘する事をブコメ欄で演じてみせたワケだな。お見事である。

政策がないのが常に悪いわけじゃない

では石丸に政策が無いのがいけないのだろうか？そうではない。政策以外で支持される選挙もある。

例えばオバマは健康保険の導入など具体策もあったが、支持の中心は「ブッシュでない事、保守系シンクタンクのパペット人形ではない事という漠然としたイメージだった。

トランプの場合は国際から国内への回帰とエリートが勝手に国を運転するなという反感であったし、バイデンの場合はもう地獄の盆踊りを終わりにして日常に帰れというものだった。

都政では青島幸男は都市博止めますの一本で、石原慎太郎は財政立て直しの一本だったが、青島が素人視されていた為、政治家経験が長いプロというイメージが強かった。

小池百合子は金の問題でヘマしない、議会を乗っ取る千代田区の自民議員傘下ではないというイメージだ。

小池の方はむしろ提言した政策の方が強烈に酷く、山手線2階建て他、皆が政策を重視していたら落ちるどころか築地の魚市場に捨ててある魚の内臓投げつけられるような代物だった。因みに増田はあの公約群を許してねーぜ。

だから現状で石丸に政策が無いのがそんなに悪いって訳じゃないね。

みんなで符牒を暗記するというのが政治かって事なんだよ

問題はそんな政策をまだ考えてないし発表もしてない政治家への批判の反論で、己も見ても聞いてもいない「政策」を見たのか！？と難じて、それに同意しまくるというネット共同性のコミュニケーション方なんだよ。

これは一つには教育への過剰適応かと思われる。

学校では社会に出ていない状態で社会的な事柄を教わる為、それが具体的にどういうものかという感触が無いままに暗記して習得しそれをテストで書く事を求められる。それが出来るのが優等生だ。

その考えのままに具体的に活用すべき事態に至っても同じ行動をしてしまう。これはいわば愚昧な優等生というべき状態だな。

だから己も見てもいない「政策」を見たのか！？とかいうコメントに大勢が賛同してしまうのだ。

で、はてなはこういう傾向がかなり強い。

例えば政治家の舌禍問題で全文が掲載されている記事に「切り取りだ」という糾弾がなされそれが多く賛同される。

例えば表現規制問題で「お気持ち」というジャーゴンが定着すると、警察や裁量権が大きいその他行政の前例に抵触している事でも「お気持ち」と言えば通ると思ってしまう。

「自分はそういうバカどもの和には入ってないぞ」という人もいるだろう。そういう人には申し訳ないが、実際こういうダメなコミュニケーションが多く観察されるのがはてなであって、ここに来れば頭を使わず、経験を問われずに背伸びが出来るって動機がそういう連中を惹きつけているのだ。「まんだらけ中野店の行為はすでに警察所掌の風営法の規制に入っている」と指摘する人も居たのに完全無視されただろう？

そして石丸自身もこういう愚昧優等生が屯するネット言論にウけるような行動をしている。

啖呵が切れるように話を勝手に持って行ったり、「マスコミを論破して出禁にする」場面を作ったりがそうだ。

そして通して見たら聞くに堪えない論破芸の論破だけを切取った動画が喝采を浴びている。それが元記事の内容だ。

これに対しても「キリトリだ」という論難が多く書かれている。

ネットの一部ではマスコミはアプリオリに悪であり、その記事に対して「～は切り取りだ」というのが習わしになっている。

そこで「キリトリ動画の元の録画を通して見たら論破に持って行くのが見え見えで話が通っておらず酷すぎて呆れる」という記事のコメントに「キリトリだ」が現れ喝采を得ているのだ。

経歴は立派でもこんな賛同のされ方している政治家がまともなワケないだろ。

なのでゲンダイの記事はそれに付いたコメントが内容の妥当性を証明するという、未来に向けて書かれた記事となっていたのであった。

それにしてもはてなが電撃無き集虫灯みたいになってるのどうにかなりませんかね？

Permalink | 記事への反応(0) | 18:15

2024-06-06

■はてな人間性テストってあるじゃん

あれ今もあるのか知らないけど、AIで普通に突破できるんちゃうん？

Permalink | 記事への反応(1) | 15:47

■数珠とかパワーストーン付けてる偉いおぢとか注意した方がいいよ…

オカルトとか自己啓発に傾倒する偉いおぢってのは、

自分の努力とかが報われない理不尽な環境にいるか、
努力の方向が間違っているのに、問題に正面から向き合わないから、願掛けとかオカルトに逃げている

のどちらかだと思われるわけで、

前者だとしても、厄介ごとに巻き込まれている状態なわけだし、

一般的に多いのは後者の方で、

オカルトとか自己啓発に傾倒している人は、自分の問題に正面から向き合っていない人が多い、つまり、逃げてる人だってこと

受験勉強とかテストとか思い出してほしいんだけど、自分もちゃんと勉強しているときは願掛けなんかしないんだよな

ちゃんと勉強していないから、願掛けなんかに走る

ちゃんと勉強しているなら、自分の努力と結果がどれぐらい比例するかとか、ちゃんと自己制御できてるわけだから、願掛けなんか考える隙がない

願掛けとかオカルト、自己啓発に走るってのは、結局のところ、前者でも後者でも、自分に制御できないものをどうにかしたい、という願望だけがある状態なわけで、

それは運もなくはないけど、努力し続けるしかないのは当然なわけで、

願掛け、オカルト、自己啓発の本を大量に持っていて趣味は読書とか言ってるような輩が、人生や仕事の問題にちゃんと真正面から向き合っている人とは考え難い

その人本人が精神的に弱かろうが何だろうが、逃げてるってこと

問題から逃げてる人と関わるとどうなるか、って考えた方がいいよ…😟

Permalink | 記事への反応(3) | 10:33

■anond:20240606085416

テストの点数わるかったら問題のほうがわるいって屁理屈こねるクソガキタイプだ😔

Permalink | 記事への反応(1) | 08:57

2024-06-05

■I.GPT-4からAGIへ：OOMを数える(10)

繰り返しになるが、非常に賢いChatGPTを想像するだけではいけない。趣味的な進歩ではなく、リモートワーカーや、推論や計画、エラー訂正ができ、あなたやあなたの会社のことを何でも知っていて、何週間も単独で問題に取り組めるような、非常に賢いエージェントのようなものになるはずだ。

私たちは2027年までにAGIを実現しようとしている。これらのAI システムは、基本的にすべての認知的な仕事（リモートでできるすべての仕事を考える）を自動化できるようになるだろう。

はっきり言って、エラーバーは大きい。データの壁を突破するために必要なアルゴリズムのブレークスルーが予想以上に困難であることが判明した場合、データが足りなくなり、進歩が停滞する可能性がある。もしかしたら、ホッブリングはそこまで進まず、専門家の同僚ではなく、単なる専門家のチャットボットに留まってしまうかもしれない。もしかしたら10年来のトレンドラインが崩れるかもしれないし、スケーリング・ディープラーニングが今度こそ本当に壁にぶつかるかもしれない。(あるいは、アルゴリズムのブレークスルーが、テスト時間の計算オーバーハングを解放する単純なアンホブリングであっても、パラダイムシフトとなり、事態をさらに加速させ、AGIをさらに早期に実現させるかもしれない)。

いずれにせよ、私たちはOOMsを駆け抜けているのであり、2027年までにAGI（真のAGI）が誕生する可能性を極めて真剣に考えるのに、難解な信念は必要なく、単に直線のトレンド外挿が必要なだけである。

最近、多くの人がAGIを単に優れたチャットボットなどとして下方定義しているように思える。私が言いたいのは、私や私の友人の仕事を完全に自動化し、AI 研究者やエンジニアの仕事を完全にこなせるようなAI システムのことだ。おそらく、ロボット工学のように、デフォルトで理解するのに時間がかかる分野もあるだろう。また、医療や法律などの社会的な普及は、社会の選択や規制によって容易に遅れる可能性がある。しかし、ひとたびAI 研究そのものを自動化するモデルができれば、それだけで十分であり、強烈なフィードバック・ループを始動させるのに十分であり、完全自動化に向けて残されたすべてのボトルネックを自動化されたAI エンジニア自身が解決することで、非常に迅速にさらなる進歩を遂げることができるだろう。特に、数百万人の自動化された研究者たちによって、アルゴリズムのさらなる進歩のための10年間が1年以内に圧縮される可能性は非常に高い。AGIは、まもなく実現する超知能のほんの一端に過ぎない。(詳しくは次の記事で）。

いずれにせよ、目まぐるしい進歩のペースが衰えることはないだろう。トレンドラインは無邪気に見えるが、その意味するところは強烈である。その前の世代がそうであったように、新世代のモデルが登場するたびに、ほとんどの見物人は唖然とするだろう。博士号を持っていれば何日もかかるような信じられないほど難しい科学的問題を、間もなくモデルが解決し、あなたのコンピュータのまわりを飛び回り、あなたの仕事をこなし、何百万行ものコードからなるコードベースをゼロから書き上げ、これらのモデルによって生み出される経済的価値が1年か2年ごとに10倍になるとき、彼らは信じられないだろう。SF小説は忘れて、OOMを数えよう。AGIはもはや遠い空想ではない。単純なディープラーニング技術をスケールアップすることがうまくいき、モデルは学習したがり、2027年末までにさらに100,000倍を超えようとしている。私たちよりも賢くなる日もそう遠くはないだろう。

https://situational-awareness.ai/wp-content/uploads/2024/06/gan_progress-1.jpeg

GPT-4はほんの始まりに過ぎない。GANの進歩に見られるように）ディープラーニングの進歩の速さを過小評価するような間違いを犯さないでほしい。

続き I.GPT-4からAGIへ：OOMを数える(11) https://anond.hatelabo.jp/20240605212014

Permalink | 記事への反応(1) | 21:18

■I.GPT-4からAGIへ：OOMを数える (9)

3.コンピュータの使用

これはおそらく3つの中で最も簡単な方法だ。現在のChatGPTは、基本的に、テキストを入力できる孤立した箱の中に座っている人間のようなものだ。初期のアンホブリング改良では、個々の孤立したツールの使い方をモデルに教えていましたが、マルチモーダルモデルでは、近いうちにこれを一挙にできるようになると期待しています。

つまり、Zoomでの通話に参加したり、オンラインで調べ物をしたり、メッセージや電子メールを送ったり、共有されたドキュメントを読んだり、アプリや開発ツールを使ったりといったことだ。(もちろん、より長いホライゾン・ループでモデルがこれを最大限に活用するためには、テスト時間のコンピューティングをアンロックする必要がある。)

最終的には、ドロップイン・リモートワーカーのようなものができると期待している。エージェントは、あなたの会社に入社し、新しい人間の雇用のようにオンボードされ、Slackであなたや同僚にメッセージを送り、あなたのソフトウェアを使用し、プルリクエストを行い、大きなプロジェクトがあれば、人間が独立してプロジェクトを完了するために数週間留守にするのと同等のことができる。これを実現するためには、GPT-4よりもいくらか優れたベースモデルが必要だろうが、おそらくそれほどでもないだろう。

https://situational-awareness.ai/wp-content/uploads/2024/06/devin.gif

Devinは、完全に自動化されたソフトウェア・エンジニアを作るために、モデル上の「エージェンシー・オーバーハング」／「テストタイム・コンピューティング・オーバハング」を解除する初期のプロトタイプだ。Devinが実際にどの程度機能するかはわからないし、このデモは、適切なチャットボット→エージェントのアンホブリングがもたらすものに比べれば、まだ非常に限定的なものだが、近々登場するもののティーザーとしては役に立つだろう。

ところで、私は、アンホブリングの中心性が、商業的応用という点で、少々興味深い「ソニックブーム」効果につながると期待している。現在とドロップイン・リモートワーカーの中間モデルは、ワークフローを変更し、統合して経済的価値を引き出すためのインフラを構築するために、膨大な手間を必要とする。ドロップイン・リモートワーカーは、統合が劇的に簡単になる。つまり、リモートでできるすべての仕事を自動化するために、ドロップインするだけでいいのだ。つまり、ドロップイン・リモートワーカーが多くの仕事を自動化できるようになる頃には、中間モデルはまだ完全に活用され統合されていないため、生み出される経済価値のジャンプはやや不連続になる可能性がある。

次の4年間

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_gpt2togpt4.png

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_ooms_2023to2027.png

GPT-4に先立つ4年間の進歩の原動力と、GPT-4後の4年間に期待されることについての推計のまとめ。

数字をまとめると、GPT-4に続く4年間で、2027年末までにGPT-2から GPT-4規模のジャンプが再び起こると（おおよそ）予想される。

GPT-2から GPT-4は、おおよそ4.5-6 OOMのベースとなる有効なコンピュート・スケールアップ（物理的なコンピュートとアルゴリズムの効率化）であり、それに加えて（ベースモデルからチャットボットへの）大きな「アンホブリング」利益であった。
その後4年間は、3～6OOMのベース実効計算スケールアップ（物理計算とアルゴリズム効率）が期待され、さらに「アンホブリング」（チャットボットからエージェント／ドロップインリモートワーカーへ）によってユーティリティとアプリケーションの段階的変化（～5OOM）がおそらく最良と推測される。

GPT-4のトレーニングに3ヶ月かかったとしよう。2027年には、一流のAI ラボはGPT-4レベルのモデルを1分で訓練できるようになるだろう。OOMの効果的なコンピュート・スケールアップは劇的なものになるだろう。

それは我々をどこへ連れて行くのだろうか？

https://situational-awareness.ai/wp-content/uploads/2024/06/overview_counting_the_ooms.png

OOMのカウントのまとめ。

GPT-2から GPT-4までで、私たちは～未就学児から～賢い高校生になった。とんでもないジャンプだ。もしこれが、私たちが今一度カバーする知能の差だとしたら、それは私たちをどこに連れて行くのだろうか？私たちは、それが私たちをとてもとても遠くに連れていっても驚かないはずだ。おそらく、ある分野の博士や最高の専門家を凌駕するようなモデルまで到達するだろう。

(このことを考える1つの良い方法は、現在のAIの進歩の傾向は、子供の成長のおよそ3倍のペースで進んでいるということだ。あなたの3倍速の子どもは高校を卒業したばかりだが、いつの間にかあなたの仕事を奪っていくだろう！)

続き I.GPT-4からAGIへ：OOMを数える(10) https://anond.hatelabo.jp/20240605211837

Permalink | 記事への反応(1) | 21:03

■I.GPT-4からAGIへ：OOMを数える (8)

チャット ボット から エージェント兼同僚へ

今後数年間の野心的なアンホブリングはどのようなものになるのでしょうか？私が考えるに、3つの重要な要素がある：

1."オンボーディング問題 "の解決

GPT-4は、多くの人の仕事の大部分をこなせるだけの生の賢さを持っているが、それは5分前に現れたばかりの賢い新入社員のようなものだ：関連するコンテキストを持っておらず、会社のドキュメントやSlackの履歴を読んだり、チームのメンバーと会話したり、会社内部のコードベースを理解するのに時間を費やしたりしていない。賢い新入社員は、着任して5分後にはそれほど役に立たないが、1ヶ月後にはかなり役に立つ！例えば、非常に長いコンテクストを通じて、新しい人間の同僚を雇うようにモデルを「オンボード」することは可能なはずだ。これだけでも、大きなアンロックになるだろう。

2.テスト時間の計算オーバーハング（より長いホライズンの問題に対する推論／エラー訂正／システムII）

今のところ、モデルは基本的に短いタスクしかこなせない。しかし、これでは非常に限界がある。5分どころか、数時間、数日、数週間、数ヶ月かかるのだ。

難しい問題について5分間しか考えることができない科学者は、科学的なブレークスルーを起こすことはできない。ソフトウェア・エンジニアは、より大きな仕事を与えられ、計画を立て、コードベースや技術ツールの関連部分を理解し、さまざまなモジュールを書いて段階的にテストし、エラーをデバッグし、可能性のある解決策を検索し、最終的には数週間の仕事の集大成である大規模なプル・リクエストを提出する。などなど。

要するに、テスト時間の計算オーバーハングが大きいのだ。GPT-4の各トークンは、問題を考えるときの内部モノローグの言葉だと考えてください。各GPT-4トークンは非常に賢いのですが、現在のところ、思考の連鎖のために～数百トークンのオーダーしか効果的に使うことができません（あたかも問題やプロジェクトに数分しか内部独白／思考を費やせないかのように）。

もし数百万トークンを使って、本当に難しい問題や大きなプロジェクトについて考え、取り組むことができるとしたらどうだろう？

トークンの数	私が何かに取り組むのに相当する時間...
100s	数分	ChatGPT (私たちはここにいる)
1000s	30分	+1 OOMsテスト時間計算
10,000 回	半日	+2 OOMs
100,000ドル	1週間	+3 OOMs
数百万回	複数月	+4 OOMs

人間が〜100トークン/分で考え、40時間/週働くと仮定して、「モデルが考える時間」をトークンで換算すると、与えられた問題/プロジェクトにおける人間の時間になる。

仮に「トークンあたり」の知能が同じだったとしても、頭のいい人が問題に費やす時間が数分なのか数ヶ月なのかの違いになる。あなたのことは知らないが、私が数ヶ月でできることと数分でできることは、はるかに、はるかに、はるかに多い。もしモデルに「数分ではなく、数カ月に相当する時間、何かを考え、取り組むことができる」という能力を与えることができれば、その能力は飛躍的に向上するだろう。ここには膨大なオーバーハングがある。

今のところ、モデルにはまだこれができない。最近のロング・コンテキストの進歩をもってしても、このロング・コンテキストのほとんどはトークンの消費にしか機能せず、トークンの生産には機能しない。しばらくすると、このモデルはレールから外れたり、行き詰まったりする。しばらくの間、離れて単独で問題やプロジェクトに取り組むことはまだできない。

しかし、テスト時間の計算を解除することは、単に比較的小さな「ホブリングしない」アルゴリズムの勝利の問題かもしれない。おそらく、少量のRLは、モデルがエラー訂正（「うーん、これは正しくないようだ、再確認してみよう」）を学習したり、計画を立てたり、可能性のある解を探索したりするのに役立つだろう。ある意味、モデルはすでに生の能力のほとんどを持っており、それをまとめるために、さらにいくつかのスキルを学習する必要があるだけなのだ。

要するに、私たちはモデルに、困難で見通しの長いプロジェクトを推論させるシステムIIのアウターループのようなものを教えればいいのだ。

この外側のループを教えることに成功すれば、2、3段落の短いチャットボットの答えの代わりに、モデルが問題を考え、ツールを使い、異なるアプローチを試し、研究を行い、仕事を修正し、他の人と調整し、大きなプロジェクトを一人で完成させるような、何百万もの言葉のストリーム（あなたが読むよりも早く入ってくる）を想像してみてほしい。

他のML 領域におけるテスト時間と訓練時間のトレードオフ

続き I.GPT-4からAGIへ：OOMを数える(9) https://anond.hatelabo.jp/20240605210357

Permalink | 記事への反応(1) | 21:02

■I.GPT-4からAGIへ：OOMを数える (3)

ディープラーニングのトレンド

過去 10年間のディープラーニングの進歩のペースは、まさに驚異的だった。ほんの10年前、ディープラーニング・システムが単純な画像を識別することは革命的だった。今日、我々は斬新でこれまで以上に難しいテストを考え出そうとし続けているが、新しいベンチマークはどれもすぐにクラックされてしまう。以前は広く使われているベンチマークをクラックするのに数十年かかっていたが、今ではほんの数カ月に感じられる。

https://situational-awareness.ai/wp-content/uploads/2024/06/owid-test-scores-1024x723.png

ディープラーニング・システムは、多くの領域で急速に人間レベルに達し、あるいはそれを超えつつある。グラフィックデータで見る我々の世界

私たちは文字通りベンチマークを使い果たしている。逸話として、友人のダンとコリンが数年前、2020年にMMLUというベンチマークを作った。彼らは、高校生や大学生が受ける最も難しい試験に匹敵するような、時の試練に耐えるベンチマークを最終的に作りたいと考えていた。GPT-4やGeminiのようなモデルで〜90％だ。

より広く言えば、GPT-4は標準的な高校や大学の適性試験をほとんど解いている。(GPT-3.5から GPT-4までの1年間でさえ、人間の成績の中央値を大きく下回るところから、人間の成績の上位に入るところまで、しばしば到達した)

https://situational-awareness.ai/wp-content/uploads/2024/06/gpt4_exams-780x1024.png

GPT-4の標準テストのスコア。また、GPT-3.5から GPT-4への移行で、これらのテストにおける人間のパーセンタイルが大きく跳ね上がり、しばしば人間の中央値よりかなり下から人間の最上位まで到達していることにも注目してほしい。(これはGPT-3.5であり、GPT-4の1年も前にリリースされたかなり新しいモデルである。)

https://situational-awareness.ai/wp-content/uploads/2024/06/math2022-1024x273.png

灰色：2021年 8月に行われた、MATHベンチマーク（高校数学コンテストの難解な数学問題）の2022年 6月のパフォーマンスに関する専門家の予測。赤い星：2022年 6月までの実際の最先端のパフォーマンス。ML 研究者の中央値はさらに悲観的だった。

MATHベンチマーク（高校の数学コンテストで出題された難しい数学の問題集）を考えてみよう。このベンチマークが2021年に発表されたとき、最高のモデルは問題の5％しか正解できなかった。そして元の論文にはこう記されている：「さらに、このままスケーリングの傾向が続けば、単純に予算とモデルのパラメータ数を増やすだけでは、強力な数学的推論を達成することは現実的ではないことがわかった。数学的な問題解決をより牽引するためには、より広範な研究コミュニティによる新たなアルゴリズムの進歩が必要になるだろう」、つまり、MATHを解くためには根本的な新しいブレークスルーが必要だ、そう彼らは考えたのだ。ML 研究者の調査では、今後数年間の進歩はごくわずかだと予測されていた。しかし、わずか1年以内（2022年半ばまで）に、最高のモデルの精度は5％から50％に向上した。

毎年毎年、懐疑論者たちは「ディープラーニングではXはできない」と主張し、すぐにその間違いが証明されてきた。過去 10年間のAI から学んだ教訓があるとすれば、ディープラーニングに賭けてはいけないということだ。

現在、最も難しい未解決のベンチマークは、博士号レベルの生物学、化学、物理学の問題を集めたGPQAのようなテストである。問題の多くは私にはちんぷんかんぷんで、他の科学分野の博士でさえ、Googleで30分以上かけてやっとランダムな偶然を上回るスコアを出している。クロード3オーパスは現在60％程度であり、それに対してインドメインの博士たちは80％程度である。

https://situational-awareness.ai/wp-content/uploads/2024/06/gpqa_examples-768x1120.png

GPQAの問題例。モデルはすでに私より優れており、おそらくすぐにエキスパート・博士レベルを突破するだろう...。

続き I.GPT-4からAGIへ：OOMを数える (4) https://anond.hatelabo.jp/20240605205024

Permalink | 記事への反応(1) | 20:47

■I.GPT-4からAGIへ：OOMを数える (2)

この4年間

私たちは今、基本的に人間のように会話できるマシンを手にしている。これが普通に思えるのは、人間の適応能力の驚くべき証であり、私たちは進歩のペースに慣れてしまったのだ。しかし、ここ数年の進歩を振り返ってみる価値はある。

GPT-2から GPT-4へ

GPT-4までのわずか4年間（！）で、私たちがどれほど進歩したかを思い出してほしい。

GPT-2（2019年）～未就学児："わあ、もっともらしい文章をいくつかつなげられるようになった"アンデス山脈のユニコーンについての半まとまりの物語という、とてもさくらんぼのような例文が生成され、当時は信じられないほど印象的だった。しかしGPT-2は、つまずくことなく5まで数えるのがやっとだった。記事を要約するときは、記事からランダムに3つの文章を選択するよりもかろうじて上回った。

当時、GPT-2が印象的だった例をいくつか挙げてみよう。左：GPT-2は極めて基本的な読解問題ではまあまあの結果を出している。右：選び抜かれたサンプル（10回試したうちのベスト）では、GPT-2は南北戦争についてある程度関連性のあることを述べた、半ば首尾一貫した段落を書くことができる。

https://situational-awareness.ai/wp-content/uploads/2024/06/gpt2_examples-1024x493.png

当時、GPT-2について人々が印象に残った例をいくつか挙げます。左: GPT-2は極めて基本的な読解問題でまあまあの仕事をする。右: 厳選されたサンプル（10回試したうちのベスト）では、GPT-2は南北戦争について少し関連性のあることを言う、半ば首尾一貫したパラグラフを書くことができる。

AIの能力と人間の知能を比較するのは難しく、欠陥もあるが、たとえそれが非常に不完全なものであったとしても、ここでその例えを考えることは有益だと思う。GPT-2は、その言語能力と、時折半まとまりの段落を生成したり、時折単純な事実の質問に正しく答えたりする能力で衝撃を与えた。未就学児にとっては感動的だっただろう。

GPT-3（2020年）～小学生："ワオ、いくつかの例だけで、簡単な便利なタスクができるんだ。"複数の段落に一貫性を持たせることができるようになり、文法を修正したり、ごく基本的な計算ができるようになった。例えば、GPT-3はSEOやマーケティング用の簡単なコピーを生成することができた。

https://situational-awareness.ai/wp-content/uploads/2024/06/gpt3_examples-1.png

GPT-3について、当時の人々が印象に残った例をいくつか挙げてみよう。上：簡単な指示の後、GPT-3は新しい文の中で作られた単語を使うことができる。左下：GPT-3は豊かなストーリーテリングを行ったり来たりできる。右下：GPT-3は非常に簡単なコードを生成できる。

GPT-3はSEOやマーケティング用の簡単なコピーを生成することができた。上：簡単な指示の後、GPT-3は新しい文章の中で作られた単語を使うことができる。左下：GPT-3は豊かなストーリーテリングを行ったり来たりできる。右下：GPT-3は非常に簡単なコードを生成できる。

繰り返しになるが、この比較は不完全である。しかし、GPT-3が人々に感銘を与えたのは、おそらく小学生にとって印象的だったことだろう。基本的な詩を書いたり、より豊かで首尾一貫した物語を語ったり、初歩的なコーディングを始めたり、簡単な指示やデモンストレーションからかなり確実に学習したり、などなど。

GPT-4（2023年）～賢い高校生：「かなり洗練されたコードを書くことができ、デバッグを繰り返し、複雑なテーマについて知的で洗練された文章を書くことができ、難しい高校生の競技数学を推論することができ、どんなテストでも大多数の高校生に勝っている。コードから数学、フェルミ推定まで、考え、推論することができる。GPT-4は、コードを書く手伝いから草稿の修正まで、今や私の日常業務に役立っている。

https://situational-awareness.ai/wp-content/uploads/2024/06/gpt4_examples-3.png

GPT-4がリリースされた当時、人々がGPT-4に感銘を受けた点をいくつか紹介しよう。上：GPT-4は非常に複雑なコードを書くことができ（中央のプロットを作成）、非自明な数学の問題を推論することができる。左下：AP 数学の問題を解く。右下：かなり複雑なコーディング問題を解いている。GPT-4の能力に関する調査からの興味深い抜粋はこちら。

AP 試験から SATに至るまで、GPT-4は大多数の高校生よりも良いスコアを出している。

もちろん、GPT-4でもまだ多少ばらつきがある。ある課題では賢い高校生よりはるかに優れているが、別の課題ではまだできないこともある。とはいえ、これらの限界のほとんどは、後で詳しく説明するように、モデルがまだ不自由であることが明らかなことに起因していると私は考えがちだ。たとえモデルがまだ人為的な制約を受けていたとしても、生のインテリジェンスは（ほとんど）そこにある。

https://situational-awareness.ai/wp-content/uploads/2024/06/timeline-1024x354.png

わずか4年間の進歩。あなたはこのラインのどこにいるのだろうか？

続き I.GPT-4からAGIへ：OOMを数える (3) https://anond.hatelabo.jp/20240605204704

Permalink | 記事への反応(2) | 20:42

■[開発メモ] サンプル欲しけりゃ自動化 しろ

誰かにプロトタイプを使ってもらって「入力Aに対して出力Bが得られる例はない？」などと言われることがあるだろう

例えばレコメンダシステムでは、ユーザーの行動を入力としてアイテムを出力する

「こういう行動をした場合と、してない場合で、こういうアイテムの違いが想定されて欲しい」という要望が出てくるのである

そういう場合は、可能な行動の組み合わせを全て網羅して、それらを関数に自動的に入力し、その出力をファイルとして出すなどして見てもらって自動化したほうが良い

要するに、プロトタイプをポチポチ触るだけでは効率が悪い場合は、入力の組み合わせを自動入力してしまったほうが早いわけである

もし出力に条件があれば、その条件をフィルタリングすることも可能だろう

ただし、自動化の設計と実装には時間と労力が必要

そのため、自動化が必要かどうか、またどの程度の自動化が適切かを判断するためには、テストの目的と範囲、そして利用可能なリソースを考慮することが重要

自動化が適切に行われれば、時間と労力を節約し、より高品質なシステムを開発することが可能になる

Permalink | 記事への反応(1) | 11:50

■anond:20240605011050

本当に共通テストで国語取らなかったんだね」と「大学受験しなかたの？」は必ずしも同じ意味ではありません。
「本当に共通テストで国語取らなかったんだね」は、共通テストという試験の中で国語という教科を選択しなかったことを示しています。
一方で、「大学受験しなかったの？」は、大学受験という行為全般を指しているため、受験したけれども残念ながら不合格だったという場合も含みます。
したがって、必ずしも同じ意味ではないと言えるでしょう。
ただし、これらの文章の意味が必ずしも異なるとは一概に言うことができず、文脈や話の流れによって様々に変化するため、あくまで参考程度と考えてください。