はてなキーワード: トランスフォーマーとは
https://arxiv.org/pdf/2305.00833.pdf
Learning to Reason and Memorize with Self-Notes
大規模な言語モデルは、限られたコンテキスト メモリと多段階の推論に苦労することが示されています。
モデルが自己メモを取ることを可能にすることにより、これらの問題の両方を解決するための簡単な方法を提案します。
最近のスクラッチパッド アプローチとは異なり、モデルはいつでも入力コンテキストから逸脱して明示的に考えることができます。
これにより、モデルはコンテキストを読み取りながら情報を想起し、オンザフライで推論を実行できるため、メモリが拡張され、複数ステップの推論が可能になります。
複数のタスクに関する私たちの実験は、推論時に自己メモを取ることにより、トレーニング設定からより長く複雑なインスタンスに私たちの方法がうまく一般化できることを示しています.
1. イントロダクション
Transformers (Vaswani et al., 2017) および同様のバリアントは、シーケンスベースのタスクで印象的な結果を示しています
特に、GPT-3 (Brown et al., 2020) などの大規模な言語モデル (LM) はトランスフォーマーを使用し、質問応答 (QA) などのさまざまな NLP タスクを解決できます。
LM を QA タスクに使用すると、図 1 (上) に示すように、事実情報と質問を含むコンテキスト プロンプトが与えられ、モデルが直接回答を生成します。 ただし、この自己回帰の「ワンステップ」アプローチは、複数ステップの推論タスクと格闘します (Austin et al., 2021; Press et al., 2022a; Creswell et al., 2023)。 これは、バニラ LM が各トークンに対して固定された計算を行い、現在のコンテキストに応じてさらに「考える」オプションがないという事実から生じると主張します。 (2021) 図 1 (中央) に示すように、モデルが質問に答える前に推論トークンを生成できるようにするスクラッチパッドの使用を提案しましたが、完全なコンテキストと質問を読み取った後です。 同様に、一連の思考を促す方法 (Wei et al., 2022; Zelikman*Equal Contributor 1Meta AI. への対応: JackLanchantin <jacklanchantin@meta.com>, Sainbayar Sukhbaatar<sainbar@meta.com>.et al., 2022; Huang et al., 2022) は、モデルをプッシュして、一度に 1 ステップずつ答えを説明し、より首尾一貫した最終的な答えに導きます。 非線形タスク (Fan et al., 2020)、LSTM (Hochreiter and Schmidhuber, 1997) などの再帰型先行モデルが十分に備えられているもの。 Fan et al., 2020; Ju et al., 2022; Hutchins et al., 2022)、しかし、それでも与えられたプロンプトに対して一定量の計算を使用します。 推論と状態追跡メモリがより扱いやすくなります。 私たちの方法である「Self-Notes」により、LM はオンザフライでコンテキスト プロンプトから逸脱し、明示的な推論トークンを生成できます。 図 1 (下) に示すように、スクラッチパッドとは異なり、モデルは生成されたトークンを入力コンテキストとインターリーブできます。 このようなセルフ ノートは、明示的な中間推論ステップと状態追跡用のメモリの両方として機能します。 具体的には、推論ステップで 2 つの事実を組み合わせる必要がある場合、結果として得られる推論をセルフ ノートに書き込んで、将来の推論に使用することができます。したがって、中間推論ステップとして機能します。 たとえば、「アリスは箱を持っています」と「アリスは公園にいます」が与えられた場合、「箱は公園にある」と推測してそれを自己メモに書き、将来のステートメント「鍵は in the box」で「鍵は公園にある」と結論付ける。 さらに、コンテキストをトラバースしながらモデルがエンティティの最新の状態を新しいトークンとして書き込むことができるため、SelfNote はワーキング メモリの形式として機能できます。 たとえば、プログラミング環境では、最初に x=5 を想定し、次に x を 1 ずつ増やします。モデルが x=6 をセルフ ノートとして正しく記述していると仮定すると、元の x=5 ステートメントをそのコンテキストから安全に削除できます。 モデルが x の値について問い合わせられた場合、モデルは既に答えを持っています。
私たちの提案した方法と、スクラッチパッド (Nye et al., 2021)、思考の連鎖 (Wei et al., 2022)、または内部独白 (Huang et al., 2022) などの以前の研究との主な違いは、モデルを許可することです。 各コンテキストステートメントを順番に読み取るときに、複数のメモを明示的に書き出す。 InarXiv:2305.00833v1 [cs.LG] 2023 年 5 月 1 日図 1: (上) ベースライン バニラ LM は、コンテキスト (C) と質問 (Q) が与えられると、回答 (A) を直接生成します。 (中央)スクラッチパッドを使用すると、モデルは質問に答える前に中間推論トークンを生成できますが、コンテキストが表示された後です。 (下) 私たちの Self-Notes メソッドにより、モデルはいつでも推論してメモを取るために入力コンテキストから逸脱することができます。言い換えれば、私たちのアプローチは、将来の推論に役立つ可能性のある情報でコンテキストを補強するスクラッチパッドのインライン形式です。 私たちはこれを、人間が読む方法と同様に、明示的に述べられていない情報を推測するための行間の読み取り (および書き込み) の形式と見なします (van den Broek et al., 2009)。 以前の方法では、モデルが完全なコンテキストを読み取った後に反芻することができ、読み取っている間ではなく、最後に大量の推論を行うように強制されます。
さらに、そのようなポストコンテキスト推論は、推論が開始される前に以前のコンテキストトークンがモデルのコンテキストウィンドウからすでに出ている可能性があるため、メモリとして機能できません。 たとえば、数週間または数か月の対話履歴を持つインテリジェント エージェントを考えてみましょう。 直観的には、最初から考え直すことなく、以前の対話で行った推論ステップを使用できることは理にかなっています。自己メモを生成するようにモデルに教えるために、トレーニング中に、入力の一部としてグラウンド トゥルース自己メモを言語モデルに提供することを検討します。 コンテクスト。 推論中に、トレーニング中に学習した特別なトークンを生成する場合、モデルはコンテキストから逸脱し、SelfNote を生成できます。モデルが Self-Note の生成を完了すると、元のコンテキスト トークンが引き続き供給されます。 これにより、モデルは最後だけでなく、入力トークンの処理中にメモリを推論および作成できます。 また、Self-Notes をトレーニングするための半教師ありおよび教師なしの方法も提案します。多段階の推論と状態追跡を評価するように設計された 5 つのテキスト データセットでこの方法をテストします。 , 2020; Anil et al., 2022)、および 2 つの現実世界のチェス ゲーム タスク (Toshniwal et al., 2022)。 私たちの方法は、明示的なメモ取りを行わない微調整された言語モデルとスクラッチパッドのベースラインの両方よりも優れています.2. 方法シーケンス内の次のトークンを予測する自己回帰変換モデル M を考えてみましょう
都会に出ていってしまった息子の部屋を片付けるべく母親の私が整理している。
私に似て玩具好きに育った息子は沢山の置き土産を残していった。押入いっぱいのおもちゃだ。
値のはる物は本人がある程度売っぱらったので「残りは捨てても売ってもいいよ」と託された。
現在は絶賛無職の専業主婦、そしてヤフオク歴20年の“粗利は100円でもあればいい女”の私は売るほかなかった。最近はメルカリのほうもよく売れる。
息子はとにかく玩具を“見つける・選ぶ・買う”ことが好きで、開封して一度作ったり弄れればもう放置する人間だったので押入はバラバラになったプラモやフィギュアやらが袋や箱に入れられて佃煮のようだ。
まず箱を用意してそれぞれにトランスフォーマー 、特撮系、ボトルマン、ガンダム系、ベイブレード、ナーフ…と張り紙をしてそこにぶっ込んでいく。特撮系は嵩張るので3箱になった。
わかりやすい物は分類しやすいが分解しやすいプラモとちまっこいフィギュアには手こずっている。
しかしどんな小さなパーツでも息子は絶対に捨てないで保管していたのでバラバラの佃煮の一部をGoogleレンズでイメ検し出てきた全体像をつかみながら目を凝らして根気よく探すとほぼ必ずそのものが完成する。
さっきは『マルチアビス V-リンク・メカ ストライカー』の中に搭乗する人物の1cmもない右腕を見つけることができて興奮した。凄いな私。さすがレゴで育てた目だ。レゴも積んでる。
そうして完成させては出品して売っているともう1万円になった。
このまま頑張れば部屋は片付き売り上げは懐に入り最後は私の趣味部屋へと変えられるだろう。
ここ数年で集めたシルバニアファミリーのダン箱が7つあるのでやっとこれを広げることができる。
これは建物はノーカンで書いてる。建物は箱に入れるとさらにかさばるからだ。建物は積んで(積める)常に眺めてる。シルバニア者は自室のことを土地と呼ぶ。
最近多いのは、年間にでるカードの種類の多さとそれに比例したエラーカードや品質の悪いカードの多さ
ようは粗製濫造だね
MTGはだいたい3ヶ月毎にスタンダードで使用できるパックを80種つくるのが恒例なんだけど、最近コレにプラスしてスタンダード以外を狙った商品展開も多い
特にアメリカではもはやスタンダード以上にスタンダードである統率者戦用のカード展開が多い
これならまだわかるが、基本的に統率者のカードは統率者戦でしか使えないのに、それをなぜかスタンダードのパックに封入しているのだから質が悪い
スダンで遊びたい人にはスタンで遊べないカードを掴まされるわけだから
また、スタンのカードにおいても様々なアートを混ぜて販売しており、同じカードでも希少価値に差を持たせる商品展開が盛んだ
そのため、実際に遊ぶ用のボックスとは別に、コレクター向けの豪華版という箱が用意されている
しかしコレクターは一般のパックの中に含まれる稀少なカードにこそ価値を見いだしやすく、わざわざ「コレを買えばキラキラしたカードがでますよ」という確定ガチャに近い物にあまり良い印象を持っていない
さらに近年は公式で使用不可だが豪華なカードという意味不明なものをだしたり、再録禁止していたものを「倉庫に積み上がっていた」という脱法詐欺のような手法で封入もしている
特定のカテゴリーに限定したパックであるはずなのにパッケージと中身が違うことがしばしばある
中でも世界に一枚しかないナンバリングされた限定カードが裁断ミスで封入されているってのはジョークでも笑えない
元々大量のカードがある中で、さらに様々な方向から粗製濫造をしている現在はMTGは高額でどれを集めるたらいいかよくわからないという、非常に厄介な商品になっている
しかしこのカードは統率者委員会という、統率者を遊ぶために組織された外部の有識者の集まりからクレームがきた
というか、実態は運営がその外部の委員会にカードデザインに関してアドバイス(?)を貰っていたらしい
そして委員会が否定したカードが実際にはすられたため、委員会のボスが怒っているんだとか
https://twitter.com/dimirub/status/1606136564488159232
一企業の商品に事前にプレイヤーが秘密裏に係わっているだけでも充分に炎上案件だし
そのキレ方も「統率者にふさわしくない」という統率者以外のプレイヤーには全く無関係な理由だったので、極めて厄介な話になっている
1枚のカードに対する一個人の見解を超えてかなり泥沼化しているのが現状
もうこの話は風化を待つ以外にないだろうな
これはもはやエルドレンあたりがピークだったと思う
うん、パワーカード多すぎ
スタンダードって初心者が一番入りやすいフォーマットなのに、そこで禁止カードを沢山作ったらいかんでしょ
最近はダンジョン&ドラゴンやトランスフォーマーともコラボしており、さらに指輪物語とかのパックもあるらしい
これ自体が問題と言うより、やはり過去の世界観を壊すような派生商品は嫌われるってことがまた顕在化したのが萎える
単なるアートの一つであっても許せないって人も多く、それで炎上するのはちょっと恥ずかしいかな
なんかウィザーズは売上げ好調のようだけど、正直企業利益の追求ばかりしていてプレイヤーが置いてけぼりにされているように感じる
ゾイドについて、こやまきみこと伊藤静が出てたやつの薄い本の知識しかないので
わんちゃん、ゴジュラスの方がオリジナルで、伊福部昭の方がパクりである可能性もあるのでは? と思ってるんだけど
流石にこれは慎重すぎるかな
いやけど、俺が一切疑いなく信じていた「ボーイズラブ同人誌という文化はベイブレードが原点」という仮説は完全に間違いだったしなあ……
急に関係ないこと書くけど、イナズマイレブンのレビューで「サッカー好きな奴が自分からゴールキーパーやるわけないだろ。リアリティがない」と言ってる人がいて
流石に難癖では? と思った。
ショウマストゴーオンはアモンデュールの中にいたって設定らしいけど、マーク2の本名がクローソーであることと関係してる?(デルタベルンとララファの関係性はやく見たい)
ナデシコの二次創作でイツキが妙に設定盛られるのと、Kanonの二次創作で祐一が設定盛られるのはどっち?
エヴァの二次創作でシンジが最終話までの記憶を保持して1話からやり直すやつと、ナデシコの二次創作で劇場版の配役がアキトに立場にルリ、ユリカの立場にアキト、ルリの立場にユリカがなるやつはどっち?
ガガガのおじさんとレレレのおじさんはどっち?
デビチルとポケモンはどっち?
ダグオンとボーイズラブはどっち?
ダーティペアとダーティペアのパクりみたいな当時流行ったえっちないくつものアニメはどっち?
ガリアンってGTM味するけど、流石にガリアンの方が古いのぐらいわかるんだからね!!!!
いや、マジでガリアンはMHにいてもいいし、GTMにいてもいい感じしない?
彼は、電子戦隊デンジマンOPのウエスタン調や、電撃戦隊チェンジマンOPの影山ヒロノブカッコよさ、
トランスフォーマーのコンボイ司令の玄田哲章の素晴らしさや永野護メカデザインの革新性を熱く語る男だった。
自動車鈑金塗装業四男だった彼は中学卒業後農業高校へ進学し、それっきり疎遠になってしまった。
高校卒業後、東京税関職員になって麻薬犬トレーナーになったが独身で相変わらず漫画とアニメ三昧の
日々を送っていると風の噂では聞いていたが、その友人がなんと結婚して36年ぶりに地元に帰っていると知り、
久し振りに当時の友人4人で会うことになった。地元の日本酒蔵元がクラフトビール醸造を始めて、
経営多角化で始めた日本酒とクラフトビールを出すバルで会うことになった。彼は下戸ではないのだが、
あまり酒に強くなく、36年ぶりに互いの近況を語り合い、俺はしこたま酔って楽しい時間を過ごすことができた。
閉店で店を追い出された後、俺は運転代行で帰る彼の車に酔った勢いで乗り込み、彼の奥さんに会いに行った。
彼の住む家は後継者がおらず空き家になった廃屋を地方創生移住支援事業でリフォームして住んでいるそうだ。
若い奥さんと娘4人と6人で暮らしていた。彼は仕事をしておらず、奥さんが農環センターという公民館みたいな
会場で教えるヨガ教室での謝金と、家の庭で育てた野菜と湖で釣った魚を、毎月8日と18日に開かれる
街場の市で売って得た僅かな現金収入しかないそうだ。そんなんで生活していけんの?と思ったが、
隣近所全員東京からの移民でみんなで物々交換で助け合っているそうで、
よく見たら娘さんの女児服もクタクタで誰かのお古のスマイルプリキュアの変身コンパクトで遊んでいた。
何軒かの廃屋に人が住む気配を感じる山奥の見捨てられた集落を歩きながら、