はてなキーワード: チェスとは
せやけど工藤、わしは以前から不思議なんやが、電子ゲームのプログラム部分って
発明の効果が「(ゲーマー=人間の目からみて)おもしろい」ちゅうのはどうかとおもうんよ
そういう複雑な計算をクライアントと分割してサーバーに電圧負荷をかけない技術ぅ~とか、(これは電気消費量メーターが正直に効果表示しますわな)
ユーザーがクライアント解析してもバレないという技術上特徴のあるシステム~ちゅうのんを、
つくったっちゅうならわかるんやけどなぁ
ありゃぁ独占権あたえてええもんなんやろかのぅ~
ちなみにそれやったらチェスのアレンジルール、ボードゲームのルール、知恵の輪、なんぞという今まで拒絶査定くらっとったもんなんかも特許あたえんと不公平なんちゃうの
アメさんの特許庁は日本とそうかわらん発明定義もっとる(ちゅうかアメさんははっきりとは定義しとらん、書き方だけ決めとる)けど全部OKなんやで~
ほんで著作権も日本は「定義するからこそ」おかしゅうなっとるんや
もっと傲慢に「日本特許庁が/文化庁がOKゆうたらそれはもう独占権のおすみつきやで」ちゅうなんかもうちょっとプロパテント的な政策必要なんとちゃうか?
https://arxiv.org/pdf/2305.00833.pdf
Learning to Reason and Memorize with Self-Notes
大規模な言語モデルは、限られたコンテキスト メモリと多段階の推論に苦労することが示されています。
モデルが自己メモを取ることを可能にすることにより、これらの問題の両方を解決するための簡単な方法を提案します。
最近のスクラッチパッド アプローチとは異なり、モデルはいつでも入力コンテキストから逸脱して明示的に考えることができます。
これにより、モデルはコンテキストを読み取りながら情報を想起し、オンザフライで推論を実行できるため、メモリが拡張され、複数ステップの推論が可能になります。
複数のタスクに関する私たちの実験は、推論時に自己メモを取ることにより、トレーニング設定からより長く複雑なインスタンスに私たちの方法がうまく一般化できることを示しています.
1. イントロダクション
Transformers (Vaswani et al., 2017) および同様のバリアントは、シーケンスベースのタスクで印象的な結果を示しています
特に、GPT-3 (Brown et al., 2020) などの大規模な言語モデル (LM) はトランスフォーマーを使用し、質問応答 (QA) などのさまざまな NLP タスクを解決できます。
LM を QA タスクに使用すると、図 1 (上) に示すように、事実情報と質問を含むコンテキスト プロンプトが与えられ、モデルが直接回答を生成します。 ただし、この自己回帰の「ワンステップ」アプローチは、複数ステップの推論タスクと格闘します (Austin et al., 2021; Press et al., 2022a; Creswell et al., 2023)。 これは、バニラ LM が各トークンに対して固定された計算を行い、現在のコンテキストに応じてさらに「考える」オプションがないという事実から生じると主張します。 (2021) 図 1 (中央) に示すように、モデルが質問に答える前に推論トークンを生成できるようにするスクラッチパッドの使用を提案しましたが、完全なコンテキストと質問を読み取った後です。 同様に、一連の思考を促す方法 (Wei et al., 2022; Zelikman*Equal Contributor 1Meta AI. への対応: JackLanchantin <jacklanchantin@meta.com>, Sainbayar Sukhbaatar<sainbar@meta.com>.et al., 2022; Huang et al., 2022) は、モデルをプッシュして、一度に 1 ステップずつ答えを説明し、より首尾一貫した最終的な答えに導きます。 非線形タスク (Fan et al., 2020)、LSTM (Hochreiter and Schmidhuber, 1997) などの再帰型先行モデルが十分に備えられているもの。 Fan et al., 2020; Ju et al., 2022; Hutchins et al., 2022)、しかし、それでも与えられたプロンプトに対して一定量の計算を使用します。 推論と状態追跡メモリがより扱いやすくなります。 私たちの方法である「Self-Notes」により、LM はオンザフライでコンテキスト プロンプトから逸脱し、明示的な推論トークンを生成できます。 図 1 (下) に示すように、スクラッチパッドとは異なり、モデルは生成されたトークンを入力コンテキストとインターリーブできます。 このようなセルフ ノートは、明示的な中間推論ステップと状態追跡用のメモリの両方として機能します。 具体的には、推論ステップで 2 つの事実を組み合わせる必要がある場合、結果として得られる推論をセルフ ノートに書き込んで、将来の推論に使用することができます。したがって、中間推論ステップとして機能します。 たとえば、「アリスは箱を持っています」と「アリスは公園にいます」が与えられた場合、「箱は公園にある」と推測してそれを自己メモに書き、将来のステートメント「鍵は in the box」で「鍵は公園にある」と結論付ける。 さらに、コンテキストをトラバースしながらモデルがエンティティの最新の状態を新しいトークンとして書き込むことができるため、SelfNote はワーキング メモリの形式として機能できます。 たとえば、プログラミング環境では、最初に x=5 を想定し、次に x を 1 ずつ増やします。モデルが x=6 をセルフ ノートとして正しく記述していると仮定すると、元の x=5 ステートメントをそのコンテキストから安全に削除できます。 モデルが x の値について問い合わせられた場合、モデルは既に答えを持っています。
私たちの提案した方法と、スクラッチパッド (Nye et al., 2021)、思考の連鎖 (Wei et al., 2022)、または内部独白 (Huang et al., 2022) などの以前の研究との主な違いは、モデルを許可することです。 各コンテキストステートメントを順番に読み取るときに、複数のメモを明示的に書き出す。 InarXiv:2305.00833v1 [cs.LG] 2023 年 5 月 1 日図 1: (上) ベースライン バニラ LM は、コンテキスト (C) と質問 (Q) が与えられると、回答 (A) を直接生成します。 (中央)スクラッチパッドを使用すると、モデルは質問に答える前に中間推論トークンを生成できますが、コンテキストが表示された後です。 (下) 私たちの Self-Notes メソッドにより、モデルはいつでも推論してメモを取るために入力コンテキストから逸脱することができます。言い換えれば、私たちのアプローチは、将来の推論に役立つ可能性のある情報でコンテキストを補強するスクラッチパッドのインライン形式です。 私たちはこれを、人間が読む方法と同様に、明示的に述べられていない情報を推測するための行間の読み取り (および書き込み) の形式と見なします (van den Broek et al., 2009)。 以前の方法では、モデルが完全なコンテキストを読み取った後に反芻することができ、読み取っている間ではなく、最後に大量の推論を行うように強制されます。
さらに、そのようなポストコンテキスト推論は、推論が開始される前に以前のコンテキストトークンがモデルのコンテキストウィンドウからすでに出ている可能性があるため、メモリとして機能できません。 たとえば、数週間または数か月の対話履歴を持つインテリジェント エージェントを考えてみましょう。 直観的には、最初から考え直すことなく、以前の対話で行った推論ステップを使用できることは理にかなっています。自己メモを生成するようにモデルに教えるために、トレーニング中に、入力の一部としてグラウンド トゥルース自己メモを言語モデルに提供することを検討します。 コンテクスト。 推論中に、トレーニング中に学習した特別なトークンを生成する場合、モデルはコンテキストから逸脱し、SelfNote を生成できます。モデルが Self-Note の生成を完了すると、元のコンテキスト トークンが引き続き供給されます。 これにより、モデルは最後だけでなく、入力トークンの処理中にメモリを推論および作成できます。 また、Self-Notes をトレーニングするための半教師ありおよび教師なしの方法も提案します。多段階の推論と状態追跡を評価するように設計された 5 つのテキスト データセットでこの方法をテストします。 , 2020; Anil et al., 2022)、および 2 つの現実世界のチェス ゲーム タスク (Toshniwal et al., 2022)。 私たちの方法は、明示的なメモ取りを行わない微調整された言語モデルとスクラッチパッドのベースラインの両方よりも優れています.2. 方法シーケンス内の次のトークンを予測する自己回帰変換モデル M を考えてみましょう
AI(人工知能)とは、人間の知的な活動をコンピューターや機械で模倣する技術です。AIは様々な分野で利用されており、ゲームの敵キャラクターもその一例です。ゲーム内の敵キャラがAIで動いていると言うこともありますが、その技術レベルには幅があります。
1. 弱いAI(Narrow AI): 特定のタスクに特化した知能を持ち、そのタスクにおいては高い性能を発揮しますが、他のタスクでは性能が低いものです。例えば、チェスや将棋のAI、音声認識システムなどが含まれます。多くのゲーム内の敵キャラクターも、限定された状況での行動パターンを持つ弱いAIといえます。
2. 強いAI(General AI): 人間のように幅広い知識や理解力、推論力を持ち、様々なタスクに適応できるAIです。現在の技術では、まだ実現していません。
3. 超AI(Superintelligent AI): 人間をはるかに超える知能を持ち、ほぼ全てのタスクで圧倒的な性能を発揮するAIです。これも現在の技術では実現していません。
ゲーム内の敵キャラクターは、通常、特定の行動パターンや戦術に基づいて動くため、弱いAIに分類されます。しかし、敵キャラクターが学習や適応能力を持ち、プレイヤーの行動に対応して戦術を変えるようなものであれば、より高度なAIと言えるでしょう。
俺はいわゆるGAFAMのどこかのソフトウェアエンジニアだが、少なくともお仕事としては
もうプログラミングという概念はなくなると予想する。それも数年のうちに。
そのうちもはや人間では解釈できないプログラムをAIが作成し始めて、それでシステムが組まれるのが普通になる。
今の将棋やチェスと同じように、ごく一部の人間が楽しみのためだけにやるのがプログラミングというものになる。
非常に危機感を感じているが、もはやこの動きは止められないと思う。
ミリオタと暇空茜の罵倒合戦が続いているが、それを見ながらふと一つの疑問が湧いた。ミリオタ側ネームドが暇空氏を罵倒するときに”戦争と戦略の天才”の部分を取り上げる時があるが、なぜミリオタは彼がそう自称する根拠の方を叩かずに自分たちの論理で彼の自称を叩いているのだろう。
相手の鼻っ柱を折りたいのであれば、相手のテリトリーの中にある相手のプライドを叩く必要がある。この場合、彼の自称である戦争と戦略の天才を叩きたいのであれば、彼がそう名乗っている理由、つまり根拠の部分を明確に否定すべきなのである。なぜ彼らはそれをしないのだろうか。
まず筆者の考えを明確にしようと思うが、私も彼の自称は些か過大評価だと思っている。というのも確かに、彼の分析能力と妨害能力は高い。それは認めるべきである。また、分析と妨害の出来る奴の戦略というのは大抵の場合は有効なので彼の戦略能力も相応に高いであろうというのは想像がつく。しかし、それで戦争と戦略の天才を名乗るのはやはり過大評価ではないかなと思う。
過大評価と思う理由だが、暇空氏は自身を天才と自称する根拠の中で、オンラインゲームでの戦績とその後、作成に携わったゲームの話題を上げている。だが、それらのオンラインゲームはいずれもアクティブユーザー数に関してはたかが知れているし、ユーザー数が限られるということは内部戦略の研究もそれだけ限られるということである。悪い言い方をすれば、そのような狭い世界の中でトップを取れたとしても、上には上がいるというのは想像に難くない。
例えば彼が推定ユーザー数が数億人規模であるチェスの世界でグランドマスターに上り詰め、チェス界を揺るがすような新しい戦術も生み出したと言うならば紛れもない天才と名乗っていいと思う。あるいは現実の軍の中で相応の地位に上り詰めていても才能を誇っていいと思う。だが、実際に彼がトップを取っているのは億どころか数千万も怪しいようなオンラインゲームの世界である。たしかに人に誇れる程度の戦績とは思うが、名だたる本物の天才達に並び立つような名乗りが出来るほどの実力とは思えない。
もし彼がこの文章を見た場合、やる気と時間さえあればチェスだろうがなんだろうがトップと渡り合えると言うかもしれないが、それは他の天才達も同じことである。例えば、羽生善治氏がやる気と時間を持って彼のやっていたゲームに取り組んでいた場合、羽生が圧倒的実力でトップに上り詰め、彼は負け続けている可能性だってあるわけだ。もちろん、これらの話は所詮たらればの話なので実際のところは分からないし、する意味もない話であるが。
以上の理由が、私が暇空氏の自己評価は過大評価だと思う理由である。とはいえ、実態に関わらず自己評価の仕方というのは本人の自由なので、彼が戦争と戦略の天才を名乗るのは自由である。私含めて周囲にそれを辞めさせる権利はない。ただ、仮に私が彼の自称を辞めさせずとも否定するのであれば、上記の理由をもう少し詰めた上で彼に叩きつけるだろう。相手が自信に思っている部分を否定しない限り、折れるタイプではないからである。
問題は、なぜミリオタ側はこの程度の否定すら出てこないのかということである。上記の文章は病床の筆者が30分程度で考えて30分程度で書き上げたものである。いくら趣味を否定されて頭に血が登っている奴が多いといえ、なぜ病床の筆者から出る程度の否定が出てこないのか。相手に下手な煽りは通じない以上、戦うなら相手のテリトリーで相手のプライドを殴るしかないのに、何故それができないのか。本当にミリタリーや軍略のオタクなのだろうか? 敵の行動と思考の分析は勝つための第一歩やぞ?
彼の煽りに顔真っ赤で反論したい気持ちもわかるが。逆にそういう時ほど冷静に戦ってほしい。冷静に戦えば、手強いが決してダメージを与えられない相手ではないだろうに。(逆に相手から冷静さを奪うあの煽りは彼の見事な戦術の一つである。私は嫌いな戦術なのであまり見たくはないが)
チェスの何とかさんが強い、サッカーのホニャララくんが強い、彼は短距離走が、強い。
〜が強いって表現は、それが記録であっても誰かと競わないと成り立たない表現だと思うんだよな。
サーカスで空中ブランコしたらすごいけど、別に強くないもんな。
バレリーナもなんか綺麗だけど強くはないだろ。喧嘩したら強そうだけどそういう話じゃなくてな。
プロレスって見てたら息を合わせる瞬間が結構ハッキリわかるし、どんな攻撃でも覚悟させる時間を取る。
それ自体悪くはないが、これは競ってないだろ。
それはそうなんだろうけど、あれは数人で不規則にある程度はアドリブで痛そうに踊ってるだけで、強いってのは物凄く違和感あるわ。
人間讃歌は苦難を乗り越える時に輝くし、手っ取り早く見せるなら苦痛を与えて耐えるのが良い。
文章力は低いのでご了承ください。
ハチワンダイバーを読んで興奮し、ハム将棋を棒銀でボコして悦に浸ったりしていた。
しかしながら、オンラインの対人戦(24やウォーズ)に潜ると自分より圧倒的に強い人しかおらず、何もわからないままボコられ、楽しさを感じる前にやめてしまった。
その後、天鳳というオンライン麻雀にドはまりしたり、格闘ゲームやLoLの観戦勢をやっていた。
天鳳で七⇔八段を何度か繰り返した後、自分のなかで「麻雀はもういいかな」という気持ちが生えてきた。
麻雀は楽しいが、どれだけ選択を考え抜いても運に振り回されるゲームなので、頑張れば頑張るほどつらい気持ちになってしまった。
ある日、Netflixで「クイーンズ・ギャンビット」という作品が流行り、チェスに興味を持った。
チェスも昔ほんの少しだけやったことがあり、ギコチェスにボコられたりする程度の知識はあった。
YouTubeで「チェス ルール」「チェス 初心者」等で検索してみると、日本チェス連盟の動画が出てきて、そこから色々動画を見漁ってるうちにチェスに引き込まれた。
https://www.youtube.com/watch?v=G5dyh24BTr4
今はChess.comという最王手のオンラインチェスサイトでプレイしている。
ソースは不明だが、Googleで検索すると約5億人くらいらしい。
故に、カジュアルなプレイヤーも数多くおり、初心者がオンライン対戦に潜ってもちゃんと初心者とマッチする。
自分はR900程なのだが、いつプレイしても大体800~1000くらいの人と対戦できて、大体ものすごい接戦になる。
これは将棋にはない良い点だと思う。
1.「取った駒を使えない」
終盤になるにつれて、盤上の駒がどんどん少なくなっていくので、将棋よりもわかり易さがある。(簡単ということではない)
2.「囲い」というものがない
キャスリングというルールによって、一手で王様の守りが完成するので、覚えることが少なくてよい。
3.駒の足が早い
将棋の歩にあたるポーンは、初期位置に居る場合に限り前方に2マスまで進める。手っ取り早くていい。
ルークが2つ(飛車)・ビショップが2つ(角)・クイーン(飛車+角)・ナイト(8方向に動ける桂馬)と、ダイナミックな駒が多く、すぐ戦いになる。
・Chess.comのデイリータクティクス(次の一手みたいなやつ)を消化
・日本チェス連盟のOpenRecチャンネルの配信を見る(月額500円だが質・量ともに大満足、初心者初級者向けのコンテンツも充実している)
・チェスに関する本を読む
・Redditのr/Chessを読む
装備可能Lv | 武器名 | 武器基本性能 | 武器オートアタック | 攻撃間隔 | DEX | VIT | クリティカル | 意志力 | スキルスピード |
Lv56 | ハロードチェスナットロングボウ[良品] | 66 | 72.16 | 3.28 | +56 | +59 | +41 | +58 | |
Lv58 | パーチロングボウ[良品] | 67 | 58.96 | 2.84 | +68 | +60 | +67 | +47 |
Q. Lv56武器からLv58武器に切り替えたときどのくらい殲滅性能が上がるか。というかパーチロングボウに買い替えたほうがよいか
せめてステータスが全部ちょっとずつ上がるんなら比較も納得もしやすいんだけど!
※注1:ステータスからダメージを計算する式(ユーザー推測)は存在するので、クリティカルが67増えてスキルスピードが58減ってDEXと意志力が12と6だけ増えた状態で手持ちのスキルを理想的に回した場合、時間あたりのダメージ総量がどのくらい増減するかの把握は可能
※注2:レベル58で気にするような内容ではないのは間違いない。運営を信じて(つまり、特定のステータスが下がることがあっても最終的な総ダメージはきちんと増えていくように並べてあると信じて)装備レベル(実際にはアイテムレベル)が高いほうで更新してOK。つまりゲームの愚痴または惚気である
Q: 政治では「誰が何に値するか」についての議論が盛んである。あなたなら、どうやって「誰が何に値するか」を定義するだろうか。
能力主義が本当に悪いのかとふと思った。
大衆の権利についてのゲームを「人狼ゲーム」に喩えるなら、能力主義は「チェス」だと私は考えている。
能力を正当に評価する方法が存在し、かつそのジャンルが多様であるほど良い。
では「受験勉強を必死にやり、学歴を得て、その学歴を用いて就職する」という一見能力主義に思えるプロセスがなぜポピュリズムなのか。
よく考えてみると、大衆が望むようなタイプの能力で一律的に評価をしていることに関係する。
「(遺伝的意味でも)暗記が得意」「努力を評価する」「外れた人間を叩く」こういう性質を持つ大衆について聞き覚えは?
このような大衆が、受験戦争に躍起になるのは必然ではないのか。なぜならそれが彼らが信じる大衆の権利だからだ。
要するに大衆側が「俺達は努力をして学歴を得たんだ。それが尊重されるべきだ」と言っているのである。
私はチェスが好きな人間なので、そういうくだらんポピュリズムはクソだと思う。
個人の能力を様々なジャンルにおいて多様な方法で可視化し「僕が思う最強の能力評価指標」などという独善に支配されない能力主義の指標が要るのではないか。
しかもその多様なジャンルというものが、個人の経済状況に影響されない、公平なものであるのが好ましい。
喩えで言うなら、オンラインチェスや競技プログラミングは(不正を検出できれば)能力主義の指標としては比較的優れていると言えるだろう。
このような能力主義が「多様な」ジャンルで評価されるのが、本当の能力主義だと私は思っている。
ポピュリズムとはつまり、カルト宗教(創価学会, 統一教会, Google)が政治と癒着して無能を洗脳して権力を得る世界のことである。
正当な評価方法が確立されれば、多くの人が何かしらの得意分野を持つことができる。