未経験から1ヶ月！Pythonで観る将ライフを向上させた話（プログラム編）

はてな匿名ダイアリー

2022-01-07

■未経験 から1ヶ月！Pythonで観る将ライフを向上させた話（プログラム編）

まとめ

プログラミング未経験から1ヶ月ほどで、将棋の評価値の新たな方法でのグラフ化を行うPythonツールを作った。

https://github.com/k-the-p/notherscore

この記事は2本立てです。プログラミングより結果のグラフや将棋に興味がある方はもう一方の将棋編から読むことをおすすめします。

未経験から1ヶ月！Pythonで観る将ライフを向上させた話（将棋編）

目標

評価値以外の観る将の楽しみとして、手の広さの可視化を提案する

AIはわれわれアマチュアの将棋への親しみを大幅に向上させてくれた一方で、棋士が悩みに悩んだ結果として評価値が下がる手を指してしまったときに、「悪手きたwwww」と騒ぐ主にABEMAのコメント欄には忸怩たる思いがあった。

とはいえ、もう評価値を知らなかった時代に後戻りするなんてことは誰にもできないだろう。そして、電王戦から将棋にハマった自分自身としても、AIを否定はしたくない。

であるなら、AIを用いた新しくよりよい将棋の楽しみ方を探っていくしかないのではないか。

以前から私は、「AIの手を指せるなら人間も苦労しないんだよなあ」と思っていた。あるとき藤森哲也先生がYoutube チャンネルで言っていたことを聞いて得心がいった。「AIの一手は最強の一手なんです。確かにプラス 1000点になるけど一手間違えた瞬間にマイナス何百点になるような綱渡りの手。それよりもアマチュアの皆さんにはプラス数百点で得は少ないけど安全な道、最善の一手を学んで欲しい」（大意）と。

ここで言う「最強の一手」に人間にして最も近いのは紛れもなく藤井聡太四冠であろう。藤森先生はアマチュアに向けて喋っていたが、その葛藤は間違いなくプロの中でもあるはずである。渡辺明三冠が言うように「藤井くんと全く同じスタイルを今から目指しても絶対藤井くんより強くなれない」のは自明であるからして。

私はここにドラマがあると思う。また、最強の一手と最善の一手が等しく「いい手」に見えてしまうわれわれアマチュアとしては、そこを機械に教えてもらえるのであれば、棋力向上にも繋がりそうである。

具体的目標

第1候補手と第2候補手の評価値の差を取ってグラフ化すればよさそう？

（差が小さければ手が広い、差が大きければ絶対手に近い、綱渡り）

目指すのはあくまで便利な将棋ツール。将棋 AIを作りたいわけではないので、将棋 AI 自体は局面を入れたら評価値を吐く謎の箱という扱いでよい。

手法

Python 一択

グラフ化や数値の扱いだけでなく、将棋 AIとのやりとりをやってくれるあれこれもあるようなので。

あと習得が楽だと聞いた。その話を教えてくれた人はもう10年間英語学習法をブクマし続けてるけど。

あと「読みやすいコードじゃないと動かない」って設計思想がかっこいい。ついでに言うといわゆる「おまじない」が少なそうなのも魅力。（CのHello worldで挫折した経験あり。studio.hって何……）

何をしたか

詳しい人に聞く

プログラム講師をやっている？方が音楽制作を初歩からやってみる、という（残念ながら）リアルタイム視聴者が俺だけしかいないような配信があったので、音楽の基礎（についての知識は持っていた）を教えてあげたお返しのような形で、「pythonでこういうことがしたくてこういうライブラリがあるのはわかった。経験はHTML+CSS（変数導入前、Bootstrapなんてなかった）のみ。どうしたらよいか」という質問をしたら、「progateは簡単すぎると思うのでPaizaが丁度いいのではないか」というアドバイスを頂き、比較もせずに即登録したのだが結果的にはこれがドンピシャだった。

Paizaラーニング

最近流行りの、環境構築不要で講座の内容を書いて覚えるタイプのサイト。

無料で入門講座の序盤を受けていたらふと目に入ったのが、「対象者：これからプログラミングを学びたい方。HTMLがどのようなものかを知っている方。」でYoutuber先生のオススメ完璧か？と思った。そして実際に完璧だった。

基本的に1講座3分+演習1～2問＋やりたければ問題集たくさんという形式なのだが、これが簡単すぎることなく難しすぎることもなく、俺の知識レベルにベストマッチだった。基本的に毎回何か書くことになるので、変数とは～みたいな解説だけで終わる回がほぼ無いのも飽きなくてよい。

Python入門（と言ってはいるがまだこれだけで発展編はない）の見出しは「プログラミングとは」「条件分岐・比較演算子」「ループ処理」「リスト」「辞書」「多次元リスト」「関数」「クラス」「クラス発展」「例外処理」に各5～8講座*3分+演習、という感じ。クラス発展の途中で行けそうだと思ったのでドロップアウトして実製作に移った。実際関数まで理解していれば、この程度の小さなツールには十分だった（もしかしたらクラスを使えば多少楽になった場面はあったかもしれないけど）。

また、これは書いてる今気づいたことだが、上のコースで学んだことで、実際に役立たなかったものはほとんどなかった（強いて挙げれば辞書くらい？使えてないだけかも）。このこともコース構成の優秀さを示している。

ここまででだいたい2週間くらい。

Google colab

もともとこのサービスは知っていたのと、谷合先生が実際に使っていたように、便利そうなライブラリのcshogiが主にcolab(jupyter)上で動かすことを意図しているようだったので、まずここから入った。最初はcshogiが列挙してくれる特定局面での合法手をリストに入れて、そのリストの項目数＝その局面での合法手の数を出力することから始めた。これは本当に簡単にできて興奮した。

学習と好きなことが直結してると、こんなサンプルコードみたいな簡単なことで喜べるのでコストパフォーマンスがよい。

cshogiとやねうら王をusiで連携する

cshogiのチュートリアルで紹介されているレサ改というAIがどうもmultipv（有望な候補手を2手以上挙げる）に対応してないらしく、強さ的な問題でいずれ手を出すつもりだった予定を繰り上げてやねうら王との連携を試みる。

makeって何？あー、もりかしてMakefileが無いと動かない？（これを書いている今もこんな理解である）みたいな人間でもなんとかやねうら王をビルド？することはできた。レサ改をcshogiに読ませる数行のサンプルコードがとても役に立った。今でもあの完成品らしき拡張子が無いファイルがなんなのか分かってない。（なお、評価関数nn.binが無いと怒られたのでどこのご家庭にもある水匠4のそれをぶち込んだら動いた。評価関数とやねうら王の分担は今もって理解があやふや）（また、途中でAyane[やねうらお氏謹製ライブラリ]も使おうとしたがcolab上では上手く動かす方法が分からなかった）

一応これでcshogiで局面の最善手と次善手およびそれらの評価値を呼び出せるようになったのだが、単にdebugでずらずらと余計なものまで出力するのではなく、重要な指し手周りのinfoだけ出力するようにしようとしたが、上手いやり方がわからず、結局こうなった。

sys.stdout = open('out.txt', 'a')
engine.go(listener=print)

ここは絶対もっとマシなやり方があるはずなので、識者の教えを請いたい。

ようやくWindowsにPythonとVSCodeを入れる

Colab上でまあまあ目処がついたので、この辺りでPythonの環境を作った。ここまでそれをやっていなかった理由は、「おま環」トラブルの可能性をなるだけ遠ざけておきたかったからである。環境が悪いのか俺が悪いのか分からない、というのは初心者にとって限りなきストレスである。あーネットが繋がらなくてルーターの設定や接続とか支払いとか文字通り部屋をひっくり返しながら調べてたら実はフレッツ自体が落ちてた件を思い出してイライラしてきた。cshogiはJupyter上で動かすことを意図しているようなので、それで動かなければ自分の書き方が間違っているのだとほぼ確実にわかる。

まあこの辺りはいろんなサイト見ながら仮想化などしつつ普通に。仮想化が何か分かってないんですけど。

Jupyter notebook

これまでColab上で書いてきたものは多少の書き換えで動いたので、ローカルにJupyter notebookをインストールして、数字の計算とグラフ化を試みる。

ちなみにこの時点で得られているデータはこんな感じ。

go
info depth 1 seldepth 1 score cp -47 multipv 1 nodes 483 nps 241500 time 2 pv 3c3d
info depth 1 seldepth 1 score cp -86 multipv 2 nodes 483 nps 241500 time 2 pv 4a3b
info depth 2 seldepth 2 score cp -53 multipv 1 nodes 847 nps 423500 time 2 pv 3c3d 9g9f
info depth 2 seldepth 2 score cp -68 multipv 2 nodes 847 nps 423500 time 2 pv 8c8d 7g7f
info depth 10 seldepth 17 score cp -78 multipv 1 nodes 100163 nps 1963980 time 51 pv 8c8d 2f2e 4a3b 7g7f 3c3d 2e2d 2c2d 2h2d 8d8e 6i7h 8e8f 8g8f
info depth 10 seldepth 17 score cp -111 multipv 2 nodes 100163 nps 1963980 time 51 pv 3c3d 7g7f
bestmove 8c8d ponder 2f2e
go
info depth 1 seldepth 1 score cp 117 multipv 1 nodes 206 nps 206000 time 1 pv 2f2e
info depth 1 seldepth 1 score cp 78 multipv 2 nodes 206 nps 206000 time 1 pv 7g7f
...

今回の小目標は、goで区切られた中から下から2行目と3行目のcp ほにゃららを取得していい感じのリストにする、というものだ。この辺りは正規表現でなんとかなるだろうと見通しを立てたが、実際そうなった。

ただ、後手が見たときの評価値が後手目線なので、それだけにマイナスをかけるのはどうするか（そうしなければ、先手+3000点の次が「後手から見て」-2900点だったりして綺麗にグラフにならないのだ）を調べるのに結構時間が掛かった。

また、詰み周りでまたプラスマイナスやカンストの絡む計算をしたくないのもあり、数値にNaNを入れてグラフ表記を省略することにしたのだが、そうするとnumpyの関係で整数(とNaN)しか扱わないのに浮動小数点で計算しなければいけなくなって若干気持ち悪かったり。まあ動くのでヨシ！

中間報告

この時点で、ローカルにKIFファイルを保存し、pyファイルでcshogiと水匠を動かし、Jupiter notebookを開き評価値グラフと手の広さのグラフを重ねて表示する、というそれなりのものは出来上がった。

簡単に言えばpyファイルで1手10万局面（森内チャンネルに出てたHEROZの方が使ってた数字をそのまま使っているので特に意味は無い）探索させ、最善手と次善手についての生の評価データを吐き出させ、ipynbでそれを整形し、グラフ化している。

基本的に全部VSCode上でできるので、慣れれば計算時間も含めて10数秒で結果が出るのだが、このワークフローはいかにも美しくない。

なので、Flaskという簡単らしいフレームワークを使ってローカルでWeb アプリとして使えるようにしようと思った。inputとoutputをどうにかするだけだから余裕やろ。

Google colabを触り始めてからここまで1日。圧倒的成長！

ローカル Web アプリを作る

Flaskを学ぶ

Paizaラーニング再び。後半ではデータベースとか本格的な話もあるようなのだが、txtに書き込む一行掲示板を作るまでの前半部を高速で履修（演習は全部飛ばした）。なるほどー、こうやってやりとりするのね、と最低限は完全に理解した。

モジュール化

Jupyter向けのコードを普通のPythonに直してあっちで数字を出してこっちでそれを受けて元に戻して……とかやってると循環参照か何かで怒られることに。その対策に細かく部分を分けて関数にしたのだが、その場合ってもしかして defの内部しか読まれない？（共通部分も読まれると思ってた）（いや、共通部分は読まれるけど他のdef内が見えないのか？何も分からん）なるほど。こうなると関数の内部から上に戻るためにクラスとか欲しくなるのかなーという感想。

最終的にWebに公開しようとこの時点では思ってたので、txtに一旦出力するのが安全性的にどうかとか考えてたのだが、テキストの読み取り周りでハマる。結局抜け出せず諦めた。

以降は、HTMLにダブルクオートが抜けてるのに一時間気づかないとか、FlaskのXSS 対策の対策をするとか、ファイルの書き込み設定をミスって2万手くらい蓄積されて評価値グラフが大変なことになったが、原因に気づかずひたすらグラフ生成部を調べ続けるなど、非本質的な問題にかかずらっていたので書くことは特にない。

GithubとVSCodeとなら連携がらくらく

なので、最初にgitignoreしてなかったせいで1万ファイルくらい上げそうになったけど、それ以外は特に問題も無く。中間報告からここまで2日ほど。結局1ヶ月かけずにプログラミングをそれなりに身につけることが出来た。「プログラムを覚えたければ作りたいものを見つければいい」というのは本当だな、と改めて思った。

で、どうなったの？

については将棋編の方で詳しく書いています。

https://anond.hatelabo.jp/20220107060727

どれくらい書けるようになったのか、を見たい方は主にvalue_output.py（将棋 AIに思考させてデータを取り出す）とgraph.py（データを整形してグラフを書き出す）を見ていただければいいかと思います。

謝辞

最初にPaizaを教えてくださったYoutuberの方、cshogiを初心者でも使いやすいように作って展示してくださったTadaoYamaoka様、水匠開発者のたややん様、水匠含めこんにちの将棋 AIの基盤を作ってくださったやねうらお様、cshogiを通して利用したpython-shogiのKIFパーサーを書いてくださったTasuku SUENAGA様に、厚く御礼申し上げます。

最後に

私は現在、仕事とTwitterのフォロワーを募集しています。

30歳無職。よろしくお願いいたします。

https://twitter.com/k_the_p

Permalink | 記事への反応(2) | 06:09

記事への反応 -

未経験から1ヶ月！Pythonで観る将ライフを向上させた話（将棋編）
まとめプログラミング未経験から1ヶ月ほどで、将棋の評価値の新たな方法でのグラフ化を行うPythonツールを作った。 https://github.com/k-the-p/notherscore この記事は2本立てです。結果のグラフ...
【急募】30代中卒職歴なし労働意欲なし借金有が人生一発逆転する方法
たぶんもうインターネット芸人になるしかないと思うんですけど、なり方がわかりません。ゆくゆくはHIKAKINさんみたいになりたいなとは思うんですけど、とりあえずは堀元見みたいに絶...
- anond:20220721075441
  @saitamasaitamaや。DM送ったので見たってな。スペースでもしながら神待ちしようやあ。
- 【急募】30代中卒職歴無しがこれから先も働かずに生きていく方法
  俺はつくづく怠惰で無責任な人間であるという認識まではあなた方と共有できるし、それが望ましくないということもわかる。しかし怠惰で無責任な人間であるが故に修正できないのだ...
  - anond:20220722003603
    何才だろうと、根本的には働かないと生きていけないのでは？
  - anond:20220722012837
    ようよう、多分お前が開き直った場合の末路だぜ。高校中退で一橋入ったけど、出席だるくて6留年して10年通って追い出された30職歴無しだ。。俺は毎日その日が楽しいから刹那的に生...
    - anond:20220722014651
      失礼かもしれませんが、俺みたいな人間はどこにでもいるんだなと思いました。引用されていた記事も拝読しました。俺は機会もしくは正当な理由さえあればいつでも死んでいいなと...
  - 俺を働かせろ。さもなくば税金食い潰して幸せに生きる
    社会へ　拝啓お久しぶりです、いかがお過ごしでしょうか。前回に私が社会と直にお会いしたのは、ハローワークでライティングの仕事を10件ほど印刷して、履歴書等々を送るのが面...
  - 無職になる自由を行使する。生活保護でFIREする方法（実証済み）
    どうも、30歳無職職歴なし労働意欲なし中卒おじさんです。さっき役場に行って生活保護を申請してきました。2週間以内には何らかの結果が明らかになるはずです。一般的には申請する...
    - 山上が犯した唯一の過ちは「暴力」ではない（あるいは山上の垂訓令和
      まず、今回の問題に解しては「全ての暴力（とりわけ殺人）は悪である」という言明から始めることが不可能であるのはもはや明らかだということをわれわれは認めなければならない。 ...
    - anond:20220722185337
      生保受けるのはいいけど、FIREじゃないよそれ無職が無職で居続けるだけ
      - anond:20220723040915
        生活保護をFIRE扱いｗ来年もらえるかもわからんのにｗ
    - anond:20220722185337
      一橋入れる頭でとる行動がこれか
    - anond:20220722185337
      実際にFIRE出来たのか実証はまだされてないじゃんタイトル詐欺
    - anond:20220722185337
      生活保護ガチャに当たった人。
    - anond:20220722185337
      今は良くても、あんた寿命迎えるまでそれで生きて行けるのか？ 90歳まで生きるとするならあと60年だろう。1962年に生活保護受け始めた人が、今日まで乗り切れてるとは思えんけど。「...
    - anond:20220722185337
      生活保護+親の現金仕送りが強いよ uberで1.5万（経費マシマシ）で実質手取り20万いけるデイケア・作業所で若美人な福祉女相手に清純派キャバクラ遊び、スポーツの相手もしてくれる ...
    - anond:20220722185337
      診察券の難易度高いやろ。あとは自治体や担当による。もっとカジュアルに失業したら受けれるようにすべき。
    - anond:20220722185337
      普通に生活保護もらえない条件あるじゃん＞親の仕送り
      - anond:20220723153047
        口座に振り込まれなければわかりようがないんだから、手渡しにすれば良くね？
    - anond:20220722185337
      生活保護おすすめしててワロタ。人数増えすぎたらその分支給額減らされたり、生活保護制度自体改定されかねないとかそういう危機意識ないのかな？
    - anond:20220722185337
      中卒にしては賢そう。いろいろ事情があるのかな
  - anond:20220722003603
    よく見てみ、増田やはてブでアドバイスしてくれるのはお前と同じ属性のダメ人間やらニートだけだぞ。同じ傷を舐め合いたいだけの人間だけがお前に関心を寄せる。普通の社会人はお...
  - anond:20220722003603
    お前の姿勢なんかどうでもよくて働かずに生きるために必要なのは金でしかないんだから方法を聞くなら前提としてお前の資産と親の資産・年齢、兄妹の有無とかが重要だろその程度...
    - anond:20220723135314
      全人類の半分は知能が半分より上で、残り半分は知能が半分以下なんだつまり増田は全人類の半分を敵に回した
  - anond:20220722003603
    納税しないって、他の人の納税によって支えられているという自覚を持ってもらいたい。インフラの維持だって無料じゃないのよ。
    - anond:20220723143218
      お前が1億円くれたら喜んで贈与税払ってやるぞ
  - anond:20220722003603
    統一教会にでも入れば？広告塔のポストが空いてるはず。
  - anond:20220722003603
    親ガチャSSRなら逆転する必要もないし金稼ぐ必要もないし、親の資産で大家やるとか資産運用するとかでいいじゃんいわゆる高等遊民よ後ろめたさなんか感じなくていいよ
  - anond:20220722003603
    ライターつづけていけばいいのに。…とおもったけどこないだのオモコロのコンテストでトイレットペーパーの芯をものすごい数あつめてて比較検討したあげく撤退したというあまりお...
  - https://anond.hatelabo.jp/20220722003603
    これかなりマジレスするけどさ。俺もかなりこれに近い状況だったけど、30過ぎてなんとなーく適当な求人に応募して働きだしたら楽しかったぞ。ど田舎薄給だけど、働いて誰かに喜ば...
  - anond:20220722003603
    俺はつくづく怠惰で無責任な人間であるという認識まではあなた方と共有できるし、それが望ましくないということもわかる。しかし怠惰で無責任な人間であるが故に修正できないの...