「Tasuku」を含む日記

はてなキーワード: Tasukuとは

2022-01-07

■未経験 から1ヶ月！Pythonで観る将ライフを向上させた話（プログラム編）

まとめ

プログラミング未経験から1ヶ月ほどで、将棋の評価値の新たな方法でのグラフ化を行うPythonツールを作った。

https://github.com/k-the-p/notherscore

この記事は2本立てです。プログラミングより結果のグラフや将棋に興味がある方はもう一方の将棋編から読むことをおすすめします。

未経験から1ヶ月！Pythonで観る将ライフを向上させた話（将棋編）

目標

評価値以外の観る将の楽しみとして、手の広さの可視化を提案する

AIはわれわれアマチュアの将棋への親しみを大幅に向上させてくれた一方で、棋士が悩みに悩んだ結果として評価値が下がる手を指してしまったときに、「悪手きたwwww」と騒ぐ主にABEMAのコメント欄には忸怩たる思いがあった。

とはいえ、もう評価値を知らなかった時代に後戻りするなんてことは誰にもできないだろう。そして、電王戦から将棋にハマった自分自身としても、AIを否定はしたくない。

であるなら、AIを用いた新しくよりよい将棋の楽しみ方を探っていくしかないのではないか。

以前から私は、「AIの手を指せるなら人間も苦労しないんだよなあ」と思っていた。あるとき藤森哲也先生がYoutube チャンネルで言っていたことを聞いて得心がいった。「AIの一手は最強の一手なんです。確かにプラス 1000点になるけど一手間違えた瞬間にマイナス何百点になるような綱渡りの手。それよりもアマチュアの皆さんにはプラス数百点で得は少ないけど安全な道、最善の一手を学んで欲しい」（大意）と。

ここで言う「最強の一手」に人間にして最も近いのは紛れもなく藤井聡太四冠であろう。藤森先生はアマチュアに向けて喋っていたが、その葛藤は間違いなくプロの中でもあるはずである。渡辺明三冠が言うように「藤井くんと全く同じスタイルを今から目指しても絶対藤井くんより強くなれない」のは自明であるからして。

私はここにドラマがあると思う。また、最強の一手と最善の一手が等しく「いい手」に見えてしまうわれわれアマチュアとしては、そこを機械に教えてもらえるのであれば、棋力向上にも繋がりそうである。

具体的目標

第1候補手と第2候補手の評価値の差を取ってグラフ化すればよさそう？

（差が小さければ手が広い、差が大きければ絶対手に近い、綱渡り）

目指すのはあくまで便利な将棋ツール。将棋 AIを作りたいわけではないので、将棋 AI 自体は局面を入れたら評価値を吐く謎の箱という扱いでよい。

手法

Python 一択

グラフ化や数値の扱いだけでなく、将棋 AIとのやりとりをやってくれるあれこれもあるようなので。

あと習得が楽だと聞いた。その話を教えてくれた人はもう10年間英語学習法をブクマし続けてるけど。

あと「読みやすいコードじゃないと動かない」って設計思想がかっこいい。ついでに言うといわゆる「おまじない」が少なそうなのも魅力。（CのHello worldで挫折した経験あり。studio.hって何……）

何をしたか

詳しい人に聞く

プログラム講師をやっている？方が音楽制作を初歩からやってみる、という（残念ながら）リアルタイム視聴者が俺だけしかいないような配信があったので、音楽の基礎（についての知識は持っていた）を教えてあげたお返しのような形で、「pythonでこういうことがしたくてこういうライブラリがあるのはわかった。経験はHTML+CSS（変数導入前、Bootstrapなんてなかった）のみ。どうしたらよいか」という質問をしたら、「progateは簡単すぎると思うのでPaizaが丁度いいのではないか」というアドバイスを頂き、比較もせずに即登録したのだが結果的にはこれがドンピシャだった。

Paizaラーニング

最近流行りの、環境構築不要で講座の内容を書いて覚えるタイプのサイト。

無料で入門講座の序盤を受けていたらふと目に入ったのが、「対象者：これからプログラミングを学びたい方。HTMLがどのようなものかを知っている方。」でYoutuber先生のオススメ完璧か？と思った。そして実際に完璧だった。

基本的に1講座3分+演習1～2問＋やりたければ問題集たくさんという形式なのだが、これが簡単すぎることなく難しすぎることもなく、俺の知識レベルにベストマッチだった。基本的に毎回何か書くことになるので、変数とは～みたいな解説だけで終わる回がほぼ無いのも飽きなくてよい。

Python入門（と言ってはいるがまだこれだけで発展編はない）の見出しは「プログラミングとは」「条件分岐・比較演算子」「ループ処理」「リスト」「辞書」「多次元リスト」「関数」「クラス」「クラス発展」「例外処理」に各5～8講座*3分+演習、という感じ。クラス発展の途中で行けそうだと思ったのでドロップアウトして実製作に移った。実際関数まで理解していれば、この程度の小さなツールには十分だった（もしかしたらクラスを使えば多少楽になった場面はあったかもしれないけど）。

また、これは書いてる今気づいたことだが、上のコースで学んだことで、実際に役立たなかったものはほとんどなかった（強いて挙げれば辞書くらい？使えてないだけかも）。このこともコース構成の優秀さを示している。

ここまででだいたい2週間くらい。

Google colab

もともとこのサービスは知っていたのと、谷合先生が実際に使っていたように、便利そうなライブラリのcshogiが主にcolab(jupyter)上で動かすことを意図しているようだったので、まずここから入った。最初はcshogiが列挙してくれる特定局面での合法手をリストに入れて、そのリストの項目数＝その局面での合法手の数を出力することから始めた。これは本当に簡単にできて興奮した。

学習と好きなことが直結してると、こんなサンプルコードみたいな簡単なことで喜べるのでコストパフォーマンスがよい。

cshogiとやねうら王をusiで連携する

cshogiのチュートリアルで紹介されているレサ改というAIがどうもmultipv（有望な候補手を2手以上挙げる）に対応してないらしく、強さ的な問題でいずれ手を出すつもりだった予定を繰り上げてやねうら王との連携を試みる。

makeって何？あー、もりかしてMakefileが無いと動かない？（これを書いている今もこんな理解である）みたいな人間でもなんとかやねうら王をビルド？することはできた。レサ改をcshogiに読ませる数行のサンプルコードがとても役に立った。今でもあの完成品らしき拡張子が無いファイルがなんなのか分かってない。（なお、評価関数nn.binが無いと怒られたのでどこのご家庭にもある水匠4のそれをぶち込んだら動いた。評価関数とやねうら王の分担は今もって理解があやふや）（また、途中でAyane[やねうらお氏謹製ライブラリ]も使おうとしたがcolab上では上手く動かす方法が分からなかった）

一応これでcshogiで局面の最善手と次善手およびそれらの評価値を呼び出せるようになったのだが、単にdebugでずらずらと余計なものまで出力するのではなく、重要な指し手周りのinfoだけ出力するようにしようとしたが、上手いやり方がわからず、結局こうなった。

sys.stdout = open('out.txt', 'a')
engine.go(listener=print)

ここは絶対もっとマシなやり方があるはずなので、識者の教えを請いたい。

ようやくWindowsにPythonとVSCodeを入れる

Colab上でまあまあ目処がついたので、この辺りでPythonの環境を作った。ここまでそれをやっていなかった理由は、「おま環」トラブルの可能性をなるだけ遠ざけておきたかったからである。環境が悪いのか俺が悪いのか分からない、というのは初心者にとって限りなきストレスである。あーネットが繋がらなくてルーターの設定や接続とか支払いとか文字通り部屋をひっくり返しながら調べてたら実はフレッツ自体が落ちてた件を思い出してイライラしてきた。cshogiはJupyter上で動かすことを意図しているようなので、それで動かなければ自分の書き方が間違っているのだとほぼ確実にわかる。

まあこの辺りはいろんなサイト見ながら仮想化などしつつ普通に。仮想化が何か分かってないんですけど。

Jupyter notebook

これまでColab上で書いてきたものは多少の書き換えで動いたので、ローカルにJupyter notebookをインストールして、数字の計算とグラフ化を試みる。

ちなみにこの時点で得られているデータはこんな感じ。

go
info depth 1 seldepth 1 score cp -47 multipv 1 nodes 483 nps 241500 time 2 pv 3c3d
info depth 1 seldepth 1 score cp -86 multipv 2 nodes 483 nps 241500 time 2 pv 4a3b
info depth 2 seldepth 2 score cp -53 multipv 1 nodes 847 nps 423500 time 2 pv 3c3d 9g9f
info depth 2 seldepth 2 score cp -68 multipv 2 nodes 847 nps 423500 time 2 pv 8c8d 7g7f
info depth 10 seldepth 17 score cp -78 multipv 1 nodes 100163 nps 1963980 time 51 pv 8c8d 2f2e 4a3b 7g7f 3c3d 2e2d 2c2d 2h2d 8d8e 6i7h 8e8f 8g8f
info depth 10 seldepth 17 score cp -111 multipv 2 nodes 100163 nps 1963980 time 51 pv 3c3d 7g7f
bestmove 8c8d ponder 2f2e
go
info depth 1 seldepth 1 score cp 117 multipv 1 nodes 206 nps 206000 time 1 pv 2f2e
info depth 1 seldepth 1 score cp 78 multipv 2 nodes 206 nps 206000 time 1 pv 7g7f
...

今回の小目標は、goで区切られた中から下から2行目と3行目のcp ほにゃららを取得していい感じのリストにする、というものだ。この辺りは正規表現でなんとかなるだろうと見通しを立てたが、実際そうなった。

ただ、後手が見たときの評価値が後手目線なので、それだけにマイナスをかけるのはどうするか（そうしなければ、先手+3000点の次が「後手から見て」-2900点だったりして綺麗にグラフにならないのだ）を調べるのに結構時間が掛かった。

また、詰み周りでまたプラスマイナスやカンストの絡む計算をしたくないのもあり、数値にNaNを入れてグラフ表記を省略することにしたのだが、そうするとnumpyの関係で整数(とNaN)しか扱わないのに浮動小数点で計算しなければいけなくなって若干気持ち悪かったり。まあ動くのでヨシ！

中間報告

この時点で、ローカルにKIFファイルを保存し、pyファイルでcshogiと水匠を動かし、Jupiter notebookを開き評価値グラフと手の広さのグラフを重ねて表示する、というそれなりのものは出来上がった。

簡単に言えばpyファイルで1手10万局面（森内チャンネルに出てたHEROZの方が使ってた数字をそのまま使っているので特に意味は無い）探索させ、最善手と次善手についての生の評価データを吐き出させ、ipynbでそれを整形し、グラフ化している。

基本的に全部VSCode上でできるので、慣れれば計算時間も含めて10数秒で結果が出るのだが、このワークフローはいかにも美しくない。

なので、Flaskという簡単らしいフレームワークを使ってローカルでWeb アプリとして使えるようにしようと思った。inputとoutputをどうにかするだけだから余裕やろ。

Google colabを触り始めてからここまで1日。圧倒的成長！

ローカル Web アプリを作る

Flaskを学ぶ

Paizaラーニング再び。後半ではデータベースとか本格的な話もあるようなのだが、txtに書き込む一行掲示板を作るまでの前半部を高速で履修（演習は全部飛ばした）。なるほどー、こうやってやりとりするのね、と最低限は完全に理解した。

モジュール化

Jupyter向けのコードを普通のPythonに直してあっちで数字を出してこっちでそれを受けて元に戻して……とかやってると循環参照か何かで怒られることに。その対策に細かく部分を分けて関数にしたのだが、その場合ってもしかして defの内部しか読まれない？（共通部分も読まれると思ってた）（いや、共通部分は読まれるけど他のdef内が見えないのか？何も分からん）なるほど。こうなると関数の内部から上に戻るためにクラスとか欲しくなるのかなーという感想。

最終的にWebに公開しようとこの時点では思ってたので、txtに一旦出力するのが安全性的にどうかとか考えてたのだが、テキストの読み取り周りでハマる。結局抜け出せず諦めた。

以降は、HTMLにダブルクオートが抜けてるのに一時間気づかないとか、FlaskのXSS 対策の対策をするとか、ファイルの書き込み設定をミスって2万手くらい蓄積されて評価値グラフが大変なことになったが、原因に気づかずひたすらグラフ生成部を調べ続けるなど、非本質的な問題にかかずらっていたので書くことは特にない。

GithubとVSCodeとなら連携がらくらく

なので、最初にgitignoreしてなかったせいで1万ファイルくらい上げそうになったけど、それ以外は特に問題も無く。中間報告からここまで2日ほど。結局1ヶ月かけずにプログラミングをそれなりに身につけることが出来た。「プログラムを覚えたければ作りたいものを見つければいい」というのは本当だな、と改めて思った。

で、どうなったの？

については将棋編の方で詳しく書いています。

https://anond.hatelabo.jp/20220107060727

どれくらい書けるようになったのか、を見たい方は主にvalue_output.py（将棋 AIに思考させてデータを取り出す）とgraph.py（データを整形してグラフを書き出す）を見ていただければいいかと思います。

謝辞

最初にPaizaを教えてくださったYoutuberの方、cshogiを初心者でも使いやすいように作って展示してくださったTadaoYamaoka様、水匠開発者のたややん様、水匠含めこんにちの将棋 AIの基盤を作ってくださったやねうらお様、cshogiを通して利用したpython-shogiのKIFパーサーを書いてくださったTasuku SUENAGA様に、厚く御礼申し上げます。

最後に

私は現在、仕事とTwitterのフォロワーを募集しています。

30歳無職。よろしくお願いいたします。

https://twitter.com/k_the_p

Permalink | 記事への反応(2) | 06:09

2019-12-16

■「日本 に学ぶことは多い」「これからは中国の時代」、日本人のノーベル賞を中国人はどう見るか

本文：　

https://www.afpbb.com/articles/-/3250602

魚拓：

http://archive.md/Ktinc

http://archive.ph/7IzGO

【10月26日東方新報】2019年のノーベル化学賞（Nobel Prize in Chemistry）は、リチウムイオン電池を開発した旭化成（Asahi Kasei Corporation）名誉フェローの吉野彰（Akira Yoshino）氏の受賞が決まった。止まらない日本人のノーベル賞ラッシュに、中国では「なぜ日本人はノーベル賞を受賞し、中国人は受賞できないのか」と話題になっている。

【関連記事】「千と千尋の神隠し」が中国で大ヒット！ 18年前の作品がなぜ？の背景

　今月9日に吉野氏の受賞が決まると、中国メディアは速報を流すとともに、「外国籍を含む日本出身者のノーベル賞受賞は通算 28人に達し、特に 21世紀に入ってからは米国に次いで受賞者が多い」と言及。ネットメディアを中心に、日本と中国をさまざまな角度で比較している。

　まず目立つのは、日本を称賛する分析だ。「日本人のノーベル賞受賞者は、子どもの頃に自然や科学に関心を持ち、その体験がその後の研究の支えになっている。子どもの好奇心や天性をそのまま伸ばす日本の教育の特徴が大きい。中国はかつての科挙制度から現在の受験競争まで、詰め込み教育ばかり重視されている」「日本の紙幣の肖像は福沢諭吉、樋口一葉、野口英世で、政治家でも軍人でもない。学者や芸術家を尊敬する社会の意識が関係している」「日本は基礎研究が盛んな一方、中国の研究は商品開発に結びつくものばかりだ」

　また、「中国が国内総生産（GDP）で日本を抜き、日本に対し優越感に浸る中国人もいるが、日本の総合力、技術力に比べれば中国はまだ劣ることを冷静に認識すべきだ」という意見もある。

　その一方で、「日本のノーベル賞受賞者は今後減少していく」という日本国内の見方も同時に伝えている。日本人研究者の論文発表数や論文が引用される数は年々減少し、国際的な科学競争力は低下する一方だ。

　ノーベル賞は20～30歳代の研究成果が数十年後に評価されるパターンが多いが、日本政府が各大学への補助金や基礎研究費への教育振興費を削減しているため、日本の若手研究者の教育環境は著しく悪化している。2015年のノーベル物理学賞（Nobel Prize in Physics）受賞者の梶田隆章（Takaaki Kajita）氏は「このままでは日本から受賞者は生まれなくなる」、2018年ノーベル医学生理学賞（Nobel Prize in Physiology or Medicine）の本庶佑（Tasuku Honjo）氏も「かなり瀬戸際に来ている」と警鐘を鳴らしている。

　そのため、「日本のノーベル賞ラッシュは前世紀の遺産」「中国人研究者の論文数・被引用数は米国に次ぐほど増えており、将来は中国人のノーベル賞ラッシュが起きる」という意見もある。

「日本に学ぶことはまだまだ多い」「これからは中国の時代」と対照的な意見が交錯する状況は、ノーベル賞に限らず、日本の経済・社会に対する中国の見方全般と重なっているようだ。(c)東方新報/AFPBB News

少し前の記事だけど、この分析は冷静的。一読する価値はある。これみる前からだけど、本当に日本の科学研究に危機感を持っている。

Permalink | 記事への反応(0) | 00:30