「将棋電王トーナメント」を含む日記 RSS

はてなキーワード: 将棋電王トーナメントとは

2016-10-13

三浦弘行九段竜王戦出場停止について

どうも、id:BigHopeClasicです。

本当はこんな内容、自分はてなブログ投稿したほうが見た目もきれいになるしいいんでしょうが、持続できないブログを作るのも気後れするので、増田を使います

さて、掲題の件、はびこりそうな誤解がいくつかありそうなのが将棋ファンとして気になったので書こうと思ったものです。

カンニングはあったの?

本稿投稿時段階での報道を元にする限りでは、

日本将棋連盟三浦九段に対して、カンニングをしていないという悪魔の証明を求めた」

しか解釈できません。つまり将棋連盟三浦九段に対して、決定的な物証などを何一つ押さえないまま

「疑われているので潔白を証明しろ

というに等しい要求を投げかけたことになります

この点については続報を待つ必要がありますが、あくまでも現段階での私個人の感想としては

「下策中の下策、愚の骨頂」

というコメントに尽きます

なるほど確かに、三浦九段が疑わしいとする複数棋士から申し立てはあったのでしょう。

連盟がそれを黙殺すれば、その疑惑文春砲などで火を噴いた可能性も否定できません。

しかしながら、決定的な物証がなければ、いくら週刊誌が書きたてようが大きなダメージにはならないのは日本相撲協会週刊ポスト週刊現代顛末を見れば明らかです。

大相撲八百長問題警察から情報提供で明らかになる前、週刊ポストは30年にわたって角界八百長告発する記事を書き続けてきましたが、その内容は元力士らの極めて具体的かつ迫真性のある証言に基づくものはいえ、決定的な物証をおさえたものではなく、大相撲はそれによってはなんら決定的ダメージを負うことはありませんでした。

週刊ポストに対しては、日本相撲協会は徹底的に無視をし続けることで対応したのです。

また、週刊現代八百長報道に関しては相撲協会と各力士は、週刊ポストとの対応とは一転して大量の名誉毀損訴訟を起こしそのことごとくに勝訴しています週刊現代八百長報道週刊ポスト比較してもあまりにお粗末だった)。

日本将棋連盟は、こうした大相撲八百長問題におけるリスク評価対策から何も学ぶことなく、あくまでも現段階の報道に基づくところからは、およそ愚劣な対応をしたと言わざるを得ません。

スマホ将棋カンニングに使えるわけないでしょ?

さて、上記とは別にこの問題が深刻なのは、自宅にあるパソコン遠隔操作するまでもなく、2016年7月におけるスマホ将棋アプリの棋力は、渡辺明竜王佐藤天彦名人羽生善治三冠といったトップ棋士の棋力をすでに上回っているという有力な推測があるからにほかなりません。

そのような推測があるからこそ、将棋連盟12月中旬から

「対局室へのスマホを含む電子機器の持ち込み禁止、昼食休憩時における将棋会館外への外出禁止

を定め、これに違反したものは除名を含む厳しい処分を課すことを決め、さらに今週末から開幕する竜王戦では、対局者に対し対局前に金属探知機で持ち物チェックをするという対応を決めていたわけです。

新聞報道ではこの金属探知機での調査については渡辺竜王三浦挑戦者双方の同意の下とされています

(なお、上記のルール12月中旬から適用とある通り、仮にこの時点で将棋連盟不正に関する動かぬ物証をつかんでいたとしても、それを三浦九段に対して遡及適用できないことは当然です)

この件を報じた朝日新聞記事についていたブコメからいくつか代表的な反応を取り上げます

b:id:temtex 仮に事実としてもだ、たかスマホアプリでどうにかなるものなのか…と思ったら、別のとこで走らせたソフトの結果さえ判れば良いのか(但し"スマホ搭載"と記事にはある)。プロに勝てる有力なソフトってどんなの?

b:id:namnchichi スマホアプリタイトル取れるのか?

b:id:symbioticworm 現時点でスマホで走らせられる将棋ソフトなんてたかが知れてるから不正があったとすれば外部との通信必要なはずだけど。現段階では情報が少なすぎる……。

b:id:buu さすがにスマホ搭載のアプリじゃ参考にならないだろうが、協力者と連携すればカンニング可能だろう。人間よりもソフトが強くなるとどういう将棋界になるのかと興味深かったのだが、こうきたか

b:id:l0x0l スマホ将棋ソフトレベルで、プロ棋士の対局の参考になるかは疑問

b:id:kaitoster 『対局中、スマートフォンなどに搭載された将棋ソフトを使って不正をした疑い』←スマホ将棋ゲームすでにプロタイトルホルダーより強いソフトあるのかな?

なるほど、確かにプロ棋士とコンピュータ将棋が戦う電王戦ではコンピュータ将棋が大きく勝ち越しているとは言え、最新の事情を詳しくご存知でなければ上記のような反応は出てくるのが自然かもしれません。また、今回の当事者である三浦九段電王戦に出場した際の対戦相手が、東大駒場情報基盤センター学生用iMac680台をクラスタリングしたGPS将棋であったことも、上記のような反応につながるかもしれません。そこで、これらの誤解を解消するため、コンピュータ将棋の現況について説明したいと思います

ここ3年のコンピュータ将棋の強さの推移

まず、上記の三浦vsGPS将棋が行われて以降、ドワンゴ主催電王戦では使用されるCPUが制限されています。この制限に基づき電王戦で使われたCPUは、2014年がcorei7 4960X(6コア12スレッド)、2015年がcorei7 5960X(8コア16スレッド)とここまではその時点で調達可能なcorei7シリーズエクストリームエディションを使用していますが、今年2016年世代こそ最新のskylakeとなったものの4コア8スレッドcore i7 6700K、そして来年2017年使用CPUは同じく4コア8スレッドのcorei7 6700と、使用するハードウェアの性能は年ごとに抑制されるフェーズに入りました。

ではそれによってコンピュータ将棋パフォーマンスの伸びに制約がかかっているかというと、全くそんなことはありません。将棋ソフトponanza開発者山本一成さんは、2016年電王戦開幕前に「corei7 6700K1台で動くponanzaは、iMac680台をクラスタリングしたGPS将棋より遥かに強くなった」と宣言しています。これは根拠のないことではありません。

現在フリーで入手できる将棋ソフトについては、有志が統計的有意手法を用いてその相互間の強さをeloレーティングを用いて計測しています。その一例として、こちらのウェブサイトがあります。eloレーティングの仕組みについては[wikipedia:イロレーティング]を参考にしていただくとして、目安としてはレート上位から見て下位に100差あれば期待勝率64%、以下同じく200差で75%、300差で85%、400差で91%、500差で95%、600差で97%、となります

ponanzaフリーで公開されていないため、上記のウェブサイトにはレートは計算されていません。しかし、2016年電王戦に出場したponanzaは、このウェブサイトで「Apery twig」として掲載されているソフトに対し勝率97%を上げていることが、電王戦に出場した山崎隆之八段をサポートした千田翔太五段の調査によりわかっています。つまりこのponanzaのレートは「Apery twig」の3250に600を足した3850前後であろうと推定できます(なお、上記のサイト検証に用いているハードウェアIvybridgeおよびskylake世代の4コア8スレッドメモリ16GBであり、これは2016年電王戦における使用ハードと大きな差はありません)。

一方、2013年電王戦に出場して三浦九段と対戦したGPS将棋は、この表に掲載されているGPSFish(レート2879)をスレーヴとしてこれを680台クラスタリングしたものでした(厳密に言えば電王戦に出場したGPSfishはこれより一つ前のエディションですが大きな棋力向上はないもの仮定します)。この680台クラスタリングした際の棋力向上幅については、GPS将棋開発チームの田中哲朗東大准教授が、根拠は全く無く経験に基づく推測にすぎないとしながらもレートにして400程度と語っており、これを採用します。

そうすると2013年電王戦GPS将棋推定レートは3279となり、2016年電王戦ponanzaとのレート差はおよそ570、ponanzaから見た期待勝率は96%となりますわずか3年の間に、コンピュータ将棋は1台のデスクトップPCで、680台のパソコンクラスタリングした将棋システムに96%勝利する成長を遂げたのです。

(なお、コンピュータ将棋がかくも異常な速度で成長したのは、ドワンゴ電王戦において「使用ハードウェア制限」と「提出後対局まで6ヶ月間一切のアップデート不可その間棋士研究し放題」という条件をつけてしまたからだと考えています。こんな条件をつけなければ開発者はここまでしゃかりきに強化はしなかったはずです。ドワンゴがコンピュータ将棋大会に出してる優勝賞金の300万円なんて開発費の元手にもなりゃしないし、強いコンピュータ将棋を作ったって売り物にはならないので、モティベーションはこんな厳しい条件のもとで恥をかかないためにはひたすら強くするしかない、ってとこだけなんですから

将棋ソフトプロ棋士の強さの関係予測

もうひとつ、これらの将棋ソフトプロ棋士の強さの関係はどうなのだということも前提として必要になります。まず、プロ棋士レーティングについては、こちらのウェブサイト現在最も信頼され参考にされています。eloレーティングは、基準となる値を何点に設定するかで絶対値はいくらにでも設定できますが、上記の点差と期待勝率関係基準値を何点にしようが変わらないので、異なる基準値をとる異なるレート表間での比較可能になります

さて、コンピュータ将棋の公開対局場として、GPS将棋の開発チームが開設しているfloodgateというサイトがあります。ここでも参加者の対戦成績に基づいてレーティングが計測されています。また、この対局場は、コンピュータ将棋だけでなく人間も参加することができます。このfloodgateに、一時期上記の千田五段が参戦されていました。その際に記録されたレートは2800ほどでした。千田五段が参戦されていた時期のプロ棋士レーティングにおける数値と、その当時の羽生三冠との数値の比較から羽生三冠がfloodgateに参戦した場合予測されるレートは3000から3100程度だろうと見込まれています。また、先に紹介したコンピュータ将棋レーティングサイトのレートは、floodgateのレートの数値と大きく変わらないようにする工夫がされています。なお、羽生三冠のここ数年のプロ棋士レーティングは時期による前後はあれど概ね1900プラスマイナス50程度であり、佐藤天彦名人渡辺竜王の棋力もほぼこの幅に安定していて、現時点ではこの3人が名実ともにほぼ拮抗した最高レベルの棋力といえます

ここから考えた際に、2016年電王戦ponanza羽生天彦渡辺といったトップ棋士の棋力差はおよそレート差800、ponanzaの期待勝率は99%超、という推測になります第2期叡王戦本戦PV千田五段が、羽生ponanzaに対する勝率を0.5%と仮定しているのは、まずこの推測に基づくものと考えて相違ないでしょう。もちろんすべての基準となるfloodgateでの千田五段の数値は、普通プロ棋士公式戦ではありえない短い持ち時間の下で行われたものであるため、実際の羽生ponanzaの実力差はこの通りではない、という反論は容易ですが、そもそも持ち時間が9時間に増えたからと言ってレート800の差は埋まるものではなく、コンピュータ将棋も持ち時間を長くすればそれだけ強くなることを考慮すれば本質的議論とは言い難いでしょう。

やっと本題、スマホにおける将棋アプリの強さ

ここまで長い前置きを置かないと、なかなかこの本題に説得力が出ないと思いましたが、いよいよここから現在スマホ将棋アプリ話題です。

これだけ強くなったコンピュータ将棋ではありますが、これまでは基本的パソコン上で動かすものでした。スマホ用の将棋アプリも多数出てはいましたが、プロ棋士最上位に匹敵すると見られているものはありませんでした。

ところが今年の7月、android用の将棋アプリとしてshogidroidがリリースされます。これ自体将棋ソフトのGUIであって思考エンジンはないのですが、このshogidroidの売りは、今年の6月に一般公開された当時の最強フリー将棋ソフト「技巧」をandroidスマホの上で動かせるようにしたことでした。技巧の強さは先のコンピュータ将棋レーティングサイトで4コア8スレッドで動かした際に3578。ponanzaの3850には及ばないとは言え、今年6月当時ではponanzaに次ぐ2番めに強いソフトで、人間から見れば驚異的な棋力です。

もちろん、この技巧といえど、その棋力がCPUの能力に依存することは言うまでもありません。しかし、スマホ今日日クァッドコアは当たり前、Huawei P9のようにオクタコアを搭載してGeekbenchを用いたベンチマークテストで高い数値を出すスマホもある時代です。第4回将棋電王トーナメントで3位になったやねうら王の開発者で、皆様もよくご存知のやねうらおさんは、2016年9月時点のハイスペックスマホに、一切のスマホ用のチューニングを行わず思考エンジンを搭載しても、レートの落ち幅は400程度推定しています。この推定を当てはめて技巧をshogidroidで動かした時のレートを推定すると3178。やはり羽生天彦渡辺を上回っていることになります。実際にはもちろんやってみないとわかりませんが、あくまでも推測上では、すでに電王戦プロ棋士スマホで十分に成立し、それでもプロ棋士の分が悪いことが予測される段階に突入しているのです。

※ちなみに、先の電王トーナメントで優勝し来年の電王戦に出場する最新のponanzaは、今年の電王戦に出場するponanzaに9割勝つとの開発者山本さんの発言がありました。これを信じるならponanzaのレートは4200となり、スマホに積んでも3800で、やはり羽生三冠の期待勝率は1%に満たないことになります

これが2016年10月における、スマホで動かすコンピュータ将棋の現状になります恐ろしいことには、shogidroidは無料アプリであり、その思考エンジンの技巧もフリーウェア。それを最高スペックで動かすHuawei P9は54000円で買える、というところにあります。この状況をどう考えるかは皆様のご想像におまかせします。

カンニングたか検証できる?

さて、お気づきの方もいるかもしれませんが、疑われた三浦九段の棋譜をソフト検証してみれば白黒はっきりするのでは?と思われるかもしれません。しかしそれは極めて困難であると申し上げましょう。

まず、Shogidroidの上で動かせるソフトは技巧に限りません。その他のソフトも動かすことが可能です。次に、同じ将棋ソフトであっても、ある局面検討させたときに導く最善手は、CPUの性能や検討させる時間によって異なります。そもそも将棋ソフトにはある特定局面において常に同じ結果とならないよう検討においては乱数使用されており、一局の将棋の棋譜からではその人がカンニングたかを導くのは容易ではありません。

さらに、将棋は二人零和有限確定完全情報ゲームである以上、ある局面における最善解というのが必ず存在します。ということは、その最善解を自力で導いたかカンニングたか区別は、着手から「だけ」では判定できないことになります

以上の理由からカンニングたか否かの実験第三者が行っても、その結果についてはいくらでも疑義をつけることができ、有効ではないと言えましょう。

取り急ぎ、私からは以上となります

 
ログイン ユーザー登録
ようこそ ゲスト さん