24のR200以下計算式によって生じる見かけRと真Rの差を計算した
2016/04/25(324日目)にやったこと
5手詰ハンドブック1(2)の1-24の24問を解いた。
まじか、この局面自分が優勢だったのか。形勢判断ができてないな pic.twitter.com/pcAG2ipOOz
— pymeoa@ぱいん (@pymeoa) 2016年4月24日
最善手は5七銀成、これが詰めろ(3手詰)になっているので馬は取られない。 pic.twitter.com/NWV8ENAhdR
— pymeoa@ぱいん (@pymeoa) 2016年4月24日
同銀、4七馬でこの局面。これは6九香成の詰めろ飛車取り。見えないなぁ。 pic.twitter.com/OizoTJxvPy
— pymeoa@ぱいん (@pymeoa) 2016年4月24日
飛車銀の田楽刺し(本譜)。自分の飛車が当たっているため、あまり効果がない pic.twitter.com/FGI4AkuO3A
— pymeoa@ぱいん (@pymeoa) 2016年4月25日
7三銀と上がるのに代えて7四歩とたたいていたら、飛車に当てられる前に田楽刺しが実現した(かもしれない) pic.twitter.com/RyuA8KUrBC
— pymeoa@ぱいん (@pymeoa) 2016年4月25日
少し気になったので、24の見かけRと真のRとの差を計算してみた。ここで、その人が観測することができる「自分のレート」を見かけRと呼び、「観測はできない真の実力」を真のRと呼ぶ。結論を最初に書いて、後でこまごまとした計算を書く。
24はレーティングのデフレ対策として、R200以下の計算式を特別なものにしている。負けた場合のRの減少が通常の半分になるというものだ。
レートのデフレへの対策ということで見かけのRが真のRよりも高くなるような補正をかけているわけだが、デフレとのつり合いが取れているか分からない。
自分の最高Rを最近更新できて喜んでいたが、レーティングの仕組みによって見かけのRが上昇しただけかもしれないと考えると、手放しには喜べない。自分の真のRが上昇した実感を何らかの方法で持ちたい。
81dojoのレーティングシステムはデフレにならないように設計されていて、2014年9月の時点ではデフレが起きていないことが確認されている。
81Dojo お知らせ: 81道場と町道場の段級位対応調査結果
24のほうが同レートの人がたくさんいて対局の待ち時間が少ないため、基本的には24で対局して経験を積み、自己のRの確認のためにたまに81dojoを利用するというのが効果的な利用方法なのだろうか。
これはまさに一般のレーティングシステムでデフレが起こる原因となる行動なわけだが、そこは81dojoのレーティングシステムが吸収してくれるはず…
以下、24のレーティングに関する計算。
通常、レーティングは対局相手とのR差から勝率と授受Rを決定し、対局によって変化するRの期待値が0になるように設計されている。真のRと現在のRにズレがあった場合、対局を重ねることでRが真のRに収束する。
一方、R200以下では負けた場合のRの減少が半分であるため、見かけのRは真のRよりも高い値になる。
対局相手のR, 自分の見かけR, 自分の真のRを変数として対局で得られるRの期待値を計算してみた。
簡単のため自分の見かけRと同じRの対局相手を選んで対局するとすると、
対局で得られるRの期待値 = 4 - (見かけR - 真のR) * 0.03
となった。
この期待値が0になるのは、見かけR - 真のR = 133.3のとき。つまり、Rが200以下の人はレートが同じ人との対局をただ単に繰り返すだけで、見かけのRが真のRよりも最大で133.3高くなる(か、R200に達する)ことになる。
レートが200よりも高くなると通常の計算式に戻るので、真のRが200以下の人のRは200よりも高くならない。
以上の計算から、R66.6からR200までの人がR200近辺に圧縮されていることになる。R200近辺のレートは当てにならない。
また、そのような「見かけのRが真のRよりも高い人々」と対局するということは、レーティングを上げるうえでは「お得」である。見かけのRが真のRと一致している人に勝った時に得られるレートが同じだが、その人よりも勝ちやすく、負けにくい。得られるRの期待値はプラスになるはずである。
つまり、Rが200近辺の人とよく対局する層、R300くらい?までは見かけのRが真のRよりも高くなる。
そして、そのような見かけのRが真のRよりも高いR300くらいの人と対局するR400代の人の見かけのRは真のRよりも高くなる。同様のことが上へ上へ伝搬していくことになるが、実際にはどこまで影響があるのだろうか。
計算の結果だけを見るとあらゆる層の見かけRが真のRよりも高くなるように思えるが、様々な記事に書いてあるように低級タブでのレーティングデフレは緩和されていないらしい。難しい。
低級タブのデフレ問題はさらに深刻になるだろう ... - だんぼら (2012/07/28)
将棋クラブ24のレーティング問題について : 冬は必ず春となる (2013/01/25)