歩兵は一手にして成らず

コツコツ将棋を頑張る人のブログ

24のR200以下計算式によって生じる見かけRと真Rの差を計算した

2016/04/25(324日目)にやったこと

 5手詰ハンドブック1(2)の1-24の24問を解いた。

 

 

 

少し気になったので、24の見かけRと真のRとの差を計算してみた。ここで、その人が観測することができる「自分のレート」を見かけRと呼び、「観測はできない真の実力」を真のRと呼ぶ。結論を最初に書いて、後でこまごまとした計算を書く。

 

24はレーティングのデフレ対策として、R200以下の計算式を特別なものにしている。負けた場合のRの減少が通常の半分になるというものだ。

レーティング

  

レートのデフレへの対策ということで見かけのRが真のRよりも高くなるような補正をかけているわけだが、デフレとのつり合いが取れているか分からない。

自分の最高Rを最近更新できて喜んでいたが、レーティングの仕組みによって見かけのRが上昇しただけかもしれないと考えると、手放しには喜べない。自分の真のRが上昇した実感を何らかの方法で持ちたい。

 

81dojoのレーティングシステムはデフレにならないように設計されていて、2014年9月の時点ではデフレが起きていないことが確認されている。

81Dojo お知らせ: 81道場と町道場の段級位対応調査結果

24のほうが同レートの人がたくさんいて対局の待ち時間が少ないため、基本的には24で対局して経験を積み、自己のRの確認のためにたまに81dojoを利用するというのが効果的な利用方法なのだろうか。

これはまさに一般のレーティングシステムでデフレが起こる原因となる行動なわけだが、そこは81dojoのレーティングシステムが吸収してくれるはず…

 

 

以下、24のレーティングに関する計算。

 

通常、レーティングは対局相手とのR差から勝率と授受Rを決定し、対局によって変化するRの期待値が0になるように設計されている。真のRと現在のRにズレがあった場合、対局を重ねることでRが真のRに収束する。

 

一方、R200以下では負けた場合のRの減少が半分であるため、見かけのRは真のRよりも高い値になる。

対局相手のR, 自分の見かけR, 自分の真のRを変数として対局で得られるRの期待値を計算してみた。

簡単のため自分の見かけRと同じRの対局相手を選んで対局するとすると、

対局で得られるRの期待値 = 4 - (見かけR - 真のR) * 0.03

となった。

 

この期待値が0になるのは、見かけR - 真のR = 133.3のとき。つまり、Rが200以下の人はレートが同じ人との対局をただ単に繰り返すだけで、見かけのRが真のRよりも最大で133.3高くなる(か、R200に達する)ことになる。

レートが200よりも高くなると通常の計算式に戻るので、真のRが200以下の人のRは200よりも高くならない。

 

以上の計算から、R66.6からR200までの人がR200近辺に圧縮されていることになる。R200近辺のレートは当てにならない。

 

また、そのような「見かけのRが真のRよりも高い人々」と対局するということは、レーティングを上げるうえでは「お得」である。見かけのRが真のRと一致している人に勝った時に得られるレートが同じだが、その人よりも勝ちやすく、負けにくい。得られるRの期待値はプラスになるはずである。

 

つまり、Rが200近辺の人とよく対局する層、R300くらい?までは見かけのRが真のRよりも高くなる。

そして、そのような見かけのRが真のRよりも高いR300くらいの人と対局するR400代の人の見かけのRは真のRよりも高くなる。同様のことが上へ上へ伝搬していくことになるが、実際にはどこまで影響があるのだろうか。

 

計算の結果だけを見るとあらゆる層の見かけRが真のRよりも高くなるように思えるが、様々な記事に書いてあるように低級タブでのレーティングデフレは緩和されていないらしい。難しい。

低級タブのデフレ問題はさらに深刻になるだろう ... - だんぼら (2012/07/28)

将棋クラブ24のレーティング問題について : 冬は必ず春となる (2013/01/25)