跳至內容

Glicko評分系統

維基百科,自由的百科全書

Glicko評分系統(英文:Glicko rating system)及Glicko-2評分系統(英文:Glicko-2 rating system)是評估選手在比賽中(如國際象棋圍棋)的技術能力方法之一。此方法由馬克·格利克曼英語Mark Glickman發明,原為國際象棋評分系統英語Chess rating system打造,後作為等級分評分系統的改進版本廣泛應用。格里克曼在此算法中的主要貢獻是「評分可靠性」(Ratings Reliability,簡稱RD),即評分標準差(Ratings Deviation)。

Glicko與Glicko-2評分系統被發表至公有領域。諸多在線遊戲服務器英語Game server(如《Pokémon Showdown》、《Lichess英語Lichess》、《自由互聯網國際象棋服務器英語Free Internet Chess Server》、《Chess.com》、《在線圍棋服務器頁面存檔備份,存於網際網路檔案館)》[1]、《絕對武力:全球攻勢》、《絕地要塞2》、《刀塔霸業》、《激戰2》、《Splatoon 2》及《皇輿爭霸》)和多個競技性編程比賽都採用此種評分方法。[2]Glicko所使用的算法可在其網站上找到。

算法中,評分可靠性用於測量選手的評分,一評分可靠性(評分標準差)相當於一標準差。舉個例子,一名評分為1500分的選手,其評分可靠性為50,表示有95%的可能性這名選手的真實實力約在1400至1600分(1500分的兩個標準差)之間。選手的實力區間需增加並減去評分中的兩個評分標準差來計算。在比賽結束後,選手的實力評分的波動根據評分標準差來計算:當選手的評分標準差較低(選手的評分已較為準確)或其對手的評分標準差較高時(對手的真實實力無法確定)時,選手的評分波動也較小。評分標準差將在比賽後減小,但將在一段時間不活躍後漸漸增大。

Glicko-2是Glicko評分系統的改進版本,引進了評分揮發度σ(Rating Volatility)的概念。澳大利亞國際象棋聯盟英語Australian Chess Federation採用稍加修改版的Glicko-2評分系統。[3]

測量

下列評分流程僅適用於Glicko評分系統,不適用於Glicko-2。

若選手沒有評分,則其評分通常被設為1500,評分標準差為350。

測算標準差

新的評分標準差()可使用舊的評分標準差()計算:

為自上次比賽至現在的時間長度(評分期),350則是新選手的評分標準差。若選手在一個評分期間內進行了多場比賽,此算法會將進行的比賽作為一場看待。評分期根據選手進行比賽的頻繁程度,可能長至七個月,短至幾分鐘。常數根據選手在特定時間段內的技術不確定性計算而來,計算方法可能通過數據分析,或是估算選手的評分標準差將在什麼時候達到未評分選手的評分標準差得來。若一名選手的評分標準差將在100個評分期間內達到350的不確定度,則評分標準差為50的玩家的常數可通過解的方式計算而來。[4]

測算新評分

在經過m場比賽後,選手的新評分可通過下列等式計算:

其中:

表示選手個人的評分;

表示每場比賽後的結果。勝利為1,平局為,失敗為0。

測算新評分標準差

原先用於計算評分標準差的函數應增大標準差值,進而反應模型中一定非觀察時間內,玩家的技術不確定性的增長。隨後,評分標準差將在幾場遊戲後更新:

另請參閱

參考文獻

  1. ^ 存档副本. [2019-08-22]. (原始內容存檔於2020-11-11). 
  2. ^ Justin, O'Dell. Finding the perfect match. [16 January 2015]. (原始內容存檔於2020-11-11). 
  3. ^ Australian Chess Federation Ratings By-Law (PDF). [17 January 2019]. (原始內容存檔 (PDF)於2020-03-11). 
  4. ^ 存档副本. [2019-08-22]. (原始內容存檔於2020-12-12). 

外部連結