2018年6月14日 星期四

[KaaS] 機器學習預測西班牙奪冠,專家押寶巴西將雪恥

資料來源:
https://ift.tt/2JJ1TN7
本文:
為大型運動賽事押注樂趣不在錢,而是為看比賽添加一些無傷大雅的樂趣,博彩公司通常雇用專業統計人員分析過去比賽結果資料庫來量化各種配對結果可能性,再依據結果提供賠率。依據不同博彩公司的綜合估算,大家最看好的是巴西,其次是德國、西班牙,但根據機器學習法估算,贏面最大的是西班牙。


麻省理工科技評論(MIT Technology Review)報導,德國多特蒙德工業大學(Technical University of Dortmund)研究人員結合機器學習與傳統統計方法,稱為隨機森林(Random Forest)方式預測贏家。隨機森林方法可以避免其他資料挖掘方式的缺陷,是近年來受到矚目的新興分析方法。
研究人員對球隊可能參加的每場比賽結果建模,並根據結果構建賽程的可能發展模式。研究人員先從可能決定結果的廣泛潛在因素開始,這些因素包括經濟因素,如國家的國內生產總值和人口、國際足球聯盟的國家隊排名,以及球隊本身的屬性,如他們的平均年齡,擁有冠軍聯賽球員的數量,是否擁有主場優勢等。
研究人員還納入其他博彩公司的排名結果一起估計。將所有這些資料鍵入模型後,出現一些有趣的見解。例如,模型估計最具影響力的因素就是由其他方法估計的排名,包括來自博彩公司、國際足聯和其他方面的排名。
其他重要因素包括國內生產總值和球隊中冠軍聯賽球員的數量。不重要的因素包括國家的人口、教練的國籍等等。隨機森林法將西班牙選為最有可能的贏家,機率為 17.8%。但是這個預測結果的關鍵在於賽程結構,如果德國贏得分組賽,在 8 強賽中很有可能遇到很強的對手,因此隨機森林法計算德國進入 4 強賽的機會為 58%,西班牙隊在 8 強賽遇到強勁對手機率較低,因此進入 4 強賽的機率有 73%。
如果雙方都進入 4 強賽,贏面就五五波,但西班牙仍比德國略勝一籌,主要是因為德國在 8 強賽被淘汰的機率較大。但是研究人員模擬整個比賽 10 萬次之後,依據最可能的賽程發展結果卻是德國隊將贏得世界盃,而不是西班牙隊,但是因為比賽的排列組合數量太多,因此德國隊要贏的賽程出現機率並不高,而以各種賽程發展機率平均而論,西班牙贏面較高。簡而言之,在比賽開始的時候,西班牙獲勝機會最高,如果德國隊順利進入 4 強,最後拿下勝利的贏面最大。
但是撇開機器學習技術不談,Business Insider 總結 ESPN、體育畫報、英國每日電訊報和衛報的專家,以及 Business Insider 邀請的專家小組認為,巴西隊將贏得本屆世界盃的壓倒性勝利,原因就是他們一定會為了上一屆在自己家鄉輸掉世界盃而努力雪恥。
(首圖來源:Flickr/Crystian Cruz CC BY 2.0)
心得討論:研究人員模擬整個比賽 10 萬次之後,依據最可能的賽程發展結果卻是德國隊將贏得世界盃,但目前看來德國已經無緣晉級,可見在實務面上還是很難預測的到正確的運動勝負。

沒有留言:

張貼留言