石頭剪子布最優(yōu)策略的線性解法

石頭剪子布屬于一種 zero-sum game,即一個人的 loss 是另一個人的 gain。

這個問題可以有多種解法,我們可以選擇 linear programming 的方法:

設我們要求解的變量為:x = [U, R, P, S]
U 是期望的效用,R 是出石頭的概率,P 是出布的概率,S 是出剪子的概率。
我們的目標是在一組限制條件下,最大化 U。

這組限制條件由石頭剪子布的 reward 矩陣 A 決定:
例如,有矩陣 A :

則限制條件為:

以及:R + P + S = 1。


結合前面幾篇介紹 cvxopt 的文章看,我們可以將上圖這個問題轉化為帶有 c,G,h,A,b 的約束問題格式:

所以可以得到:

有個 c,G,h,A,b 的數值,就可以調用 cvxopt 進行求解此優(yōu)化問題,最后 solution 里面的 x 中后三項就是要求的概率。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容