翻译:
假设我们有一个两人零和游戏,每个玩家有两种行动,行收益矩阵如下: 计算行和列玩家的最小最大最优策略以及游戏的价值。
X Y
A a11 a12
B a21 a22
选项:
1. 行玩家:第一种行动的概率为三分之二,第二种行动的概率为三分之一;列玩家:第一种行动的概率为五分之三,第二种行动的概率为五分之二;游戏的价值为0。
2. 行玩家:第一种行动的概率为二分之一,第二种行动的概率为二分之一;列玩家:第一种行动的概率为二分之一,第二种行动的概率为二分之一;游戏的价值为0。
3. 行玩家:第一种行动的概率为三分之一,第二种行动的概率为三分之二;列玩家:第一种行动的概率为五分之二,第二种行动的概率为五分之三;游戏的价值为1。
4. 行玩家:第一种行动的概率为四分之三,第二种行动的概率为四分之一;列玩家:第一种行动的概率为四分之一,第二种行动的概率为四分之三;游戏的价值为-1。
知识点:零和博弈(一方收益等于另一方损失)
解析:
一、因为为零和博弈,所以游戏价值为0,排除3,4.
二、行玩家期望收益:E=p*(q*a11+(1-q)*a12)+(1-p)(q*a21+(1-q)*a22);
列玩家期望收益:E'=q*(p*a11+(1-p)*a12)+(1-q)(p*a21+(1-p)*a22);
游戏价值:V=E+E';
所以选项1.表示为E=(2/3*3/5*a)+(2/3*2/5*b)+(1/3*3/5*c)+(1/3*2/5*d);
E'=-((2/3*3/5*a)+(2/3*2/5*b)+(1/3*3/5*c)+(1/3*2/5*d));
V=0;
选项2.表示为E=(1/2*1/2*a)+(1/2*1/2*b)+(1/2*1/2*c)+(1/2*1/2*d);
E'=-((1/2*1/2*a)+(1/2*1/2*b)+(1/2*1/2*c)+(1/2*1/2*d));
V=0;
所以选项一二都符合标准,但选项一,提供了更具体的混合策略,在实际博弈中更有效,为玩家提供了更多的灵活性来适应对方的策略变化,答案为选项一。
翻译:
考虑一个两人零和游戏,其收益矩阵如下:
确定行玩家和列玩家的最小最大最优策略以及游戏的价值。选项:
1. 行玩家:第一个行动以 三分之二的概率,第二个行动以 三分之一的概率;列玩家:第一个行动以 五分之三的概率,第二个行动以 五分之二的概率;游戏价值:0。
2. 行玩家:第一个行动以 二分之一的概率,第二个行动以 二分之一的概率;列玩家:第一个行动以 二分之一 的概率,第二个行动以 二分之一的概率;游戏价值:1。
3. 行玩家:第一个行动以 四分之三的概率,第二个行动以 四分之一的概率;列玩家:第一个行动以 四分之一的概率,第二个行动以 四分之三的概率;游戏价值:-1。
4. 行玩家:第一个行动以 三分之一 的概率,第二个行动以 三分之二的概率;列玩家:第一个行动以 五分之二的概率,第二个行动以 五分之三 的概率;游戏价值:0.5。
知识点:零和博弈
解析:
因为是零和博弈,所以游戏价值为0。
答案为选项一。
愿我们都能成为我们想要去成为的人!
日出有盼,日落有思,平平安安,所遇皆愿!
那些所谓的遗憾,都会化作照亮前路的光!