耶鲁大学 博弈论(Game Theory) 笔记4-足球比赛与商业合作之最佳对策

耶鲁大学 博弈论(Game Theory) 笔记4-足球比赛与商业合作之最佳对策

耶鲁大学 博弈论(Game Theory) 笔记4-足球比赛与商业合作之最佳对策

文章目录

点球博弈结论

最佳对策定义参与者针对对手策略的定义广义定义

合伙人博弈外部性

点球博弈

其中

U

1

(

4

,

4

)

U_1(4,-4)

U1​(4,−4)=4,即为我选择左路射门而对手选择左路防守时进球概率为40%。 由图可见,选择M永远不是一个最佳对策(BR)

结论

不要选择在任何条件下都非最佳对策的策略。

最佳对策定义

参与者针对对手策略的定义

如果对

S

i

S_i

Si​的所有

s

i

s‘_i

s‘i​有

U

i

(

s

^

i

,

s

i

)

U

i

(

s

i

,

s

i

)

U_i(\hat{s}_i,s_{-i})\geq U_i(s'_i,s_{-i})

Ui​(s^i​,s−i​)≥Ui​(si′​,s−i​)

则参与者

i

i

i的策略

s

^

i

\hat{s}_i

s^i​是对其他参与者策略

s

i

s_{-i}

s−i​的BR。 或者表示为如下形式,即最大化对手选择策略

s

1

s_{-1}

s−1​时我方的收益。

s

^

i

s

o

l

v

e

s

s

i

m

a

x

U

i

(

s

i

,

s

1

)

\hat{s}_i\quad solves_{s_i}^{max}U_i(s_i,s_{-1})

s^i​solvessi​max​Ui​(si​,s−1​)

广义定义

扩展为广义定义后,参与者

i

i

i的策略

s

^

i

\hat{s}_i

s^i​是对其他参与者策略选择持信念P的BR。在参与者持信念 P 的情况下选

s

^

i

\hat{s}_i

s^i​获得的预期收益比在同样的信念p 下选其它策略,获得的预期收益都要高,对于可选的

s

i

s'_i

si′​均成立。

E

U

i

(

s

^

i

,

P

)

E

U

(

s

i

,

P

)

EU_i(\hat{s}_i,P)\geq EU(s_i,P)

EUi​(s^i​,P)≥EU(si​,P) 或表达为如下形式

s

^

i

s

o

l

v

e

s

s

i

m

a

x

E

U

i

(

s

i

,

s

1

)

\hat{s}_i\quad solves_{s_i}^{max}EU_i(s'_i,s_{-1})

s^i​solvessi​max​EUi​(si′​,s−1​) 预期收益=我的收益1x对面选择1的概率+我的收益2x对面选择2的概率。

预期收益,此案例中,在参与人 i 持有信念P的情况下,他选择左路攻门的预期收益等于,门将扑向左路的概率乘以两人都选择左路下参与人 i 的收益,再加上门将扑向右路的概率乘以门将扑向右路参与人 i 左路进攻时,参与人 i 的收益,即

E

U

(

L

,

P

)

=

P

(

l

)

×

U

1

(

L

,

l

)

+

P

(

r

)

×

U

1

(

L

,

r

)

EU(L,P)=P(l)\times U_1(L,l)+P(r)\times U_1(L,r)

EU(L,P)=P(l)×U1​(L,l)+P(r)×U1​(L,r)

合伙人博弈

1.两个参与人都是公司股东,各持有公司 50%的股份,供应合伙关系;

2.每个股东要选择对公司投入精力,以“小时”表示,策略集合 Si=[0,4],这是一个连续区间,不是同于选数游戏中的只能选整数。

3.利润计算方式如下

4

×

[

s

1

+

s

2

+

b

s

1

s

2

]

0

b

1

4

4\times[s_1+s_2+b*s_1*s_2] \quad 0\leq b \leq \frac{1}{4}

4×[s1​+s2​+b∗s1​∗s2​]0≤b≤41​

其中b为协同或互补部分。

由此我们可以进行收益计算:

U

1

(

s

1

,

s

2

)

=

1

2

[

4

×

[

s

1

+

s

2

+

b

s

1

s

2

]

]

s

1

2

U

2

(

s

1

,

s

2

)

=

1

2

[

4

×

[

s

1

+

s

2

+

b

s

1

s

2

]

]

s

2

2

U_1(s_1,s_2)=\frac{1}{2}[4\times[s_1+s_2+b*s_1*s_2]]-s_1^2\\ U_2(s_1,s_2)=\frac{1}{2}[4\times[s_1+s_2+b*s_1*s_2]]-s_2^2

U1​(s1​,s2​)=21​[4×[s1​+s2​+b∗s1​∗s2​]]−s12​U2​(s1​,s2​)=21​[4×[s1​+s2​+b∗s1​∗s2​]]−s22​ 其中

1

2

\frac{1}{2}

21​为股份占比,

s

1

2

s_1^2

s12​为自身投入。

若要计算选

s

1

s_1

s1​时的最大收益(

s

2

s_2

s2​为已知数):

M

A

X

s

1

2

(

s

1

+

s

2

+

b

s

1

s

2

)

s

1

2

MAX_{s_1}\quad2(s_1+s_2+b*s_1*s_2)-s_1^2

MAXs1​​2(s1​+s2​+b∗s1​∗s2​)−s12​ 进行求导

2

(

1

+

b

s

2

)

2

s

1

^

=

0

s

1

^

=

1

+

b

s

2

=

B

R

(

s

2

)

s

2

^

=

1

+

b

s

1

=

B

R

(

s

1

)

2(1+b*s_2)-2\hat{s_1}=0\\ \hat{s_1}=1+b*s_2=BR(s_2)\\ 同理\\ \hat{s_2}=1+b*s_1=BR(s_1)

2(1+b∗s2​)−2s1​^​=0s1​^​=1+b∗s2​=BR(s2​)同理s2​^​=1+b∗s1​=BR(s1​) 此时令导数得零取得最值,再求二阶导判断最大最小,小于零,取得是最大值。

0

2

0

0-2\leq0

0−2≤0

B

R

(

s

1

)

BR(s_1)

BR(s1​)和

B

R

(

s

2

)

BR(s_2)

BR(s2​)可得:

B

R

1

(

s

2

)

=

1

+

(

1

4

)

s

2

BR_1(s_2)=1+(\frac{1}{4})s_2

BR1​(s2​)=1+(41​)s2​

将BR用图表示,红色代表参与者1在不同

s

2

s_2

s2​下的BR,蓝色为参与者2在不同

s

1

s_1

s1​下的BR。 因为永远不要选择劣势策略,因此参与人1的

(

0

,

1

)

(

2

,

4

)

(0,1)\cup(2,4)

(0,1)∪(2,4)策略被剔除。 同理,参与人2的

(

0

,

1

)

(

2

,

4

)

(0,1)\cup(2,4)

(0,1)∪(2,4)策略被剔除,只剩下中间的区域。 将中间区域放大,图像除了点坐标不同外和初始图像完全一样,再次剔除非BR,迭代剔除最终将归为一点。

{

s

1

=

1

+

b

s

2

s

2

=

1

+

b

s

1

s

1

=

s

2

=

1

1

b

\left\{ \begin{aligned} s_1^*=1+bs_2^* \\ s_2^*=1+bs_1^* \\ \end{aligned} \right. \rightarrow s_1^*=s_2^*=\frac{1}{1-b}

{s1∗​=1+bs2∗​s2∗​=1+bs1∗​​→s1∗​=s2∗​=1−b1​

外部性

当我计算要为公司付出多少时,没有考虑到利润的一半会归别人所有。

如果减小协同系数b,那么两条线会越来越皆接近于平行和垂直,最终的点会越来越接近于(1,1)。

上图中的交点即是著名的纳什均衡点,在此处双方都采用了自己的最优反应。

🌈 相关推荐