14.12 Oyun Teorisi Muhamet Yıldız Güz 2005 Ders 18-20: Eksik Bilgi Dinamik Oyunlar Yol haritası 1. Çifte İhale 2. Ardaşık Rasyonelite 3. Mükemmel Bayesyen Nash Dengesi 4. Ekonomik Uygulamalar (a) Eksik bilgili ardaşık pazarlık (b) İtibar 1 Bir Örnek 1,2 calis I Firma Ise al calisma yuksek p 0,1 Ise alma 0,0 Doga I 1-p calis 1,1 Ise al dusuk calisma -1,2 Ise alma 0,0 Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte, işçinin iki tipi var: Yüksek ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir oyuncunun tipini seçtiği ve oyuncuları özel olarak bilgilendirdiği kusurlu bilgili oyunlarla modellenmiştir. Bu tip oyunlar eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adlandırılırlar. Formel olarak, eksik bilgili statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈ T seçer, öyle ki, her t ∈ T p(t) olasıliğıyla seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N = 1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini öğrenmez. Son olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı olarak seçerler. Tüm oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈ A ile ifade ediyoruz, öyle ki, ai ∈ Ai oyuncu i’nin eylemidir. Oyun (N, T, A, p) ile gösterilir. Her zamanki gibi, bir oyuncunun stratejisi her bilgi kümesinde hangi eylemi seçeceğini belirler. Burada, bilgi kümeleri tiplere, ti ∈ Ti , denk gelir. Dolayısıyla, oyuncu i’nin bir stratejisi si : Ti → Ai şeklinde, oyuncunun tiplerini eylemlerine atayan bir fonksiyondur. Mesela, yukarıdaki örnekte, işçinin dört stratejisi vardır: (Çalış,Çalış) - yüksek veya düşük kabiliyetli olmasından bağımsız olarak çalışacağı anlamına gelir, (Çalış, Kaytar) - yüksek kabiliyetli ise çalışacağıve düßük kabiliyetli ise kaytaracağı anlamına gelir, (Kaytar, Çalış) ve(Kaytar, Kaytar). 2 2 Bu dengedeki sorun nedir? 1,2 calis I Firma Ise al calisma yuksek p 0,1 Ise alma 0,0 Doga I 1-p calis 1,1 Ise al dusuk calisma -1,2 Ise alma 0,0 Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte, işçinin iki tipi var: Yüksek ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir oyuncunun tipini seçtiği ve oyuncuları özel olarak bilgilendirdiği kusurlu bilgili oyunlarla modellenmiştir. Bu tip oyunlar eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adlandırılırlar. Formel olarak, eksik bilgili statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈ T seçer, öyle ki, her t ∈ T p(t) olasıliğıyla seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N = 1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini öğrenmez. Son olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı olarak seçerler. Tüm oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈ A ile ifade ediyoruz, öyle ki, ai ∈ Ai oyuncu i’nin eylemidir. Oyun (N, T, A, p) ile gösterilir. Her zamanki gibi, bir oyuncunun stratejisi her bilgi kümesinde hangi eylemi seçeceğini belirler. Burada, bilgi kümeleri tiplere, ti ∈ Ti , denk gelir. Dolayısıyla, oyuncu i’nin bir stratejisi si : Ti → Ai şeklinde, oyuncunun tiplerini eylemlerine atayan bir fonksiyondur. Mesela, yukarıdaki örnekte, işçinin dört stratejisi vardır: (Çalış,Çalış) - yüksek veya düşük kabiliyetli olmasından bağımsız olarak çalışacağı anlamına gelir, (Çalış, Kaytar) - yüksek kabiliyetli ise çalışacağıve düßük kabiliyetli ise kaytaracağı anlamına gelir, (Kaytar, Çalış) ve(Kaytar, Kaytar). 3 2 What is wrong with this equilibrium? X What isBuwrong with (2,6) this equilibrium? 1 dengedeki sorun nedir? T B X 1 2 L (0,1) R L (3,2) 2 T (0,1) Beliefs B R (-1,3) L (2,6) (1,5) R L (3,2) (-1,3) R (1,5) İnanışlar X Beliefs of an agent at a given 1 (2,6) nformation set is a Beliefs probability distribution on T B X he information set. • Beliefs of an agent at a given 1 (2,6) For each information set, we information set is a P P must specify the beliefs of 2 probability distribution on T he agent who moves at that B the informationLset. R L R nformation set. • For each information set, we (-1,3) (1,5) (0,1) (3,2) P P must specify the beliefs of 2 the agent who moves at that L R L R • Bir oyuncunun information set. verili bir bilgi kümesindeki inanışları o bilgi (0,1) (3,2) (-1,3) (1,5) kümesi üzerine bir olasılık dağılımıdır. • Her bilgi kümesi için o kümede oynayacak olan oyuncu için 3 olasılıkları belirtmeliyiz. 4 3 Ardaşık Rasyonelite Bir oyuncu ardaşık rasyoneldir ancak ve ancak, oynayacayı her bilgi kümesinde, bu kümede olduğu veriliyken, bu kümede verili inanışları doğrultusunda beklenen faydasını maksimize eder Bir Örnek 1,2 calis I Firma Ise al calisma yuksek p 0,1 Ise alma 0,0 Doga I 1-p calis 1,1 Ise al dusuk calisma -1,2 Ise alma 0,0 Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte, işçinin iki tipi var: Yüksek ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir oyuncunun tipini seçtiği ve oyuncuları özel olarak bilgilendirdiği kusurlu bilgili oyunlarla modellenmiştir. Bu tip oyunlar eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adlandırılırlar. 5 Formel olarak, eksik bilgili statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈ T seçer, öyle ki, her t ∈ T p(t) olasıliğıyla seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N = 1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini öğrenmez. Son olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı olarak seçerler. Tüm oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈ Another example Başka bir Örnek Another example X 1 T 2 L X 1 T B 2 R L R (0,1) (3,2) (0,1) (3,2) (2,6) (2,6) B L L (-1,3) (-1,3) R R (1,5) (1,5) Example Example Örnek 1 T 2 L 2 .1 1 T B .9 .1 R L R (0,10) (3,2) (0,10) (3,2) L B .9 L (-1,3) (-1,3) 6 R R (1,5) (1,5) 5 5 “Consistency” Tutarlılık Definition: Given any (possibly mixed) strategy profile s, an information set is said icin, Tanım: Herhangi bir strateji vektörü s (karma olabilir) to be on the path of play iff the bir bilgi kümesi oyun yolu üzerindedir ancak ve ancak bilgi information set is reached with positive kümesine, oyuncular s’e probability if sadıkalırlarsa, players stickpozitif to s.olasılıkla ulaşılır. Definition: Given anyvektörü strategy profile s andbir oyun Tanım: Herhangi bir strateji s için ve herhangi any information set I on the path of play of yolu üzerinde bir I bilgi kümesi için, bir oyuncunun I’daki inanışları s, a player’s beliefs at I is said to be s ile tutarlı’dır ancak with ve ancak inanışlar Bayes kuralı ve s’i kullanarak consistent s iff the beliefs are derived using the Bayes’ rule and s. çıkarılmıştır. Example Örnek 1 T B 2 L (0,10) R L (3,2) (-1,3) R (1,5) 6 7 Örnek Example 1 E X 2 T B 2 0 0 3 L R 1 2 1 L 3 3 3 R 0 1 2 0 1 1 “Consistency” Tutarlılık • Given s and an information set I, even if I is s ve Ioff bilgithe kümesi oyun yolu üzerinde olmasa bile, pathveriliyken, of play, Ithe beliefs must be Bayes’ rule andves s kullanılarak inanışlarderived ’mümkünusing olan’ the heryerde Bayes kuralı “whenever possible,” bulunmalı. • e.g., if players tremble with very small yani, eğer oyuncuların elleri çok düşük bir olasılıkla titrese ve probability so that I is on the path, the bu yüzden I oyun yolu üzerinde olsa, inanışlar Bayes kuralı ve s’i beliefs must be very close to the ones kullanılarak bulunanlara olmalı. derived usingçok theyekın Bayes’ rule and s. 8 7 Örnek Example 1 E X 2 T B 2 0 0 3 L R 1 2 1 L 3 3 3 R 0 1 2 0 1 1 Sequential Rationality Ardaşık Rasyonellik A strategy profile ardaşık is said torasyoneldir be sequentially Bir strateji vektörü ancakrational ve ancak, her iff, at each information set, the player who is to move maximizes his expected utility 1. given his beliefs at the information set, and 1. bilgi kümesindeki inanışları veriliyken 2. given that the other players play according to the strategy profilediğer in the continuation 2. oyunun geri kalanında oyuncular stratejigame vektörüne göre (and given that he is at the information set) . bilgi kümesinde, oynayacak olan oyuncu oynayacakları veriliyken (kendisinin de bu bilgi kümesinde olduğu veriliyken) beklenen faydasını maksimize eder. 9 8 Mükemmel Bayesyen Nash Dengesi Perfect Bayesian Nash Equilibrium Bir Mükemmel Bayesyen Nash Dengesi bir (s,b) strateji vektörü A Perfect Bayesian Nash Equilibrium is a pair (s,b) of strategy profile and a set of beliefs such that strateji vektörü, s, inanışlar, b, veriliyken ardaşık rasyoneldir 1. Strategy profile s is sequentially rational ve given beliefs b, and 2. Beliefs consistent with s. inanışlar, b, s b ileare tutarlıdır. ve inanışlar ikilisidir, öyle ki, 1. 2. Subgame-perfect Nash Bayesian Nash Perfect Bayesian Bayesyen Nash −→ Mükemmel Bayesyen Nash −→ Alt-oyun mükemmel Örnek Example 1 E X 2 T B 2 0 0 3 L R 1 2 1 L 3 3 3 R 0 1 2 10 0 1 1 9 Bira-Börek Beer – Quiche Beer – Quiche 3 31 1 ’t don’t don el el du du 2 20 0 1 10 0 du du el el ’t don’t don beer beer el duel du don don ’ t ’t quiche quiche {.1} {.1} tw tw beer {.9} beer {.9} ts ts quiche quiche du du el el 0 01 1 1 11 1 3 30 0 0 00 0 2 21 1 don don ’t ’t Beer: Bira, Quiche: Börek, Don’t: yapma, Duel: duello anlamındadır. Bira-Börek, Bir Denge Beer – Quiche, An equilibrium Beer – Quiche, An equilibrium 1 0 3 31 1 beer beer ’t .1 don’t .1 don el el du du 2 20 0 1 10 0 du du el el .9 beer {.9} .9 beer {.9} t ’ don’t n do quiche quiche {.1} {.1} tw tw ts ts el duel du 1 d 1 d on’ t on’ t du du el el 01 1 quiche 0 quiche 0 don don ’t ’t 11 1 3 30 0 0 00 0 2 21 1 Beer: Bira, Quiche: Börek, Don’t: yapma, Duel: duello anlamındadır. 11 10 10 Örnek Example Example 2 1 1 2 1 1 (5,2) (5,2) 2 2 (3,3) (3,3) (1,-5) (1,-5) .9 .9 .1 .1 (4,4) (4,4) 1 1 (-1,4) (-1,4) 1 1 (0,-5) (0,-5) (-1,3) (-1,3) (0,2) (0,2) Örnek - Çözüm Example –– solved Example solved 2 1 D 1 D E E 2 1 1 (1,-5) (1,-5) P P .9 .9 .1 .1 (4,4) (4,4) 1 1 (-1,4) (-1,4) (3,3) (3,3) (5,2) (5,2) 2 2 1 1 (0,2) (0,2) (0,-5) (0,-5) (-1,3) (-1,3) 12 11 11 Ardaşık Pazarlık 1. 1 periyotluk pazarlık - 2 tip 2. 2 periyotluk pazarlık - 2 tip 3. 1 periyotluk pazarlık - sürekli 4. 2 periyotluk pazarlık - sürekli 13 Pazarlık SequentialArdaşık bargaining 1-p 1-periyot A seller S with valuation 0 A buyer B with valuation v; H S – B knows v, S does not – v = 2 with probability S – = 1 with probability 1-S sets a price p t 0; either p Y – buys, yielding (p,v-p) – or does not, yielding (0,0). L p 2-p p N Y 0 0 p 1-p N 0 0 • Bir satıcıS, değeri 0 • Bir aliçı B, değeri v; 12 – B v’yi biliyor, S bilmiyor – v=2, π olasılıkla – v=1, 1 − π olasılıkla • S fiyat bildirir p ≥ 0; • B – ya satın alır, (p,v-p) kazanır – ya da satın almaz, ve (0,0) kazanır 14 Çözüm Solution US(p) B buys iff v t p; 1. If p d 1, both types buy: 1 S gets p. 2. If 1 < p d 2, only H-type buys: S gets Sp. 3. If p > 2, no one buys. S offers 1 if S < !, 1. 2 if S > !. 1 2 p B satın alır ancak ve ancak v ≥ p; (a) Eğer p ≤ 1, her iki tip satın alır, S p kazanır. (b) Eğer 1 < p ≤ 2, sadece H tipi satın alır, S πp kazanır. (c) Eğer p > 2, hiçbir tip satın almaz. 2. S Sequential bargaining 2-period • 1 eğer π < 1/2 1. At t = 0, S sets a price p01/2 t 0; • 2 eğer π > A seller S with valuation 2. B either 0 teklifinde bulunur – buys, yielding (p0,v-p0) A buyer B with valuation – or does not, then v; 3. At t = 1, S sets another – B knows v, S does not price p1 t 0; – v = 2 with probability S – = 1 with probability 1-S 4. B either – – buys, yielding (Gp1Gv-p1)) or does not, yielding (0,0) 15 13 Ardaşık Pazarlık 2-periyot • Bir satıcıS, değeri 0 • Bir aliçı B, değeri v; – B v’yi biliyor, S bilmiyor – v=2, π olasılıkla – v=1, 1 − π olasılıkla 1. t=0’da S fiyat belirler, p0 ≥ 0 2. B • ya satın alır, (p0 , v − p0 ) kazançları doğar • ya da almaz, o zaman 3. t=1’de, S başka bir fiyat belirler, p1 ≥ 0 4. B • ya satın alır, (δp1 , δ(v − p1 )) kazançları doğar • ya da almaz, (0,0) kazançları doğar 16 Çözüm, 2-periyot 1. Let µ = P r(v = 2|t = 1gecmisinde). Solution, 2-period 2. t=1’de, satın al ancak ve ancak v ≥ p; 2|history at t=1). Solution, 2-period 3. Eğer µ>P 1/2, p1 = 2= 1. Let = Pr(v 2. At t = 1, buy iff v t p; 1. If LetP P> =!,Pr(v 3. p1 ==22|history at t=1). 2. If At=Pt 1/2, 1,1buy v t p; karma yap 5. Eğer µ arasında 1. 4. <= !, pve1 =2iff 2 3. If If P P => !, !, mix p1 = between 5. 1 and 2. 6. B4.içinIfv=1 ise, eğer p ≤ 1 ise, t=0’da satın alır. 0 = 1. P < !, p1 buys 6. B with v=1 at t=0 if p0 d 1. 5. If If Pp =>!, and 2.d S. 1, mix = Pbetween Pr(v = 2|p 2|p100,,t=1) 7. 01 ise, 7. Eğer p0 > µP = r(v = t = 1) ≤ π. 6. B with v=1 buys at t=0 if p0 d 1. 7. If p0 > 1, P = Pr(v = 2|p0,t=1) d S. 4. Eğer µ > 1/2, p1 = 1 Çözüm, devamı π < 1/2 1. µ = P r(v = 2|p0 , t = 1) ≤ π < 1/2. Solution, cont. S <1/2 2. t=1 anında, satın al ancak ve ancak v ≥ p P = Pr(v = 2|p0,t=1) d S <1/2. Solution, cont. S <1/2 2. At t = 1, buy iff v t p; pPB==t=0’da Pr(v 2|p0,t=1) d S <1/2. 3. 1. =satın 4. v=2’li alır eğer 1 2. B Atwith t = 1,v=2 buybuys iff vattt=0 p; if 4. 3. p1 =(2-p 1. ) t G GÙ p d G. 0 0 4. B with v=2 buys at t=0 if 5. p0 = 1: GÙGGG p0 d G. 5. p0 SGSG = 1: (2-p0) t G SG 5. p0 = 1: SGSG SG GGG 3. p1 = 1 17 14 14 Çözüm, devamı π > 1/2 • Eğer v=2, p0 > 2 − δ’da alıyorsa, o zaman – µ = P r(v = 2|p0 > 2 − δ, t = 1) = 0 – p1 = 1 – v=2, p0 > 2 − δ’da almamalı. • Eğer v=2, 2 > p0 > 2 − δ’da almıyorsa, o zaman – µ = P r(v = 2|p0 > 2 − δ, t = 1) = π > 1/2; – p1 = 2 – v=2, 2 > p0 > 2 − δ’da almalı. • Saf strateji dengesi yoktur. 18 – – – = Pr(v = 02|p = 0; P–=PPr(v = 2|p > G,t=1) = S!; 0 > G,t=1) p1–=p12;= 1; 2 should p > G. v –= v2 =should buynot at 2buy > pat 0 > 0G. • Ifpure-strategy v=2 is not buying at 2> p0 > G, then • No equilibrium. – P = Pr(v = 2|p0 > G,t=1) = S!; Karma dengesi, π – p1 =strateji 2; – v = 2 should buy at 2 > p0 > G. > 1/2 Mixed-strategy equilibrium, S >1/2 • No pure-strategy equilibrium. 1. p0 > 2 − δ icin, µ(p0 ) = 1/2; 1. 0 )For >r(v G P(p 2. β(p = 1 p−0 P = 2, p00 daalir) 0) = !; Mixed-strategy equilibrium, S >1/2 2. E(p0) = 1- Pr(v=2 buys at p0) P ( p0 )pS > G1P(p ) = !; 1S 1. EFor 0E ( p0 )S 1 S E ( p0 ) . 0 S E 2. ( p0 )S (1 S ) 2 E(p0) = 1- Pr(v=2 buys at p0) Mixed-strategy equilibrium, S >1/2 3.P v = E2( is indifferent towards buying at p1 : S p0 )S 1 E ( p0 )S 1 S E ( p0 ) 0 . p0 )Salmak (’da S konusunda ) 2 3. v=2, pE01. kayıtsızdır: ) = (2- p0)/G S 2-For p0(1=p0GJ(p > G P(pJ(p 0) Ù 0) =0 !; 3.where 2J(p is )indifferent towards 1-Pr(p Pr(v=2 buys atbuying p0) at p0: 2.v = E(p 0 0)= = 1=1|p0). P 2-E p( p00=)SGJ(p0) 1Ù J(p0) = (2- p0)/G 1S E ( p0 )S 1 S E ( p0 ) . (10) = S E ( p0 )SJ(p S )Pr(p 2 1=1|p0). where öyle ki,3. v = 2 is indifferent towards buying at p0: 2- p0 = GJ(p0) Ù J(p0) = (2- p0)/G where J(p0) = Pr(p1=1|p0). 15 15 15 Ardaşık Pazarlık v ∈ [0, 1] 1 periyot • B, p’de alır ancak ve ancak v ≥ p; • S, U (p) = pP r(v ≥ p) kazanır; • v ∈ [0, a] ⇒ U (p) = p(a − p)/a; • p = a/2. 19 Sequential bargaining, v in [0,1] – v in [0,a] => U(p) = p(a-p)/a; – p = a/2. • 1 period: – B buys at p iff v t p; Ardaşık Pazarlık – S gets U(p) = p Pr(v t p); – v in [0,a] => U(p) = p(a-p)/a; 2 periyot: (p0 , p1 ) – p = a/2. v ∈ [0, 1] Sequential bargaining, • t=0’da, B, p’de alır ancak ve ancak vv≥ in a(p [0,1] ); 0 • • 2p periods: (p ,p ) = a(p )/2 0 1 1 0 –Sequential At t = 0, B buysbargaining, at p0 iff v t a(p0); v in [0,1] • – a(p a(pkayıtsızdır: p01)=tipi 0)/2; •– 2Type periods: (pindifferent: 0,p1) a(p0) is – At a(p t = 0, B buys at p iff v t a(p0); )/2 0) – p0 = G(a(p00) – p1 ) = Ga(p 0 – p1 = a(p0)/2; Ùa(p0) = p0/(1-G/2) Sequential v2 in [0,1] is indifferent: Type a(p0) bargaining, • S– gets p0 · § p0 · § ¸ p0 G0)¨ – p1 )¸ = Ga(p0)/2 a(p¨1 0) – • S 1pG0 /=2 G(a(p © 2 G ¹ ¹ © • 2 periods: (p0,p1Ùa(p ) ) = p 0 0/(1-G/2) 2 • FOC: 2 p 2 G p G / 2 0 0 iff v t a(p1); – At t = 0, B buys at p 0 0 p0 0 2 1 • S gets · 3G / 4 § p201 1 G §/ 2 2 p0G · – p1 = a(p0)/2;¨1 ¸ ¸ p0 G ¨ © 2 G ¹ © 1 G / 2 ¹ – Type a(p0) is indifferent: 2 • FOC: 2 p0 2Gp0 1 G / 2 a(p p1 p)0= Ga(p0)/2 10) – p0 =G(a(p0) – 0 1 G / 2 2 G 21 3G / 4 kazanır. Ùa(p0) = p0/(1-G/2) 2 • S gets § p · § p · • birinci derece1 türevden gelen koşul: 0 ¸ p0 G ¨ 0 ¸ ¨ 1 G / 2 © 2 G ¹ ¹ © • FOC: 1 2 p0 2Gp0 1 G / 2 2 G 0 p0 16 1 G / 22 21 3G / 4 16 16 20