Date post: | 11-Jan-2016 |
Category: |
Documents |
Upload: | rosaline-james |
View: | 226 times |
Download: | 0 times |
Extensive Form Game
“Burn the Boats”
הביטוי • את שומעים אנחנו let’s burn“לעיתיםthe boats? הכוונה”. מה
אלטרנטיבה – על Bלוותרלהשיג – ולנסות ברירה להותיר לא Aובכך
• Paradox of commitment• It is by limiting my own options that I can manage to
influence the rival’s course of actions in my interest.
Hernan Cortes and the Aztecs
• From a good Spanish family.– Failed at being a
European soldier.– Failed at becoming a
lawyer.Cortes was hungry for wealth and recognition.
Cortes
• 1519 – landed on the coast of Mexico with :– 600 men, 16 horses, and
a few cannon.
• WHY WOULD CORTES BURN HIS SHIPS WHEN HE GOT TO THE NEW WORLD?
5
C
Burn ships
Keep Ships
S
S Be careful
Fight Hard
C = 100, S = 0
C = -100, S = -100
C = 100, S = 0
C = 0, S = 10
Think of Cortes trying to motivate his own soldiers
Fight Hard
Be careful
6
C
Burn ships
Keep Ships
S
S Be careful
Fight Hard
C = 100, S = 0
C = -100, S = -100
C = 100, S = 0
C = 0, S = 10
If no retreat possible, will fight hard or die. But if retreat is possible, may fight less hard and ‘run away’
Fight Hard
Be careful
7
C
Burn ships
Keep Ships
S
S Be careful
Fight Hard
C = 100, S = 0
C = -100, S = -100
C = 100, S = 0
C = 0, S = 10
So Cortes wants to burn his ships. It is a credible commitment not to retreat – and this alters how his own troops behave.
Fight Hard
Be careful
על Burn the boatsעוד
•? כה עד בזה נתקלנו היכן–Golden Balls - ל – ביטול stealהתחייבות ובכך
- ל splitהאופציה– - ב ההגה chicken gameעקירת
• Busi ness guru, Tom Peters swears by Cortés’ destruc tive strat egy by going so far as to sug gest that every com pany hire a CDO – a Chief Destruc tive Officer.
הזמן Extensive Form Game - מימדמשמעותי - • מרכיב הפעולות וסדר הזמן מימד
משחק בניתוח• - ה שום normal form gameתצוגת משלבת לא
הפעולות ) סדר של זמן( sequenceמרכיב אוזמנית – בו פועלים השחקנים
• - ה הינה extensive form gameתצוגתהמרכיב את גם שמייצגת אלטרנטיבה
שבמשחק הטמפורלי– perfect information extensive-form games– imperfect-information extensive-form games
Perfect Information Extensive Form Game
• A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where:– Players: N– Actions: A– Choice nodes and labels for these nodes:
• Choice nodes: H• Action function: χ : H → 2A assigns to each choice node a set
of possible actions• Player function: ρ : H → N assigns to each non-terminal node
h a player iϵN who chooses an action at h– .
Perfect Information Extensive Form Game
• A (finite) perfect-information game (in extensive form) is defined by the tuple (N ; A ; H ; Z ; χ ; ρ ; σ ; u), where:– Terminal nodes: Z is a set of terminal nodes, disjoint
from H– Successor function: σ : HxA → H U Z maps a choice
node and an action to a new choice node or terminal node such that for all h1,h2 ϵ H and a1,a2 ϵA, if σ(h1,a1) = σ(h2,a2) then h1 = h2 and a1 = a2
• Choice nodes form a tree: nodes encode history
– Utility function: u = (u1,…,un); ui : Z → is a utility function for player i on the terminal nodes Z.
The Sharing Gameדוגמה – ביניהם • לחלק צריכים ואחות דולר 2אחמתחיל • האחמקבלים • שניהם אז מסכימה לא האחות 0אם
אסטרטגיות
שחקן • לכל יש טהורות אסטרטגיות כמהבמשחק?
(2-0,1-1,0-2)אסטרטגיות 3יש 1לשחקן –אסטרטגיות( 2^3 )8יש 2לשחקן –
הגדרה - טהורה אסטרטגיה
• - ב שחקן של טהורה perfectאסטרטגיהinformation game של מלאה הגדרה היא
צומת ) כל עבור ינקוט בה ( nodeהפעולהזה לשחקן השייכת
דוגמה
שחקן • של הטהורות האסטרטגיות ?2מהן– S2 = {(C,E),(C,F),(D,E),(D,F)}
שחקן • של הטהורות האסטרטגיות ?1מהן– S1 = }(B,G),(B,H),(A,G),(A,H)}
- ל לעולם נגיע לא זה Hבמצבהטהורה האסטרטגיה עדיין אבל
(A,H( - מ( (A,Gשונה
נאש" מ ש
• , ניתן- הטהורה האסטרטגיה הגדרת בסיס על: גם מחדש להגדיר
מעורבות – אסטרטגיות–Best responseנאש" – מ ש
- ל המשחק Normal Formהמרת
• - ה את להמיר - extensive form gameניתן ל normal form game קלה יחסית בצורה
:חשיבות / ב שהתקיימו הוכחות התוצאות -כלnormal form game ב גם -יתקיימו
extensive form
- ה extensive form gameיתרונות
זמן • של אלמנט בהם שיש משחקים לייצג מאפשר•: קומפקטית בצורה משחקים לייצג מאפשר
פעולות – הרבה עם משחקיםהיינו ) – הקודמת בדוגמה למשל מצבים של חזרה מונע
- payoff pairs 16צריכים ה שבאמצעות extensiveבעודform לנו 5מספיק
אבל... •– - כ לייצג ניתן משחק כל , extensive formלא כלומר )
- מ - normal formהמעבר תמיד extensive formל לאמתקיים(
matching penniesדוגמה – –
- ב" מ Extensive Formש
סדרתית • בצורה עובדים שאנחנו מכך נובע(sequential)
• - !!! ל/ ורק אך נכון המשפט לב י perfectשימinformation extensive form game - שב ) ראינו כבר
normal form אין שבהם מצבים - PSNEיש ב, למשלmatching pennies)
• - ב מעורבת באסטרטגיה להשתמש טעם יש האםperfect information extensive form game ?
לא! ) – אני עשינו מה רואה השני השחקן ממילא כי לא - מה כלום (randomizationמרוויח
- ל המשחק Normal Formהמרת
אסטרטגיות • בסיס על המשקל שיוויי מהם? במשחק טהורות
Subgame Perfection
מ" • ששחקן( – BH,CE)ש למה מוזר לו Hישחק 1קצת יש אםהאלטרנטיבה את ?Gגם
– - ב הבחירה " – Hלמעשה שחקן מ בש עלינו ששומר האיום 2היא - ב יבחר שאם שחקן Fיודע - 1אז ב - Hיבחר ב לבחור לו עדיף Eולכן
– ? שחקן באמת האם אמין איום זה האמנם ברגע 1אבל כך יפעלהאמת?
פורמלית הגדרה
•s הואsubgame perfect equilibrium שלG אםלכל אם של, Gשל’ subgame Gורק sהנגזרת
’Gשל Nash equilibriumהיא’ Gל-
דוגמה
הפעולה subgameב- " )Hהזה הפיתרון ולכן נאש מ ש לא לא( BH,CEהיא הואsubgame perfect equilibrium
Subgame G’
נוספות נקודות
• - ש גם Gמכיוון כל subgameהוא אז עצמו שלSPE גם .NEהוא
אמינים • לא איומים פוסלת הנוכחית ההגדרהnon-credible threats
לנו יש subgame perfect equilibriumהאםבמשחק?
- )Hהאסטרטגיה • off pathנקראת( AH,CFב
Backward Induction
• - ה לחישוב subgame perfect equilibriumדרךמשחק של
all leaf nodes
vector denoting the utility for each player
set of all actions available to player at that node
Centipede gameדוגמה –
• - ה ?subgame perfect equilibriumמהוהראשון Dבוחר 1שחקן – בתור כבר
היא • זו - Pareto-dominatedתוצאה האחרות התוצאות כל ידי על) השניה) מלבד
•? " זה מ ש לפי ישחקו אנשים האםשחקן • צריך שחקן 2מה אם - Aבחר 1לעשות ה? עליו SPEלפי
Dלבחור שחקן – גם לבחור 1אבל צריך . Dהיה שחקן אולי אז זה היגיון 1לפי
? רציונלית לא בצורה משחקבספרות – רבות נחקר הנושא
Example: Mini Ultimatum Game• Proposer (Player 1) can suggest one of two splits of £10: (5,5)
and (9,1).• Responder (Player 2) can decide whether to accept or reject
(9,1), but has to accept (5,5). Reject leads to 0 for both
Player 1
(9,1)
a r
9 1 0 0
(5,5)
5 5
Player 2
Mini Ultimatum Game in Strategic Form
Player 2accept (9,1) reject (9,1)
Player 1 propose (5,5) 5,5 5,5propose (9,1) 9,1 0,0
• There are two equilibria: 1. (propose (9,1), accept (9,1))2. (propose (5,5), reject (9,1)).
• Equilibrium 2 is in weakly dominated strategies (reject (9,1) is weakly dominated)
Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)
Player 1
(9,1)
a r
9 1 0 0
(5,5)
5 5
Player 2
Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)• The optimal action is accept
Player 1
(9,1)
a r
9 1 0 0
(5,5)
5 5
Player 2
Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)• The optimal action is accept• There is one subgame of length 2, the whole game
Player 1
(9,1)
a r
9 1 0 0
(5,5)
5 5
Player 2
Example: Mini Ultimatum Game• There is one subgame of length 1, following (9,1)• The optimal action is accept• There is one subgame of length 2, the whole game• Taking “accept” in the subgame of length 1 as given, we see
that (9,1) is optimalPlayer 1
(9,1)
a r
9 1 0 0
(5,5)
5 5
Player 2
Extensive Form Games with Perfect Information
Example (172.1)1
2
2
CE
F
D
G
H
2,11,32,2
3,0
2
KJI
1,11,0
Extensive Form Games with Perfect Information
Example (172.1)1
22
CE
F
D
G
H
2,11,32,2
3,0
2
KJI
1,11,0
Player 2 Optimal Strategies:(FHK),(FIK),(GHK),(GIK)
Extensive Form Games with Perfect Information
Example (172.1)1
22
CE
F
D
G
H
2,11,32,2
3,0
2
KJI
1,11,0
Player 2 Optimal Strategies:(FHK),(FIK),(GHK),(GIK)
Player 1 Best Responses:(C),(C),(C or D, or E),(D)
Extensive Form Games with Perfect Information
1
22
CE
F
D
G
H
2,11,32,2
3,0
2
KJI
1,11,0
Strategy Pairs: (C,FHK), (C,FIK), (C,GHK), (D,GHK), (E,GHK), (D,GIK)
Player 2 Optimal Strategies:(FHK),(FIK),(GHK),(GIK)
Player 1 Best Responses:(C),(C),(C or D, or E),(D)
All SPE
Example: Voting for a PayraiseThree legislators are voting on whether to give themselves a pay raise. All three want the pay raise; however, Each face a small cost in voter resentment c>0.The benefit for the raise is greater than cost: b>cThey vote in the order 1-2-3. Simple majority ruleWhat is the outcome obtained by backward induction? (N; NY; nyyn)
Diagram courtesy: Dr. Tayfun Sönmez