Date post: | 16-Jul-2015 |
Category: |
Science |
Upload: | fujio-toriumi |
View: | 2,686 times |
Download: | 6 times |
今日の内容
• 人はなぜSNSを使うのか
• ゲーム理論によるモデル化とシミュレーション
• ソーシャルメディアは公共財ゲームである
• 報酬を考慮したとき協調が支配的になる条件は何か?
• エージェントベースシミュレーションによる分析
• 報酬で得られる利得>報酬コスト
• 反応された嬉しさが反応するコストより大きいと
ソーシャルメディアを使う気になる 協調率
報酬利得
報酬コスト
ソーシャルメディアの成功と失敗
• 様々なソーシャルメディアの成功
• Twitter,Facebook
• QAサイト・クックパッド・Wikipedia
• 使われないソーシャルメディアの存在
• 多くの企業内SNS・キャンパスSNS
• So-netSNS・β版 (2010年閉鎖)
• 成功と失敗の分かれ目はどこに?
目的
• ソーシャルメディアが成功する条件とは?
• 十分条件は難しい
• 個々の機能
• じゃんけん大会(=運)の可能性
• 成功への必要条件を知りたい
• ソーシャルメディアの基本的性質のモデル化
• モデルに基づく分析
• 成功への必要条件を明らかにする
ソーシャルメディアが利用されるメカニズム
• 成功したソーシャルメディアとは
• 情報が提供されるソーシャルメディア
• ユーザがコストを省みず情報を提供
• 情報が提供されるサイトは利得が大きい
• 協力する価値がある
• 「ただ乗り」も考えられる
公共財ゲームによる表現
Tweet,レシピ商品の感想
etc…
公共財ゲームによるソーシャルメディアの表現
• ゲーム構造はn人囚人のジレンマ
• 皆が情報提供⇒全員に利得
• 自分以外情報提供⇒より大きい利得
• 誰も情報提供しない⇒全員利得なし
協調(C) 裏切り(D)
協調(C) -F+(Nc-1)M -F
裏切り(D) (Nc-1)M 0
自分他人
嬉しい
最高
最悪
損得なし
公共財ゲームにおける協調の促進
• 規範ゲーム
• 裏切りに対する罰則(規範)
• 裏切りが発見されると罰せられる
• メタ規範ゲーム
• 罰しないことに対する罰則(メタ規範)
• 裏切りを見ても罰しないと罰せられる
• メタ規範の存在が協調を促進
Axelrod, R.: An Evolutionary Approach to Norms,
American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986)
メタ規範ゲームにおけるユーザ行動
• ユーザiの行動 (協調率Bi)
• 協調
• 非協調
• ユーザj(≠i)の行動 (懲罰率Vj)
• 裏切り者ユーザiを罰する⇒協調
• 裏切り者ユーザiを罰しない⇒非協調
• ユーザk(≠i,j)の行動 (懲罰率Vk)
• 非協調ユーザjを罰する⇒協調
• 非協調ユーザjを罰しない⇒非協調
S<B
i gets T
others get H j gets E
i gets P
j doesn’t punish i
メタ規範ゲーム
k gets E’
j gets P’
k doesn’t punish j
j punishes i
k punishes j
i defectsVj
Vk
Axelrod, R.: An Evolutionary Approach to Norms,
American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986)
T=3
H=-1
E=-9
P=-2
E’=-9
P’=-2
ソーシャルメディアにおけるメタ規範ゲーム
• ソーシャルメディアには罰則機能は導入困難
• 情報提供しないユーザを罰を与えられない
• 情報提供者への報酬は可能
• コメント,「いいね」ボタン,ポイント
• メタ規範ゲームへの報酬の追加
• 報酬・報酬への報酬(メタ報酬)
一般化メタ規範ゲーム
S<B
i gets T
others get H j gets E
i gets P
j doesn’t punish i
一般化メタ規範ゲーム
k gets E’
j gets P’
k doesn’t punish j
j punishes i
k punishes j
i defectsVj
Vk
協調
j doesn’t reward i
j rewards i
k gets C’
j gets R’
k doesn’t reward j
k rewards j
k gets E’’
j gets P’’
k doesn’t punish j
k punishes j
k gets C’’
j gets R’’
k doesn’t reward j
k rewards j
i cooperatsLj
Vk
Lk
Lk
k gets C’’
j gets R’’
i gets F
others get M
k gets C’
j gets R’
k gets C’’
j gets R’’
i gets F
others get M
j gets C
i gets R
ソーシャルメディアにおける行動
SNS Q&Aサイト レシピ投稿サイト
協調 日記の投稿 質問の投稿 レシピ投稿
報酬 コメント 回答の投稿 感想の投稿
メタ報酬 コメントへの返信
回答への
お礼・ポイント
感想へのお礼
ソーシャルメディアにおけるユーザ行動
• ユーザiの行動 (協調率Bi)
• 情報提供⇒協調
• 情報提供せず⇒非協調
• ユーザj(≠i)の行動 (報酬率Lj)
• 協調ユーザiに報酬⇒協調
• 協調ユーザiに報酬を与えない⇒非協調
• ユーザk(≠j)の行動 (報酬率Lk)
• 協調ユーザjに報酬⇒協調
• 協調ユーザjに報酬を与えない⇒非協調
S<B
メタ報酬ゲーム
協調
j rewards ik gets C’’
j gets R’’
k doesn’t reward j
k rewards j
i cooperats
Lk
k gets C’’
j gets R’’
i gets F
others get M
Vj
i gets T
others get H j gets E
i gets P
j doesn’t punish i
k gets E’
j gets P’
k doesn’t punish j
j punishes i
k punishes j
i defects
j doesn’t reward i
k gets C’
j gets R’
k doesn’t reward j
k rewards j
k gets E’’
j gets P’’
k doesn’t punish j
k punishes jLj
Vk
Vk
Lk
k gets C’
j gets R’
k gets C’’
j gets R’’
i gets F
others get M
j gets C
i gets R
従来の議論
• 報酬では協調は促進されづらい
• メタ報酬ゲームで協調は促進されるのか?
• 二つのゲームを比較
• メタ懲罰ゲーム
• Axelrodによるメタ規範ゲーム
• メタ報酬ゲーム
• ソーシャルメディアをモデル化したメタ規範ゲーム
・Sutter, M., Haigner, S., and Kocher, M. G.:
Choosing the Carrot or the Stick? Endogenous Institutional Choice in Social
Dilemma Situations, Review of Economic Studies, Vol. 77, No. 4, pp. 1540–1566 (2010)
・Hilbe, C. and Sigmund, K.: Incentives and opportunism: from the carrot to the stick
Proc. R. Soc. B, Vol. 277, pp. 2427–2433 (2010)
S<B
i gets T
others get H j gets E
i gets P
j doesn’t punish i
一般化メタ規範ゲーム
k gets E’
j gets P’
k doesn’t punish j
j punishes i
k punishes j
i defects
協調
j doesn’t reward i
j rewards i
k gets C’
j gets R’
k doesn’t reward j
k rewards j
k gets E’’
j gets P’’
k doesn’t punish j
k punishes j
k gets C’’
j gets R’’
k doesn’t reward j
k rewards j
i cooperats
Vj
Lj
Vk
Vk
Lk
Lk
k gets C’’
j gets R’’
i gets F
others get M
k gets C’
j gets R’
k gets C’’
j gets R’’
i gets F
others get M
j gets C
i gets Rメタ報酬ゲーム
メタ懲罰ゲーム
メタ懲罰ゲームエージェント
• エージェントパラメータ
• 協調率: Bi
• 懲罰率: Vi
• エージェントの行動
• 発見率St <1- Bi :裏切り
• 確率Stで他人の裏切りを発見
• 確率Viで懲罰
• 確率Stで他人が懲罰していないのを発見
• 確率Viでメタ懲罰
メタ報酬ゲームエージェント
• エージェントパラメータ
• 協調率: Bi
• 報酬率: Li
• エージェントの行動
• 発見率St < Bi :協調(情報提供)
• 確率Stで他人の協調を発見
• 確率Liで報酬
• 確率Stで他人の報酬を発見
• 確率Liでメタ報酬
シミュレーション条件(1)
• シミュレーションステップ数:10000
• エージェント数:N=20
• ネットワーク:完全ネットワーク
• エージェントの進化
• Bi, Vi, Liをより利得が高いエージェントからコピー
• 遺伝的アルゴリズム
• 一様交叉
• 突然変異率: 0.01
シミュレーション条件(2)
値
協調コストF -3.0
協調利得M 1.0
報酬コストC -2.0
報酬利得R 9.0
メタ報酬コストC’’ -2.0
メタ報酬利得R’’ 9.0
値
裏切り利得T 3.0
裏切られた痛手H -1.0
懲罰コストE -2.0
懲罰痛手P -9.0
メタ懲罰コストE’’ -2.0
メタ懲罰痛手P’’ -9.0
メタ懲罰ゲーム メタ報酬ゲーム
メタ報酬ゲーム
協調
-3
+1
+1
+1
+1
+1 S<B
協調
j doesn’t reward i
j rewards ik gets C’’
j gets R’’
k doesn’t reward j
k rewards j
i cooperats
Lj
Lk
k gets C’’
j gets R’’
i gets F
others get M
k gets C’’
j gets R’’
i gets F
others get M
j gets C
i gets Rメタ報酬ゲーム
メタ報酬ゲーム
協調
協調者への報酬
協調者を発見&報酬を与える
-2
+9
S<B
協調
j doesn’t reward i
j rewards ik gets C’’
j gets R’’
k doesn’t reward j
k rewards j
i cooperats
Lj
Lk
k gets C’’
j gets R’’
i gets F
others get M
k gets C’’
j gets R’’
i gets F
others get M
j gets C
i gets Rメタ報酬ゲーム
メタ報酬ゲーム
協調
協調へのメタ報酬
協調を発見&報酬
報酬を与えたことを発見&報酬
-2
+9S<B
協調
j doesn’t reward i
j rewards ik gets C’’
j gets R’’
k doesn’t reward j
k rewards j
i cooperats
Lj
Lk
k gets C’’
j gets R’’
i gets F
others get M
k gets C’’
j gets R’’
i gets F
others get M
j gets C
i gets Rメタ報酬ゲーム
一般化メタ規範ゲームにおける協調の進化
• メタ懲罰ゲーム
• 当初は協調が支配的
• あるタイミングで裏切りが支配
• 裏切り者を罰するエージェントがいなくなることが原因
• メタ報酬ゲーム
• 完全協調支配ではないが協調が多い
• 協調者へ報酬を与えるエージェントが常に多数
ソーシャルメディアのシステムは協調を促進しやすい
利得は妥当か?
値
協調コストF -3.0
協調利得M 1.0
報酬コストC -2.0
報酬利得R 9.0
メタ報酬コストC’’ -2.0
メタ報酬利得R’’ 9.0
メタ報酬ゲーム
利得がコストに比べて非常に高い
コストと利得
• メタ報酬ゲームにおけるコストと利得• 利得とコストにどのような関係があれば協調が進化するのか
• コストの変化• C=C’’=c
• 0≦c≦10
• 利得の変化• R=R’’=r
• 0≦r≦10
値
協調コストF -3.0
協調利得M 1.0
報酬コストC c
報酬利得R r
メタ報酬コストC’’ c
メタ報酬利得R’’ r
シミュレーション条件
• シミュレーションステップ数:10000
• エージェント数:N=20
• ネットワーク:完全ネットワーク
• c=2.0固定
• 0≦r≦10
• 100回シミュレーションの平均
利得による協調の変化
0
0.10.2
0.3
0.40.5
0.6
0.7
0.80.9
1
0 2 4 6 8 10
Behave Rate(B)
Reaction Rate(L)
c=2.0,0≦r≦10
シミュレーション条件
• シミュレーションステップ数:10000
• エージェント数:N=20
• ネットワーク:完全ネットワーク
• 0≦c≦10(0.1刻み)
• 0≦r≦10(0.1刻み)
• 100回シミュレーションの平均
コストと利得による協調率の変化
• 利得がコストを上回ったとき協調が支配的
• r(利得)>c(コスト)+ε
• エージェント数が変化しても同様の結果
• ソーシャルメディアでいえば
• Facebookのいいね!ボタン• 低いコスト・低い利得
• Q&Aサイトの回答• 高いコスト・高い利得
⇒情報に対する反応システムの設計へ応用