SNS とゲーム理論～人はなぜ投稿するのか？～

SNS とゲーム理論～人はなぜ投稿するのか？～

鳥海不二夫東京大学大学院工学系研究科

システム創成学専攻

第3回ソーシャルコンピューティングシンポジウム2012年6月23日青山学院アスタジオ

今日の内容

• 人はなぜSNSを使うのか

• ゲーム理論によるモデル化とシミュレーション

• ソーシャルメディアは公共財ゲームである

• 報酬を考慮したとき協調が支配的になる条件は何か？

• エージェントベースシミュレーションによる分析

• 報酬で得られる利得>報酬コスト

• 反応された嬉しさが反応するコストより大きいと

ソーシャルメディアを使う気になる協調率

報酬利得

報酬コスト

Research Question

• なぜ人はソーシャルメディアを使うのか？

• ソーシャルメディアが「使われる」条件は？

• 新しいコミュニケーションツールの設計へ

ソーシャルメディアの成功と失敗

• 様々なソーシャルメディアの成功

• Twitter，Facebook

• QAサイト・クックパッド・Wikipedia

• 使われないソーシャルメディアの存在

• 多くの企業内SNS・キャンパスSNS

• So-netSNS・β版 (2010年閉鎖)

• 成功と失敗の分かれ目はどこに？

背景

• 成功したソーシャルメディアも入れ替わる

• どんなソーシャルメディアが次に成功するか？

• 成功の予測

What comes next?

目的

• ソーシャルメディアが成功する条件とは？

• 十分条件は難しい

• 個々の機能

• じゃんけん大会(＝運)の可能性

• 成功への必要条件を知りたい

• ソーシャルメディアの基本的性質のモデル化

• モデルに基づく分析

• 成功への必要条件を明らかにする

ソーシャルメディアが利用されるメカニズム

• 成功したソーシャルメディアとは

• 情報が提供されるソーシャルメディア

• ユーザがコストを省みず情報を提供

• 情報が提供されるサイトは利得が大きい

• 協力する価値がある

• 「ただ乗り」も考えられる

公共財ゲームによる表現

Tweet，レシピ商品の感想

etc…

公共財ゲーム

• 各プレイヤーは一定額の財を支払う

• 払われた財より大きい財をすべてのプレイヤーに均等に配る

• 財を支払う=協調行動

• 財を支払わない=裏切り行動

公共財ゲームとしてのソーシャルメディア

• 各プレイヤーは情報(=財)を提供

• 提供した情報以上の情報をすべてのプレイヤーが得る

• 情報を提供する=協調行動

• 情報を提供しない=裏切り行動

公共財ゲームによるソーシャルメディアの表現

• ゲーム構造はn人囚人のジレンマ

• 皆が情報提供⇒全員に利得

• 自分以外情報提供⇒より大きい利得

• 誰も情報提供しない⇒全員利得なし

協調(C) 裏切り(D)

協調(C) -F+(Nc-1)M -F

裏切り(D) (Nc-1)M 0

自分他人

嬉しい

最高

最悪

損得なし

公共財ゲームにおける協調の促進

• 規範ゲーム

• 裏切りに対する罰則(規範)

• 裏切りが発見されると罰せられる

• メタ規範ゲーム

• 罰しないことに対する罰則(メタ規範)

• 裏切りを見ても罰しないと罰せられる

• メタ規範の存在が協調を促進

Axelrod, R.: An Evolutionary Approach to Norms,

American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986)

公共財ゲーム

裏切る

3

-1

-1

-1

-1

-1裏切らない

0

0

0

0

0

0

規範ゲーム

裏切る裏切らない

0

0

0

0

0

0

裏切りへの懲罰

裏切りを発見&罰する

-2

-9

メタ規範ゲーム

裏切る裏切らない

0

0

0

0

0

0

裏切りへのメタ懲罰

裏切りを発見&罰しない

裏切り罰しないことを発見&罰する

-2

-9

メタ規範ゲームにおけるユーザ行動

• ユーザiの行動 (協調率Bi)

• 協調

• 非協調

• ユーザj(≠i)の行動 (懲罰率Vj)

• 裏切り者ユーザiを罰する⇒協調

• 裏切り者ユーザiを罰しない⇒非協調

• ユーザk(≠i,j)の行動 (懲罰率Vk)

• 非協調ユーザjを罰する⇒協調

• 非協調ユーザjを罰しない⇒非協調

S<B

i gets T

others get H j gets E

i gets P

j doesn’t punish i

メタ規範ゲーム

k gets E’

j gets P’

k doesn’t punish j

j punishes i

k punishes j

i defectsVj

Vk

Axelrod, R.: An Evolutionary Approach to Norms,

American Political Science Review, Vol. 80, No. 4, pp. 1095–1111(1986)

T=3

H=-1

E=-9

P=-2

E’=-9

P’=-2

ソーシャルメディアにおけるメタ規範ゲーム

• ソーシャルメディアには罰則機能は導入困難

• 情報提供しないユーザを罰を与えられない

• 情報提供者への報酬は可能

• コメント，「いいね」ボタン，ポイント

• メタ規範ゲームへの報酬の追加

• 報酬・報酬への報酬(メタ報酬)

一般化メタ規範ゲーム

S<B

i gets T


i gets P



k gets E’

j gets P’


j punishes i

k punishes j

i defectsVj

Vk

協調

j doesn’t reward i

j rewards i

k gets C’

j gets R’

k doesn’t reward j

k rewards j

k gets E’’

j gets P’’


k punishes j

k gets C’’

j gets R’’


k rewards j

i cooperatsLj

Vk

Lk

Lk

k gets C’’

j gets R’’

i gets F

others get M

k gets C’

j gets R’

k gets C’’

j gets R’’

i gets F

others get M

j gets C

i gets R

ソーシャルメディアにおける行動

SNS Q&Aサイトレシピ投稿サイト

協調日記の投稿質問の投稿レシピ投稿

報酬コメント回答の投稿感想の投稿

メタ報酬コメントへの返信

回答への

お礼・ポイント

感想へのお礼

ソーシャルメディアにおけるユーザ行動

• ユーザiの行動 (協調率Bi)

• 情報提供⇒協調

• 情報提供せず⇒非協調

• ユーザj(≠i)の行動 (報酬率Lj)

• 協調ユーザiに報酬⇒協調

• 協調ユーザiに報酬を与えない⇒非協調

• ユーザk(≠j)の行動 (報酬率Lk)

• 協調ユーザjに報酬⇒協調

• 協調ユーザjに報酬を与えない⇒非協調

S<B

メタ報酬ゲーム

協調

j rewards ik gets C’’

j gets R’’


k rewards j

i cooperats

Lk

k gets C’’

j gets R’’

i gets F

others get M

Vj

i gets T


i gets P


k gets E’

j gets P’


j punishes i

k punishes j

i defects


k gets C’

j gets R’


k rewards j

k gets E’’

j gets P’’


k punishes jLj

Vk

Vk

Lk

k gets C’

j gets R’

k gets C’’

j gets R’’

i gets F

others get M

j gets C

i gets R

従来の議論

• 報酬では協調は促進されづらい

• メタ報酬ゲームで協調は促進されるのか？

• 二つのゲームを比較

• メタ懲罰ゲーム

• Axelrodによるメタ規範ゲーム

• メタ報酬ゲーム

• ソーシャルメディアをモデル化したメタ規範ゲーム

・Sutter, M., Haigner, S., and Kocher, M. G.:

Choosing the Carrot or the Stick? Endogenous Institutional Choice in Social

Dilemma Situations, Review of Economic Studies, Vol. 77, No. 4, pp. 1540–1566 (2010)

・Hilbe, C. and Sigmund, K.: Incentives and opportunism: from the carrot to the stick

Proc. R. Soc. B, Vol. 277, pp. 2427–2433 (2010)

S<B

i gets T


i gets P



k gets E’

j gets P’


j punishes i

k punishes j

i defects

協調


j rewards i

k gets C’

j gets R’


k rewards j

k gets E’’

j gets P’’


k punishes j

k gets C’’

j gets R’’


k rewards j

i cooperats

Vj

Lj

Vk

Vk

Lk

Lk

k gets C’’

j gets R’’

i gets F

others get M

k gets C’

j gets R’

k gets C’’

j gets R’’

i gets F

others get M

j gets C

i gets Rメタ報酬ゲーム

メタ懲罰ゲーム

メタ懲罰ゲームエージェント

• エージェントパラメータ

• 協調率： Bi

• 懲罰率： Vi

• エージェントの行動

• 発見率St ＜1- Bi ：裏切り

• 確率Stで他人の裏切りを発見

• 確率Viで懲罰

• 確率Stで他人が懲罰していないのを発見

• 確率Viでメタ懲罰

メタ報酬ゲームエージェント

• エージェントパラメータ

• 協調率： Bi

• 報酬率： Li

• エージェントの行動

• 発見率St ＜ Bi ：協調（情報提供）

• 確率Stで他人の協調を発見

• 確率Liで報酬

• 確率Stで他人の報酬を発見

• 確率Liでメタ報酬

シミュレーション条件(1)

• シミュレーションステップ数：10000

• エージェント数：N=20

• ネットワーク：完全ネットワーク

• エージェントの進化

• Bi, Vi, Liをより利得が高いエージェントからコピー

• 遺伝的アルゴリズム

• 一様交叉

• 突然変異率： 0.01

シミュレーション条件(2)

値

協調コストF -3.0

協調利得M 1.0

報酬コストC -2.0

報酬利得R 9.0

メタ報酬コストC’’ -2.0

メタ報酬利得R’’ 9.0

値

裏切り利得T 3.0

裏切られた痛手H -1.0

懲罰コストE -2.0

懲罰痛手P -9.0

メタ懲罰コストE’’ -2.0

メタ懲罰痛手P’’ -9.0

メタ懲罰ゲームメタ報酬ゲーム


協調

-3

+1

+1

+1

+1

+1 S<B

協調



j gets R’’


k rewards j

i cooperats

Lj

Lk

k gets C’’

j gets R’’

i gets F

others get M

k gets C’’

j gets R’’

i gets F

others get M

j gets C



協調

協調者への報酬

協調者を発見&報酬を与える

-2

+9

S<B

協調



j gets R’’


k rewards j

i cooperats

Lj

Lk

k gets C’’

j gets R’’

i gets F

others get M

k gets C’’

j gets R’’

i gets F

others get M

j gets C



協調

協調へのメタ報酬

協調を発見&報酬

報酬を与えたことを発見&報酬

-2

+9S<B

協調



j gets R’’


k rewards j

i cooperats

Lj

Lk

k gets C’’

j gets R’’

i gets F

others get M

k gets C’’

j gets R’’

i gets F

others get M

j gets C


進化

高い利得のエージェントをコピー

利得の高いエージェント

GAによる進化エージェントパラメータ協調率：L報酬率：V

メタ懲罰ゲーム


一般化メタ規範ゲームにおける協調の進化

• メタ懲罰ゲーム

• 当初は協調が支配的

• あるタイミングで裏切りが支配

• 裏切り者を罰するエージェントがいなくなることが原因

• メタ報酬ゲーム

• 完全協調支配ではないが協調が多い

• 協調者へ報酬を与えるエージェントが常に多数

ソーシャルメディアのシステムは協調を促進しやすい

利得は妥当か?

値


協調利得M 1.0

報酬コストC -2.0

報酬利得R 9.0

メタ報酬コストC’’ -2.0

メタ報酬利得R’’ 9.0


利得がコストに比べて非常に高い

コストと利得

• メタ報酬ゲームにおけるコストと利得• 利得とコストにどのような関係があれば協調が進化するのか

• コストの変化• C=C’’=c

• 0≦c≦10

• 利得の変化• R=R’’=r

• 0≦r≦10

値


協調利得M 1.0

報酬コストC c

報酬利得R r

メタ報酬コストC’’ c

メタ報酬利得R’’ r

シミュレーション条件




• c=2.0固定

• 0≦r≦10

• 100回シミュレーションの平均

利得による協調の変化

0

0.10.2

0.3

0.40.5

0.6

0.7

0.80.9

1

0 2 4 6 8 10

Behave Rate(B)

Reaction Rate(L)

c=2.0，0≦r≦10

シミュレーション条件




• 0≦c≦10(0.1刻み)

• 0≦r≦10(0.1刻み)

• 100回シミュレーションの平均

コストと利得による協調率の変化協調率

被報酬利得(r)

報酬コスト(c)

コストと利得による協調率の変化

• 利得がコストを上回ったとき協調が支配的

• r(利得)>c(コスト)+ε

• エージェント数が変化しても同様の結果

• ソーシャルメディアでいえば

• Facebookのいいね！ボタン• 低いコスト・低い利得

• Q&Aサイトの回答• 高いコスト・高い利得

⇒情報に対する反応システムの設計へ応用

結論

• ソーシャルメディアを公共財ゲームで表現

• 一般化メタ規範ゲームの提案

• 一般化メタ規範ゲームにおけるメタ報酬ゲーム

• メタ報酬ゲームで協調を実現

• 100%協調ではないが，おおむね協調が支配的

• 協調促進は報酬とそのコストで説明可能

• ソーシャルメディア⇒報酬とコストの設計が重要

Date post:	16-Jul-2015
Category:	Science
Upload:	fujio-toriumi
View:	2,686 times
Download:	6 times