Date post: | 26-Jun-2015 |
Category: |
Technology |
Upload: | h-mm |
View: | 990 times |
Download: | 0 times |
Intelligent Systems Design Laboratory , Doshisha University
多様性を持つユーザの動的グルーピングSo‐net Recommendation Service Contest
牧野浩之 同志社⼤学⼤学院⼯学研究科廣安知之 同志社⼤学⽣命医科学部
○廣安知之 同志社⼤学⽣命医科学部三⽊光範 同志社⼤学理⼯学部横内久猛 同志社⼤学⽣命医科学部
研究背景
異業種交流会異業種交流会SNSなどネットコミュニティでのイベントオフ会
経験あり か
誰に話しかければ良いのか?
こんな経験ありませんか
誰に話しかければ良いのか?どんな話題を話せば良いのか?
分からない
結局いろんな⼈に出会うチャンスなのにメシを⾷べるだけのイベントになってしまう
Intelligent Systems Design Laboratory , Doshisha University
メシを⾷ るだけのイ ントになってしまう
オフ会や異業種交流会での期待と悩み
ニ ズニーズ趣味が近い⼈やうまが合う⼈を⾒つけたい共通の興味について詳しい情報を得たい共通の興味について詳しい情報を得たい
障壁時間
全ての⼈とじっくり話すチャンスが少ない話題
お互いに何に興味を持っているか分からないお互いに何に興味を持っているか分からない
交流会で誰に何を話すか教えてくれるサ ビスIntelligent Systems Design Laboratory , Doshisha University
交流会で誰に何を話すか教えてくれるサービス
交流会の場で
ケータイを使ってあるサービスにアクセス
Intelligent Systems Design Laboratory , Doshisha University
交流会の場で
その場で決めた全員共通の合い⾔葉を⼊れる
Intelligent Systems Design Laboratory , Doshisha University
交流会の場で
即座に計算
Intelligent Systems Design Laboratory , Doshisha University
交流会の場で
makihiroさんはmakihiroさんはカラオケを歌うのが好き!
⾃分と趣味の合いそうな⼈と話題を提供!
Intelligent Systems Design Laboratory , Doshisha University
交流会の場で
気になる⼈のプロフィールも⾒える!交換できる!
Intelligent Systems Design Laboratory , Doshisha University
交流会ツール実現のための要件
ザの興味の抽出が必要ユーザの興味の抽出が必要興味をくみ取る仕組み プロフサービス興味は時間によって変化
興味に応じたグループ分けが必要どのようにグル プを分けるのか決定が困難どのようにグループを分けるのか決定が困難組み合わせ爆発による計算量の増⼤
Intelligent Systems Design Laboratory , Doshisha University
プロフサービスとは
プ フ ル作成サ ビスプロフィール作成サービス好きな項⽬について⼊⼒し⾃⼰紹介ページを作成ユーザの趣味や嗜好に関する情報を公開するコミュニケーションツール若者に⼈気のサービス• 楽天「前略プロフ」• ニフティ「アバウトミー」
Intelligent Systems Design Laboratory , Doshisha University
研究⽬的
プ フサ ビスにおける ザの情報蓄積をもとにプロフサービスにおけるユーザの情報蓄積をもとにユーザの興味でグループ分けを⾏うユーザの興味の変化を捉える
ユーザのグループ分けをもとにユーザのグループ分けをもとに興味の合うユーザを推薦する興味がありそうなキ ワ ドを推薦する興味がありそうなキーワードを推薦する
イベントで「話す⼈」と「話題」を提供するツールの実現
Intelligent Systems Design Laboratory , Doshisha University
構築したシステム
簡単な質問に答えると⾃分のプロフ ルペ ジが簡単な質問に答えると⾃分のプロフィールページが作成できるプロフサービス
プループ.イン(Profile + Group = Proup )p p
http://proup.in/p p p
普段はこのサイトを通じて普段はこのサイトを通じて,⾃分の興味を蓄積
Intelligent Systems Design Laboratory , Doshisha University
システムの利⽤の流れ
1. ログイン1. ログインOpenIDによるシングルサインオン
2. 質問の回答2. 質問の回答興味のある質問を⾒つけて回答公開当初では約500個の質問を⽤意
3. 質問の作成ユーザが⾃由に質問を作成可能
4. 推薦結果の閲覧同じグループに属する(興味の近い)ユーザの提⽰興味キーワードの提⽰興味キ ワ ドの提⽰
5. オフ会・異業種交流会での利⽤
Intelligent Systems Design Laboratory , Doshisha University
システムの動作イメージ
グインログイン質問の回答質問の回答プロフの閲覧グルーピング結果の閲覧
ムービーをご覧くださいIntelligent Systems Design Laboratory , Doshisha University
ム ビ をご覧ください
システムの処理の流れ
•質問項⽬群のキーワード抽出•質問項⽬同⼠の類似度計算•クラスタリングによるカテゴリ分け
質問項⽬の体系化 •クラスタリングによるカテゴリ分け
•ユーザの回答カテゴリをもとにベクトル⽣成•ユーザ同⼠の類似度を計算し,クラスタリンググルーピング
興味 近 ザ リ メンデ シ ン推薦 •興味の近いユーザのリコメンデーション•キーワードのリコメンデーション
Intelligent Systems Design Laboratory , Doshisha University
質問項⽬の体系化
1 質問項⽬からキ ワ ド抽出 スポ ツ 定期的にしてる?1. 質問項⽬からキーワード抽出形態素解析(MeCab)
スポーツ、定期的にしてる?→スポーツ
⼀番よく遊ぶゲーム機は?
2. 質問項⽬同⼠の類似度計算シソーラスを⽤いた階層距離計算
く→ゲーム
シソ ラスを⽤いた階層距離計算3. 質問項⽬のクラスタリング
Newman法クラスタリング
シソーラスIntelligent Systems Design Laboratory , Doshisha University
シソ ラス類似度計算質問群 クラスタリング
質問項⽬の体系化
1 質問項⽬からキ ワ ド抽出 スポ ツ 定期的にしてる?1. 質問項⽬からキーワード抽出形態素解析(MeCab)
スポーツ、定期的にしてる?→スポーツ
⼀番よく遊ぶゲーム機は?
2. 質問項⽬同⼠の類似度計算シソーラスを⽤いた階層距離計算
く→ゲーム
シソ ラスを⽤いた階層距離計算3. 質問項⽬のクラスタリング
Newman法クラスタリング
シソーラスIntelligent Systems Design Laboratory , Doshisha University
シソ ラス類似度計算質問群 クラスタリング
階層距離計算
シソ ラスの⽊構造を利⽤シソーラスの⽊構造を利⽤2単語の類似度を計算2単語の類似度を計算
質問項⽬同⼠の繋がりを取得dq. dd = ⾒出し語q,dが属する意味属性の深さ意味属性の深さ
Cqd = ⾒出し語q,dが属する共通の上位属性で最も下の階層に
11上位属性で最も下の階層に位置するカテゴリの深さ
33sim(猫,燕) = 2×3 ÷ (5+1 + 5+1) = 0.500sim(猫,本棚)
Intelligent Systems Design Laboratory , Doshisha University55 55
( )= 2×1 ÷ (5+1 + 5+1) = 0.16755 55
Newman法
階層的クラスタリング⼿法階層的クラスタリング⼿法モジュール性を評価する指標 Modularity Qが⾼くモジュ ル性を評価する指標 Modularity Qが⾼くなるクラスタを結合し,Modularity Qを最⼤化
クラスタ内に存在するエッジの本数が多く,クラスタ内に存在するエッジの本数が多く,クラスタ間をつなぐエッジの本数が少ない状態
クラスタ数の⾃動決定が可能クラスタ数の⾃動決定が可能
をクラスタiからj ジ 割合としeijをクラスタiからjへのエッジの割合とし,ai =Σj(eij)としたとき,
Q=Σ(e a 2)Intelligent Systems Design Laboratory , Doshisha University
Q=Σi(eii-ai2)
グルーピング
ユ ザがどのような質問クラスタに1. ユーザがどのような質問クラスタに対して回答しているかをカウント対象質問クラスタと2. 対象質問クラスタとカウント数でベクトルを⽣成⽣成したベクトル同⼠の3. ⽣成したベクトル同⼠の内積により関連度を計算
連度 ⾏列4. 関連度の⾏列をクラスタリングし,グループを決定
5. 定期的なクラスタリングで時間ごとの変化を捕捉
Intelligent Systems Design Laboratory , Doshisha University
推薦
ザが属するグル プのメンバ を推薦1. ユーザが属するグループのメンバーを推薦2. キーワードの提⽰2. キ ワ ドの提⽰
PC版:質問項⽬同⼠のキーワードの繋がりを可視化携帯版:話題となるキーワードを提⽰
興味や嗜好の近いユーザの把握興味や嗜好の近いユ ザの把握提⽰されたキーワードによる新しい興味・話題の発⾒
Intelligent Systems Design Laboratory , Doshisha University
グルーピングの例
質問項⽬群のクラスタリング質問項⽬数 500個
質問項⽬群のクラスタリング
キーワード数 337個⽣成クラスタ数 74個
ユーザのクラスタリングユーザ数 14⼈ユーザの平均回答数 41個ユ ザの平均回答数 41個⽣成グループ数 5グループ
Intelligent Systems Design Laboratory , Doshisha University
グルーピングの例
1 2 3 4 51 2 3 4 5nick makihiro
きよちゃんSooooすけ
bte0059なべ
mizu‐tamaふーByYou
多希有⽒JiJiぷゆSooooすけ ByYou
みぞtwatanabe
ぷゆ
makihiro きよちゃん
Intelligent Systems Design Laboratory , Doshisha University
今後の課題
時間経過における興味の変化の捕捉時間経過における興味の変化の捕捉計算コストの検討計算コストの検討
スケールアウトと計算時間クラスタリング精度向上のためのチューニングモバイルデバイスでの展開モバイルデバイスでの展開
現在β版オフ会・異業種交流会の場での検証
Intelligent Systems Design Laboratory , Doshisha University
まとめ
オンラインサ ビスによるユ ザの情報蓄積オンラインサービスによるユーザの情報蓄積オフ会や交流会でのマッチング
ユーザの興味の把握とグループ分け
質問回答型プロフサ ビス の構築質問回答型プロフサービスproup.inの構築2段階(質問項⽬・ユーザ)のクラスタリングによるグル ピンググルーピング交流会等のイベントで 話すべき⼈と話題 を推薦
Intelligent Systems Design Laboratory , Doshisha University
Hiroyuki MAKINOhttp://makihiro.com/p
Intelligent Systems Design Laboratory , Doshisha University