Post on 20-Jul-2015
transcript
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 2
Artículo
Hernando, A., Moya, R., Ortega, F., & Bobadilla, J. (2013).
Hierarchical Graph Maps for Visualization of Collaborative Recommender Systems
Journal of Information Sciences, 40(1), 97-106.
(JCR Impact factor: 1.087. Q2)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 3
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 4
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 5
• Los sistemas de recomendación (SR) son sistemas inteligentes capaces de realizar recomendaciones personalizadas a usuarios registrados en el sistema.
• Se necesita conocer los gustos de los usuarios para poder realizar recomendaciones personalizadas.
• El tipo de ítems a recomendar por un SR es muy variado: películas, libros, artículos, etc.
• Nacen como consecuencia del denominado “problema de la sobrecarga de información” que hay en Internet.
Introducción
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 6
• La tarea de averiguar los gustos de los usuarios y encontrar aquellos ítems que más se ajusta a sus gustos ha requerido del uso de técnicas de Machine Learning:
Introducción
Knn (K-Vecinos) Redes Neuronales Modelos Bayesianos
Descomposición matricial Modelos probabilísticos
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)
Métodos Híbridos
Sistemas de Recomendación
Filtrado Demográfico
Filtrado Basado en Contenido
Filtrado Colaborativo
Basados en Memoria
Basados en Modelos
Basados en Memoria
Basados en Modelos
7
Clasificación
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 8
• La tendencia de los SR corre paralela a la propia evolución de la web.
• Inicio de la Web: Los SR se nutrían únicamente de información explicita de los usuarios.
• Web 2.0: Utilizan información de redes sociales (amigos, followers, etc.), su comportamiento, participación en blogs, foros, etc.
• Web 3.0: Incorporan más información: Internet of things, ubicuidad, parámetros de salud, compras, hábitos, etc.
Tendencias
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 9
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 10
• El número de usuarios no registrados que acceden a un SR es muchísimo mayor que el de los usuarios registrados.
• Gran parte de las investigaciones en el campo de los SR se han centrado en el cálculo de recomendaciones a usuarios registrados.
• Esta tesis se centra fundamentalmente en los usuarios no registrados.
Motivación
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 11
Motivación
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 12
Si bien es cierto que los SR no pueden realizar recomendaciones personalizadas a usuarios no registrados, sí
que es posible que el SR pueda ofrecer un modelo de inferencia sencillo de interpretar que permita a un usuario
no registrado inferir por él mismo las propias recomendaciones a partir de sus gustos.
Hipótesis
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 13
• Para que este modelo de inferencia tenga sentido, debe cumplir los siguientes puntos:
1. El modelo de inferencia no debe estar basado en ecuaciones matemáticas.
2. El modelo de inferencia debe estar basado en un tipo de razonamiento similar al razonamiento humano.
3. La inferencia en el modelo propuesto debe proporcionar recomendaciones lo más similares posibles a algún mecanismo de recomendación conocido.
4. La inferencia debe estar basada en modelos visuales.
Hipótesis
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 14
• Los sistemas de inferencia basado en reglas cumplen:
1. Se basan en un razonamiento muy cercano al humano (Modus ponens, Modus tollens)
2. No se usan ecuaciones matemáticas complejas.
Modelo basado en reglas
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 15
Modelo basado en reglasEjemplo
Hecho 1 En general suele gustar la película “Ocho apellidos vascos”
Regla 1 Si te gusta la película “La isla mínima”, entonces probablemente te gustará la película “El niño”
Hecho IIUsuario no registrado
Me gusta bastante la película “La isla mínima”
InferenciaUsuario no registrado
Sería interesante ver la película “Ocho apellidos vascos” (Hecho I)
Sería interesante ver la película “El niño” (Regla I y Hecho II)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 16
1. Inferencia compleja para el usuario: El SR tiene que ofrecer una gran cantidad de reglas y hechos.
2. Basado en representación textual: El usuario tiene que leerse una gran cantidad de reglas y hechos para poder sacar sus propias conclusiones.
Modelo basado en reglasInconvenientes
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 17
• Solventa los inconvenientes de los modelos basados en reglas:
1. No se definen infinidad de reglas y hechos.
2. Es un modelo visual (no implica lectura para el usuario)
Modelo basado en grafos
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 18
• Se propone un grafo no dirigido con las siguientes características:
1. Vértices: representarán a los ítems del SR y definirán una cantidad asociado al ítem i que indicarán el grado de confianza del hecho:
Hecho: “En general suele gustar el ítem i”
2. Aristas: Dados dos ítems i,j; existe una arista entre dos vértices asociados a estos dos ítems si existe la regla del tipo:
Regla: “Si te gusta el ítem i, entonces ‘probablemente’ te gustará el ítem j”
La longitud de la arista equivaldrá al grado de incertidumbre de la regla (‘probablemente’, ‘es posible’, ‘quizás’, etc.)
Modelo basado en grafos
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 19
• El grafo obtenido en general no es plano (las aristas se cruzan).
• No se puede representar con la longitud de la arista el grado de incertidumbre de las reglas.
Modelos basados en grafos Inconvenientes
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 20
• Construir un subgrafo a partir del grafo de relaciones entre ítems con las reglas más significativas (con mayor grado de confianza).
• Dentro de los tipos de subgrafos, se han considerado los árboles de recubrimiento mínimo (ARM) ya que:
1. Son grafos planos.
2. Las aristas no se cruzan entre ellas.
3. Con la longitud de las aristas se puede representar el grado de confianza.
4. El problema de los ARM ha sido muy estudiado y es muy conocido en el campo de la algorítmica.
Modelo definitivo
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 21
Modelo definitivoEjemplo
Hecho En general suele gustar el item “I4”
Regla Si te gusta el item “I2”, entonces probablemente te gustará el ítem “I5”
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 22
Modelo definitivoEjemplo del caso de estudio: RS-IST
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 23
• La tesis propuesta puede encuadrarse dentro del área de visualización en Machine Learning.
• Existen técnicas destinadas a la visualización de d a t o s c o m o : P C A , Ke r n e l P C A , M ap a s autoorganizados, técnicas de clustering, etc.
• Estas técnicas no son adecuadas para representar los ítems de un SR ya que aunque representan en el plano los datos, no establecen relaciones entre los datos y por tanto no proporcionan un modelo de inferencia.
Métodos de visualización en Machine Learning
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 24
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 25
Método
Calcular importancia del item
Calcular distancias entre items
Calcular el ARM
Calcular la fiabilidad de las similaridades
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)
importancia(I1) = 2importancia(I2) = 3
importancia(I6) = 2
importancia(I3) = 2importancia(I4) = -2
importancia(I5) = -1
26
MétodoPaso I: Cálculo de la importancia de un ítem
UsuariosIt
emsU1 U2 U3 U4 U5
I1 4 5 4 1I2 3 5 4I3 1 5 5I4 1 4 3 2I5 2 4 3 2I6 5
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 27
MétodoPaso I: Cálculo de la importancia de un ítem
Items
I1 I2 I3 I4 I5 I6
Importancia 2 3 2 -2 -1 2
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 28
MétodoPaso II: Cálculo de distancias entre ítems
Usuarios
Item
s
U1 U2 U3 U4 U5I1 4 5 4 1I2 3 5 4I3 1 5 5I4 1 4 3 2I5 2 4 3 2I6 5
I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x
Distancias
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 29
MétodoPaso II: Cálculo de distancias entre ítems
I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 30
MétodoPaso III: Cálculo del árbol de recubrimiento mínimo
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 31
MétodoPaso IV: Cálculo de la fiabilidad de las similaridades
Usuarios
Item
s
U1 U2 U3 U4 U5I1 4 5 4 1I2 3 5 4I3 1 5 5I4 1 4 3 2I5 2 4 3 2I6 5
I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x
Distancias
I1 I2 I3 I4 I5 I6I1 x 0.75 0.40 0.60 0.60 0I2 x 0.40 0.40 0.40 0I3 x 0.75 0.75 0.33I4 x 1 0.25I5 x 0.25I6 x
Fiabilidad
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 32
MétodoPaso IV: Cálculo de la fiabilidad de las similaridades
I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x
DistanciasI1 I2 I3 I4 I5 I6
I1 x 0.75 0.40 0.60 0.60 0I2 x 0.40 0.40 0.40 0I3 x 0.75 0.75 0.33I4 x 1 0.25I5 x 0.25I6 x
Fiabilidad
Fiabilidad 1 - 0.8 0.79 - 0.6 0.59 - 0.4 0.39 - 0.2 0.19 - 0
Color Rojo Naranja Verde Morado Azul
Tramos de fiabilidad
I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x
DistanciasI1 I2 I3 I4 I5 I6
I1 x 0.75 0.40 0.60 0.60 0I2 x 0.40 0.40 0.40 0I3 x 0.75 0.75 0.33I4 x 1 0.25I5 x 0.25I6 x
Fiabilidad
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 33
MétodoPaso IV: Cálculo de la fiabilidad de las similaridades
I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 34
Resultado y conclusiones
Hecho En general suele gustar el item “I2”
Hecho En general suele gustar el item “I1”
Hecho En general suele gustar el item “I3”
Regla Si te gusta el ítem “I5”, entonces probablemente te gustará el ítem “I4”
Regla Si te gusta el ítem “I5”, entonces es posible que te guste el ítem “I2”
Regla Si te gusta el ítem “I5”, entonces quizás te guste el ítem “I6”
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 35
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 36
Método
Calcular importancia del item
Calcular distancias entre items
Calcular el ARM
Calcular la fiabilidad de las similaridades
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 37
SR basados en contenido
Sistemas de Recomendación
Basados en Memoria Basados en Modelos
SR basados en vectores de palabras
LSI PLSI LDA
Filtrado Basado en Contenido
No probabilísticos Probabilísticos
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 38
• Preprocesamiento de la descripción de los ítems:
• Eliminar preposiciones, artículos, etc.
• Sustituir plurales, diminutivos, etc. a su palabra raíz.
• Se trabaja con una matriz de apariciones de palabras en los ítems (palabras/items).
SR basados en contenido
Items
Pala
bras
I1 I2 I3 I4 I5
Fútbol 3 0 2 0 0
Política 0 0 4 4 2
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 39
• Calculan las recomendaciones basándose en el cálculo de distancias entre cada par de vectores de apariciones de palabras en los ítems.
SR basados en vectores de palabras
Items
Pala
bras
I1 I2 I3 I4 I5
Fútbol 3 0 2 0 0
Política 0 0 4 4 2
I1 I2 I3 I4 I5
I1 0 3.0 4.1 5.0 3.6
I2 3.0 0 4.5 4 2
I3 4.1 4.5 0 2 2.8
I4 5.0 4 2 0 2
I5 3.6 2 2.8 2 0
Distancia Euclidea
I1 I2 I3 I4 I5
I1 0 3.0 4.1 5.0 3.6
I2 3.0 0 4.5 4 2
I3 4.1 4.5 0 2 2.8
I4 5.0 4 2 0 2
I5 3.6 2 2.8 2 0
Distancia Euclidea
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 40
• Técnica de factorización matricial basada en la técnica matemática del SVD.
• Extrae (a partir de la matriz de apariciones de palabras en ítems) una serie de factores latentes que caracterizan a las palabras y los documentos.
• A partir de esos factores latentes podemos calcular las similaridades entre los ítems o las palabras.
LSIPu
blic
ació
n
Deerwester.S, Dumais.ST, Furnas.GW, Landauer.TK, and Harshman.R. Indexing by latent semantic analysis. Journal of the American Society for Information Science, page 391, 1990.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 41
LSI
Teorema de Eckart-Young
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 42
Cálculo de distanciasPara SR basados en vectores de palabras y LSI
SR basados en vectores de palabras LSI
Métrica de similaridad basada en ángulos (Coseno)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 43
• El PLSI es una evolución del LSI al que se le añado un modelo probabilístico.
• Descompone la matriz de apariciones de palabras/ítems en dos matrices que van a tener un significado probabilístico.
• Los items y las palabras están caracterizados por una distribución de probabilidad en el que se indica con que grado un item o palabra pertenecen a un tema u otro.
PLSIPu
blic
ació
n
Hofmann.T. Probabilistic latent semantic indexing. International Computer Science Institute, 1999.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 44
PLSI
Conjunto de temas: z ∈ Z = {z1,...,zk}
Conjunto de palabras: w ∈ W = {w1,...,wn}
Conjunto de documentos: d ∈ D = {d1,...,dm}
Estudiar similaridades entre items
Probabilidad de que un documento pertenezca a un determinado tema.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 45
PLSIEjemplo
Items
Pala
bras
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11Balón 3 2Fútbol 2 6 8 1 1Liga 3 1CR7 6 7
Messi 1 2 5Política 4 4 4 1 1
PP 6 3 1PSOE 4 6 1
ZP 3 5 1 1 1Rajoy 5 1 1 1 1Dinero 1 4 4
FMI 5 4 4UE 4 4 3PIB 3 1 1Ibex 2
K = 3
Temas
Fútbol Política EconomíaI1 1.00 0 0I2 1.00 0 0I3 1.00 0 0I4 0 1.00 0I5 0 1.00 0I6 0 1.00 0I7 0 0 1.00I8 0 0 1.00I9 0 0.21 0.79
I10 0.33 0.33 0.33I11 0.40 0.60 0
P (z | d)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 46
• Modelo probabilístico que se enmarca dentro de los modelos generativos ya que trata de describir como se crea un documento.
• Al igual que el PLSI, el LDA calcula dos matrices de probabilidad P(w|z) y P(z|θ).
• La diferencia radica en como se calculan las matrices de probabilidad:
• LDA: Cada ítem esta representado por un vector que sigue una distribución de Dirichlet.
• PLSI: Cada ítem esta representado por un vector que sigue una distribución categórica.
LDAPu
blic
ació
n
Blei.D, Ng.A, and Jordan.M. Latent dirichlet allocation. the Journal of machine Learning research, pages 993–1022, 2003.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 47
LDA
Probabilidad de que un documento pertenezca a un determinado tema.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 48
LDAEjemplo
Items
Pala
bras
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11Balón 3 2Fútbol 2 6 8 1 1Liga 3 1CR7 6 7
Messi 1 2 5Política 4 4 4 1 1
PP 6 3 1PSOE 4 6 1
ZP 3 5 1 1 1Rajoy 5 1 1 1 1Dinero 1 4 4
FMI 5 4 4UE 4 4 3PIB 3 1 1Ibex 2
K = 3 Temas
Fútbol Política EconomíaI1 15.01 0.01 0.01I2 15.01 0.01 0.01I3 15.01 0.01 0.01I4 0.01 15.01 0.01I5 0.01 15.01 0.01I6 0.01 15.01 0.01I7 0.01 0.01 15.01I8 0.01 2.01 13.01I9 0.01 4.01 11.01
I10 1.01 1.01 1.01I11 2.01 3.01 0.01
P (z | θ)
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 49
Cálculo de distanciasPara SR basados en modelos probabilísticos
PLSI LDA
Métrica de similaridad entre distribuciones de probabilidad
Kullback-Liebler (KL)
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 50
SR basados en filtrado colaborativo
Sistemas de Recomendación
Basados en Memoria Basados en Modelos
Knn (K-Vecinos) Factorización Matricial
Filtrado Colaborativo
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 51
• Se toma como base la matriz de votos que los usuarios han emitido sobre los ítems
• El filtrado colaborativo consiste en ver que usuarios (o ítems) son similares al usuario (o ítem) activo al que se ha de recomendar.
SR basados en filtrado colaborativo
Items
Usu
ario
s
I1 I2 I3 I4 I5 I6U1 4 3 1 2U2 1 4 4 5U3 5 5U4 4 4 5 3 3U5 1 5 2 2
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 52
K-VecinosEsquema general
Calcular la similaridad
Buscar los k vecinos
Predecir votaciones
Elegir items recomendados
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 53
• Uno de los pasos más importantes es el de calcular la similaridad entre usuarios o ítems.
• Se han propuesto varias métricas de similaridad
• Tradicionales: MSD, Coseno, Correlación
• Destacadas: JMSD, Singularidades
• La distancia se calcula como:
Cálculo de distanciasPara la técnica de los K-Vecinos
dist(I1,I2) = 1 - sim(I1,I2)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 54
• Una de las técnicas más importantes utilizadas en los SR basados en factorización matricial es el basado en SVD aplicado a los SR basados en FC.
• Esta técnica tiene como finalidad la de obtener una serie de factores latentes que caractericen a los usuario y a los ítems.
• A partir de estos factores se pueden calcular la similaridad en usuarios o entre ítems.
SR basados en factorización matricial
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 55
SVD aplicado a FC
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 56
SVD aplicado a FC
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 57
• Para el cálculo de similaridades entre usuario o entre ítems a partir de sus factores latentes, se puede utilizar cualquiera de las métricas basadas en distancias o en ángulos como el MSD, Coseno, Correlación, etc.
• De igual forma la distancia se calcula como:
Cálculo de distanciasPara el SVD
dist(I1,I2) = 1 - sim(I1,I2)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 58
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)
Métodos Híbridos
Sistemas de Recomendación
Filtrado Demográfico
Filtrado Basado en Contenido
Filtrado Colaborativo
Basados en Memoria
Basados en Modelos
Basados en Memoria
Basados en Modelos
Sistemas de Recomendación
Filtrado Colaborativo
Basados en Memoria
59
Caso de estudio
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 60
Base de datos
MovieLens
Número de usuarios 6.040
Número de ítems 3.900
Número de votaciones 1.000.209 (1M)
Escala 1 - 5
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 61
RS-ISTVisión general
películas más populares
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 62
RS-ISTPelículas más populares
Hecho En general suele gustar la película “ ”
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 63
RS-ISTEjemplo de inferencia
Loca academia de policía
Loca academia de policía 2
Loca academia de policía 4
Loca academia de policía 5
Loca academia de policía 3
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 64
RS-ISTEjemplo (Muchos vértices adyacentes)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 65
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 66
• Se ha presentado un modelo de inferencia sencillo para usuarios no registrados.
• Se ha presentado un modelo de visualización para los ítems de un SR en los que es posible estudiar sus similaridades.
• Como caso de estudio, se ha probado el modelo propuesto con la base de datos de MovieLens 1M.
• Con el RS-IST resultante ha sido posible determinar que ítems (películas) han sido votadas de forma similar, pudiendo así “explicar las recomendaciones al estilo ítem”.
Conclusiones
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 67
• Estudiar posibles formas de generar árboles personalizados para usuarios de los que se tiene cierta información sobre su perfil, gustos, etc.
• Introducir otras medidas de fiabilidad.
• Comparar las diferentes estructuras de árboles al aplicar diferentes medidas de similaridad entre ítems.
• Incorporar una etapa de pre-clasterización.
• Recuperación de información en las diferentes áreas en las que existen sistemas de recomendación basados en memoria (redes sociales, blogs, etc.), para poder aplicar más características a los árboles.
• Árboles dirigidos (Poliárboles).
• Aplicar este concepto a otros grafos planos (mallas).
Trabajos futuros