+ All Categories
Home > Documents > Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias...

Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias...

Date post: 28-Jan-2016
Category:
Upload: mateo-grajales
View: 221 times
Download: 0 times
Share this document with a friend
Popular Tags:
19
Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Transcript
Page 1: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

Aprendizaje de Agentes II

Alberto Reyes Ballesteros

Programa ITESM-IIE

Doctorado en Ciencias Computacionales

Page 2: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

Intuición b2-a2

?

Page 3: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 4: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 5: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

Modelo de una Neurona Artificial

Page 6: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 7: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 8: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 9: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 10: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 11: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 12: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 13: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.
Page 14: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

REDES NEURONALES MULTICAPA

w1(1,1)

w1(8,4)

w2(2,8)

w2(1,1)

b1(1)

b1(8)

a2(1)

a2(2)

p(1)

p(2)

p(3)

p(4)

Page 15: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

Introducción• Redes neuronales con una o mas capas ocultas.

• MLP - Multilayer Perceptrons (Perceptrón Multicapa)

• Normalmente cada capa oculta de una red usa el mismo tipo de función de activación.

• La función de activación de la salida es sigmoidal o lineal.

• Llamados aproximadores universales.

Page 16: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

Introducción• Perceptrón multicapas con una sola capa oculta no-

lineal (neuronas sigmoidales) aproximan cualquier función continua.

• No hay prueba de cuantas capas ocultas se requieren para esto.

• BP-Backpropagation es un método general para resolver iterativamente los pesos y los bias del MLP.

• Usa la técnica del gradiente descendente para el cálculo de los pesos, minimizando el error.

Page 17: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

BP-Backpropagation• Rumelhart, Hinton y Williams (1986) basandose

en trabajos de (Werbos 74) y (Parker 82).

• Método para que la RNA aprendiera la asociación entre patrones de entrada y las clases correspondientes.

• Técnica de optimización diseñada para minimizar una función objetivo:

M

kkk wydwe

1

2)(21

Page 18: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales.

Algoritmo

• Inicialización aleatoria de pesos• Aplicar patrón de entrada• Propagación de la entrada a través de todas las capas• La RNA genera salidas y se calcula el error para cada

neurona de salida• Los errores se transmiten hacia atrás, partiendo de la capa

de salida hacia las neuronas de la capa intermedia• Este proceso se repite capa por capa.• Se reajustan los pesos de conexión da cada neurona en base

al error recibido.


Recommended