+ All Categories
Home > Documents > Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio...

Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio...

Date post: 06-Oct-2020
Category:
Upload: others
View: 1 times
Download: 0 times
Share this document with a friend
15
Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en la activación cerebral Miguel Ángel Rodríguez Jiménez Universidad Carlos III de Madrid [email protected] RESUMEN En este Trabajo se ha abordado un problema de miner´ ıa de datos, en el que se realiza un aprendizaje utilizando al- goritmos de b´ usqueda sobre un conjunto de observaciones emp´ ıricas. El objetivo se ha centrado en estudiar la relaci´ on que existe entre las activaciones cerebrales visual, motora, cognitiva y auditiva y las diferentes regiones funcionales del cerebro: cerebelo, frontal, occipital, parietal, subcortical y temporal. La informaci´ on de que se dispone para llevar a cabo este objetivo es una base de im´ agenes de resonancia magn´ etica funcional (fMRI: functional Magnetic Resonance Imaging ). Para realizar este estudio, se ha contestado la pregunta re- convirti´ endola en un problema de clasificaci´ on, en el que se ha empleado el algoritmo AdaBoost Distribuido utilizando M´aquinas de Vectores Soporte (SVM: Support Vector Ma- chines) como clasificadores base. El algoritmo AdaBoost Distribuido es un algoritmo de agregaci´ on ´optima de clasifi- cadores base aplicados sobre diferentes regiones de las im´ a- genes de fMRI. La elecci´ on de este algoritmo se debe a que permite ponderar la relevancia de cada regi´ on funcional del cerebro en la clasificaci´ on. La SVM es un algoritmo de aprendizaje basado en muestras, cuya principal propiedad es la maximizaci´ on del margen. La elecci´ on de la SVM como tipo de clasificador base empleado por el algoritmo AdaBoost Distribuido se debe a que es muy robusta frente a problemas de alta dimensionalidad, como es el caso de las im´ agenes de fMRI. Sobre estos algoritmos, se ha utilizado el remuestreo bootstrap no param´ etrico en dos formas distintas. La primera como he- rramienta para obtener una visi´on estad´ ıstica del problema sin necesidad de hacer ninguna suposici´ on acerca de la dis- tribuci´ on de los datos, y la segunda como herramienta para estimar la probabilidad de error (P e ) y su intervalo de con- fianza al 95% de los clasificadores. El Trabajo se ha comenzado dando una descripci´on te´ orica de las herramientas utilizadas en el estudio, se ha continuado con el an´ alisis de las im´ agenes de fMRI correspondientes a los distintos tipos de activaciones cerebrales, y se ha finalizado con las conclusiones y l´ ıneas futuras. Categorías y Descriptores de Tema H.3.3 [usqueda y recuperaci´ on de informaci´ on]: Pro- ceso de B´ usqueda; I.2.6 [Aprendizaje]: Adquisici´ on de conocimiento Términos Generales Algoritmos Palabras Clave Resonancia magn´ etica funcional, m´aquinas de vectores so- porte, AdaBoost, bootstrap, regiones funcionales del cerebro 1. INTRODUCCIÓN El objetivo de este Trabajo ha sido estudiar la influencia que ejercen las activaciones cerebrales visual, motora, cognitiva y auditiva sobre las diferentes regiones funcionales del cerebro, bas´ andonos en la informaci´ on obtenida mediante im´ agenes de fMRI. Para ello, se ha convertido el citado estudio en un problema de clasificaci´ on, dado que las im´ agenes de fMRI se corresponden con cuatro tipos de activaciones, propicias a ser clasificadas. Dado que hemos utilizado clasificadores bicl´ asicos, nuestro estudio ha consistido en realizar todas las posibles combinaciones de clasificaciones entre dos tipos de activaciones, es decir, clasificaci´ on visual frente a motora, visual frente a cognitiva, visual frente a auditiva, motora frente a cognitiva, motora frente a auditiva y cognitiva frente a auditiva. Para llevar a cabo estas clasificaciones, se ha utilizado el al- goritmo de boosting AdaBoost Distribuido, empleando SVMs como clasificadores base sobre las im´agenes de fMRI del cere- bro. Sobre el algoritmo AdaBoost Distribuido, se ha apli- cado el remuestreo bootstrap no param´ etrico con el fin de obtener un criterio estad´ ıstico que nos permita seleccionar aquellos coeficientes que son relevantes para la clasificaci´ on 1 . 1 Existe un estudio previo [5] en el que se realiza un an´ alisis sobre la influencia de las distintas activaciones cerebrales so- bre las regiones funcionales. La novedad introducida aqu´ ı es el uso del remuestreo bootstrap como herramienta estad´ ıs-
Transcript
Page 1: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

Estudio mediante SVM, Boosting y Bootstrap de larelevancia de las regiones funcionales en la activación

cerebral

Miguel Ángel Rodríguez JiménezUniversidad Carlos III de Madrid

[email protected]

RESUMENEn este Trabajo se ha abordado un problema de minerıade datos, en el que se realiza un aprendizaje utilizando al-goritmos de busqueda sobre un conjunto de observacionesempıricas. El objetivo se ha centrado en estudiar la relacionque existe entre las activaciones cerebrales visual, motora,cognitiva y auditiva y las diferentes regiones funcionales delcerebro: cerebelo, frontal, occipital, parietal, subcortical ytemporal. La informacion de que se dispone para llevar acabo este objetivo es una base de imagenes de resonanciamagnetica funcional (fMRI: functional Magnetic ResonanceImaging).

Para realizar este estudio, se ha contestado la pregunta re-convirtiendola en un problema de clasificacion, en el que seha empleado el algoritmo AdaBoost Distribuido utilizandoMaquinas de Vectores Soporte (SVM: Support Vector Ma-chines) como clasificadores base. El algoritmo AdaBoostDistribuido es un algoritmo de agregacion optima de clasifi-cadores base aplicados sobre diferentes regiones de las ima-genes de fMRI. La eleccion de este algoritmo se debe a quepermite ponderar la relevancia de cada region funcional delcerebro en la clasificacion.

La SVM es un algoritmo de aprendizaje basado en muestras,cuya principal propiedad es la maximizacion del margen. Laeleccion de la SVM como tipo de clasificador base empleadopor el algoritmo AdaBoost Distribuido se debe a que es muyrobusta frente a problemas de alta dimensionalidad, como esel caso de las imagenes de fMRI.

Sobre estos algoritmos, se ha utilizado el remuestreo bootstrapno parametrico en dos formas distintas. La primera como he-rramienta para obtener una vision estadıstica del problemasin necesidad de hacer ninguna suposicion acerca de la dis-tribucion de los datos, y la segunda como herramienta paraestimar la probabilidad de error (Pe) y su intervalo de con-fianza al 95% de los clasificadores.

El Trabajo se ha comenzado dando una descripcion teoricade las herramientas utilizadas en el estudio, se ha continuadocon el analisis de las imagenes de fMRI correspondientes a losdistintos tipos de activaciones cerebrales, y se ha finalizadocon las conclusiones y lıneas futuras.

Categorías y Descriptores de TemaH.3.3 [Busqueda y recuperacion de informacion]: Pro-ceso de Busqueda; I.2.6 [Aprendizaje]: Adquisicion deconocimiento

Términos GeneralesAlgoritmos

Palabras ClaveResonancia magnetica funcional, maquinas de vectores so-porte, AdaBoost, bootstrap, regiones funcionales del cerebro

1. INTRODUCCIÓNEl objetivo de este Trabajo ha sido estudiar la influencia queejercen las activaciones cerebrales visual, motora, cognitiva yauditiva sobre las diferentes regiones funcionales del cerebro,basandonos en la informacion obtenida mediante imagenesde fMRI. Para ello, se ha convertido el citado estudio en unproblema de clasificacion, dado que las imagenes de fMRIse corresponden con cuatro tipos de activaciones, propiciasa ser clasificadas. Dado que hemos utilizado clasificadoresbiclasicos, nuestro estudio ha consistido en realizar todas lasposibles combinaciones de clasificaciones entre dos tipos deactivaciones, es decir, clasificacion visual frente a motora,visual frente a cognitiva, visual frente a auditiva, motorafrente a cognitiva, motora frente a auditiva y cognitiva frentea auditiva.

Para llevar a cabo estas clasificaciones, se ha utilizado el al-goritmo de boosting AdaBoost Distribuido, empleando SVMscomo clasificadores base sobre las imagenes de fMRI del cere-bro. Sobre el algoritmo AdaBoost Distribuido, se ha apli-cado el remuestreo bootstrap no parametrico con el fin deobtener un criterio estadıstico que nos permita seleccionaraquellos coeficientes que son relevantes para la clasificacion1.

1Existe un estudio previo [5] en el que se realiza un analisissobre la influencia de las distintas activaciones cerebrales so-bre las regiones funcionales. La novedad introducida aquı esel uso del remuestreo bootstrap como herramienta estadıs-

Page 2: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

Las aplicaciones potenciales del metodo estan en el area deidentificacion de areas funcionales del cerebro (Brain Map-ping), area que esta adquiriendo una creciente importanciaen el terreno de la psiquiatrıa y de la neurologıa, dadas lasimportantes implicaciones que el desarrollo del conocimientofuncional del cerebro y su relacion con su anatomıa tienenpara la medicina clınica (diagnostico y tratamiento de pa-cientes) y la investigacion en general. En particular, se estaestudiando la aplicacion de estos metodos en la deteccionde diferencias sutiles en determinadas tareas relacionadascon el lenguaje, la vision y la imaginacion (o visualizacionde imagenes). Una aplicacion directa de la clasificacion es eldiagnostico asistido por ordenador, utilizando para ello ima-genes de sujetos sanos y enfermos en el entrenamiento de lamaquina de clasificacion. Otras aplicaciones potenciales serelacionan con el manejo de maquinas mediante ordenes dic-tadas con el pensamiento, deteccion de estados emocionalesalterados, alucinaciones auditivas o visuales, o incluso el usoforense para la deteccion de falsos testimonios.

2. MÁQUINAS DE VECTORES SOPORTELa Maquina de Vectores Soporte (SVM) es un algoritmo deaprendizaje basado en muestras, cuyas bases fueron desar-rolladas por [3]. Sus principales caracterısticas son su ca-pacidad de generalizacion, solucion unica y aplicacion di-recta en problemas no lineales.

2.1 Fundamentos teóricosSupongamos que agrupamos las observaciones realizadas so-bre una determinada poblacion estadıstica, junto con susclases, en un conjunto de entrenamiento S:

S ={(x1, y1), (x2, y2), . . . , (xN , yN )

}, (1)

es decir, que tendremos un total de N observaciones en elconjunto de entrenamiento. La teorıa del aprendizaje es-tadıstico establece dos importantes caracterısticas que unalgoritmo de aprendizaje debe poseer [1]:

• La capacidad de aprender una regla que clasifique co-rrectamente el mayor numero posible de observacionesen el conjunto de entrenamiento.

• La capacidad de que la regla resultante clasifique co-rrectamente nuevas observaciones, es decir, la capaci-dad de generalizacion.

2.1.1 SVM linealSupongamos que los objetos de nuestro problema son vec-tores de dos coordenadas, ~x = (x1, x2). Entonces, un ob-jeto de este tipo puede representarse por un punto en elplano R2, donde x1 es la coordenada horizontal y x2 la ver-tical. La clasificacion consiste en trazar una frontera lineal(~w ·~x+ b = 0) que separe las dos clases de muestras. Defini-mos el margen γ como la distancia que hay entre la muestramas cercana a la frontera y esta ultima. Supongamos ahoraque asignamos a una de las clases el valor +1 y a la otra el-1, esto es, y = {+1,−1}; entonces:

• si ~w · ~x + b > 0, ~x sera clasificado como +1;

tica para la seleccion de los coeficientes significativos parala clasificacion.

Figura 1: Separacion lineal.

• si ~w · ~x + b < 0, ~x sera clasificado como -1;

• si ~w · ~x + b = 0, se asigna a ~x cualquiera de las dosclases.

Un ejemplo grafico puede verse en la Figura 1. Esta fronteraes la optima porque separa el conjunto de entrenamientosin errores y, ademas, maximiza el margen. El efecto demaximizar el margen se traduce en lograr una mayor ge-neralizacion para nuevas muestras de la poblacion que sevayan a clasificar. De esta forma, evitamos el sobreajuste alconjunto de entrenamiento empleado, especialmente si esteposee pocas muestras.

2.1.2 SVM no linealEn la mayorıa de las aplicaciones reales, los datos no sonlinealmente separables, y aplicar una SVM lineal a este tipode poblacion darıa muy malos resultados. Para construiruna SVM no lineal, podemos generalizar la SVM lineal coneste procedimiento:

• Definir una funcion de mapeo φ adecuada para pasar aun nuevo espacio en el que los datos sean linealmenteseparables.

• Construir una SVM lineal sobre dicho espacio.

Por tanto, una poblacion de datos no lineal puede ser facil-mente separada por un clasificador lineal en el nuevo espacio(vease Figura 2). En este ejemplo, la funcion de mapeo haceque la frontera lineal trazada en el nuevo espacio se traduzcaen una frontera circular en el espacio original de los datos.

2.2 SVM y remuestreo bootstrapEn muchos problemas de clasificacion reales, especialmenteen Ingenierıa Biomedica, el numero de observaciones de quese dispone es, a menudo, muy pequeno. Esto ocurre, porejemplo, en la discriminacion de arritmias cardıacas [6] [7],donde el numero de episodios disponibles es muy escaso. Enestos casos, la generalizacion en el aprendizaje juega un pa-pel fundamental, ya que con pocas observaciones disponibles,los algoritmos tienden al sobreajuste. En estas situacionesde baja densidad muestral, el ajuste de los parametros libres

Page 3: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

Figura 2: Separacion no lineal.

de una SVM no es viable utilizando validacion cruzada, de-bido a la inviabilidad de construir un conjunto de validacionsuficientemente representativo (grande). En esta situacionusaremos el remuestreo bootstrap para estimar la Pe realsegun el valor de los parametros libres [6] [7]. De esta formapodremos seleccionar los valores de los parametros libres es-cogiendo aquellos que hagan mınima la Pe real estimada.

Partimos de un conjunto de entrenamiento de un problemade clasificacion bicasico, en el que las observaciones del con-junto de entrenamiento proceden de una cierta distribucionestadıstica. Una remuestra bootstrap x∗ = (x∗1, x

∗2, . . . , x

∗N )

se define como un conjunto de objetos de tamano N toma-dos mediante muestreo con reposicion de la muestra x ={x1, x2, . . . , xN} [9]. Por tanto, los objetos dentro de la re-muestra bootstrap x∗ son los objetos de la muestra originalx apareciendo cada uno ninguna, una, dos o varias veces.Los pasos del algoritmo se enumeran a continuacion:

1. Seleccionar los posibles valores del parametro libre θi

sobre el que se va a realizar la busqueda.

2. Para cada valor θi:

• Se seleccionan B remuestras bootstrap del con-junto de entrenamiento.

• Sobre cada remuestra, se entrena una SVM, obtenien-dose una estimacion de los parametros de la SVM.

• Se estima el riesgo actual realizando el promediosobre las replicas obtenidas.

3. Se selecciona el valor del parametro optimo θopt comoel valor que haga mınimo el riesgo actual.

3. ADABOOST DISTRIBUIDOExisten ciertos problemas de clasificacion en los que sola-mente ciertas regiones del espacio de entrada de las obser-vaciones tienen alguna informacion relevante para la clasi-ficacion, mientras que en las demas zonas solo hay ruido.Imagınese, por ejemplo, un problema de clasificacion bina-ria de imagenes, en el que las imagenes estan corruptas porruido y otros efectos no deseados. Supongase que solamenteunas pocas regiones de las imagenes contienen informacionpara la clasificacion. Entonces, parece sensato utilizar so-lamente esas regiones para la clasificacion. Esta es la ideaprinpipal de Adaboost Distribuido, con el que ademas, esposible obtener un mapa de la imagen que indica la impor-tancia de cada zona en la clasificacion.

AdaBoost Distribuido es un tipo especıfico de algoritmode boosting, el cual es un metodo con el que se consigueuna regla de prediccion (en nuestro caso, un clasificador)muy precisa mediante la combinacion (agregacion) de algo-ritmos de aprendizaje simples [4]. La idea fundamental delboosting es entrenar secuencialmente un algoritmo de apren-dizaje simple, centrando la atencion de este en diferentesobservaciones del conjunto de entrenamiento en cada ronda,para ası aumentar su precision. Cada vez que entrenamosel algoritmo en cada ronda, estamos generando una reglade prediccion que, intuitivamente, realiza bien su trabajo endiferentes zonas del espacio de los objetos del problema.

Basandonos en [5], el algoritmo sera el siguiente:

1. Se entrena cada clasificador base hj , j = 1, . . . , Q so-bre las observaciones locales, utilizando solamente losdatos correspondientes a la region en la que trabajacada uno de los clasificadores.

2. Se inicializan los pesos de las observaciones a wi = 1N

,

i = 1, 2, . . . , N , y los coeficientes de agregado λj = 0,j = 1, . . . , Q.

3. Para cada ronda:

(a) Se calcula la tasa de error ponderada sobre lasobservaciones de agregacion de cada clasificadorbase hj , j = 1, . . . , Q sobre su region como:

errj =

N∑i=1

wiI(yi 6= hj(xi)

)

(b) Se escoge el clasificador base hK que produzcamenor tasa de error ponderada errK en el pasoanterior.

(c) Se calcula su peso αK como:

αK =1

2log

[(1− errK)

(errK + γ)

], γ = 10−9

(d) Actualizamos el coeficiente de agregado corres-pondiente al clasificador base hK :

λK′= λK + αK

(e) Actualizamos los pesos wi de las observacionescomo:

w′i =wi · exp[−yiαKhK(xi)]∑N

j=1 wj

, i = 1, 2, . . . , N

Al finalizar el entrenamiento, los coeficientes de agregado λj

expresaran la importancia de cada region del espacio de lasmuestras en la clasificacion.

4. PRUEBAS CON IMÁGENES DE RESO-NANCIA MAGNÉTICA FUNCIONAL

En el presente capıtulo se estudiaran las prestaciones de lasSVMs con kernel lineal en combinacion con el algoritmo deboosting AdaBoost Distribuido. Se mostrara que este algo-ritmo es capaz de detectar aquellas regiones del cerebro que

Page 4: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

contienen informacion para la clasificacion. Ello tiene venta-jas desde el punto de vista del estudio neuroanatomico delcerebro y tambien desde el punto de vista de la eficienciadel clasificador, ya que la identificacion de regiones conte-niendo informacion permite reducir la dimensionalidad y,por tanto, la complejidad de la tarea de clasificacion. Seaplicara, ademas, el remuestreo bootstrap como criterio es-tadıstico de decision para regiones dudosas en la clasificaciony para la estimacion de la probabilidad de error.

Los datos que tenemos estan encapsulados en una matriz de4 dimensiones. Las tres primeras dimensiones especifican elvoxel de la imagen de fMRI del cerebro (un voxel es como unpıxel, pero en 3D). La cuarta dimension especifica la ima-gen en concreto que estemos utilizando. Adicionalmente,se dispone de un vector con las etiquetas de la clase a laque pertenece cada imagen (visual, auditiva, motora o cog-nitiva). Los algoritmos utilizados se han programado comorutinas de MATLAB, y algunos de ellos utilizan funcionesde la toolbox ”spider” para implementar los algoritmos.

4.1 Algoritmo AdaBoost DistribuidoComo se ha dicho anteriormente, nos proponemos utilizarel algoritmo AdaBoost Distribuido empleando SVMs comoclasificadores base sobre imagenes de fMRI. La eleccion delalgoritmo AdaBoost Distribuido radica en que nos permitedeterminar la relevancia de cada region funcional del cere-bro en una determinada clasificacion. La eleccion de la SVMse debe, principalmente, a que se trata de un algoritmo deaprendizaje que ha demostrado ser muy robusto frente a pro-blemas de alta dimensionalidad y con pocas observacionesdisponibles, como es el caso de las imagenes de fMRI, en losque ocurre muy facilmente el fenomeno del sobreajuste.

El estudio que vamos a realizar encierra un problema declasificacion multiclasico, debido a los cuatro tipos de acti-vaciones con que contamos: activacion visual, motora, cog-nitiva y auditiva. Resolveremos este problema dividiendoloen subproblemas biclasicos, mas concretamente, utilizandoel metodo uno-contra-uno. Este ultimo consiste en situarK(K−1)

2clasificadores binarios, donde K es el numero de

clases, siendo cada uno de ellos entrenado solo por observa-ciones de dos de las clases que componen el problema [2].A la hora de realizar la clasificacion, asignamos un ”voto” ala clase que resulte elegida en cada uno de los clasificadoresbinarios. Al final, la clase resultado sera la que tenga mayornumero de votos. La eleccion de este metodo nos va a per-mitir estudiar todas las posibles combinaciones de clasifica-ciones de dos tipos de activaciones, lo que resultara en unestudio mucho mas amplio y rico.

Las regiones funcionales del cerebro a considerar son 12:

1. Lobulo cerebelo izquierdo.

2. Lobulo frontal izquierdo.

3. Lobulo occipital izquierdo.

4. Lobulo parietal izquierdo.

5. Lobulo subcortical izquierdo.

6. Lobulo temporal izquierdo.

7. Lobulo cerebelo derecho.

8. Lobulo frontal derecho.

9. Lobulo occipital derecho.

10. Lobulo parietal derecho.

11. Lobulo subcortical derecho.

12. Lobulo temporal derecho.

Los clasificadores base elegidos para el algoritmo AdaBoostDistribuido son SVMs con kernel lineal y parametro C = 10.Este valor ha sido seleccionado de manera que ofrezca unabuena generalizacion, aunque no se ha utilizado validacioncruzada para calcularlo. En cualquier caso, no es necesariauna precision muy elevada para seleccionar C, dado los algo-ritmos de boosting solo necesitan que los clasificadores baseescogidos logren una Pe algo menor que 0.5, ya que el propioalgoritmo de boosting se encarga de potenciar la eficacia delos clasificadores base en cada ronda.

Dado que se dispondran de 108 observaciones en cada pro-blema de clasificacion biclasico, se utilizaran 54 observa-ciones para entrenamiento local de las SVMs y otras 54 parala agregacion.

En esta seccion, se entrenara el algoritmo sobre las observa-ciones de cada problema biclasico para obtener el valor delos coeficientes de agregado. Dado que relacionaremos cadauno de estos ultimos con un area funcional del cerebro, nosayudaran a determinar la relevancia de las distintas regionesfuncionales en cada clasificacion.

Activación visual frente motora.Los resultados de laspruebas se muestran en la Figura (3). Como se aprecia, lasolucion es dispersa, dado que solo algunos valores son com-parativamente altos, mientras que la mayorıa son nulos o devalor muy pequeno. Esto es importante, dado que uno de losrequisitos de AdaBoost Distribuido es que el problema seadisperso. Como se ve en la figura, las regiones 1,7,10 y 12, esdecir, el lobulo cerebelo izquierdo, el lobulo cerebelo derecho,el lobulo parietal derecho y el lobulo temporal derecho, sonrelevantes para esta clasificacion, mientras que los demas no,dado que llevan asociado un coeficiente de agregado de nuloo un valor muy pequeno.

Activación visual frente a cognitiva.Los resultados delas pruebas se muestran en la Figura (4). Como se observaen la figura, las regiones 3,6,9 y 11, es decir, el lobulo occipi-tal izquierdo, el lobulo temporal izquierdo, el lobulo occipitalderecho y el lobulo subcortical derecho, son los mas relevantespara esta clasificacion.

Activación visual frente a auditiva.Los resultados de laspruebas se muestran en la Figura (5). En este caso no estatan claro que regiones son las mas significativas, pues hay al-gunas de ellas que llevan asociado un coeficiente de agregadono nulo, pero de pequeno valor, como por ejemplo la region 8

Page 5: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

(lobulo frontal derecho). Por lo tanto, tenemos dudas en de-terminar si el area en cuestion es significativa para la clasifi-cacion. Este problema se intentara solucionar en la siguienteseccion, en la que se empleara el remuestreo bootstrap sobrelos coeficientes de agregado que permita definir un criterioque decida basandose en criterios estadısticos.

Activación motora frente a cognitiva.Los resultados delas pruebas se muestran en la Figura (6). Como se observaen la figura, ocurre lo mismo que en la clasificacion anterior:no se puede determinar si algunas de las regiones son sig-nificativas o no. Estas regiones dudosas son: 1,3,6 y 7, quese corresponden con el lobulo cerebelo izquierdo, lobulo oc-cipital izquierdo, lobulo temporal izquierdo y lobulo cerebeloderecho, respectivamente.

Activación motora frente a auditiva.Los resultados delas pruebas se muestran en la Figura (7). En este caso, lasregiones 4 y 9, es decir, el lobulo parietal izquierdo y el lobulooccipital derecho, resultan dudosas en cuanto a determinarsi son significativas para esta clasificacion, dado su valor nonulo, pero pequeno.

Activación cognitiva frente a auditiva.Los resultados delas pruebas se muestran en la Figura (8). Como se observa enla figura, las regiones 3,5,6,7 y 12, que se corresponden conel lobulo occipital izquierdo, el lobulo subcortical izquierdo,el lobulo temporal izquierdo, el lobulo cerebelo derecho y ellobulo temporal derecho, respectivamente, resultan dudosasen cuanto a si son significativas o no para esta clasificacion.

Por lo tanto, vemos que los coeficientes que devuelve el al-goritmo AdaBoost Distribuido resultan ser:

• nulos o practicamente nulos;

• de valor alto;

• no nulos, pero de de valor pequeno.

Los primeros se corresponden con regiones que no son signi-ficativas para la clasificacion en cuestion, los segundos conregiones que sı son significativas, y los terceros dan lugara duda. En la siguiente seccion se utilizara el remuestreobootstrap sobre los coeficientes para intentar solucionar elproblema de interpretacion de estos coeficientes.

4.2 AdaBoost Distribuido con BootstrapComo se vio en la seccion anterior, hay algunos coeficien-tes de agregado que resultan dudosos en cuanto a si resul-tan significativos o no para una determinada clasificacion.Para intentar resolver esta duda, recurriremos al remuestreobootstrap, que permitira decidir sobre estas regiones du-dosas utilizando un criterio estadıstico.

Para ello, primero se obtendran los histogramas de las re-plicas de cada coeficiente de agregado en cada clasificacion

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4VISUAL VS MOTORA

Figura 3: Activacion visual frente a motora. Coeficientesde agregado para cada region. En el eje de abcisas esta re-presentado el ındice de cada region y en el de ordenadas elcoeficiente.

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4VISUAL VS COGNITIVA

Figura 4: Activacion visual frente a cognitiva. Coeficien-tes de agregado para cada region. En el eje de abcisas estarepresentado el ındice de cada region y en el de ordenadasel coeficiente.

Page 6: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4VISUAL VS AUDITIVA

Figura 5: Activacion visual frente a auditiva. Coeficientesde agregado para cada region. En el eje de abcisas esta re-presentado el ındice de cada region y en el de ordenadas elcoeficiente.

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4MOTORA VS COGNITIVA

Figura 6: Activacion motora frente a cognitiva. Coeficien-tes de agregado para cada region. En el eje de abcisas estarepresentado el ındice de cada region y en el de ordenadasel coeficiente.

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4MOTORA VS AUDITIVA

Figura 7: Activacion motora fente a auditiva. Coeficientesde agregado para cada region. En el eje de abcisas esta re-presentado el ındice de cada region y en el de ordenadas elcoeficiente.

0 2 4 6 8 10 120

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4COGNITIVA VS AUDITIVA

Figura 8: Activacion cognitiva frente a auditiva. Coeficien-tes de agregado para cada region. En el eje de abcisas estarepresentado el ındice de cada region y en el de ordenadasel coeficiente.

Page 7: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

biclasica, que son una aproximacion a la f.d.p de cada coe-ficiente. Para obtener las replicas, se realiza un remuestreobootstrap de 200 remuestras sobre los coeficientes de agre-gado, para cada clasificacion biclasica. Veanse las Figuras(9), (10), (11), (12), (13) y (14).

El resultado es que los histogramas obtenidos son bimodales,es decir, tienen una acumulacion de frecuencia en dos zonasdel histograma, y muy baja o nula frecuencia en el resto.En nuestro caso, la primera acumulacion de frecuencia esen el valor cero, y la segunda acumulacion comprende elresto de valores. Un posible criterio para determinar queregiones son mas relevantes para la clasificacion es obtenerel intervalo de confianza al 95% de cada coeficiente, y es-coger como relevantes aquellos coeficientes cuyo intervalo deconfianza no incluya el valor cero. Sin embargo, dada estabimodalidad, no ha sido posible utilizar este criterio, dadoque todos los intervalos de confianza contenıan el valor cero.Siendo conscientes de esta bimodalidad, una forma de de-cidir si un coeficiente es significativo o no es comparar elnumero de veces que aparecen los valores en torno a cerofrente al numero de veces que aparecen el resto de valores.Para utilizar este criterio, definimos un estadıstico v que,basandose en la informacion estadıstica que proporcionanlas replicas bootstrap, decidira cuando una region es signi-ficativa y cuando no lo es comparando las dos acumulacionesde frecuencia. Si la hipotesis 0 corresponde a que el coefi-ciente de agregado en cuestion (λj) no es significativo, y lahipotesis 1 a que sı lo es, es decir:

{H0 : λj = 0H1 : λj > 0

}

entonces el estadıstico v vendra dado por la expresion:

v =P (λj |H1)

P (λj |H0)(2)

Dado que estamos trabajando con histogramas y no con fun-ciones densidad de probabilidad, tendremos que definir unumbral para λj que separe la hipotesis H0 de la H1. El un-bral escogido, de manera cualitativa, es 0.05. Por lo tanto,el estadıstico v, definido en base al histograma, quedara dela siguiente forma:

v =#(λj > 0.05)

#(λj ≤ 0.05)(3)

donde #(A) se refiere al numero de veces que ocurre el sucesoA. Entonces, la hipotesis predicha sera H0 si hay mayornumero de replicas menores o iguales que 0.05 comparadocon las que son mayores que 0.05 (v ≤ 1), y sera H1 si ocurrelo contrario (v > 1), es decir:

{H0 : v ≤ 1H1 : v > 1

}

El umbral de 0.05 ha sido elegido sobre los histogramas demanera empırica. Por tanto, v es un estadıstico sencilloy que, sin duda, podrıa ser refinado en el futuro, pero enprincipio es una aproximacion valida y funcional.

Para probar los resultados del clasificador de agregado, quepondera las SVMs base con los coeficientes de agregadoobtenidos en la realizacion de la Seccion (4.1), se efectuaraotro remuestreo bootstrap para estimar la Pe real a partirde las observaciones de entrenamiento, obteniendose la Pe

0 0.5 10

10

20

30

40C

0 0.2 0.40

50

100

150

200F

0 0.2 0.40

20

40

60

80O

0 0.2 0.40

50

100

150

200P

0 0.2 0.40

50

100

150S

0 0.2 0.40

20

40

60

80

100T

(a)

0 0.2 0.40

10

20

30

40

50

60C

0 0.1 0.20

50

100

150

200F

0 0.2 0.40

20

40

60

80O

0 0.2 0.40

5

10

15

20

25

30P

0 0.2 0.40

50

100

150S

0 0.5 10

10

20

30

40

50T

(b)

Figura 9: Activacion visual frente a motora. (a) Histogra-mas correspondientes a las replicas de los coeficientes deagregado de los lobulos izquierdos. (b) Histogramas corres-pondientes a las replicas de los coeficientes de agregado delos lobulos derechos. C: cerebelo. F: frontal. O: occipital.P: parietal. S: subcortical. T: temporal.

Page 8: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

0 0.5 10

10

20

30

40C

0 0.5 10

10

20

30

40

50

60F

0 0.2 0.40

20

40

60

80O

0 0.2 0.40

50

100

150

200P

0 0.2 0.40

50

100

150S

0 0.5 10

10

20

30

40T

(a)

0 0.2 0.40

10

20

30

40

50C

0 0.2 0.40

20

40

60

80

100F

0 0.2 0.40

10

20

30

40

50

60O

0 0.2 0.40

50

100

150P

0 0.2 0.40

50

100

150S

0 0.5 10

10

20

30

40

50

60T

(b)

Figura 10: Activacion visual frente a cognitiva. (a) His-togramas correspondientes a las replicas de los coeficientesde agregado de los lobulos izquierdos. (b) Histogramas co-rrespondientes a las replicas de los coeficientes de agregadode los lobulos derechos. C: cerebelo. F: frontal. O: occipital.P: parietal. S: subcortical. T: temporal.

0 0.2 0.40

10

20

30

40

50C

0 0.2 0.40

20

40

60

80

100F

0 0.2 0.40

20

40

60

80O

0 0.2 0.40

50

100

150P

0 0.2 0.40

50

100

150S

0 0.5 10

10

20

30

40T

(a)

0 0.2 0.40

20

40

60

80C

0 0.2 0.40

50

100

150F

0 0.2 0.40

20

40

60

80

100O

0 0.2 0.40

10

20

30

40

50P

0 0.2 0.40

50

100

150S

0 0.5 10

5

10

15

20

25T

(b)

Figura 11: Activacion visual frente a auditiva. (a) His-togramas correspondientes a las replicas de los coeficientesde agregado de los lobulos izquierdos. (b) Histogramas co-rrespondientes a las replicas de los coeficientes de agregadode los lobulos derechos. C: cerebelo. F: frontal. O: occipital.P: parietal. S: subcortical. T: temporal.

Page 9: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

0 0.2 0.40

20

40

60

80C

0 0.5 10

20

40

60

80F

0 0.2 0.40

50

100

150O

0 0.2 0.40

50

100

150P

0 0.2 0.40

20

40

60

80S

0 0.2 0.40

20

40

60

80

100T

(a)

0 0.2 0.40

20

40

60

80

100C

0 0.5 10

10

20

30

40F

0 0.2 0.40

50

100

150O

0 0.5 10

10

20

30

40P

0 0.2 0.40

20

40

60

80

100S

0 0.5 10

20

40

60

80

100T

(b)

Figura 12: Activacion motora frente a cognitiva. (a) His-togramas correspondientes a las replicas de los coeficientesde agregado de los lobulos izquierdos. (b) Histogramas co-rrespondientes a las replicas de los coeficientes de agregadode los lobulos derechos. C: cerebelo. F: frontal. O: occipital.P: parietal. S: subcortical. T: temporal.

0 0.5 10

10

20

30

40

50C

0 0.2 0.40

20

40

60

80

100F

0 0.2 0.40

20

40

60

80O

0 0.2 0.40

50

100

150P

0 0.1 0.20

50

100

150

200S

0 0.2 0.40

5

10

15

20

25

30T

(a)

0 0.2 0.40

20

40

60

80C

0 0.2 0.40

20

40

60

80F

0 0.2 0.40

50

100

150O

0 0.2 0.40

5

10

15

20

25

30P

0 0.2 0.40

50

100

150

200S

0 0.2 0.40

20

40

60

80

100T

(b)

Figura 13: Activacion motora frente a auditiva. (a) His-togramas correspondientes a las replicas de los coeficientesde agregado de los lobulos izquierdos. (b) Histogramas co-rrespondientes a las replicas de los coeficientes de agregadode los lobulos derechos. C: cerebelo. F: frontal. O: occipital.P: parietal. S: subcortical. T: temporal.

Page 10: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

0 0.1 0.20

50

100

150C

0 0.2 0.40

20

40

60

80

100F

0 0.2 0.40

20

40

60

80

100O

0 0.2 0.40

10

20

30

40

50

60P

0 0.2 0.40

50

100

150S

0 0.2 0.40

50

100

150T

(a)

0 0.2 0.40

20

40

60

80

100C

0 0.5 10

5

10

15F

0 0.2 0.40

10

20

30

40

50

60O

0 0.5 10

5

10

15

20

25P

0 0.2 0.40

50

100

150S

0 0.2 0.40

10

20

30

40

50T

(b)

Figura 14: Activacion cognitiva frente a auditiva. (a) His-togramas correspondientes a las replicas de los coeficientesde agregado de los lobulos izquierdos. (b) Histogramas co-rrespondientes a las replicas de los coeficientes de agregadode los lobulos derechos. C: cerebelo. F: frontal. O: occipital.P: parietal. S: subcortical. T: temporal.

media y su intervalo de confianza del 95%. En este caso, elremuestreo bootstrap se utiliza a modo de diagnostico, dadoque todas las observaciones han sido utilizadas para entre-nar el algoritmo, no dejando ninguna para disponer de unconjunto de test sobre el que calcular la Pe.

En la Tabla (1) se muestra un resumen de las pruebas,con los valores los coeficiente de agregado obtenidos la real-izacion de la Seccion (4.1), junto con el valor del estadısticov obtenido sobre las 200 replicas generadas en esta seccion.

Notese que, en la tabla, se ha puesto un asterisco al lado delvalor del coeficiente de agregado que es significativo parala clasificacion, basandonos en el criterio del estadıstico v.Cada columna de la tabla se refiere a una de las distintasclasificaciones biclasicas, y cada fila a la region a la que cor-responde el coeficiente de agregado. Las activaciones son lassiguientes: visual (V), motora (M), cognitiva (C) y auditiva(A), y las regiones de la tabla, las que vienen a continuacion:

C-I: Lobulo cerebelo izquierdo.

F-I: Lobulo frontal izquierdo.

O-I: Lobulo occipital izquierdo.

P-I: Lobulo parietal izquierdo.

S-I: Lobulo subcortical izquierdo.

T-I: Lobulo temporal izquierdo.

C-D: Lobulo cerebelo derecho.

F-D: Lobulo frontal derecho.

O-D: Lobulo occipital derecho.

P-D: Lobulo parietal derecho.

S-D: Lobulo subcortical derecho.

T-D: Lobulo temporal derecho.

Como se observa en la Tabla (1), la mayorıa de las veces,el valor del coeficiente de agregado obtenido en una real-izacion esta en consonancia con el valor del estadıstico v,es decir, el valor del coeficiente es significativamente mayorque 0 cuando v es mayor que 1, o el valor del coeficiente esnulo o practicamente nulo cuando v es menor o igual a 1.No obstante, hay casos de la tabla en los que esto no ocurre,y podrıa parecer una contradiccion. Por ejemplo, el lobulooccipital izquierdo en la clasificacion visual frente a motoralleva asociado v = 1.2 y un coeficiente de agragado nulo;esto serıa como decir que esa region es relevante, y en cam-bio se ha obtenido un coeficiente de agregado de valor nulo.Esto es importante, porque puede que los coeficientes quese obtienen en una sola realizacion del algoritmo AdaboostDistribuido no esten reflejando fielmente la realidad. Es aquıdonde el la vision estadıstica del comportamiento de los co-eficientes de agregado cobra todo su sentido, pues sin estano habrıamos podido observar este comportamiento tan in-teresante.

La contradiccion aparente del lobulo occipital izquierdo enla clasificacion visual frente a motora puede comprenderse

Page 11: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

V/M V/C V/A M/C M/A C/AC-I 0.17∗ (3.8) 0.01∗ (3.9) 0.25∗ (2.6) 0.02 (1.0) 0.18∗ (2.2) 0.00 (0.1)F-I 0.00 (0.1) 0.00∗ (1.7) 0.00 (0.8) 0.23∗ (1.5) 0.14 (0.8) 0.00 (0.7)O-I 0.00∗ (1.2) 0.19∗ (1.2) 0.11 (0.9) 0.03 (0.4) 0.00∗ (1.1) 0.04 (0.7)P-I 0.00 (0.2) 0.00 (0.1) 0.00 (0.5) 0.12 (0.4) 0.09 (0.2) 0.20∗ (1.8)S-I 0.00 (0.3) 0.01 (0.6) 0.00 (0.3) 0.17∗ (1.2) 0.00 (0.0) 0.09 (0.4)T-I 0.00 (0.8) 0.37∗ (2.9) 0.10∗ (4.0) 0.07 (0.9) 0.28∗ (4.6) 0.03 (0.4)C-D 0.16∗ (1.9) 0.02∗ (2.5) 0.15∗ (1.3) 0.04 (0.8) 0.00 (0.9) 0.08 (0.7)F-D 0.00 (0.1) 0.00 (0.9) 0.05 (0.2) 0.13∗ (2.8) 0.01∗ (1.3) 0.18∗ (8.1)O-D 0.00∗ (1.2) 0.19∗ (2.1) 0.10 (0.8) 0.00 (0.4) 0.08 (0.2) 0.16∗ (2.0)P-D 0.33∗ (4.1) 0.00 (0.4) 0.09∗ (2.2) 0.19∗ (3.2) 0.22∗ (4.9) 0.15∗ (4.6)S-D 0.00 (0.5) 0.19 (0.2) 0.00 (0.2) 0.00 (0.7) 0.00 (0.1) 0.00 (0.5)T-D 0.33∗ (2.5) 0.02∗ (1.8) 0.15∗ (9.0) 0.00 (0.9) 0.00 (0.8) 0.06∗ (2.0)

Tabla 1: Tabla resumen de las pruebas. Se muestra el valor del coeficiente de agregado junto con el estadıstico v ( ). Elsımbolo (*) senala los coeficientes significativos.

observando el histograma correspondiente de la Figura (9).En el se aprecia la bimodalidad descrita anteriormente. Estabimodalidad, que se da en todos los histogramas, deberse ados causas:

• Una posible causa de que coeficientes significativos ten-gan valor nulo en una determinada realizacion es quehaya una colinealidad entre distintos coeficientes. Lacolinealidad se da cuando existen varias variables deun modelo (en nuestro caso las regiones funcionales)que son significativamente importantes y estan rela-cionadas entre sı, es decir, la correlacion lineal entre el-las es elevada. En nuestro caso, puede que el algoritmoAdaBoost Distribuido no este teniendo en cuenta todaslas regiones significativamente importantes, dado quesi encuentra una que contiene suficiente informacionpara llevar a cabo la clasificacion, se corre el peligro deque las demas regiones significativamente importantesno se tengan en cuenta. Entonces, puede que la clasifi-cacion se realice con mınimo error teniendo en cuentasolo una o unas pocas regiones importantes, pero deesta manera no se estan determinando todas las queson relevantes en la clasificacion.

La colinealidad podrıa explicar la bimodalidad de loshistogramas, en los que para las regiones significativasse obtiene una acumulacion de frecuencia en el valorcero, pero tambien en el resto de valores. Esto estarıaindicando que la region es significativa porque su coe-ficiente toma valores distintos de cero con mucha fre-cuencia, pero tambien estarıa indicando que en muchasrealizaciones no se esta teniendo en cuenta la regionen cuestion, pues su coeficiente vale cero tambien conmucha frecuencia.

• Dentro del algoritmo AdaBoost Distribuido, hay unacierta aleatoriedad en la eleccion del mejor clasificadorde cada ronda, por lo que hay veces que el mejor clasi-ficador escogido en una ronda determinada no se cor-responde con el que menor error ponderado obtieney, por tanto, el valor del coeficiente de agregado delmejor clasificador de la ronda no se incrementa. Si estoocurre muchas veces, coeficientes importantes puedenquedar con un valor nulo o muy pequeno. La aleato-riedad mencionada anteriormente se utiliza para que,en el caso de haber regiones comparativamente mucho

Pe sin estadıstico Pe con estadısticoV/M 0.03 (0.00 , 0.07) 0.02 (0.00 , 0.07)V/C 0.06 (0.00 , 0.13) 0.03 (0.00 ,0.07 )V/A 0.03 (0.00 , 0.07) 0.01 (0.00 , 0.06)M/C 0.07 (0.02 , 0.15) 0.08 (0.02 , 0.15)M/A 0.17 (0.07 , 0.26) 0.16 (0.07 , 0.26)C/A 0.10 (0.04 , 0.20) 0.09 (0.02 , 0.17)

Tabla 2: Tabla con los resultados de aplicar el remuestreobootstrap a la Pe calculada sobre el conjunto de entre-namiento utilizando el clasificador agregado. La primeracolumna usa los coeficientes tal cual, y la segunda utilizalos coeficientes modificados segun el criterio del estadısticov.

mas importantes que las demas en la clasificacion, no seescojan siempre estas como mejores en cada ronda. Deesta manera, intentamos que otras regiones que tam-bien son relevantes no sean tapadas por otras compar-ativamente mas influyentes en la clasificacion.

Para probar los resultados que ofrecen los coeficientes, loscombinamos en el clasificador de agregado y hallamos la Pe

que se comete en cada una de las clasificaciones (vease laprimera columna de la Tabla (2)). Para ello, y dado quetodas no han quedado observaciones para disponer de unconjunto de test, se realiza un remuestreo bootstrap de 250remuestras sobre la Pe del clasificador agregado sobre lasobservaciones disponibles en cada clasificacion. Con esto sepretende obtener una medida cuantitativa aproximada de laPe que se esta cometiendo. Ahora bien, como ya disponemosde los valores del estadıstico v, podemos ya corregir los co-eficientes de la siguiente manera:

• Si v ≤ 1, entonces el valor del coeficiente pasa a ser 0(no significativo).

• Si v > 1, entonces el valor del coeficiente pasa a serla media de las replicas de los coeficientes de agregadoque son mayores que el umbral 0.05 (significativo).

Los coeficientes de agregado modificados segun este crite-rio se muestran en la Tabla (3). Los resultados que ofrece

Page 12: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

V/M V/C V/A M/C M/A C/AC-I 0.22 0.18 0.15 0.21F-I 0.16 0.16O-I 0.17 0.13 0.15P-I 0.16S-I 0.16T-I 0.19 0.21 0.22C-D 0.17 0.17 0.15F-D 0.19 0.19 0.24O-D 0.17 0.15 0.16P-D 0.20 0.17 0.19 0.21 0.19S-DT-D 0.22 0.18 0.25 0.16

Tabla 3: Tabla en la que se muestra el valor de los coe-ficientes de agregado significativos y corregidos mediante elcriterio del estadıstico v.

pueden verse en la segunda columna de la Tabla (2)). Com-parando ambas columnas, vemos que hay una tendencia aque la Pe disminuya cuando utilizamos los coeficientes mo-dificados.

5. CONCLUSIONESEn este Trabajo se ha estudiado la influencia que ejercen lasactivaciones visual, motora, cognitiva y auditiva sobre lasdistintas regiones funcionales del cerebro, conviertiendo esteestudio en un problema de clasificacion. Para ello, se ha uti-lizado el algoritmo de boosting AdaBoost Distribuido conSVMs como clasificadores base, y el remuestreo bootstrapcomo herramienta estadıstica para la seleccion de los coe-ficientes significativos. Las observaciones disponibles hansido imagenes de fMRI del cerebro, asociadas a diferentesactivaciones cerebrales.

En las primeras secciones se ha realizado un analisis teoricode las herramientas utilizadas, como lo son la SVM, el re-muestreo bootstrap y el algoritmo AdaBoost Distribuido.Despues de esto, hemos llegado al punto de analizar las ima-genes de fMRI en las que se basa el Trabajo. Se utilizo el al-goritmo AdaBoost Distribuido, el cual expresa la relevanciade cada region funcional en la clasificacion. Intentando sim-plificar el problema, se penso en reducir la solucion a regionessignificativas y no significativas. Dado que aparecieron re-giones en las que existıa duda respecto a cual de las dosopciones asignarle, se utilizo el remuestreo bootstrap conel fin de obtener una vision estadıstica que resolviera nue-stro problema, que pudiera ver de manera global el compor-tamiento de cada region y no solo una realizacion del algo-ritmo. Finalmente, se probaron los resultados utilizando elremuestreo bootstrap, a modo de diagnostico, para estimarla Pe cometida.

Notese que, dada la baja cantidad de observaciones, parael algoritmo AdaBoost Distribuido no se ha utilizado unconjunto de test para probar los resultados, sino que se hapreferido utilizar todas las observaciones disponibles parael entrenamiento, para ası acercarnos lo mas posible a larealidad. En teorıa, el algoritmo AdaBoost Distribuido vadecrementando la Pe sobre el conjunto de entrenamiento, yno produce sobreajuste, siempre que los clasificadores baseutilizados obtengan una Pe menor que 0.5. Ademas, in-ternamente en el algoritmo, se dividen las observacionesdisponibles en observaciones locales para el entrenamientode los clasificadores base y en las observaciones de agregado,que se utilizan para calcular el error ponderado de los clasi-ficadores base, en cada ronda. Estas ultimas observacionesactuarıan, de alguna manera, como conjunto de test. Noobstante, a modo de diagnostico, se realiza un remuestreobootstrap para estimar la Pe, dando un intervalo de confi-anza que nos da una idea de la calidad de los resultados.

Como lıneas lıneas futuras de este Trabajo cabe citar lassiguientes:

• Comprobar, ya sea mediante la experiencia o medianteotros resultados, la validez definitiva y el verdaderoalcance de estos resultados preliminares.

• Puede contemplarse el uso de otro kernel para las SVMsmas complejo, en lugar de lineal, para ver si los resul-tados mejoran.

• Puede ampliarse el estudio utilizando otros esquemasde clasificacion multiclasica, como puede ser el metodouno-contra-todos, que permitirıa contrastar resultados.

Page 13: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

• Profundizar en el fenomeno de la colinealidad, y enpruebas adicionales para su deteccion.

6. REFERENCIAS[1] Jean-Philippe Vert. Introduction to support vector

machines and applications to computational biologyDRAFT. 2001.

[2] Chih-Wei Hsu and Chih-Jen Lin. A Comparison ofMethods for Multiclass Support Vector Machines. IEEEtransactions on neural networks. Vol. 13, No. 2, March2002.

[3] Vapnik, V. The Nature of Statistical Learning Theory.Springer. N.Y. 1995.

[4] Yoav Freund and Robert E. Schapire. A ShortIntroduction to Boosting. AT&T Labs - Research. 1999.

[5] Vladimir Koltchinskii, Manel Martınez-Ramon andStefan Posse. Optimal Aggregation of Classifiers andBoosting Maps in functional Magnetic ResonanceImaging. 2004.

[6] Jose Luis Rojo Alvarez, Angel Arenal Maız y AntonioArtes Rodrıguez. Discriminating BetweenSupraventricular and Ventricular Tachycardias fromEGM Onset Analysis. Support Vector Preprocessingand Incremental Learning Approaches for IncreasedSensitivity and Specificity of ICDs. Escuela PolitecnicaSuperior, Universidad Carlos III de Madrid.Department of Cardiology, Hospital GU GregorioMaranon, Madrid. IEEE Engineering in Medicine andBiology. 2002.

[7] Jose Luis Rojo Alvarez, Angel Arenal Maız y AntonioArtes Rodrıguez. Support Vector Black-BoxInterpretation un Ventricular ArrhythmiaDiscrimination. The Advantages of the Support VectorMethod Make It Attractive for Clinical Applications.Escuela Politecnica Superior, Universidad Carlos III deMadrid. Department of Cardiology, Hospital GUGregorio Maranon, Madrid. IEEE Engineering inmedicine and biology. 2002.

[8] Joseph D. Bronzino. The Biomedical EngineeringHadbook. CRC Press and IEEE Press. 1995.

[9] Bradley Efron and Robert J. Tibshirani. An Introduction tothe Bootstrap. Chapman & Hall, Inc. 1993.

APÉNDICEA. BASE DE IMÁGENES UTILIZADAS EN

LAS PRUEBASEn este apendice se da una descripcion de la base de ima-genes de resonancia magnetica (fMRI: functional MagneticResonance Imaging) utilizadas en este Trabajo. Para mayorprofundidad, vease [8].

La imagen de resonancia magnetica funcional (fMRI) es unatecnica que permite plasmar en una imagen el grado de ac-tividad neuronal, debida a una activacion cerebral causadapor un estımulo o accion, utilizando la resonancia magneticacomo metodo de deteccion. Los cambios en la actividad neu-ronal estan acompanados de cambios focalizados en la oxi-genacion sanguınea del cerebro, que se miden con la senalBOLD (del ingles, Blood Oxigenation Level Dependent). Latecnica se basa en observar la diferencia en la senal de re-sonancia magnetica con el tiempo. Ası, cuando se da una

actividad neuronal focalizada en un tejido, aumenta la can-tidad de oxihemoglobina y se reduce la de deoxihemoglobinaen el flujo venoso, y esto es lo que se detecta con la resonan-cia magnetica.

Las principales ventajas del uso de las imagenes fMRI frentea otras imagenes, como las imagenes PET (Positron Emis-sion Tomography) son que ofrecen un alto contraste en lostejidos blandos, y que se trata de una tecnica no invasivapara el paciente.

La base de imagenes de fMRI utilizadas en este Trabajoconsiste en 217 imagenes tomadas de 18 voluntarios sanosmediante un escaner Siemens Sonata con una intensidad decampo de 1.5 Teslas, y mediante un escaner Broker MedSpecde 4.0 Teslas.

Los tipos de activacion que se van a considerar son: visual,motora, cognitiva y auditiva. Para ello, mientras los volun-tarios se encontraban en el escaner, se les sometio a dife-rentes estımulos y acciones para lograr las activaciones cere-brales descritas anteriormente. Estos estımulos y accionesse explican a continuacion:

• Visual: estimulacion mediante una senal luminosa conuna frecuencia de 8 Hz. La senal luminosa consistio enla imagen de un tablero de ajedrez.

• Motora: estimulacion mediante activacion de un trans-ductor compatible con escaneres de resonancia mag-netica, con dedo ındice de la mano derecha y con unafrecuencia de 2 Hz.

• Cognitiva: estimulacion mediante calculo mental. Elcalculo se baso en sumar tres numeros, escuchados porunos auriculares, y dividir la suma entre tres. El sujetodebıa pulsar el transductor cuando el resultado fueseentero.

• Auditiva: estimulacion basada en la discriminacion desılabas. Se pidio a los voluntarios que pulsaran sobreun boton al escuchar sılabas ’Ta’ frente a otras como’Ah’, ’Ba’, ’Ja’, ’Ca’, ’Ra’.

Las imagenes obtenidas tienen un tamano o campo de vista(FOV: Field Of View) de 64 × 64 × 36 voxels. La resolu-cion de las imagenes es de 4× 4× 4 milımetros. Cada voxelrepresenta la intensidad de cambio de la senal BOLD. Sedispone de 54 imagenes correspondientes a la activacion vi-sual, 55 correspondientes a la activacion motora, 54 corres-pondientes a la activacion cognitiva y 54 correspondientes ala activacion auditiva. Puede verse un ejemplo de una ima-gen correspondiente a cada tipo de activacion en la Figura(15).

Finalmente, para poder dividir los datos segun las diferentesregiones funcionales, que son:

1. Lobulo cerebelo izquierdo.

2. Lobulo frontal izquierdo.

3. Lobulo occipital izquierdo.

4. Lobulo parietal izquierdo.

5. Lobulo subcortical izquierdo.

Page 14: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

(a) (b)

(c) (d)

Figura 15: Ejemplos de imagenes de fMRI de cada tipo de activacion. La representacion de las imagenes son cortes dearriba a abajo del cerebro. (a) Imagen correspondiente a una activacion visual. (b) Imagen correspondiente a una activacionmotora. (c) Imagen correspondiente a una activacion cognitiva. (d) Imagen correspondiente a una activacion auditiva.

6. Lobulo temporal izquierdo.

7. Lobulo cerebelo derecho.

8. Lobulo frontal derecho.

9. Lobulo occipital derecho.

10. Lobulo parietal derecho.

11. Lobulo subcortical derecho.

12. Lobulo temporal derecho.

se utiliza la mascara de la Figura (16). Esta figura con-tiene las llamadas areas de Broadman, que corresponden condiferentes estructuras del tejido cerebral en el cortex (ma-teria gris), mas las areas estructurales del cerebelo. Paraconseguir las regiones funcionales arriba mencionadas, sehan reagrupado convenientemente las areas de Broadman ydel cerebelo. Gracias a esta mascara pueden introducirselos datos correspondientes a cada region en el algoritmoAdaBoost Distribuido de una manera sencilla.

Page 15: Estudio mediante SVM, Boosting Bootstrap de la relevancia de las … · 2007. 1. 10. · Estudio mediante SVM, Boosting y Bootstrap de la relevancia de las regiones funcionales en

Figura 16: Mascaras utilizadas para dividir los datos segun las regiones funcionales. Se representan los cortes de arriba aabajo del cerebro.


Recommended