+ All Categories
Home > Documents > Aplicación de detección de objetos y algoritmo de Viola ...

Aplicación de detección de objetos y algoritmo de Viola ...

Date post: 20-Nov-2021
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
7
2019 14th Iberian Conference on Information Systems and Technologies (CISTI) 19 – 22 June 2019, Coimbra, Portugal ISBN: 978-989-98434-9-3 Aplicación de detección de objetos y algoritmo de Viola Jones para el desarrollo de una base de datos en pacientes de Alzheimer Object detection application and Viola Jones algorithm for the development of a database in Alzheimer's patients David Ricardo Castillo Salazar Universidad Tecnológica Indoamérica Ambato, Ecuador [email protected] Universidad Nacional de la Plata Argentina, La Plata [email protected] Héctor Fernando Gómez Alvarado Universidad Técnica de Ambato Ambato, Ecuador [email protected] Cesar Byron Guevara Maldonado Universidad Tecnológica Indoamérica Quito, Ecuador [email protected] Laura Lanzarini Instituto de Investigación en Informática LIDI (Centro CICPBA) Facultad de Informática, Universidad Nacional de la Plata La Plata, Buenos Aires, Argentina [email protected] Resumen El Alzheimer, así como otras enfermedades neurológicas, altera de manera progresiva las capacidades de comunicación de las personas que lo padecen. En estos casos, los gestos faciales constituyen un medio de comunicación muy importante y su tratamiento es el objetivo central de esta investigación. Este artículo describe la creación de una base de datos con información de pacientes con Alzheimer representado en imágenes de rostros, respetando la ética y basándose en la parte normativa de los permisos concedidos, estos centros de cuidados para ancianos se encuentran en distintos cantones de Ambato - Ecuador, que será utilizada posteriormente en investigaciones relacionadas con el reconocimiento de gestos faciales. Se trabajó con una población de 61 personas diagnosticadas con Alzheimer, cuyas edades fluctúan entre 69 a 98 años. Los datos obtenidos en imágenes fueron procesados aplicando el método Viola-Jones, para detectar objetos de manera visual de forma rápida y precisa, el método utilizado es el algoritmo de neighbords en conjunto con la técnica de los bordes de canny. Como resultado se logró confeccionar una base de datos depurada que incluye las imágenes de los rostros de los pacientes, en escala de grises, utilizando alta resolución. Esto constituye un insumo importante para futuras investigaciones en el área de la salud. Se concluye que la información obtenida es de calidad y presión para futuros análisis. Palabras Clave – Enfermedad de Alzheimer; detección de objetos, algoritmo Viola-Jones Abstract — Alzheimer's, as well as other neurological diseases, alters progressively the communication abilities of people who suffer from it. In these cases, facial gestures are a very important means of communication and their treatment is the central objective of this investigation. This article describes the creation of a database with the information of patients with Alzheimer's disease represented on faces’ images, respecting the etic and based on the normative and respective permissions, these care centers for the elderly people are located in different cantons of Ambato, Ecuador, which will be used later in investigations related to the recognition of facial gestures. It has worked with a population of 61 people diagnosed with Alzheimer's, between 69 and 98 years old. The data obtained on the images were processed using the Viola-Jones method, making it possible to detect objects quickly and accurately. This method used the algorithm of neighbors with the canny border’s technique. As a result, it was possible to create a database that includes the images of the patients' faces, in a gray scale, using high resolution. This constitutes an important input for future research on the health subjects. It is concluded that the information obtained is of quality and pressure for future analysis. Keywords – Alzheimer disease; object detection, Viola-Jones algorithm I. INTRODUCCIÓN Los gestos faciales, en el contexto de la evolución humana, permiten expresar emociones y difundir mensajes. En el área
Transcript
Page 1: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

Aplicación de detección de objetos y algoritmo de Viola Jones para el desarrollo de una base de datos en

pacientes de Alzheimer

Object detection application and Viola Jones

algorithm for the development of a database in

Alzheimer's patients

David Ricardo Castillo Salazar Universidad Tecnológica Indoamérica

Ambato, Ecuador [email protected]

Universidad Nacional de la Plata Argentina, La Plata

[email protected]

Héctor Fernando Gómez Alvarado Universidad Técnica de Ambato

Ambato, Ecuador [email protected]

Cesar Byron Guevara Maldonado Universidad Tecnológica Indoamérica

Quito, Ecuador [email protected]

Laura Lanzarini

Instituto de Investigación en Informática LIDI (Centro CICPBA) Facultad de Informática, Universidad Nacional de la Plata

La Plata, Buenos Aires, Argentina [email protected]

Resumen —El Alzheimer, así como otras enfermedades neurológicas, altera de manera progresiva las capacidades de comunicación de las personas que lo padecen. En estos casos, los gestos faciales constituyen un medio de comunicación muy importante y su tratamiento es el objetivo central de esta investigación. Este artículo describe la creación de una base de datos con información de pacientes con Alzheimer representado en imágenes de rostros, respetando la ética y basándose en la parte normativa de los permisos concedidos, estos centros de cuidados para ancianos se encuentran en distintos cantones de Ambato - Ecuador, que será utilizada posteriormente en investigaciones relacionadas con el reconocimiento de gestos faciales. Se trabajó con una población de 61 personas diagnosticadas con Alzheimer, cuyas edades fluctúan entre 69 a 98 años. Los datos obtenidos en imágenes fueron procesados aplicando el método Viola-Jones, para detectar objetos de manera visual de forma rápida y precisa, el método utilizado es el algoritmo de neighbords en conjunto con la técnica de los bordes de canny. Como resultado se logró confeccionar una base de datos depurada que incluye las imágenes de los rostros de los pacientes, en escala de grises, utilizando alta resolución. Esto constituye un insumo importante para futuras investigaciones en el área de la salud. Se concluye que la información obtenida es de calidad y presión para futuros análisis.

Palabras Clave – Enfermedad de Alzheimer; detección de

objetos, algoritmo Viola-Jones

Abstract — Alzheimer's, as well as other neurological diseases, alters progressively the communication abilities of people who suffer from it. In these cases, facial gestures are a very important means of communication and their treatment is the central objective of this investigation. This article describes the creation of a database with the information of patients with Alzheimer's disease represented on faces’ images, respecting the etic and based on the normative and respective permissions, these care centers for the elderly people are located in different cantons of Ambato, Ecuador, which will be used later in investigations related to the recognition of facial gestures. It has worked with a population of 61 people diagnosed with Alzheimer's, between 69 and 98 years old. The data obtained on the images were processed using the Viola-Jones method, making it possible to detect objects quickly and accurately. This method used the algorithm of neighbors with the canny border’s technique. As a result, it was possible to create a database that includes the images of the patients' faces, in a gray scale, using high resolution. This constitutes an important input for future research on the health subjects. It is concluded that the information obtained is of quality and pressure for future analysis. Keywords – Alzheimer disease; object detection, Viola-Jones algorithm

I. INTRODUCCIÓN Los gestos faciales, en el contexto de la evolución humana,

permiten expresar emociones y difundir mensajes. En el área

Page 2: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

de la salud, se han realizado numerosos estudios relacionando este tema con determinadas patologías siendo las neurológicas las que han recibido la mayor atención. En el ámbito de la salud y de manera especial en las personas de la tercera edad con enfermedades neurológicas como el Alzheimer, es de vital interés analizar los rostros de estos pacientes. Existen en la literatura diferentes artículos orientados a determinar la incidencia que tiene el grado de avance de la enfermedad en las expresiones faciales de estos pacientes, el proceso tecnológico involucra la generación de las imágenes de estos rostros en imágenes a escala de grises.

En el desarrollo de esta base de datos, el trabajo se centra en la implementación del algoritmo de viola jones para generar un banco imágenes de pacientes de Alzheimer

En el artículo desarrollado por [1], se presenta la detección de rostros humanos heterogéneos en una imagen infrarroja y térmica e intenta mejorar la precisión de un algoritmo que fue diseñado con el fin de detectar rostros visibles, concluye que la aplicación de varias técnicas como el modelo YCbCr, ecualización de histogramas y CLAHE que mejora la visibilidad de las características en las imágenes.

El artículo desarrollado por [2], manifiesta que uno de los objetos más específicos que se pueden rastrear en las imágenes son las personas y de manera especial el rostro, para ello se cumple con el procedimiento de reconocimiento, análisis facial y la detección de ciertas características de la cara. Se analizan distintos algoritmos de detección como Viola Jones, características SMQT y el clasificador SNOW, el estudio se basa en redes neuronales y en la máquina de soporte vectorial. Se determina que el mejor algoritmo es Viola Jones.

El análisis de expresiones faciales a través de aplicaciones informáticas inicia con la detección de rostros. Este es un tema de sumo interés en numerosas áreas entre las que se destacan la salud, la seguridad y el control de accesos. El avance tecnológico ha tenido un fuerte impacto en el desarrollo de aplicaciones informáticas para la detección de rostros. Actualmente numerosos dispositivos cuentan con aplicaciones integradas que realizan esta tarea. Esto involucra procesos automáticos capaces de identificar una cara en una imagen o vídeo digital mediante el análisis de características del rostro en diferentes situaciones o estados de ánimo [3]. También pueden encontrarse soluciones como la propuesta en [1], donde se presenta la detección de rostros en una imagen heterogénea, infrarroja y térmica. Si bien este tipo de imagen no se ajusta exactamente a lo tratado en este artículo, es una alternativa interesante a la hora de tener que utilizar diferentes técnicas como el modelo YCbCr, ecualización de histogramas y CLAHE para mejorar la visibilidad de las características en una imagen.

En particular, en el área de la salud existen distintas soluciones propuestas, como la propuesta en [4], donde se desarrolló una interfaz hombre-máquina para personas con discapacidad motriz. En este trabajo el objetivo central fue el desarrollo de un reconocedor de gestos faciales generados con los ojos y la boca. Dichos gestos, luego de ser reconocidos, fueron utilizados para comandar dispositivos con una performance muy buena.

En [5] se analizó la expresión facial y emocional en pacientes que requirieron tratamiento de psicoterapia. En este estudio se propuso un sistema de reconocimiento de emociones faciales combinando el detector de objetos de Viola-Jones y el descriptor Edge-Histogram of Oriented Gradients (E-HOG). Este tipo de soluciones, complementadas con información proveniente de sesiones de psicoanálisis, la misma que ha demostrado ser muy eficiente.

En el estudio desarrollado por [6], se definió un modelo de variable latente de proceso gaussiano discriminativo compartido (DS-GPLVM), para la clasificación de expresiones faciales invariante al punto de vista. Para ello, primero se efectuó el aprendizaje de una variedad discriminativa, donde se compartió múltiples vistas de una expresión facial. Luego, se definió un clasificador (que tiene en cuenta las distintas vistas de una misma expresión facial). Finalmente, como resultado pudo realizarse la clasificación de una expresión facial observada de manera invariable al punto de vista, ya sea usando solo una única vista o bien usando múltiples vistas de la expresión.

En la investigación desarrollada por [7], se describió el uso del algoritmo AdaBoost para construir un clasificador visual de objetos a partir del uso de las características de Haar en cascada. En este caso particular, fue aplicado a un conjunto de imágenes en dos etapas, la primera para detectar la presencia de rostros y la segunda para determinar cuáles de ellos estaban sonriendo.

Otro artículo relacionado es el presentado por [8], donde se detectaron caras y se localizaron rasgos faciales en una imagen usando el detector de objetos en cascada Viola-Jones. La cara, los ojos, la nariz y la boca de un ser humano se detectan en un conjunto aleatorio de muestras y son analizados a fondo. Además, se proponen algunas variantes a la hora de calcular las características Haar utilizando cocientes evaluados sobre la información extraída de las áreas de interés de la imagen. Según los autores, estas características favorecen cierto tipo de rostros.

Los trabajos mencionados previamente evidencian la importancia del reconocimiento de rostros y partes faciales en distintos contextos. En todos ellos se hace uso, en mayor o menor medida, el método Viola-Jones.

En este artículo se propone la creación de una base de imágenes de rostros de personas con Alzheimer. El proceso se centra en tres etapas: la primera es la captura de la imagen de la persona de manera frontal, la segunda es la detección del rostro y de cada uno de los objetos que se encuentran en su interior (ojos, nariz y boca). La tercera comprende el procesamiento del área del rostro, en escala de grises, por medio del cual se determina el contorno de todos los objetos ubicados en su interior con el objetivo de acentuar los rasgos principales.

El artículo está estructurado de la siguiente manera: en la sección dos se presentan los métodos y materiales utilizados, en este estudio. En la sección tres se describe el proceso de obtención de los datos y el modelo propuesto para la detección facial de los pacientes con Alzheimer. En la sección cuatro se presentan los resultados obtenidos. finalmente, en la sección

Page 3: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

cinco se exponen las conclusiones del estudio realizado y líneas futuras de investigación.

II. MÉTODOS Y MATERIALES En la siguiente sección se presenta el método de Viola Jones que tiene una base en la detección de objetos. Los métodos utilizados son Viola Jones es un método para la detección de objetos que se usa en la detección de rostro en imágenes. Además, se aplica la escala de grises, donde el método RGB es utilizado para convertir una imagen con múltiples colores a una imagen monocromática. Por otro lado, se mejoran el contorno de las formas en la imagen aplicando el aumento de características (Canny), usado para detectar los bordes existentes en una imagen. Y finalmente, se utiliza una base de datos que contendrá la información digital de las imágenes originales y procesadas de los pacientes de Alzheimer.

A. Métodos

Algoritmo de Viola Jones El método utilizado en este trabajo para detectar rostros es

el detector de objetos definido por Viola y Jones en [9]. Su correcto funcionamiento requiere de imágenes donde los rostros se encuentren ubicados en forma vertical, de frente a la cámara y sin ninguna oclusión. Si bien parece que estas restricciones podrían disminuir un poco la utilidad del algoritmo, en la práctica estos límites en la postura son bastante aceptables.

El algoritmo tiene cuatro etapas: la selección de las características de Haar, la creación de la imagen integral para facilitar el cálculo de las características anteriores, el entrenamiento utilizando el algoritmo Adaboost y la obtención de clasificadores en cascada.

La Fig. 1 ilustra los tres tipos de características rectangulares utilizados. El valor de una característica de dos rectángulos es la diferencia entre la suma de los píxeles dentro de dos regiones rectangulares. Las regiones tienen el mismo tamaño y forma y están adyacentes horizontal y verticalmente. Una característica de tres rectángulos calcula la suma dentro de dos rectángulos externos que se restan de la suma en un rectángulo central. Finalmente, una característica de cuatro rectángulos calcula la diferencia entre pares diagonales de rectángulos.

Figura 1. Características de dos (A y B), tres (C) y cuatro (D) rectángulos. La suma de los píxeles que se encuentran dentro de los rectángulos blancos se resta de la suma de píxeles en los rectángulos grises [10].

Con el objetivo de reducir el tiempo de cálculo necesario para evaluar características rectangulares de distintas zonas de la

imagen a diferentes escalas, el método utiliza una nueva representación de la imagen denominada Imagen Integral que se calcula en la ecuación (1).

(1)

Donde es el valor de la posición de la imagen integral e es el valor del pixel de la imagen original en

. La imagen integral puede calcularse en una única pasada de la imagen original si se acumula la suma por filas en otra matriz auxiliar [10].

El método de Viola-Jones utiliza una variante de AdaBoost tanto para seleccionar un pequeño conjunto de características como para entrenar al clasificador. Es importe considerar que el número de características rectangulares asociadas con cada región de la imagen es muy superior al número de píxeles. Aunque cada característica se puede calcular de manera muy eficiente, calcular el conjunto completo es prohibitivamente costoso. Por lo tanto, resulta fundamental encontrar las características adecuadas. Esto se logra entrenando en un algoritmo de aprendizaje débil con capacidad para seleccionar la función rectangular que mejor separa los ejemplos positivos de los negativos. Para cada función, el aprendiz débil determina la función de clasificación de umbral óptima, de manera que el número de ejemplos erróneamente clasificados sea mínimo.

Las características se calculan a partir de los distintos filtros con base Haar. Los filtros rectangulares pueden ser calculados a partir de la imagen integral ya que son filtros selectivos en la orientación espacial y frecuencial. El objetivo es ir modificando la escala y orientación para una búsqueda más rápida [11]. Cada uno corresponde a una característica distinta. La Figura 1 muestra características de dos , tres y cuatro rectángulos. En cada caso el valor se calcula restando la suma de los píxeles que se encuentran dentro de los rectángulos blancos de la suma de píxeles en los rectángulos grises.

Figura 2: La suma de los píxeles dentro del rectángulo D se puede calcular con cuatro referencias matriciales de la imagen integral [10].

La imagen integral permite el cálculo de la suma de todos los pixeles dentro de cualquier rectángulo dado, utilizando solo 4 valores en las esquinas del rectángulo, representadas por las letras A, B, C, D.

Si se observa la Fig. 2, la suma de los píxeles dentro del rectángulo se puede calcular con cuatro referencias matriciales de la imagen integral. El valor de la imagen integral en la ubicación 1 es la suma de los píxeles en el rectángulo . El valor en la ubicación es , en la ubicación es

, y en la ubicación 4 es . Luego, la suma dentro de se puede calcular como .

Page 4: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

El tratamiento de las imágenes fue realizado utilizando librerías de técnicas de aprendizaje de máquina que contiene OpenCV en lenguaje de C# [12]. La tabla I ejemplifica las transformaciones realizadas en cada caso, las mismas que han sido reconocidas adecuadamente por el clasificador de rostros Haar Cascade [13].

Modelo RGB (Algoritmo de escala de grises)

La investigación realizada por [14] presenta un método efectivo de detección de rostros para imágenes en color con un fondo complejo, el modelo de color RGB (Red, Green, Blue) se encuentra descompuesto en tres componentes espectrales primarios de rojo, verde y azul, al combinar las distintas intensidades de estros tres colores primarios, se obtiene los colores visibles, el mismo se encuenta basado en un sistema de coordenadas cartesianas. La formula de normalización se representa en (2).

(2)

Al contar con 8 bits para representar una imagen en cada canal (R,G,B) una imagen a color tiene una profudidad de 24 bits, tambien llamada imagen de color real o de 16 millones,

=16.777.216. Algoritmo Canny de mejoramiento de características en las imágenes

El propósito de desarrollo del algoritmo de Canny es la detección de bordes considerándose óptima en una buena detección, localización y respuesta mínima, sus etapas se concentran en la reducción de ruido y en la intensidad del gradiente de la imagen.

El artículo de [15] se centra en un enfoque hibrido basado

en el borde para la detección de rostros utilizando el clasificador de redes neuronales y el método de Canny este algoritmo permite detectar las vistas frontales verticales del rostro humano permitiendo la extracción del rasgo facial.

B. Materiales

Los datos para esta investigación han sido tomados de varios centros de cuidados para ancianos con pacientes de Alzheimer en distintos cantones de Ambato – Ecuador. La base de datos consta de un total de 55 personas, entre hombres y mujeres con edades entre los 69 a 76 años para los hombres y 70 a 98 años en mujeres. Los pacientes fueron seleccionados por psicólogos que identificaron a los pacientes que cumplen con los criterios neurológicos para posteriormente proceder a registrar las evidencias fotográficas en el tiempo dispuesto de cada uno de los centros gerontológicos con el consentimiento informado de los pacientes [16].

Tabla I. Conjunto de imágenes procesadas. Id Imagen Original Detección de objetos

Rostro Imagen Escala

De Grises 1

… … … …

55

El procedimiento desarrollado requirió de

equipamiento específico conformado por un equipo portátil, una webcam y una cámara fotográfica. En lo relacionado al Software se trabajó con Visual Studio 2015 y los lenguajes compatibles con .NET como es el caso de C# que permite la utilidad con EmguCv como una plataforma cruzada para la librería de procesamiento de imágenes OpenCv.

En la siguiente sección se presenta el desarrollo del modelo

propuesto de detección de rostros y pre procesamiento de imágenes.

III. DESARROLLO DEL MODELO El modelo propuesto tiene un enfoque de aprendizaje para la

detección de objetos con la facilidad de procesar imágenes extremadamente rápido con una tasa de detección alta en pacientes de Alzheimer.

Las etapas del modelo se describen a continuación:

Detección de objetos

La detección de los rostros se realizó de manera eficiente en una imagen original de 100x100 pixeles para este estudio. Se identificaron tres etapas (Fig. 3). La etapa 1, da paso a la imagen integral que es generar una nueva imagen que permite la evaluación de la función rápidamente. La etapa 2, emplea los filtros complejos de características , que se usan basados en la función de base Haar [17]. El objetivo de esta función es garantizar una clasificación rápida, mediante la selección de un pequeño número de características importantes. Finalmente, en la etapa 3 se genera la imagen en escala de grises para detectar las regiones de interés en la imagen [18].

Filtrado de Grises

El filtro de escala de grises es un proceso que parte desde una imagen obtenida por una cámara digital, estándares en color. Estas imágenes son matrices de puntos denominadas pixeles, las mismas que representan la menor unidad homogénea dentro de la imagen. La imagen en color está formada por tres canales RGB correspondiendo a rojo, verde y azul. Y, por lo tanto, cada pixel viene dado por tres valores numéricos que están entre el rango de cero a 255.

En la investigación desarrollada por [19] presenta un enfoque de la aplicabildad de la técnica en la deteccón de rostros basadas en el color de la piel, el procedimeinto se fundamenta en la entrada de la imagen que cambia de tamaño y se corrige la luminosidad, la misma se convierte a escala de grises y se aplica la detección de bordes usando el modelo canny que permite la generación del cuadro delimitador obteniendo como resultado el rostro detectado.

Page 5: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

Figura 3. Proceso para el rostro detectado.

Las características más importantes que se usaron para la evaluación del rostro se fundamentan en dos propiedades. La primera es la zona de los ojos es a menudo más oscura que la región de la nariz y las mejillas. La segunda es que los ojos son más oscuros que el puente de la nariz, como lo presenta la Fig. 4 [20].

Figura 4. Propiedades de la zona del rostro.

En el artículo presentado por [19] se manifiesta la localización de la cara en la imagen luego del proceso de segmentación, para ello se separa el fondo de la región de la cara usando los bordes de la imagen. Los métodos comunes de detección de bordes son Sobel, Prewitt, Roberts, Log y Canny este último puede detectar los bordes débiles y retener un límite fuerte, esta salida es una imagen binaria en pixeles que tienen un valor de 1 y 0. En la siguiente sección se presenta los resultados de la investigación desarrollada.

IV. RESULTADOS Los datos obtenidos y procesados han permitido la

generación de una base de datos. Se trabajó con 61 enfermos de Alzheimer con

características comunes en ansiedad y depresión. La aplicación del método de Viola-Jones al conjunto de imágenes ofreció resultados satisfactorios en 55 de los 61 casos. Los datos obtenidos se encuentran en la Tabla II.

Los resultados muestran la imagen original, el reconocimiento facial, la escala de grises y la edad de los pacientes.

Existen bases de datos que satisfacen los requerimiento de estimación de la edad humana, el problema surge cuando se investiga imágenes de ancianso, niños o jovenes con ciertas caracteristicas especiales, es ahi donde parte la necesidad de la creación de una base de datos [21].

Tabla II. Data set con información completa Id Imagen Original Detección de objetos

rostro Imagen Escala De

Grises Edad Tiempo

de Proceso

1

68 1.62 seg

2

91

1.24 seg

… … … … … …

54

82

1.77 seg

55

65 1.93 seg

Utilizando este procedimiento se procederá a completar la base de datos con nuevas imágenes de rostros que incluyan también personas sanas. De esa forma se completará el conjnto de imágenes necesarias para disponer de un conjunto de prueba objetivo para medir el desempeño de diferentes estrategias. En lo referido al análisis de expresiones faciales, se utilizarán también los filtros rectangulares para identificar las regiones más representativas del rostro. Existen numerosas bases de datos que están disponibles para el reconocimiento de rostros en [22] las BDDs MUCT, Face94, Grimace que han sido utilizadas para la detección de objetos se centra en el proceso de la imagen de la cara completa, en [21] se aplica Fg-net donde sus datos se caracterizan por la clasificación de humanos por edades y en [23] RGB-D Face es una base de datos multimodal. La Tabla III muestra los parámetros de las bases de datos. Tabla III. Características de Base de Datos Bases de

Datos Formato Individuos Hombre Mujer Imágenes Tamaño Imagenes Edad

MUCT RGB 8 - - 3 480*640 -

Face94 RGB 8 113 20 4 180*200 18-20

Grimace RGB 8 10 4 180*200 - Fe.net - - - - 1002 - 0-69 RGB-D Face - 125 - - 225 640*480 -

En la tabla IV se muestran detalles con caracterírticas técnicas de las bases de datos mensionadas anteriormente. Tabla IV. Procedimientos Técnicos de las Base de Datos Bases de

Datos Tasa de

Reconocimiento Método Tiempo de Procesamiento

Metodología Aplicada Caracteristicas

MUCT Bajas Viola Jones 87% Simulación en

Matlab Medición de

distancias

Face94 Alta Viola Jones 100% Simulación en Matlab

Distancia euclidiana

Grimace Alta Viola Jones 91.6% Simulación en Matlab

Medición de distancias

Fe.net - Algortimo para l clasificación y

estimación - Script Python Distancia

euclidiana

RGB-D Face Alta Viola Jones 90.4%

Algoritmo ICP Convencional

Medición de distancias

Page 6: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

En la siguiente sección se presentan las conclusiones y líneas futuras de investigación del estudio desarrollado.

V. CONCLUSIONES El pre procesamiento de imágenes aplicando el método más

adecuado permite obtener información de calidad y presión para futuros análisis. Por otro lado, la aplicación de métodos para aumentar carácterísticas del objeto (escala de grises en rostros) durante la detección ha permitido como resultado una base de datos depurada, lo que es eficiente para la aplicación de técnicas de clasificación supervisada.

En esta investigación se pueden encontrar aspectos positivos debido a que al utilizar el algoritmo de Viola Jones se tiene una extracción automática de rostros en imágenes captadas. Esto ha permitido que de la representación original se puedan eliminar inconsistencias, resaltar características, detectar un objeto y obtener una imagen en gris para estudios posteriores.

Entre los aspectos negativos se pueden determinar que no todas las imágenes han sido reconocidas en el clasificador de Viola Jones. Esto incia que es necesario analizar previante al recorte de la zona del rostro, algunos factores como la inclinación de la cabeza con el objetivo de mejorar los resultados obtenidos.

Como trabajos futuros se pretende usar el entrenamiento de clasificadores como : redes neuronales, la regresión logistica, adaboost y verificar cual de elllos es el que mejor resultado genera. Estas técnicas permiten distinguir entre un objeto que nos interesa y el resto de cualidades que no y encontrar un optimo resultado de los datos obtenidos.

REFERENCIAS [1] A. Das, R. K. Kumar, and D. R. Kisku,

“Heterogeneous Face Detection,” Proc. Int. Conf.

Internet things Cloud Comput. - ICC ’16, pp. 1–6, 2016.

[2] K. Dang and S. Sharma, “Review and comparison of face detection algorithms,” Proc. 7th Int. Conf.

Conflu. 2017 Cloud Comput. Data Sci. Eng., pp. 629–633, 2017.

[3] P. Nair and V. Subha, “Facial Expression Analysis for Distress Detection,” 2018 Second Int. Conf. Electron.

Commun. Aerosp. Technol., no. Iceca, pp. 1652–1655, 2018.

[4] K. Yu, “The Study of Facial Gesture Based on Facial Features *,” 2018 IEEE Int. Conf. Intell. Saf. Robot., pp. 105–109, 2018.

[5] H. Candra, M. Yuwono, R. Chai, H. T. Nguyen, and S. Su, “Classification of facial-emotion expression in the application of psychotherapy using Viola-Jones and Edge-Histogram of Oriented Gradient,” Proc. Annu.

Int. Conf. IEEE Eng. Med. Biol. Soc. EMBS, vol. 2016–Octob, no. Di, pp. 423–426, 2016.

[6] S. Eleftheriadis, O. Rudovic, and M. Pantic, “Discriminative shared gaussian processes for multiview and view-invariant facial expression

recognition,” IEEE Trans. Image Process., vol. 24, no. 1, pp. 189–204, 2015.

[7] V. K. Gudipati, O. R. Barman, M. Gaffoor, and A. Abuzneid, “Efficient Facial Expression Recognition Using Adaboost and Haar Cascade Classifiers,” pp. 0–3, 2016.

[8] K. Vikram, “Facial Parts Detection Using Viola,” Adv.

Comput. Commun. Syst. (ICACCS), 2017 4th Int.

Conf., pp. 2015–2018, 2017. [9] J. Howie, “Cohomology of one-relator products of

locally indicable groups,” J. London Math. Soc., vol. s2-30, no. 3, pp. 419–430, 1984.

[10] Y. G. Shen, A. Bilić, D. J. O’Connor, and B. V. King, “Reinvestigation of the surface reconstruction of Cu(001)-(2 × 2)p4g-Pd,” Surf. Sci., vol. 394, no. 1–3, 1997.

[11] M. Oualla, A. Sadiq, and S. Mbarki, “A survey of Haar-Like feature representation,” Int. Conf.

Multimed. Comput. Syst. -Proceedings, vol. 0, pp. 1101–1106, 2014.

[12] P. Krakowska, K. Informatyka, R. Javier, S. Entrena, and P. Dyplomowa, “Face Detection in C #,” 2012.

[13] T. Mantoro and M. A. Ayu, “Multi-Faces Recognition Process Using Haar Cascades and Eigenface Methods,” 2018 6th Int. Conf. Multimed. Comput.

Syst., pp. 1–5, 2018. [14] Y. Zhu, H. Cheng, Z. Kun, and L. Pan, “Face

detection method using template feature and skin color feature in rgb color space,” Proc. 2015 27th Chinese

Control Decis. Conf. CCDC 2015, pp. 6133–6137, 2015.

[15] R. Sikarwar, “An Edge Based Efficient Method of Face Detection and Feature Extraction,” pp. 1147–1151, 2015.

[16] A. Popli and D. Upadhyay, “Comparative analysis of the software techniques available for protecting Alzheimer patient,” Proc. 2016 6th Int. Conf. - Cloud

Syst. Big Data Eng. Conflu. 2016, pp. 744–747, 2016. [17] M. Oualla and A. Sadiq, “Face Detection Using

Rotated Asymmetric Haar Features,” Proc. 2nd Int.

Conf. Big Data, Cloud Appl. - BDCA’17, pp. 1–6, 2017.

[18] C. H. Setjo, B. Achmad, and Faridah, “Thermal image human detection using Haar-cascade classifier,” Proc.

- 2017 7th Int. Annu. Eng. Semin. Ina. 2017, 2017. [19] H. A. Alabbasi and F. Moldoveanu, “Human face

detection from images, based on skin color,” 2014

18th Int. Conf. Syst. Theory, Control Comput. ICSTCC

2014, pp. 532–537, 2014. [20] M. Kahlon and S. Ganesan, “Driver Drowsiness

Detection System Based on Binary Eyes Image Data,” 2018 IEEE Int. Conf. Electro/Information Technol., pp. 209–215, 2018.

[21] P. Grd and M. Baca, “Creating a face database for age estimation and classification,” 2016 39th Int. Conv.

Inf. Commun. Technol. Electron. Microelectron.

MIPRO 2016 - Proc., pp. 1371–1374, 2016.

Page 7: Aplicación de detección de objetos y algoritmo de Viola ...

2019 14th Iberian Conference on Information Systems and Technologies (CISTI)

19 – 22 June 2019, Coimbra, Portugal

ISBN: 978-989-98434-9-3

[22] N. Hazim, S. Sameer, W. Esam, and M. Abdul, “Face Detection and Recognition Using Viola-Jones with PCA-LDA and Square Euclidean Distance,” Int. J.

Adv. Comput. Sci. Appl., vol. 7, no. 5, 2016. [23] S. R. Bodhi and S. Naveen, “Face detection,

registration and feature localization experiments with RGB-D face database,” Procedia Comput. Sci., vol. 46, no. Icict 2014, pp. 1778–1785, 2015.


Recommended