Interciência 1 Sociedade · o contínuo apoio do Prof. Me. Márcio Antonio Ferreira, diretor da...

Interciência & Sociedade1


ISSN 2238-1295Fundação Educacional Guaçuana – FEG

Presidente – Bruno Franco de Almeida

Faculdade Municipal Prof. Franco Montoro - FMPFMDiretor Geral – Prof. Me. Márcio Antonio Ferreira

Secretária Geral – Profa. Alessandra Zaganin FalaschiCoordenadora do Curso de Administração – Profa. Me. Marli Delfino Campos

Coordenador do Curso de Ciências da Computação – Prof. Dr. José Tarcísio Franco de CamargoCoordenador do Curso de Engenharia Ambiental – Prof. Dr. Mário Roberto Barraza Larios

Coordenadora do Curso de Engenharia Química – Profa. Dra. Vanessa Dias AlvesCoordenadora do Curso de Nutrição – Profa. Me. Daniela Soares de Oliveira

Coordenadora do Curso de Psicologia – Profa. Esp. Luciene Aparecida Scanavachi de Jesus

Editor: Prof. Dr. Norian Marranghello - Professor de Sistemas Digitais - UNESP - Campus de São José do Rio PretoCo-Editor: Prof. Dr. José Tarcísio Franco de Camargo

Conselho Editorial

Profa. Dra. Ana Olivia Barufi Franco de MagalhãesProf. Dr. Antonio Medina Rivilla – Universidad Nacional de Educación a Distáncia (España)

Profa. Dra. Daniela Melaré – Universidade Aberta de Lisboa (Portugal)Prof. Dr. Erico Fernando Lopes Pereira-Silva

Prof. Dr. Francisco García García – Universidad Complutense de Madrid (España)Prof. Dr. João Alexandre Bortoloti

Prof. Dr. José Tarcísio Franco de CamargoProfa. Dra. Maria Suzett Biembengut Santade

Prof. Dr. Moacyr Rodrigo Hoedmaker de AlmeidaProf. Dr. Norian Marranghello - UNESPProf. Dr. Paulo Roberto Alves Pereira

ParceiristasProf. Dr. André Guilherme Ribeiro Balan – UFABC (área de Processamento de Imagens e Visão Computacional)

Profª Drª Kelly Rosa Braghetto – IME – USP (área de Eng. de Software e Banco de Dados)Prof. Dr. Luiz Fernando Bittencourt – IC – Unicamp (área de Arquitetura de Computadores e Sistemas Distribuídos)

Prof. Dr. Marcos Gonçalves Quiles – Unifesp (área de Matemática e Inteligência Computacional)


Diagramação e ArteEdmar Pereira

Editora FMPFM

FICHA CATALOGRÁFICA

Ficha Catalográfica: Adriano Madaleno Miossi – CRB 8 / nº 6981

Os textos publicados na revista são de inteira responsabilidade de seus autores.Permite-se a reprodução desde que citada a fonte e o autor.

Endereço para correspondência e contato:REVISTA INTERCIÊNCIA & SOCIEDADE

Faculdade Municipal Professor Franco Montoro – FMPFMRua dos Estudantes, s/nº, Cachoeira de Cima, Caixa Postal 293,

CEP: 13843-971 - Mogi Guaçu - SP.Fone: (19) 3861-6255 e 3861-6606

Homepage: www. fmpfm.edu.bre-mail: [email protected]


EDITORIAL

Este é o terceiro ano seguido que publicamos um número especial da revista Inter-ciência & Sociedade, com artigos relativos aos Workshops do Programa de Pós-Graduação em Ciência da Computação (WPPGCC) da UNESP. É com grata satisfação que vejo, com o contínuo apoio do Prof. Me. Márcio Antonio Ferreira, diretor da Faculdade Municipal “Pro-fessor Franco Montoro” (FMPFM), e do Prof. Dr. José Tarcísio Franco de Camargo, editor da revista, isto se constituindo numa série de fascículos especiais e começando a se tornar uma tradição. Neste ano temos artigos selecionados durante o IV Workshop do Programa de Pós--Graduação em Ciência da Computação (WPPGCC) da UNESP.

O IV WPPGCC ocorreu nos dias 21 e 22 de maio de 2014, no auditório da Facul-dade de Ciência e Tecnologia (FCT) da Unesp, campus de Presidente Prudente. A mesa da sessão de abertura contou com a presença Prof. Dr. Rogério Eduardo Garcia (coordenador do evento), do Prof. Dr. Aparecido Nilceu Marana (coordenador do PPGCC/UNESP), da Pofª. Drª. Silvana Aparecida Borsetti Gregório Vidotti (representante da ProPG/UNESP) e do Prof. Dr. José Carlos Silva Camargo Filho (vice-diretor da FCT/UNESP).

O evento contou com 4 palestras convidadas e 33 trabalhos apresentados pelos alu-nos do programa, sendo 13 na forma oral e 20 na forma de pôsteres. Os palestrantes que nos deram a honra de compartilhar suas experiências foram: o Prof. Dr. Rodolfo Jardim de Azeve-do, do Instituto de Computação da UNICAMP; a Profª. Drª. Maria Cristina Ferreira de Oliveira, do Instituto de Ciências Matemáticas e de Computação da USP-SCar; a Profª. Drª. Silvana Aparecida Borsetti Gregório Vidotti, da Faculdade de Filosofia e Ciências da Unesp em Marí-lia, representando o Pró-Reitor de Pós-Graduação da UNESP; e o Prof. Dr. Aparecido Nilceu Marana, da Faculdade de Ciências da UNESP em Bauru, coordenador do PPGCC-UNESP.

Além dos palestrantes convidados, contamos também com a inestimável colabora-ção da Profª. Drª. Alessandra Aparecida Paulino (FC/Unesp-Bauru); Prof. Dr. André Luis De-biaso Rossi (Unesp -Itapeva); Prof. Dr. Marcelo Medeiros Eler (EACH/USP-São Paulo); e Prof. Dr. Ricardo Menotti (DC/UFSCar-São Carlos). Esses professores foram responsáveis pela avaliação tanto dos trabalhos apresentados quanto do evento propriamente. Esta avalia-ção externa por colegas de outras instituições tem se mostrado muito importante, pois ajuda a nortear nossas discussões sobre futuras ações com vistas à evolução do PPGCC/UNESP.

Neste ano, nosso corpo de revisores para os artigos submetidos a este fascículo da revista contou com os seguintes colaboradores: Profª. Drª. Alessandra Aparecida Paulino, da Unesp, campus de Bauru; Prof. Dr. Alexandre Luis Magalhães Levada, da UFSCar; Prof. Dr. André Luis Debiaso Rossi, da Unesp, campus experimental de Itapeva; Prof. Dr. Evandro Luís Linhari Rodrigues, da USP-SCar; Prof. Dr. Luiz Fernando Bittencourt, da Unicamp; Prof. Dr. Marcelo Medeiros Eler, da USP-SP; Prof. Dr. Marcos Gonçalves Quiles, da Unifesp; Prof. Dr. Ricardo Menotti, da UFSCar; e Prof. Dr. Wagner Luiz Alves de Oliveira, da UFBA.

Da seleção feita durante o evento pelos avaliadores convidamos 12 trabalhos, três de cada uma das linhas de atuação dos docentes do PPGCC/Unesp, a saber: Arquiteturas de Computadores e Sistemas Distribuídos; Engenharia de Software e Bancos de Dados; Ma-temática Computacional e Inteligência Artificial; e Visão Computacional e Processamento de Imagens. Nos últimos seis meses estive, junto com o corpo de revisores, trabalhando nesses artigos e, por fim, chegamos ao conjunto de 10 artigos que compõem esta edição especial da revista Interciência & Sociedade.


Gostaria de agradecer a todos aqueles que contribuíram para o sucesso de nosso workshop, bem como para a realização deste número especial da revista Interciência & Socie-dade. Todos foram muito importantes para que pudéssemos concluir essas atividades com o devido êxito. Não me arriscarei a citar cada indivíduo que contribuiu por duas razões: primeiro, porque provavelmente eu incorreria na injustiça de esquecer algum nome; e segundo, porque a lista ficaria, certamente, muito longa. Portanto, gostaria de agradecer ao Prof. Dr. Rogério Eduardo Garcia, coordenador do IV WPPGCC, na pessoa de quem agradeço a todos os en-volvidos na organização e na realização do evento, e ao Prof. Dr. José Tarcísio Franco de Ca-margo, pelo seu empenho pessoal, desde que lhe apresentei a ideia de um número especial da revista com artigos oriundos do II WPPGCC, no sentido de viabilizar a materialização deste projeto, na pessoa de quem agradeço a todos aqueles envolvidos na edição e na publicação de mais este fascículo. Além disso, acho importante mencionar algumas instituições que con-correram para o bom termo de nosso evento e, ao citá-las, estendo meus agradecimentos a todos os seus colaboradores que, direta ou indiretamente, se envolveram com o nosso evento, são elas: FAPESP, FUNDUNESP, VUNESP e a UNESP/PROPG, pelo apoio financei-ro; UNESP/AREx, UNESP/PPGCC, UNESP/IBILCE/GBD e UNESP/IBILCE/SEDI, pelo apoio logístico; às direções das quatro unidades envolvidas com o PPGCC, quais sejam: FC/Bauru, FCT/Presidente Prudente, IGCE/Rio Claro e IBILCE/São José do Rio Preto, pelos apoios fi-nanceiro e logístico; e à direção da FMPFM por todo o apoio relativo à edição da revista.

Ao concluir este editorial, tomo a liberdade de parafrasear um amigo que, recente-mente, me enviou uma mensagem muito bonita. Dizia ele o seguinte: o tempo é o bem mais precioso que temos, uma vez que depois de o utilizarmos para alguma coisa, nunca mais podemos recuperá-lo; portanto, quando dedicamos tempo a alguém, estamos doando parte de nossas vidas. Sendo assim, agradeço a todos e cada um de vocês que doaram parte de suas vidas para que este trabalho pudesse ser realizado. Acredito que o resultado tenha se materializado em um conjunto de artigos cuja leitura seja proveitosa a todos. Meus agradeci-mentos e boa leitura.

Norian Marranghello

Editor Convidado


9

APRENDIZAGEM DE MÁQUINA PARA ANÁLISE DE INDICADORES NA ENGENHARIA DE SOFTWARE

SUMÁRIO

BODO, Leandro; OLIVEIRA, Hilda Carvalho de; BREVE, Fabricio Aparecido; MARINHO, Eraldo Pereira; ELER, Danilo Medeiros

21

AVALIAÇÃO DE DESEMPENHO DO MÉTODO 3DLBP UTILIZANDO MAPAS DE PROFUNDIDADE GERADOS PELO MICROSOFT KINECTCARDIA Neto, João Baptista; MARANA, Aparecido Nilceu

DETECÇÃO DE REGIÕES EM CENÁRIOS NATURAIS UTILIZANDO UM SISTEMA DE VISÃO CATADIÓPTRICORODRIGUES, Victor de Assis; TRENTINI, Vinicius Bergoli; LÚLIO, Luciano Cássio; TRONCO, Mário Luiz

43EXPTOOL - FERRAMENTA DE APOIO À CONDUÇÃO, EMPACOTAMENTO E REPLICAÇÃO DE EXPERIMENTOSPUCCI, João Neto; GARCIA, Rogério E.

NAVEGAÇÃO AUTÔNOMA EM AMBIENTES AGRÍCOLAS UTILIZANDO VISÃO ESTÉREOTRENTINI, Vinicius Bergoli; RODRIGUES, Victor de Assis; MARANA, Aparecido Nilceu; LÚLIO, Luciano Cássio; TRONCO, Mário Luiz

OBTENÇÃO DE NEURÔNIOS DE REDES NEURAIS DE BASE RADIAL VIA AGRUPAMENTO DE DADOS POR FLORESTA DE CAMINHOS ÓTIMOSPASSOS, Júnior Leandro A.; COSTA, Kelton A. P.; ROSA, Gustavo Henrique; PAPA, João Paulo

32

53

64


86

SIMULAÇÃO DE SISTEMAS DE COMPUTAÇÃO EM NUVEM PARA O ISPDSILVA, Diogo Tavares; MANACERO, Aleardo; MENEZES, Denison; JORGE, Arthur; LOBATO, Renata Spolon; SPOLON, Roberta

94

UMA PLATAFORMA ABERTA E DE BAIXO CUSTO DE ROBÔ MÓVEL PARA PROPÓSITO GERALMATSUMURA, Takao; FERASOLI FILHO, Humberto; MARRANGHELLO, Norian

VIABILIDADE DO PROTOCOL μTESLA EM REDES VEICULARESCONCEIÇÃO, Rodrigo Martins da; LOBATO, Renata Spolon; MANACERO JUNIOR, Aleardo; SPOLON, Roberta 105

75SEGMENTAÇÃO DE IMAGENS UTILIZANDO COMPETIÇÃO E COOPERAÇÃO ENTRE PARTÍCULASSilva, Bárbara Ribeiro; Breve, Fabricio Aparecido

SUMÁRIO


APRENDIZAGEM DE MÁQUINA PARA ANÁLISE DE INDICADORES NA ENGENHARIA DE SOFTWARE

RESUMO: Indicadores de desempenho são importantes recursos para a gestão da qualidade no de-senvolvimento de software. O volume de dados produzido por esses indicadores tende a aumentar significativamente com o tempo de monitoração, dificultando análises e tomadas de decisão. As bases históricas tornam-se complexas, considerando a quantidade de dados monitorados e a diversidade de indicadores (diferentes tipos, granularidade e frequência). Este trabalho propõe o uso de técnicas de aprendizagem de máquina para análise dessas bases, utilizando redes neurais artificiais combinadas com técnicas de visualização de informação. É utilizado um modelo de indicadores, com base nos pro-cessos do modelo de referência MPS para Software (MPS-SW), agrupados segundo as perspectivas estratégicas do Balanced Scorecard (BSC).PALAVRAS CHAVE: Qualidade de processo de software, Indicadores, MPS-SW, BSC, Rede Neural Artificial, Visualização da Informação.

ABSTRACT: Performance indicators are important resources for quality management in software deve-lopment. The data volume produced by these indicators tends to increase significantly over monitoring time, which complicates analysis and decision making. The historical basis become complex, when considered the amount of data monitored and the indicators diversity (different types, granularity and frequency). This paper proposes the use of machine learning techniques for analysis of these bases using artificial neural networks combined with information visualization techniques. A model of indicators is used, based on the processes of the MPS reference model for Software (MPS-SW), grouped accor-ding to the strategic perspectives of the Balanced Scorecard (BSC).KEY WORDS: Quality of software process, Indicators, MPS-SW, BSC, Artificial Neural Network, Visu-alization of information.

1. INTRODUÇÃO

O gerenciamento da qualidade de um projeto, incluindo os de software, envol-ve três processos básicos: planejamento da qualidade, realização da garantia da quali-dade e realização do controle da qualida-

de. Esses processos interagem entre si e com os demais, pelo menos uma vez duran-te todo o ciclo de vida de um projeto (PMI, 2008).

O planejamento da qualidade con-siste na identificação e documentação dos requisitos, de modo que os processos e/

BODO, Leandro Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

OLIVEIRA, Hilda Carvalho deUniversidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

BREVE, Fabricio Aparecido Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

MARINHO, Eraldo Pereira Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

ELER, Danilo Medeiros Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]


ou produto estejam em conformidade com as especificações definidas (PMI, 2008). Já o processo de garantia da qualidade é responsável por prover a confiança de que os requisitos da qualidade serão plenamen-te atendidos e mantidos (ABNT, 2005). O processo de controle da qualidade, por sua vez, provê informações para avaliação de desempenho e mudanças. Resultados es-pecíficos do projeto devem ser monitorados para determinar se eles estão de acordo com os critérios (padrões) de qualidade definidos e considerados relevantes (PMI, 2008).

Um recurso fundamental no con-trole de qualidade são os indicadores de de-sempenho. Esses indicadores visam quan-tificar o desempenho do objeto medido, de modo a obter uma visão local dos processos e compará-los às metas globais da organi-zação (BOYD; COX, 1997). De modo geral, possibilitam analisar se as metas e objeti-vos definidos para a qualidade estão sendo atingidos, assim como evidenciam desvios que mereçam atenção gerencial e tomadas de decisão. Análises mais abrangentes en-volvendo esses indicadores podem apoiar a avaliação da eficácia e eficiência das ferra-mentas e métodos utilizados nos processos de software (SOMMERVILLE, 2011).

Tradicionalmente, os indicadores podem ser analisados individualmente ou em grupos, segundo semânticas significati-vas para as decisões a serem tomadas. Es-sas análises são realizadas durante todo o processo de desenvolvimento do software, visando historiar e julgar a qualidade do sof-tware ao longo do processo (SOMMERVIL-LE, 2011). Com o tempo de monitoração, o volume de dados produzido por esses indicadores tende a aumentar significati-vamente, inviabilizando a análise manual. As bases históricas tornam-se complexas, considerando a quantidade de dados mo-nitorados simultaneamente. Segundo Mou-ra (1999), uma visão mais estratégica dos indicadores de desempenho deve produzir resultados melhores do que a soma dos re-sultados de suas partes. Porém, a comple-xidade da base histórica dificulta uma visão mais estratégica e efetiva, devida a diversi-dade dos indicadores (diferentes tipos, gra-nularidade e frequência), inclusive.

Nesse contexto, este trabalho pro-põe o uso de técnicas de aprendizagem de máquina para análise de indicadores de de-sempenho na produção de software. A pro-posta consiste em utilizar Redes Neurais Ar-tificiais (RNAs), combinadas com técnicas de visualização de informação para apoiar o processo de rotulagem das amostras para o treinamento da RNA. A ideia é “ensinar” a RNA, de modo que seu treinamento seja ajustado com base em critérios definidos pelos gestores. Após o treinamento, a rede será capaz de analisar o grande volume de dados históricos gerados pelos indicadores nos vários projetos em desenvolvimento. Com o uso de uma RNA, é possível analisar grupos de indicadores simultaneamente de acordo com o que foi “ensinado” à rede – o que também é válido para os indicadores in-dividualmente. A partir dessas análises, gru-pos de indicadores poderão ser controlados e exibidos em dashboards ou scorecards, contribuindo para as tomadas de decisão.

Convém observar que faltam traba-lhos na literatura voltados especificamente à aplicação de aprendizagem de máquina em indicadores de processos de desenvol-vimento de software visando o controle da qualidade. Contudo, podem ser encontra-dos trabalhos em Engenharia de Software que utilizam técnicas de aprendizagem de máquina em outras direções, como Kutlu-bay et al. (2005), por exemplo, que visa detecção de defeitos de software. Já em outras áreas de aplicação podem ser en-contrados trabalhos que utilizam RNAs para melhorar o mecanismo de análise dos indi-cadores de desempenho, como, por exem-plo: setor agropecuário, tráfego rodoviário, área de saúde, entre outras.

De modo a contemplar os diferen-tes processos e indicadores de desempe-nho de organizações produtoras de softwa-re, foi elaborado um modelo de indicadores com base nos processos dos níveis G e F do modelo de referência MPS para Softwa-re (MPS-SW) (SOFTEX, 2012a). Para ela-boração do modelo de indicadores, além dos guias do MPS-SW, contou-se com uma ontologia dos níveis G e F desenvolvida por Pizzoleto (2013). Essa ontologia organiza o modelo MPS-SW e inclui orientações de especialistas, sugerindo indicadores de de-

Interciência & Sociedade (ISSN: 2238-1295) - Vol. 4, N. 1, 2015


sempenho. Além do modelo de indicadores propostos, este trabalho apresenta uma forma de agrupamento dos indicadores se-gundo as perspectivas do método Balanced Scorecard (BSC), proposto por Kaplan e Norton (1997). Esse modelo deve orientar as associações de indicadores (grupos) em uma organização com processos dos níveis G e F do modelo MPS-SW, antes de se em-pregar uma RNA.

Tanto o modelo de indicadores de desempenho como o modelo de agrupa-mento de indicadores, segundo as perspec-tivas do BSC, estão apresentados na seção 2. A seção 3, por sua vez, apresenta uma visão geral de aprendizagem de máquina com foco em RNA, indicando as técnicas se-lecionadas para a continuidade do trabalho. Para analisar a viabilidade do uso de RNA em indicadores de processos de produção de software, foram desenvolvidos alguns experimentos iniciais. A seção 4 apresenta um desses experimentos, que considerou indicadores gerenciais específicos de pro-cessos de produção e aplicou uma técnica de RNA. O experimento mostra que técni-cas de visualização de informação podem contribuir para melhorar o aprendizado da RNA. As considerações finais deste artigo são apresentadas na seção 5.

2. MODELO DE INDICADORES DE DE-SEMPENHO

Para uniformizar o estudo de indi-cadores de desempenho utilizados na pro-dução de software, foram considerados os processos constantes do modelo de refe-rência MPS para Software (MPS-SW). Esse modelo faz parte do Programa de Melhoria de Processo de Software Brasileiro (MPS.BR), mantido pela Associação para Promo-ção da Excelência do Software Brasileiro (Softex). O modelo MPS-SW é baseado no modelo CMMI-DEV e nas normas ISO/IEC 12207 (ciclo de vida do software) e ISO/IEC 15504 (avaliação do software).

O modelo MPS-SW compreende definições de processos no ciclo de vida de um software, descrito em termos de objeti-vos e resultados esperados. Ao implemen-tar o modelo MPS-SW, cada organização deve definir as atividades e tarefas neces-

sárias para atender aos objetivos e resulta-dos esperados dos processos, com a liber-dade de adaptação às suas necessidades e políticas. O modelo MPS-SW conta com sete níveis de maturidade, representados por letras de G (nível mais baixo) a A (nível mais alto). Assim, a implementação do mo-delo pode ser realizada de maneira gradual, com possibilidade de certificação da empre-sa por nível (desde o nível G).

Para este trabalho, foram conside-rados os níveis G e F, considerando que a grande maioria das certificações expedidas do MPS-SW são para esses dois níveis. Se-gundo o site da Softex, das 568 empresas certificadas até 2015, 58% são certificadas no nível G e 29% no nível F. As mudanças causadas na empresa para a adaptação dos seus “processos” aos dos níveis G e F são complexas e impactantes. São envolvi-dos diretamente recursos humanos, tecno-lógicos e políticos da empresa. As mudan-ças requerem formalização dos processos.

A Tabela 1 mostra os processos dos níveis G e F, bem como a quantidade de resultados esperados em cada proces-so. Os processos de cada nível indicam onde a organização deve investir mais es-forços para melhorias. Os processos do ní-vel G estabelecem mecanismos para serem usados em processos gerenciais críticos no desenvolvimento de software: gerência de projetos (GPR) e de requisitos (GRE). No nível F são definidos processos de apoio, que asseguram a qualidade dos produtos e do processo, bem como gerenciam as configurações dos produtos. Até o nível F, a organização ainda é dependente do co-nhecimento individual dos profissionais. Nos níveis seguintes, os novos processos já incorporam o conhecimento.

A todos esses processos devem ser associados indicadores quantitativos de desempenho. Avaliações de controle de-vem ser empregadas em pontos estratégi-cos dos processos, de modo que o monito-ramento auxilie as tomadas de decisão para os devidos ajustes, mitigando o comprome-timento das metas da cadeia do processo. Geralmente, nos níveis iniciais de maturi-dade dos modelos de qualidade, as empre-sas adotam o sistema de medição de de-sempenho tradicional. Esse tipo de sistema



consiste, basicamente, na coleta de dados originados da execução dos projetos, segui-da da comparação desses valores com os valores planejados (BARCELLOS, 2009). A medição tradicional consiste de duas pers-pectivas básicas. A primeira preza pela efici-ência operacional, buscando retratar o grau de utilização dos recursos operacionais. A segunda é voltada a uma visão financeira/contábil, com monitoramento e controle dos custos e lucros. Contudo, a partir dos anos 90, surgiram outros sistemas de medição de desempenho, visando minimizar incon-gruências geradas pelo modelo tradicional. Foram introduzidas características específi-cas, como: prover um alarme antecipatório de problemas, transcender o papel de con-trole, entre outras.

Para compor o modelo de indicado-res chave de desempenho (KPIs – Key Per-formance Indicators) para os níveis G e F, foi utilizada a ontologia proposta por Pizzoletto (2013) e entrevistas em empresas desen-volvedoras de software, além de literaturas de apoio, como Ojha (2014), Santos et al. (2009), Moreira et al. (2009), entre outras. As entrevistas em empresas foram realiza-das por meio de discussões com analistas e gerentes de projetos. A ontologia utilizada uniformiza a organização do conteúdo dos guias do MPS-SW, apoiando a avaliação e implementação do modelo, principalmente nas micro, pequenas e médias empresas (mPME), que possuem restrições técnicas e financeiras. A ontologia associou, ao MPS--SW, a terminologia e conceitos do PMBOK (Project Management Body of Knowledge), e propõe indicadores de desempenho para quase todos os resultados esperados nos processos. Para complementar a estratégia

de medições nos processos do MPS-SW, a ontologia inclui indicadores de três perspec-tivas do modelo Balanced Scorecard (BSC): clientes, processos internos e aprendiza-gem/renovação. Segundo Pizzoleto, esses indicadores contribuem para iniciativas de alinhamento com o planejamento estratégi-co e modelo de negócios. A Figura 1 mostra telas do sistema Protégé com partes do pro-cesso de medição (MED) e dos indicadores baseados no modelo BSC.

O modelo de KPIs proposto con-templa, então, os indicadores da ontologia de Pizzoleto (2013), mais alguns indicado-res resultantes de estudos nas literaturas e levantamentos junto a empresas. Aos indi-cadores são associados os seguintes atri-butos: descrição, objetivo, forma de cálculo, unidade de medida, frequência de coleta, frequência de apresentação de resultados e escopo de aplicação (projeto, produto, negócio etc.). A Figura 2 mostra uma par-te do modelo de indicadores, contemplando os níveis e processos do modelo MPS-SW, os atributos de descrição, objetivo, forma de cálculo e escopo de aplicação.

A finalidade do modelo genérico de KPIs é que ele possa servir de parâmetro para mapeamento dos indicadores reais de uma empresa com os processos do nível G e/ou F implementados. O mapeamen-to pode não ser biunívoco; indicadores do modelo podem não ter correspondentes na empresa e vice-versa.

Para o propósito da aplicação de uma RNA de aprendizado supervisionado ou semi-supervisionado (ver seção 3), é necessário um treinamento prévio da rede com um conjunto específico de entradas. Durante a fase de treinamento, os conjun-


Tabela 1 - Processos dos níveis G e F do modelo MPS-SW. SOFTEX (2012b).


tos de indicadores de entrada devem ser definidos pela empresa, incluindo o que é esperado de saída para cada conjunto. Isso é feito pelos gestores dos processos. Após o treinamento, a rede deve ser capaz de

tornar genérico o comportamento do pro-cesso, no momento em que outras entradas (diferentes das que foram utilizadas durante o treinamento) sejam apresentadas.


Figura 1 - Partes da ontologia de Pizzoleto (2013) no sistema Protégé.

Figura 2 - Representação parcial do modelo de KPIs proposto.


Uma forma de agrupar os indi-cadores do modelo de KPIs é através das perspectivas do BSC, de modo que cada perspectiva forneça um resultado de saída que indique o status do conjunto de dados analisado. Para prover um parâmetro de saída padrão pode ser utilizado um critério bem simples, semelhante a um semáforo de trânsito. Na metáfora do semáforo, o si-nal verde indica que é para seguir com o processo, pois a situação está satisfatória. O sinal amarelo alerta para prestar atenção, porque o grau de satisfação perante a meta previamente definida é regular. Já o sinal vermelho indica que o processo deve ser interrompido, por estar insatisfatório, mui-to fora do padrão estabelecido. A Tabela 2 mostra alguns indicadores do modelo de KPIs proposto, agrupados segundo as pers-pectiva do BSC (KAPLAN; NORTON, 1997). O modelo BSC contempla quatro perspecti-vas que refletem a visão e estratégia em-presarial, as quais podem ser adequadas à gestão de processos de qualquer empresa, inclusive em empresas desenvolvedoras de software. Para o resultado de cada grupo de indicadores, segundo as perspectiva do BSC, a Tabela 2 mostra três possíveis refe-rências de estado: verde (satisfatório), ama-relo (regular) e vermelho (insatisfatório).

3. APRENDIZAGEM DE MÁQUINA E RE-DES NEURAIS ARTIFICIAIS (RNAS)

De modo geral, o uso de um algo-ritmo de aprendizado de máquina requer a análise de uma grande quantidade de amostras, com características diferentes. Essa análise objetiva ensiná-lo a resolver problemas diferentes, dentro de um determi-nado contexto. Esse contexto pode possuir características potencialmente mutáveis ao longo do tempo e/ou do tipo de aplicação e uso (ALPAYDIN, 2004). Entre as categorias de aprendizado de máquina, destacam-se: aprendizado supervisionado, não supervi-sionado e semi-supervisionado.

No aprendizado supervisionado existe o papel de um especialista (entidade externa), que apresenta ao algoritmo alguns conjuntos de padrões de entradas e seus correspondentes padrões de saída. Essa saída pode ser um valor contínuo ou pode predizer um rótulo de classe para o obje-to de entrada. No caso de uma RNA, por exemplo, na fase de treinamento da rede, a cada entrada de dados, o especialista indica, de maneira explícita, se a resposta calculada é boa ou ruim (processo de rotu-lagem dos dados). Então, a resposta forne-cida pela rede é comparada à resposta es-perada. Caso o resultado seja diferente do desejado, um erro é informado à rede para que os ajustes possam ser realizados, a fim de melhorar as respostas futuras.

Em algoritmos de aprendizado não supervisionado não existe a entidade exter-na para realizar o processo de treinamen-to. Eles buscam determinar como os dados estão organizados, baseados somente nos padrões de entrada, sem rótulos ou valores de saída. Algoritmos desta categoria pro-cessam as entradas disponíveis e tentam, progressivamente, estabelecer representa-ções internas para codificar características e classificá-las automaticamente, por meio da detecção da singularidade nas amostras de entrada.

No aprendizado semi-supervisio-nado são usados tanto dados rotulados, como dados não rotulados para o treina-mento. Em muitos casos, o uso de alguns dados rotulados em meio aos dados não ro-tulados melhora consideravelmente a preci-


Tabela 2 - KPIs agrupados segundo perspecti-vas do BSC com três possíveis saídas.


são do aprendizado (BREVE, 2010). Devi-do à grande quantidade de bases de dados existentes, rotular dados para uso em al-goritmos de aprendizado supervisionado tem se tornado um processo cada vez mais inviável. Isto ocorre porque o processo de rotulagem é frequentemente caro e moroso, sendo imprescindível o envolvimento de es-pecialistas humanos. Por outro lado, como não há qualquer rotulagem nos algoritmos não supervisionados, essa técnica acaba ignorando informações valiosas de rótulo dos itens de dados. Esses problemas são tratados pelos algoritmos semi-supervisio-nados, combinando poucos itens de dados rotulados com uma grande quantidade de dados não rotulados, produzindo melhores classificadores (BREVE, 2010). Além disso, requerem menor esforço humano e menos custo financeiro (aprendizado supervisiona-do) e não ignoram todas as informações de rótulo (aprendizado não supervisionado).

Entre as diversas técnicas de aprendizagem de máquina, cada uma indi-cada a um tipo de problema, destaca-se as Redes Neurais Artificias (RNAs). Segundo Haykin (1994), RNAs consistem em técni-cas computacionais baseadas em modelos matemáticos inspirados na estrutura neural de organismos inteligentes, cuja aquisição do conhecimento é realizada através da ex-periência. Sua propriedade mais importante está na capacidade de aprender por inter-médio de exemplos, fazendo inferências sobre o que aprendeu, melhorando grada-tivamente seu desempenho.

Uma RNA possui comportamento baseado nos grupos de neurônios do cé-rebro humano, que recebem e transmitem informações através dos dendritos e axô-nios, respectivamente (KOVACS, 1996). Quando se apresenta um conjunto específi-co de entradas e suas respectivas saídas a uma RNA, ela é capaz de auto ajustar seus pesos sinápticos. O ajuste das conexões é obtido por meio de aprendizado, adotando como critério de treinamento (e posterior análise) uma determinada função de ativa-ção. Os treinamentos das RNAs consistem no mapeamento do relacionamento funcio-nal existente entre as entradas e as saídas. Após o treinamento, a rede deve ser capaz de tornar genérico o comportamento do pro-

cesso, no momento em que outras entradas (diferentes das que foram utilizadas durante o treinamento) sejam apresentadas (BRA-GA et al., 2000).

O tipo de problema abordado neste trabalho, avaliação de grupos de indicado-res de desempenho associados ao proces-so de desenvolvimento de software, pode ser tratado por RNAs. É um caso em que os indicadores (atributos) possuem valores de medição e metas bem diferentes, sem um padrão nos tipos de dados definidos (podem conter valores inteiros, booleanos, reais etc.). Uma organização pode “ensi-nar”, com base em critérios de pesos, como determinados conjuntos de indicadores po-dem expressar metas de controle, ajustan-do seus parâmetros sob demanda. Apesar dos pesos de uma RNA geralmente serem determinados pelos treinamentos da rede, durante o treinamento os gestores podem contribuir com esse “ajuste de parâmetro” nas penalizações de aprendizado, para que o resultado seja o melhor possível para seus indicadores. Devido aos custos envol-vidos nos procedimentos que envolvem o treinamento, as técnicas de RNA de apren-dizado semi-supervisionado mostram-se adequadas na avaliação de indicadores de desempenho de produção de software.

4. APLICAÇÃO DE RNA NA AVALIAÇÃO DE INDICADORES DE DESEMPENHO

Esta seção apresenta um expe-rimento realizado com indicadores de de-sempenho de um processo produtivo de uma empresa que, embora não seja da área de produção de software, mostrou muitas semelhanças com o tratamento de indica-dores dessa área. A ideia foi verificar o com-portamento da RNA em um cenário pouco favorável, com poucas amostras para trei-namento e poucos indicadores, consideran-do a aplicação de RNA em empresas que estão começando a padronizar seus pro-cessos com os níveis G e F do MPS-SW.

Foi utilizada uma RNA Perceptron (ROSENBLATT, 1959) de única camada, considerando 30 amostras de quatro indica-dores de desempenho reais. O processo de rotulagem das amostras para treinamento da RNA foi feito por um especialista do do-



Na intenção de auxiliar um espe-cialista em futuros processos de rotulagem das amostras, foram aplicadas técnicas de visualização no conjunto de dados, classi-ficado pelo algoritmo Perceptron. O uso de


mínio da empresa fornecedora dos dados, utilizando o critério baseado na metáfora do semáforo: “verde” obteve o rótulo “Satisfa-tório”, “Amarelo” ficou com rótulo “Regular” e “Vermelho”, “Insatisfatório”. Assim, se a saída fornecida pela RNA obtiver rótulo “Sa-tisfatório” (Verde), indicará que o conjunto de indicadores analisados está em confor-midade, demonstrando que os processos estão controlados. Se o resultado de saída for “Regular” (Amarelo), indicará que o pro-cesso possui rupturas, sendo necessária maior atenção da gestão dos processos. Por fim, se a saída for “Insatisfatória”, indi-cará que os processos não estão eficazes, sendo necessárias ações corretivas.

Para o experimento, contou-se com 30 instâncias (10 de cada classe) e os quatro atributos. Foram utilizados 50% das amostras para treinamento e os outros 50% para teste, sendo cinco amostras por clas-se. Os testes foram feitos focados em dois fatores principais: acurácia e tempo de aná-lise. Os resultados dos testes estão apre-sentados na Tabela 3. O algoritmo acertou 100% das amostras das classes “Satisfató-rio” e “Insatisfatório”. Na classe “Regular”, houve o retorno de apenas uma amostra errada, classificando-a como classe “In-satisfatório”. Quanto ao tempo de análise (teste), se comparado a um ser humano, o algoritmo obteve um desempenho muito alto, como é possível observar na Figura 3. Observa-se que a medição humana foi rea-lizada por um especialista no domínio, que analisou visualmente os resultados de cada indicador e os comparou com o resultado esperado.

Tabela 3 - Total de acertos entre classes: real vs predita.

técnicas de visualização da informação an-tes da rotulagem dos dados pode ajudar na observação do comportamento dos atribu-tos (indicadores), identificando possíveis er-ros no processo de rotulagem e melhoran-do os resultados no treinamento da RNA. A Figura 4 apresenta o resultado da projeção multidimensional desses dados, baseada nos atributos de cada amostra, utilizando a técnica de projeção LSP (Least Squares Projection) (PAULOVICH et al., 2008). Nes-sa técnica, as cores representam as clas-ses, cada amostra representa um ponto e cada ponto corresponde a um projeto, iden-tificado pela letra “P”. Os projetos mais si-milares são posicionados bem próximos no plano de projeção, enquanto os mais dissi-milares (distantes) são posicionados mais afastados.

Figura 3 - Tempo de execução do teste: algorit-mo vs ser humano.


Nesse tipo de projeção, é possível perceber que alguns projetos de diferentes classes estão se misturando (ver o centro da projeção), mas não se pode explicar o motivo pelo qual isso ocorre. Dessa forma, se fez necessária a busca por outra forma de visualização desse conjunto de dados, cuja representação visual destaque o rela-cionamento entre os atributos dos dados. Assim, a Figura 5 apresenta o resultado da técnica de coordenadas paralelas, propos-ta por Inselberg e Dimsdale (1990). Nessa técnica, as cores correspondem às classes, os eixos representam os atributos e as li-nhas representam as instâncias dos dados. Cada linha corta o eixo paralelo no valor correspondente ao atributo. Desta maneira, é possível observar o comportamento dos atributos dos dados, identificando padrões ou discrepâncias.

Através de técnicas de coordena-das paralelas é possível analisar o compor-tamento das instâncias selecionadas na Fi-gura 4. Observando os pontos destacados na Figura 6, é possível notar que os atribu-tos das instâncias possuem valores e com-portamento similares, justificando o porquê delas terem sido posicionadas próximas na técnica de projeção.

Essa análise, embora visual e sub-jetiva, indica que as instâncias agrupadas na projeção exibida na Figura 6 poderiam ter sua classificação revisada, o que certa-mente contribuiria na acurácia dos testes

anteriormente realizados (ver Tabela 3). Além disso, é possível perceber os atribu-tos necessários para fazer a classificação das instâncias, bem como os atributos que poderiam ter um peso maior para eviden-ciar ou classificar uma classe específica. Portanto, além de auxiliar o especialista no processo de rotulagem, as técnicas de visualização possibilitam a observação do comportamento dos atributos, podendo au-mentar a confiabilidade no processo de ro-tulagem das poucas amostras que as cate-gorias de aprendizado semi-supervisionado necessitam.


Figura 4 - Projeção multidimensional dos dados, utilizando a técnica LSP.

Figura 5 - Coordenadas paralelas do conjunto de dados.


5. CONSIDERAÇÕES FINAIS

O objetivo deste artigo foi propor o uso de Redes Neurais Artificiais (RNAs) para o tratamento de indicadores de de-sempenho no controle da qualidade da pro-dução de software. O uso de técnicas de vi-sualização pode ajudar na classificação dos grupos de indicadores para treinamento da base, como foi mostrado em um experimen-to simples. Em experimentos mais comple-xos, com grande número de amostras, a contribuição das técnicas de visualização pode ser ainda mais impactante. Apesar do experimento apresentado utilizar uma RNA de aprendizado supervisionado, em empre-sas produtoras de software, as pesquisas mostram que uma RNA de aprendizado se-mi-supervisonado pode ser mais adequada. Isso porque combinam poucos itens de da-dos rotulados (redução de esforço e custo) com uma grande quantidade de dados não rotulados, podendo contribuir para obten-ção de melhores resultados.

Em continuidade a esse trabalho, estão sendo realizadas pesquisas com em-presas reais de produção de software em grande escala e com processos dos níveis G e/ou F. Para isso, o modelo de KPIs apre-sentado tem contribuído para o entendi-mento dos indicadores utilizados em cada empresa. A quantidade de dados das bases

de monitoração de indicadores tem sido va-riável. Uma das empresas contém dados de cinco anos de monitoramento, com carac-terísticas complexas e de grande interesse às pesquisas. O modelo de agrupamento por perspectivas do BSC colaborou com o entendimento de grupos de indicadores em alguns casos.

6. REFERÊNCIAS

ABNT - ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR ISO 9000: Sistemas de gestão da qualidade – Fundamentos e vocabulários. Rio de Ja-neiro: ABNT, 2005. 35 p.

ALPAYDIN, E. Introduction to machine learning. Cambridge, Ma: The MIT Press, 2004.

BARCELLOS, M. P. Uma estratégia para medição de software e avaliação de bases de medidas para controle estatístico de processos de software em organizações de alta maturidade. 2009. 419 f. Tese (Doutorado) - Curso de Engenharia de Sistemas e Computação, Universidade Federal do Rio de Janei-ro, 2009.

BOYD, L. H.; COX, J. F. A cause-and-effect approa-ch to analyzing performance measures. Production and Inventory Management Journal, v. 38, n. 3, p. 25-32, 1997.

BRAGA, A. P; CARVALHO, A. C. P. L. F.; LUDEMIR, T. B. Redes Neurais Artificiais: teoria e aplicações. Rio de Janeiro: LTC, 2000.

BREVE, F. A. Aprendizado de máquina utilizando


Figura 6 - Comportamento dos atributos de algumas instâncias selecionadas na projeção.


dinâmica espaço-temporal em redes complexas. 2010. 165 f. Tese (Doutorado) - Curso de Ciências de Computação e Matemática Computacional, Depar-tamento de ICMC-USP, Universidade de São Paulo, São Carlos, 2010.

CHAPELLE, O.; SCHÖLKOPF, B.; ZIEN, A. (Eds.). Semi-supervised learning. Cambridge, Ma: The MIT Press, 2006. (Adaptive Computation and Machine Le-arning).

HAYKIN, S. Neural Networks: a comprehensive foundation. Upper Saddle River, Nj: Prentice Hall, 1994. 768 p.

INSELBERG, A; DIMSDALE, B. Parallel coordina-tes: a tool for visualizing multi-dimensional geometry, in Proceedings of the 1st conference on Visualization (VIS ’90). Los Alamitos, CA, USA: IEEE Computer So-ciety Press, 1990, pp. 361–378.

KAPLAN, R.; NORTON, D. A estratégia em ação: Balanced Scorecard. 4. ed. Rio de Janeiro: Campus, 1997.

KOVACS, Z. Lx. Redes Neurais Artificiais: Funda-mentos e Aplicações. São Paulo: Edição Acadêmica, 1996.

MOREIRA, R. T.; LIMA, G. N.; MACHADO, B. B.; MA-RINHO, W. T.; VASCONCELOS, A.; ROUILLER, A. C. Uma abordagem para melhoria do processo de software baseada em medição. VIII Simpósio Brasi-leiro de Qualidade de Software.

MOURA, L. R. Gestão Estratégica da Informação: proposição de um modelo de organização baseado no uso da informação como recurso da gestão em-presarial. 1999. 117 f. Dissertação (Mestrado) - Curso de Faculdade de Economia, Administração e Contabi-lidade, Universidade de São Paulo, São Paulo, 1999.

OJHA, T. R. Analysis of hey performance indica-tors in software development. Master os Science Thesis. Tampere University of Technology, 2014.

PAULOVICH, F. V; NONATO, L. G.; MINGHIM, R.; LEVKOWITZ, H. Least Square Projection: a fast high precision multidimensional projection technique and its application to document mapping, IEEE Tran-sactions on Visualization and Computer Graphics, vol. 14, no. 3, pp. 564–575, 2008.

PIZZOLETO, A. V. Ontologia Empresarial no mode-lo MPS.BR visando modelagem de processos de negócios, com foco nos níveis G e F. Dissertação (Mestrado) – Universidade Estadual Júlio de Mesqui-ta Filho, 2013.

PMI - PROJECT MANAGEMENT INSTITUTE INC (Pennsylvania). Um guia do conhecimento em gerenciamento de projetos: Guia PMBOK. 4. ed. Newtown Square: PMI, 2008. 459 p.

ROSENBLATT, R. Principles of Neurodynamics. New York: Spartan Books, 1959.SANTOS, G.; MONTONI, M.; FILHO, R. C. S.; KAT-SURAYAMA, A. E.; ZANETTI, D.; BARRETO, A. O. S.; ROCHA, A. R.; Indicadores da Implementação do Nível E do MR-MPS em uma Instituição de Pes-quisa. VIII Simpósio Brasileiro de Qualidade de Sof-tware.

SOFTEX - Associação para Promoção da Excelência do Software Brasileiro. MPS.BR Melhoria de proces-so do software brasileiro: Guia de Implementação – Parte 9: Implementação do MR-MPS em organizações do tipo Fábrica de Software, 2012a. Disponível em: . Acesso em: 20 ago. 2013.

______. MPS.BR Melhoria de processo do sof-tware brasileiro: guia geral. 2012b. Disponível em: . Acesso em: 20 ago. 2013.

SOMMERVILLE, I. Engenharia de Software. 9. ed. São Paulo: Pearson, 2011. 529 p. Tradução de: Ka-linka Oliveira; Ivan Bosnic.




Leandro Bodo é graduado em Sistemas de Informação pela FACOL e pós graduado em Desenvolvimento de Sistemas para Ambiente WEB baseados em tecnologia JAVA pela USC. Atualmente é aluno regular de mestrado em Ciências da Computação pela Unesp, membro do Grupo de Pesquisa LesTIC - Laboratório em Engenharia de Software e Tecnologias da Informação e Comunicação, e atua como coordenador de projetos e de garantia da qualidade na empresa Hadrion Sistemas Integrados. Atualmente suas áreas de interesse estão relacionadas à qualidade na engenharia de software e aprendizado de máquina.

Hilda Carvalho de Oliveira é Mestre em Ciência da Computação pela Unicamp e doutora em Engenharia Elé-trica, com ênfase em Sistemas Digitais, pela Escola Politécnica da USP. É professora da Unesp desde 1989 na área de Ciência da Computação, atuando junto à graduação e pós-graduação. Coordena o grupo de pesquisa Engenharia de Software e Tecnologias da Informação e Comunicação (LesTIC). Atualmente, as áreas de interes-se são: sistemas colaborativos, convergência digital, informática aplicada a educação, ontologias empresariais, gerência de projetos e qualidade em engenharia de software.

Fabricio Aparecido Breve possui graduação em Ciência da Computação pela Universidade Metodista de Piraci-caba (2001), mestrado em Ciência da Computação pela Universidade Federal de São Carlos (2006) e doutorado em Ciências da Computação e Matemática Computacional pela Universidade de São Paulo (2010) com período sanduíche na University of Alberta, Canadá. Atualmente é professor assistente doutor da Unesp. Seus interesses de pesquisa incluem aprendizado de máquina, reconhecimento de padrões, processamento de imagens, redes complexas, redes neurais artificiais e computação inspirada pela natureza.

Eraldo Pereira Marinho possui graduação em Bacharelado em Física pela Universidade Federal da Bahia (1987), mestrado em Astrofísica pelo Instituto Nacional de Pesquisas Espaciais (1991) e Doutorado em Astrono-mia pela Universidade de São Paulo (1997), ambos temas no contexto de Astrofísica Computacional. Atualmente é professor assistente doutor da Unesp. Tem experiência em Astrofísica Computacional, atuando principalmente nos seguintes temas: Smoothed Particle Hydrodynamics, Algoritmos e Estruturas de dados, Vetorização de Qua-dtrees e Busca Anisotrópica dos K-vizinhos Mais Próximos.

Danilo Medeiros Eler é Professor Assistente no Departamento de Matemática e Computação da FCT/UNESP em Presidente Prudente. Seus interesses em pesquisas são na área de Visualização de Informação, principal-mente nos seguintes tópicos: múltiplas visões coordenadas, visualização de dados, mineração visual de dados, técnicas de visualização, e aplicações em coleções de texto e de imagens.


1. INTRODUÇÃO

Hoje em dia a maioria dos siste-mas que necessitam garantir a identidade de uma pessoa utiliza senhas, cartões de acesso ou uma combinação de ambos. Apesar de ser uma estratégia amplamente utilizada esta forma de identificação possui uma fragilidade inerente, pois se um impos-tor roubar um cartão de acesso (ou apren-der uma senha) e as restrições forem todas baseadas nesse objeto (ou conhecimento), ele irá possuir o mesmo nível de acesso do usuário genuíno e o sistema não terá como diferenciar os dois sujeitos.

Esse tipo de identificação é base-ado em algo que alguém conhece (senha)

ou possui (cartão de acesso), e como esses métodos não são baseados em algo que a pessoa é o sistema se torna incapacitado de distinguir genuínos de impostores (BOL-LE; PANKANTI,1998). O reconhecimento de uma pessoa baseada em características que descrevem seu físico/fisiologia ou com-portamento é conhecido como Biometria.

Como não se baseiam em conhe-cimento ou posse, sistemas biométricos podem ser mais seguros do que as formas tradicionais de identificação. Porém, a iden-tificação biométrica também não é infalível. Em um caso relatado pelo jornal O Estado de São Paulo (ESTADÃO,2012) uma auto-escola usava moldes das impressões digi-tais de seus alunos feitos em silicone para

AVALIAÇÃO DE DESEMPENHO DO MÉTODO 3DLBP UTILIZANDO MAPAS DE PROFUNDIDADE GERADOS PELO MICROSOFT KINECT

RESUMO: Problemas com pose e iluminação são desafios complexos para o reconhecimento de faces 2D. Devido a estes problemas vários métodos para reconhecimento de faces 3D têm sido propostos, principalmente pelo fato que os dados em 3D são mais resistentes a iluminação e são úteis para cor-reção de pose. O maior problema com a utilização de métodos 3D é o custo elevado dos scanners 3D tradicionais. Uma alternativa é a utilização do Microsoft Kinect que, além de ser consideravelmente mais barato, é capaz de capturar os dados de profundidade com precisão necessária para discriminar sujeitos. O principal objetivo do presente trabalho é avaliar a performance do método 3DLBP para o reconhecimento de faces quando utilizando os mapas de profundidade gerados pelo Kinect. Outro objetivo é investigar quais regiões da face que desempenham melhor no reconhecimento de face.PALAVRAS-CHAVE: Biometria, Kinect, Reconhecimento de Faces 3D.

ABSTRACT: Due to the difficulty in dealing with pose and illumination on 2D face recognition, 3D face recognition methods have been proposed in the last years, since 3D data is less sensible to illumination changes and, more important, is very useful to correct differences in pose. The main drawback of using 3D-based face recognition methods is the high cost of the traditional 3D sensors. One alternative to these expensive scanners are the Kinect devices that, besides being considerable cheaper, are able to capture quite precisely the depth information. The main goal of this work was to assess the performance of 3DLBP method for face recognition when using depth maps generated by Kinect devices. Another goal was to investigate the face regions in which the depth maps contribute most to increase the face recognition rates.KEYWORDS: Biometrics, Kinect, 3D Face Recognition.

CARDIA NETO, João BaptistaUniversidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

MARANA, Aparecido NilceuUniversidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]


registrar de forma fraudulenta a presença nas aulas. Em sistemas biométricos de identificação baseados em reconhecimento de faces as fraudes são ainda mais fáceis de serem cometidas, uma vez que é mais simples adquirir uma foto de um sujeito ge-nuíno do que um molde de sua impressão digital.

A utilização de dados de profun-didade da face pode auxiliar os sistemas biométricos de identificação baseados em faces a se tornarem mais resistentes contra fraudes. Dados de profundidade são mais difíceis de serem reproduzidos de forma tri-vial, além de serem mais resistentes a mu-danças de iluminação e facilitar correções de pose.

Entretanto, uma das restrições para o uso de dados de profundidade no reconhecimento facial, ou seja, para o re-conhecimento tridimensional de faces, é o custo dos sensores necessários para a di-gitalização 3D das faces dos sujeitos. Nes-se aspecto o Microsoft Kinect se torna uma ótima alternativa para os scanners tradicio-nais, pois seu custo é bem menor.

Este trabalho visa efetuar o reco-nhecimento de faces 3D utilizando o Micro-soft Kinect como um substituto aos scan-ners 3D tradicionais. Neste caso, o grande desafio é realizar o reconhecimento a partir de um conjunto reduzido de dados, uma vez que o Kinect tem resolução bem menor do que os dispositivos 3D tradicionais.

2. TRABALHOS CORRELATADOS

Na literatura especializada, o con-junto de trabalhos que utilizam dados do Microsoft Kinect para o reconhecimento 3D de faces é bastante reduzido. Os trabalhos mais interessantes são os de Goswami et al. (GOSWAMI et al., 2013) e Li et al. (LI et al., 2013).

Goswami et al. (GOSWAMI et al., 2013) geram mapas de entropia e saliência visual para os dados gerados pelo Kinect. Para as imagens RGB ambos os mapas são gerados, para os dados de profundida-de somente o mapa de entropia é gerado. O descritor da face é gerado concatenando os HOGs (Histograma de Gradientes Orienta-dos) de diferentes fragmentos de ambos os

mapas. Para a classificação dos sujeitos é utilizado o classificador RDF (Floresta Ran-dômica de Decisão.

Li et al. (LI et al., 2013) também uti-lizam tanto os dados de profundidade quan-to as imagens RGB para fazer o reconheci-mento 3D de faces. Como primeiro passo do método os dados em RGB passam pela transformada DCS (Espaço de Cor Descri-minante) para aumentar seu poder discrimi-nativo. Como possuem três canais eles são empilhados. As imagens de profundidade são baseadas nas nuvens de pontos gera-da pelo Kinect. Para melhorar a densidade elas são submetidas a um processo de Pre-enchimento Simétrico (Symmetric Filling no original).

Preenchimento Simétrico é um processo onde a nuvem de pontos de uma face é espelhada e, cada ponto na face ori-ginal, é comparado com um ponto na nu-vem espelhada. Caso a distância entre os dois pontos seja menor que um threshold t então o ponto da nuvem espelhada passa a fazer parte da nuvem original. Devido as propriedades simétricas da face esse pro-cesso tende a melhorar a qualidade dos da-dos gerados pelo Kinect.

Após gerar as imagens de pro-fundidade baseadas nas novas nuvens de pontos o classificador SRC (Classificador de Representação Esparsa) é utilizado para classificação dos sujeitos.

A maior semelhança entre o nos-so trabalho e os trabalhos correlatos des-critos é que todos utilizam o Kinect como um dispositivo substituto dos scanners 3D tradicionais. Porém, ao contrário dos de-mais, o nosso trabalho não utiliza as ima-gens RGB. Além disso, um dos objetivos do trabalho é avaliar as regiões utilizadas para o reconhecimento 3D de faces e verificar quais delas apresentam melhores resulta-dos, tendo em vista a baixa resolução do Kinect.

3. BIOMETRIA

Na biometria utiliza-se característi-cas físicas/fisiológicas ou comportamentais para a identificação de pessoas, sendo ba-seada em algo que a pessoa é e não em algo que ela possui ou sabe. A Figura 1 ilus-



tra exemplos de características biométricas. As características físicas/fisiológi-

cas são baseadas na anatomia ou no fun-cionamento do organismo de uma pessoa viva, como termograma facial. Já as com-portamentais são baseadas na forma par-ticular que um sujeito executa uma ação, como andar ou assinar. Qualquer caracte-rística pode ser utilizada desde que atenda algumas restrições, tais como (JAIN; MAL-TONI, 2003):

• Universalidade: A característica deve estar presente na maior quantidade possível de pessoas;

• Unicidade: A característica deve ser diferente entre pessoas dife-rentes;

• Permanência: A característica não deve mudar com o passar do tempo;

• Mensurabilidade: A característica deve ser fácil de coletar e men-surar;

• Desempenho: A característica deve permitir alta acurácia com baixo tempo de processamen-to e custo computacional, além de ser robusta á ambientes não controlados;

• Aceitabilidade: A característica deve ser aceita facilmente pelas pessoas como forma de identifi-cação;

• Grau de impostura: A caracterís-tica deve ser resistente a fraude.

A Tabela 1 exibe a comparação en-tre algumas características biométricas le-vando em consideração essas restrições. É importante frisar que não existe uma carac-terística biométrica perfeita, e que ao cons-truir um sistema é importante considerar o ambiente onde a aplicação irá ser executa-da, bem como os sujeitos envolvidos.

3.1. Sistemas Biométricos

Um sistema de reconhecimento de padrões que utiliza um vetor de caracterís-tica baseado em qualquer traço biométrico para garantir a identidade de uma pessoa é um sistema biométrico. Eles podem operar

em dois modos: Identificação ou Verificação (PRABHAKAR; PANKANTI; JAIN, 2003).

Restrição Face Digital AndarUniversalidade A M MUnicidade B A BPermanência M A BMensurabilidade A M ADesempenho B A BAceitabilidade A M AGrau de impostura B M M


Tabela 3 - Total de acertos entre classes: real vs predita.

Indiferente do modo que o sistema irá operar uma pessoa necessita ser cadas-trada. Para isso o sistema recebe a cara-terística da pessoa, processa ela em uma forma reduzida chamada de template. Esse template pode ser armazenado em um ban-co de dados central ou em um dispositivo de mídia removível.

Modo de verificação é quando o usuário afirma ser um sujeito e o sistema compara a amostra biométrica atual dele com o template armazenado. No modo de identificação nenhuma identidade é afirma-da e, com base nas características biomé-tricas atuais do sujeito, o sistema descobre sua identidade real.

Um sistema biométrico pode ser classificado em uma das setes categorias definidas por Wayman (WAYMAN, 2002):

• Cooperativo ou não cooperativo: O sujeito deseja ser identificado?

• Evidente ou sigiloso: O sujeito sabe que ele está sendo identi-ficado?

• Habituado ou não habituado: O sujeito frequentemente se sub-mete à identificação?

• Auxiliado ou não auxiliado: Exis-te um operador humano auxilian-do o sistema?

• Ambiente controlado ou não con-trolado: Em qual ambiente o sis-tema irá operar?

• Privado ou público: Os sujeitos


são empregados (privado) ou clientes (público)?

• Aberto ou fechado: O sistema precisa de padrões para ter inte-roperabilidade entre sistemas?

• Mesmo um sistema que utilize a característica mais segura, que se adapte melhor ao seu ambiente e população ainda serão encontradas dificuldades na hora da validação, pois duas amostras biométricas, mesmo sendo da mesma pessoa, nunca serão idênticas (PRABHAKAR; PANKANTI; JAIN, 2003). Devi-do a este fato a comparação nos sistemas não é feita de forma direta, cada comparação entre duas amostras diferentes gera uma pontuação que é compara-da com um threshold t, caso seja menor o indivíduo não é identifi-cado, caso contrário a identidade é vinculada com o sujeito. Por esse motivo sistemas biométri-cos possuem dois tipos de erros, são eles:

• Falsa aceitação: A amostra de um impostor é reconhecida como genuína;

• Falsa rejeição: A amostra de um sujeito genuíno não é reconhecida.

4. KINECT

O dispositivo Microsoft Kinect con-tém um sensor de profundidade 3D, uma

câmera RGB, uma matriz de microfones e um motor de inclinação. O sensor de profun-didade é composto de um emissor infraver-melho e uma câmera infravermelho. Para estimar a profundidade o dispositivo projeta uma matriz de pontos em infravermelho e mede a distorção causada pelos raios re-fletidos de volta ao dispositivo (SHPUNT; ZALEVSKY, 2008).

O sensor gera uma grade de pro-fundidade de 640 X 480 com a precisão de 11 bits @ 30Hz (ZOLLHÖFER et al., 2011). A abrangência da profundidade vai de 1.2 até 3.5 metros.

O campo de visão angular da câ-mera é de 57º horizontalmente e 43º verti-calmente (STOWERS; HAYES; BAINBRID-GE-SMITH, 2011). Os ângulos são relativos ao horizonte e não a base do dispositivo. Como ele possui um motor de inclinação é possível alterar o ângulo para focar na ca-racterística biométrica desejada. A Figura 2 é de um Kinect.

Como já discutido anteriormente o maior problema do Kinect é a sua baixa resolução, a Tabela 2 mostra isso com uma comparação entre ele e outros scanners. Isso traz novos problemas e mostra a im-portância de estudar a desempenho de mé-todos de reconhecimento facial propostos na literatura, já que em geral esses métodos são propostos com dados de alta resolução.

5. RECONHECIMENTO DE FACES

A necessidade da existência de sistemas que possam identificar pessoas de maneira simples e sem cooperação é


Dispositivo Velocidade Carga Tamanho Preço Acurácia3dMD 0.002 10 s N/A >$50K $50K 0.1Artec Eva 0.063 Não 160.8 >$20K 0.53D3 HDI R1 1.3 Não N/A >$10K 0.3SwissRanger 0.02 Não 17.53 >$5K 10David SLS 2.4 Não N/A >$2K 0.5Kinect 0.033 Não 41.25 >$200 1.5-50

Tabela 2 - Comparação entre diferentes scanners 3D (LI et al., 2013). A velocidade é expressada em segundos, tamanho em polegada3, preço em USD e a acurácia é uma aproximação expressada em mm.


evidente. Como já foi discutido anteriormen-te basear a identificação somente em posse ou conhecimento pode causar falhas na au-tenticação e a utilização de métodos mais confiáveis, como impressão digital ou íris, dependem da cooperação dos usuários. O reconhecimento de faces é mais vantajoso nesse aspecto, pois é possível realizar a identificação de uma pessoa sem ela coo-perar ou saber que está sendo identificado. Na Figura 3 tem-se a configuração genérica de um sistema de reconhecimento de faces (ZHAO et al., 2003). Primeiro é necessário detectar e segmentar faces de cenas com-

face é tomada (Reconhecimento de face).O primeiro trabalho de reconheci-

mento automático de faces foi feito por Ka-nade (KANADE, 1973) em 1973, depois o interesse na área só voltou em 1991 com o trabalho de Turk e Pentland (TURK; PEN-TLAND, 1991). Nos dias atuais o reconheci-mento automático de faces tem uma gama de novas oportunidades, a tecnologia teve um avanço significativo desde 1991 e novas formas de reconhecimento que demandam maior poder computacional podem ser uti-lizadas. Outro fator é a miniaturização de câmeras, com isso é possível criar aplica-ções de vigilância que sejam praticamente imperceptíveis.

A grande variabilidade na aparên-cia da face é um desafio a ser enfrentado. Iluminação, pose e expressões afetam dire-tamente a textura (aparência) fazendo com que se torne um problema mais complexo e, por sua vez, fazendo os sistemas biomé-tricos terem diminuição de performance.

Outra dificuldade é o envelheci-mento, a face possui permanência média e as alterações acarretadas pelo tempo au-mentam as variações intra-sujeitos e, con-sequentemente, pioram o desempenho dos sistemas (LI; JAIN, 2011).

Outro problema com sistema de re-conhecimento biométrico baseado em faces é a baixa variação que pode existir entre su-


Figura 1 - Exemplo de características biométricas. Na primeira linha da esquerda para direita: ore-lha, face, termograma facial, termograma da mão e padrões de veias da mão. Na segunda linha da esquerda para direita: impressão digital, íris, retina e assinatura.

Figura 2 - O sensor Microsoft Kinect: 1) Sensor de profundidade; 2) Câmera RGB; 3) Mariz de microfones; 4) Motor de inclinação.

plexas (Detecção de Faces), para cada face o processo de extração de característica é aplicado (Extração de Característica) e as características extraídas são comparadas com os templates cadastrados na galeria de faces e a decisão sobre a identidade da


jeitos distintos, pois quando duas pessoas possuem feições similares os métodos de reconhecimento podem ter dificuldades em distinguir corretamente uma da outra. Esta situação se intensifica entre irmãos (gême-os e não gêmeos).

Para lidar com problemas de apa-rência é interessante utilizar informação 3D da face. A face é um objeto 3D e a sua projeção em uma imagem 2D inviabiliza a correção de alguns fatores como pose, ilu-minação e expressão. Reconhecimento de faces 3D é uma alternativa para melhorar

trabalho sobre esse tema é o de Mian, Ben-namoun e Owens (MIAN; BENNAMOUN; OWENS, 2007), em que pontos chave da face são detectados e características locais de seus vizinhos são extraídos.

Esses dois trabalhos utilizam a base FRGC v2 para a validação de seus métodos. A base FRGC v2 é composta de 4007 amostras 3D de 466 sujeitos diferen-tes. Dentre os sujeitos da base 57% são ho-mens e 43% mulheres. Essa base foi capta-da com o scanner Minolta.

5.2. 3DLBP

O método LBP (Local Binary Pat-tern) original foi introduzido por (OJALA; PIETIKÄINEN; HARWOOD, 1996) e consis-te em analisar a diferença entre um pixel e sua vizinhança 3 X 3. Dado um pixel central (xc , yc) o operador LBP é definido por (RO-DRIGUEZ; MARCEL, 2006):

sendo ic o valor do tom de cinza no pixel central e o valor do pixel vizinho. A função s(x) é definida como:

Uma extensão do operador clássi-co foi proposta por (OJALA; PIETIKAINEN; MAENPAA, 2002). Nela um círculo de raio R centrado em um ponto (xc , yc) é definido e P pontos deste círculo são amostrados. A Figura 4 exemplifica a extensão do opera-dor para diferentes valores de P e R.

Figura 4 - Exemplo da extensão do operador LBP original. Valores de : (8,1), (16,2) e (8,2).


Figura 3 - Configuração genérica de um siste-ma de reconhecimento de faces (ZHAO et al., 2003).

a performance de sistemas biométricos. Com um modelo tridimensional da face é possível rotacionar, projetar iluminação ou até corrigir deformações causadas por ex-pressões. Essas operações visam atenuar possíveis diferenças de aparência entre di-ferentes amostras do mesmo sujeito.

5.1. Reconhecimento de Faces 3D

O reconhecimento de faces 3D tem como maior vantagem a possibilidade de corrigir pose, iluminação e expressões, mas acaba enfrentando outros tipos de pro-blemas, tais como preço, a fragilidade dos dispositivos e o grau de cooperação neces-sária para scanners tradicionais.

Na vasta literatura sobre méto-dos de reconhecimento facial 3D é possí-vel destacar métodos como o proposto por Lei et al. (LEI; BENNAMOUN; EL-SALLAM, 2013) que utiliza a fusão de características local para formar o descritor da face. Outro


Considerando o pixel central com as coordenadas (0,0) o cálculo das coorde-nadas dos P pontos vizinhos é dado por:

Caso a coordenada não seja no centro de um pixel o valor de cinza é calcu-lado utilizando interpolação bilinear.

O operador LBP foi criado como um descritor de textura, ao utilizar dados de profundidade ao invés de tons de cinza ele não consegue lidar com o comportamento desse tipo de dado. Caso duas áreas em di-ferentes sujeitos tenham o pixel central com o valor maior que todos os seus vizinhos o operador terá o mesmo valor (HUANG; WANG; TAN, 2006). Regiões da ponta do nariz costumam se enquadrar neste caso.

Devido ao ruído gerado pelo Kinect a ponta do nariz se torna um dos pontos mais confiáveis na face (LI et al., 2013). Como o operador LBP original possui problemas em lidar com regiões com essas características a busca de alternativas se torna necessária. Uma alternativa interessante é o 3DLBP.

Proposto por Huang et al. (HUANG; WANG; TAN, 2006) o operador 3DLBP leva em consideração o valor absoluto da dife-rença de profundidade entre um pixel e seu vizinho. Huang et al. (HUANG; WANG; TAN, 2006) afirmam que, devido a superfície sua-ve da face, mais de 93% das diferenças de profundidade (DD) com vizinhos em um raio R = 2 são menores que 7. Essa propriedade torna possível armazenar o valor absoluto da DD em três unidades binárias (i2, i3, i4), o sinal da diferença é representado utilizando a unidade binária i1. Assim, é possível defi-nir DD como:

E i1 possui o mesmo valor que o operador LBP original, ou seja, i1 = s(x). Na Figura 5 tem-se processo.

As quatro unidades binárias sãos divididas em quatro camadas e, para cada camada, um número decimal é obtido (P1, P2, P3, P4). Para o matching os histogramas de cada uma das regiões locais são conca-tenados.

Huang et al. (HUANG; WANG; TAN, 2006) utilizaram a base de dados FRGC v2 para validar o operador, dividindo a face em cinco regiões diferentes.

6. METODOLOGIA E DESENVOLVIMEN-TO

Neste trabalho a base EURECOM Face Dataset (HUYNH; MIN; DUGELAY, 2012) foi utilizada. Ela é composta por 52 sujeitos com imagens para cada sujeito captadas em duas sessões diferentes com quinze dias de diferença entre elas. A base possui nove imagens por cada sessão sen-do elas: neutro, boca aberta, sorrindo, dife-rença de iluminação, perfil esquerdo, perfil direito, obstrução da face, obstrução da boca e oclusão dos olhos. Cada uma das imagens possui uma nuvem de pontos (ar-quivo .obj), RGB e mapa de profundidade. As faces possuem os olhos, a ponta do na-riz, os cantos da boca e o queixo anotados. A Figura 6 mostra todas as variações de fa-ces para um sujeito da base e a Figura 7 mostra os pontos anotados.

Para este trabalho somente as faces com diferença de iluminação, boca aberta, sorrindo e neutra foram utilizadas. As três primeiras compõem a galeria e a úl-tima o probe e somente imagens da primei-ra sessão foram utilizadas.

Quatro experimentos diferentes foram realizados, três utilizando variações das regiões em que o 3DLBP foi aplicado


Figura 5 - Exemplo do processo do 3DLBP.


e um com o LBP nas imagens RGB. Para cada experimento um classificador SVM é treinado com as imagens da galeria e é uti-lizado para reconhecer a imagem do probe. Os testes foram feitos no modo de identifi-cação.

As seguintes regiões da face foram consideradas:

• Região do nariz e dos olhos;• Cinco fatias da face (testa, olhos,

nariz, boca e queixo) – essas regiões foram as mesmas uti-lizadas no trabalho original do 3DLBP;

• Região centralizada na ponta do nariz com resolução de 32X32 e subdividindo essa região em 64 micro regiões.

7. RESULTADOS

A Figura 8 mostra a curva CMC (Cumulative Match Characteristic) obtida nos experimentos.

É possível observar que o méto-do LBP apresenta o pior desempenho. Nas variações de regiões utilizando o 3DLBP é possível visualizar que a região utilizada no trabalho original (3DLBP com 5 fatias) possui pior desempenho, isso se deve ao fato da boca ter sido utilizada e esta é uma região extremamente sensível às defor-mações geradas por expressão. As outras duas regiões não utilizam a boca e, por isso, se mostram mais resistentes a presença de deformação por expressões faciais. Como

no experimento com 64 regiões há identi-ficação errada de apenas dois sujeitos, a taxa de reconhecimento correto se mantêm constante até o rank 6.

8. CONCLUSÕES E TRABALHOS FUTU-ROS

O objetivo deste trabalho é aplicar o operador 3DLBP, proposto originalmente para ser utilizado com imagens capturadas com sensores 3D de alta resolução, nos da-dos obtidos pelo Microsoft Kinect e avaliar o seu desempenho em relação a dados gera-dos por outros sensores. Os resultados ob-tidos foram promissores, principalmente se for considerada a baixa qualidade dos da-dos gerados pelo Kinect. Isso pode levar a um avanço na área de reconhecimento bio-métrico de faces, pois o reconhecimento 3D tem inúmeras vantagens sobre o tradicional


Figura 6 - Exemplo de um sujeito da base de dados EURECOM. Na linha superior imagens em RGB e na inferior os mapas de profundidade. São elas: a) obstrução da face, b) obstrução da boca, c) oclusão dos olhos, d) neutro, e) diferença de iluminação, f) perfil esquerdo, g) sorrindo, h) boca aberta e i) perfil direito.

Figura 7 - Pontos anotados da base EURE-COM. São eles: 1) olho direito, 2) olho esquer-do, 3) ponta do nariz, 4) canto direito da boca, 5) canto esquerdo da boca e 6) queixo.


reconhecimento 2D, porém as técnicas atu-ais exigem o uso de sensores muito caros, o que limita suas aplicações em larga esca-la. O custo do Kinect é bem mais acessível.

Outro resultado importante obser-vado nos experimentos é a clara vantagem que dados de profundidade têm sobre as imagens em RGB. Isso pode ser explicado pelos dados de profundidade serem mais resistentes a diferença de iluminação do que as imagens em RGB.

Também é possível concluir que os dados gerados pelo Microsoft Kinect são suficientemente discriminativos para a identificação de pessoas, mesmo possuindo resolução mais baixa do que scanners tra-dicionais.

nh,924087,0.htm>. Acesso em: 28 out. 2012.

GOSWAMI, G. et al. On rgb-d face recognition us-ing kinect. International Conference on Biometrics: Theory, Applications and Systems, 2013. 2013.

HUANG, Y.; WANG, Y.; TAN, T. Combining statistics of geometrical and correlative features for 3d face recognition. In: Proceedings of the British Machine Vision Conference. [S.l.]: BMVA Press, 2006. p. 90.1–90.10. ISBN 1-901725-32-4. Doi:10.5244/C.20.90. HUYNH, T.; MIN, R.; DUGELAY, J.-L. An efficient LBP--based descriptor for facial depth images applied to gender recognition using RGB-D face data. In: ACCV 2012, Workshop on Computer Vision with Local Bina-ry Pattern Variants, Daejeon, Korea, November 5-9, 2012 / Published also as LNCS, Vol 7728, PART 1. Daejeon, KOREA, DEMOCRATIC PEOPLE’S REPU-BLIC OF: [s.n.], 2012. Disponível em: .

JAIN, A. K.; MALTONI, D. Handbook of Fingerprint Recognition. Secaucus, NJ, USA: Springer-Verlag New York, Inc., 2003. ISBN 0387954317.

JAIN, A. K.; ROSS, A.; PRABHAKAR, S. An intro-duction to biometric recognition. IEEE Trans. on Circuits and Systems for Video Technology, 2004. v. 14, p. 4–20, 2004.

KAKADIARIS, I. A. et al. Threedimensional face re-cognition in the presence of facial expressions: An annotated deformable model approach. IEEE Trans. Pattern Anal. Mach. Intell., 2007. IEEE Com-puter Society, Washington, DC, USA, v. 29, n. 4, p. 640–649, abr. 2007. ISSN 0162-8828. Disponível em: .

KANADE, T. Picture processing system by com-puter complex and recognition of human faces. In: doctoral dissertation, Kyoto University. [S.l.: s.n.], 1973.

KINECT sensor components. 2010. Disponível em: . Acesso em: 5 nov. 2012.

LEI, Y.; BENNAMOUN, M.; EL-SALLAM, A. A. An ef-ficient 3d face recognition approach based on the fusion of novel local low-level features. Pattern Recognition, 2013. v. 46, n. 1, p. 24–37, 2013.

LI, B. et al. Using kinect for face recognition under varying poses, expressions, illumination and dis-guise. In: Applications of Computer Vision (WACV), 2013 IEEE Workshop on. [S.l.: s.n.], 2013. p. 186–192. ISSN 1550-5790.LI, S. Z.; JAIN, A. K. (Ed.). Handbook of Face Rec-ognition, 2nd Edition. Springer, 2011. ISBN 978-0-85729-931-4. Disponível em: .

MIAN, A.; BENNAMOUN, M.; OWENS, R. An effi-cient multimodal 2d-3d hybrid approach to auto-matic face recognition. IEEE Trans. Pattern Anal.


Figura 8 - Curva CMC dos métodos e das re-giões avaliadas. Regiões por ordem decrescen-te de performance: 3DLBP – Face dividida em 64 regiões, 3DLBP – Região do nariz e olhos, 3DLBP – Cinco fatias da face e LBP.

Como trabalho futuro será rea-lizada a fusão deste operador com outras características extraídas da face e a reali-zação de testes com maiores variações de poses.

9. REFERÊNCIAS BIBLIOGRÁFICAS

BOLLE, R.; PANKANTI, S. Biometrics, Personal Identification in Networked Society: Personal Identification in Networked Society. Norwell, MA, USA: Kluwer Academic Publishers, 1998. ISBN 0792383451.

ESTADÃO. Autoescola é acusada de falsifi-car impressões digitais de alunos para vender CNH. 2012. Disponível em:


STOWERS, J.; HAYES, M.; BAINBRIDGESMITH, A. Altitude control of a quadrotor helicopter using depth map from Microsoft kinect sensor. In: Me-chatronics (ICM), 2011 IEEE International Conference on. [S.l.: s.n.], 2011. p. 358 –362.

TURK, M.; PENTLAND, A. Eigenfaces for recogni-tion. J. Cognitive Neuroscience, 1991. MIT Press, Cambridge, MA, USA, v. 3, n. 1, p. 71–86, jan. 1991. ISSN 0898-929X. Disponível em: .

WAYMAN, J. Technical testing and evaluation of biometric identification devices. In: JAIN, A.; BOLLE, R.; PANKANTI, S. (Ed.). Biometrics. [S.l.]: Springer US, 2002. p. 345–368. ISBN 978-0-387-28539-9.

ZHAO, W. et al. Face recognition: A literature sur-vey. ACM Comput. Surv., 2003. ACM, New York, NY, USA, v. 35, n. 4, p. 399–458, dez. 2003. ISSN 0360-0300. Disponível em: .

ZOLLHÖFER, M. et al. Automatic reconstruction of personalized avatars from 3d face scans. Comput. Animat. Virtual Worlds, 2011. John Wiley and Sons Ltd., Chichester, UK, v. 22, n. 2-3, p. 195–202, abr. 2011. ISSN 1546-4261. Disponível em: .

Mach. Intell., 2007. IEEE Computer Society, Wash-ington, DC, USA, v. 29, n. 11, p. 1927–1943, nov. 2007. ISSN 0162-8828. Disponível em: .

OJALA, T.; PIETIKÄINEN, M.; HARWOOD, D. A com-parative study of texture measures with classifica-tion based on featured distributions. Pattern Rec-ognition, 1996. v. 29, n. 1, p. 51–59, 1996.

OJALA, T.; PIETIKAINEN, M.; MAENPAA, T. Multire-solution gray-scale and rotation invariant texture classification with local binary patterns. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2002. v. 24, n. 7, p. 971–987, 2002. ISSN 0162-8828.PRABHAKAR, S.; PANKANTI, S.; JAIN, A. Biometric recognition: Security and privacy concerns. IEEE Security and Privacy, 2003. IEEE Computer Society, Los Alamitos, CA, USA, v. 1, p. 33–42, 2003. ISSN 1540-7993.

RODRIGUEZ, Y.; MARCEL, S. Face authentication using adapted local binary pattern histograms. In: 9th European Conference on Computer Vision (ECCV). [S.l.: s.n.], 2006. IDIAP-RR 06-06.

SHPUNT, A.; ZALEVSKY, Z. Depthvarying light fields for three dimensional sensing. Google Patents, 2008. US Patent App. 11/724,068. Dis-ponível em:.


João Baptista Cardia Neto é mestrando em Ciência da computação pela Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP). Possui graduação em Bacharelado em Ciência da Computação pelo Centro Universitá-rio Euripedes de Marília (2010). Atuou como docente dos cursos técnicos de Informática para Internet e Informática no Centro Paula Souza. Atualmente desenvolve trabalhos nos seguintes temas: Biometria, Reconhecimento de Faces 3D.

Aparecido Nilceu Marana é doutor em Engenharia Elétrica pela Faculdade de Engenharia Elétrica e de Com-putação da UNICAMP. Realizou estágio de pós-doutorado na Michigan State University, East Lansing, MI, USA, no período de agosto de 2004 a julho de 2005, com o Professor Anil K. Jain, na área de Biometria. Foi chefe do Departamento de Computação, da Faculdade de Ciências, Unesp, Bauru, no período de julho de 2002 a julho de 2004. Foi coordenador dos cursos de pós-graduação lato-sensu, CEInfo e CETI, da Faculdade de Ciências, Unesp, Bauru, nos anos de 2000, 2001, 2006 e 2007. Foi presidente do Grupo de Avaliação Local da Faculdade de Ciências, Unesp, Bauru, no processo de Avaliação Institucional da Unesp, durante o triênio 2006-2008. Foi coordenador do Curso de Bacharelado em Ciência da Computação, Unesp, Bauru, no período de abril de 2008 a abril de 2010. Atualmente, é coordenador do Programa de Pós-Graduação em Ciência da Computação da Unesp.



1. INTRODUÇÃO

Existem muitos problemas da Agri-cultura de Precisão que utilizam informa-ções presentes no ambiente para poderem alcançar seus objetivos. Nesses sistemas, os sensores de visão são equipamentos po-pulares pois permitem uma captura basea-da em grande quantidade de informações do ambiente sem a necessidade de contato físico, além de possuírem custos bastante acessíveis se comparados a outros tipos de sensores.

DETECÇÃO DE REGIÕES EM CENÁRIOS NATURAIS UTILIZANDO UM SISTEMA DE VISÃO CATADIÓPTRICO

RODRIGUES Victor de AssisUniversidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

TRENTINI Vinicius BergoliUniversidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP)

[email protected]

TRONCO Mário LuizEscola de Engenharia de São Carlos Universidade de São Paulo (USP)

[email protected]

LÚLIO Luciano CássioEscola de Engenharia de São Carlos Universidade de São Paulo (USP)

[email protected]

RESUMO: Esse trabalho utiliza um sistema de visão catadióptrico para capturar imagens de um cená-rio natural agrícola e realizar o levantamento de regiões que possam auxiliar diversas aplicações na área da Robótica Móvel Agrícola. Os sistemas de visão catadióptricos buscam capturar uma imagem 360° do ambiente a partir da combinação de lentes e espelhos. A imagem omnidirecional é retificada e seus quadrantes são extraídos, originando quatro novas imagens que representam lados de visão do veículo. Uma etapa de segmentação por cor é proposta utilizando como base o algoritmo Otsu Thresholding. No final do processo, é possível visualizar as regiões de interesse de cada quadrante.PALAVRAS-CHAVE: Visão omnidirecional, robôs agrícolas móveis, sistemas catadióptricos, ambien-tes externos agrícolas.

ABSTRACT: This paper uses a catadioptric vision system to capture images of a natural agricultural scenario and to perform the recognition of regions. This recognition can be useful to many applica-tions in the mobile robotic area. The catadioptric vision systems aim to obtain a 360-degree vision of the environment by using a combination of lenses and mirrors. The omnidirectional image obtained is unwrapped and its quadrants are generated, which represents each side of the vehicle. The step of segmentation using color band is applied based on the Otsu Thresholding algorithm. In the last step of the process, the regions of interest for each quadrant can be visualized.KEYWORDS: Omnidirectional vision, agricultural mobile robots, catadiptric systems, agricultural outdo-or environments.

Em alguns problemas da área da Visão Computacional, entretanto, é neces-sário ampliar o campo de visão para au-mentar a eficiência das aplicações. Na Agri-cultura de Precisão tarefas como vigilância de ambientes, rastreamento, navegação e mapeamento de ambientes (BONARINI et al., 2000; BAKER; NAYAR, 1999) exigem um grande volume de informações para que seus processos funcionem adequadamen-te.

Os Sistemas de Visão Omnidi-recional podem ser uma alternativa para


aumentar a capacidade de captura de in-formações do ambiente, pois fornecem téc-nicas que possibilitam obter imagens 360º do ambiente (NAYAR, 1997). Dentro dessas técnicas estão os sistemas omnidirecionais catadióptricos, criados a partir da combina-ção de lentes e espelhos.

Esse trabalho pertence ao módu-lo de visão computacional do projeto Agri-BOT. O AgriBOT é uma plataforma robótica modular com o objetivo de locomoção em ambientes típicos da área agrícola, pos-suindo como finalidade a aquisição de da-dos e pesquisa de novas tecnologias para o sensoriamento remoto para a área agrícola (NEPAS, 2014). O projeto teve a atuação de professores e estudantes de graduação e pós-graduação da EESC/USP (Escola de Engenharia de São Carlos da Universidade de São Paulo). Além disso, diversas enti-dades brasileiras importantes participaram do projeto, como a FINEP (“Financiadora de Estudos e Projetos”), Embrapa (“Empre-sa Brasileira de Pesquisa Agropecuária”) e Jacto S.A. company (DIAZ et al., 2013). As culturas estudadas nesse projeto são milho, cana-de-açúcar e laranja.

Esse trabalho consiste na captura e identificação de regiões em imagens om-nidirecionais relacionadas ao percurso efe-

tuado pela plataforma robótica em cenários agrícolas. A identificação de regiões pre-sentes no ambiente permite a precipitação de situações que possam ocorrer durante a navegação. Essas informações resgatadas do ambiente servem de base para outros módulos do veículo, sendo este intimamen-te ligado ao sistema de controle de nave-gação da plataforma robótica base (NEPAS, 2014). Entretanto, durante o desenvolvi-mento desse trabalho foi possível identificar que a solução poderia se tornar uma aplica-ção modular, auxiliando outros sistemas da Agricultura de Precisão a alcançarem seus objetivos por meio das informações gera-das, tanto de forma total como parcial.

O trabalho é organizado como se-gue: a Sessão 1 apresenta a metodologia do trabalho e os conceitos utilizados, a Ses-são 2 apresenta os resultados obtidos e na Sessão 3 a conclusão.

2. PROPOSTA DO TRABALHO

Para alcançar os objetivos espera-dos para o desenvolvimento do projeto foi proposta uma metodolog

Date post:	25-Jan-2021
Category:	Documents
Upload:	others
View:	0 times
Download:	0 times

Interciência 1 Sociedade · o contínuo apoio do Prof. Me. Márcio Antonio Ferreira, diretor da...

Documents