+ All Categories
Home > Documents > Revista Ingenieria 2010 Vol. 1 y 2

Revista Ingenieria 2010 Vol. 1 y 2

Date post: 25-Mar-2016
Category:
Upload: gerson-villa-gonzalez
View: 225 times
Download: 6 times
Share this document with a friend
Description:
Revista Ingenieria 2010 Vol. 1 y 2
Popular Tags:
97
l Vol. 15 No. 1 y 2 Año 2010 l l Vol. 15 No. 1 y 2 Año 2010 l l Vol. 15 No. 1 y 2 Año 2010 l Representación computacional del lenguaje natural escrito Computational representation of written natural language Sonia Ordoñez Salinas • Alexander Gelbukh Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país Impact of the ISO 9001:2000 standard on countries competitiveness Luz Esperanza Bohórquez Arévalo Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos A software tool for the development of graphic-model-based hardware descriptions using VHDL Jose Roberto Vargas Rivero Sistema de inferencia difusa basado en relaciones Booleanas A fuzzy inference system based on Boolean relations Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM” mediante ingeniería dirigida por modelos Developing a domain-specific language for learning management systems, and a corresponding implementation tool (“KiwiDSM”) through model-driven engineering Carlos Enrique Montenegro Marín Juan Manuel Cueva Lovelle Óscar Sanjuán Martinez Paulo Alonso Gaona García Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana A capacity planning model for web hosting providers serving small- and medium-scale businesses in Colombia Olga Lucía Ramírez Calero Jairo Humberto Torres Acosta Contenido Volumen 15 • Número 2 • Año 2010 Volumen 15 • Número 1 • Año 2010 6 - 21 52-66 Pág. Pág. 22-34 67-81 35-46 82-95
Transcript
Page 1: Revista Ingenieria 2010 Vol. 1 y 2

lVol. 15 No. 1 y 2 Año 2010l lVol. 15 No. 1 y 2 Año 2010l

lV

ol. 1

5

No

. 1 y

2

o 2

010

l

CR 83A 75-50 BLA CASA1812 DIANA DUARTE ASCABIO

Representación computacional del lenguaje natural escrito

Computational representation of written natural languageSonia Ordoñez Salinas • Alexander Gelbukh

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Impact of the ISO 9001:2000 standard on countries competitivenessLuz Esperanza Bohórquez Arévalo

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

A software tool for the development of graphic-model-based hardware descriptions using VHDLJose Roberto Vargas Rivero

Sistema de inferencia difusa basado en relaciones Booleanas

A fuzzy inference system based on Boolean relationsHelbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM” mediante ingeniería dirigida por modelos

Developing a domain-specific language for learning management systems, and a corresponding implementation tool (“KiwiDSM”) through model-driven engineeringCarlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

A capacity planning model for web hosting providers serving small- and medium-scale businesses in Colombia

• Olga Lucía Ramírez Calero Jairo Humberto Torres Acosta

Contenido

Volumen 15 • Número 2 • Año 2010

Volumen 15 • Número 1 • Año 2010

6 - 21

52-66

Pág.

Pág.

22-34

67-81

35-46

82-95

Page 2: Revista Ingenieria 2010 Vol. 1 y 2

IngenieríaREVISTAREVISTA

IngenieríaREVISTA CIENTÍFICA SEMESTRAL

Volumen 15 • Número 1 • Año 2010 • ISSN 0121-750X

20

10

UNIVERSIDAD DISTRITALFRANCISCO JOSÉ DE CALDAS

FACULTAD DE INGENIERÍA

Page 3: Revista Ingenieria 2010 Vol. 1 y 2

UNIVERSIDAD DISTRITAL FRANCISCOJOSÉ DE CALDAS, FACULTAD DE INGENIERÍA

Carrera 7 No. 40-53 Piso 4 Bogotá, ColombiaTeléfono: + 57 (1) 323 93 00 ext. 2413

Correo electrónico: [email protected]://revistas.udistrital.edu.co/ojs/index.php/reving

EDITOR

Inocencio Bahamón C., MSc.Rector

María Elvira Rodríguez, PhD.Vicerrectora Académica

Octavio Salcedo Parra, MSc.Decano Facultad Ingeniería

Luz Esperanza Bohorquez, MSc.Universidad Distrital Francisco José de Caldas

Marco Alzate, PhD.Universidad Distrital Francisco José de Caldas

Rodrigo Herrera, Magister.Universidad Distrital Francisco José de Caldas

Ana María Peña, PhD.Universidad Distrital Francisco José de Caldas

Edwin Rivas, PhD.Universidad Distrital Francisco José de Caldas

Juan Carlos Figueroa, MSc.Universidad Distrital Francisco José de Caldas

COMITÉ CIENTÍFICO

Germán Méndez, PhD.Universidad Distrital Francisco José de Caldas

Víctor Hugo Grisales, PhD.Universidad Nacional de Colombia

Sofía Natalia Galicia Haro, PhD., U. Nacional Autonoma de Mexico

Grigori Sidorov, PhD., Instituto Politecnico Nacional de Mexico

Fabiola Sáenz Blanco, PhD., Universidad Distrital

Mabel Muñoz, Universidad Distrital

Laura Marcela Giraldo, Econ., Universidad Distrital

Andrés Gaona, MSc., Universidad Distrital

Jose Luis Villa, PhD., Universidad Tecnológica de Bolivar

Daniel Llamocca, MSc., The University of New Mexico

Fabio González, PhD., Universidad Nacional de Colombia

Juan Carlos Figueroa, MSc., Universidad Distrital

Oscar German Duarte, PhD., Universidad Nacional de Colombia

Jose Marcio Luna, MSc., University of New Mexico

Álvaro David Orjuela, MSc., Universidade Federal do Rio de Janeiro

Eduardo Caicedo Bravo, PhD., Universidad del Valle

Jose Guillermo Guarnizo Marin, MSc., U. Nacional de Colombia

ÁRBITROS EN ESTA EDICIÓN

Los textos de los artículos incluidos en esta edición pueden serutilizados y reproducidos con fines sin ánimo de lucro y dando créditoa los autores.

PERMISO DE REPRODUCCIÓN

Cra. 7 No. 40-53 P. 4 Decanatura Facultad de IngenieríaTeléfono: + 57 (1) 323 93 00 ext. 2413

SUSCRIPCIÓN

INDIZADA EN

Ni la Revista INGENIERÍA, Editor, Comité Editorial, Facultad de Ingenieríade la Universidad Distrital F.J.C., otorgan ninguna garantía, expresa o implí-cita, o asumen responsabilidad alguna por la exactitud, completitud o utilidadde cualquier información, aparato, producto o proceso divulgado, o que repre-sente que su uso no infrinja derechos privados. La mención o referencia aalgún producto, proceso o servicio comercial en específico, por su marcacomercial, marca registrada, fabricante o cualquier otra denominación, noimplica ni constituye su endoso, recomendación o favorecimiento por partede la Revista INGENIERÍA. Los juicios y opiniones expresadas por los autoresen este medio son de su responsabilidad, y no establecen, reflejan o compro-meten los de la Revista INGENIERÍA.

COMITÉ EDITORIAL

Maquetación, indización, copyedición, diseño gráfico e impresión:

Grupo Editorial Gaia

Sergio A. Rojas, PhD.Universidad Distrital Francisco José de Caldas

La Revista INGENIERÍA es editada por la Universidad Distrital, ypublicada con periodicidad semestral. Su principal objetivo es difundiry debatir avances en investigación y desarrollo en las diferentesáreas de la ingeniería. El contenido de la revista está dirigido ainvestigadores, especialistas, docentes, estudiantes de pregrado yposgrado, ingenieros en ejercicio y al sector empresarial.

POSTURA EDITORIAL Y AUDIENCIA

REVISTA CIENTÍFICA SEMESTRALPublicación admitida en el Índice Nacional de Publicaciones

Seriadas Científicas y Tecnológicas de Colciencias

Vol. 15 • No. 1 • Año 2010 • ISSN 0121-750X

DIRECTIVAS

REVISTAREVISTA

IngenieríaIngeniería

Colciencias

UNAM

UNAM

Directory of Open Access Journals

Universidad de la Rioja

Sergio A. Rojas, PhD.Universidad Distrital Francisco José de Caldas

REVISOR DE ESTILO

Ing. Felipe Forero, CAE (Cambridge).

SCIENTIFIC WRITING ADVISOR

Page 4: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 3

Reingeniería a la Revista INGENIERÍA

La Revista INGENIERÍA, fundada en 1993, ha tenido publi-cación seriada desde el año 2000, lo que la constituye en una delas de mayor tradición en el país. Su prestigio es alto, no así suimpacto ni su visibilidad, tal como lo evidencia su indización en laCategoría C (bajo impacto) en el índice PUBLINDEX-Colciencias. El principal reto que se han propuesto el Editor y elComité Editorial presentes, apalancándose en la trayectoria de laRevista, es consolidar este espacio como un medio de divulga-ción de avances y reflexiones científicas reconocido comoreferencia primaria para la actividad ingenieril colombiana. Nues-tro propósito es ser leídos. Nuestro desafío es ser citados.

Lo anterior requiere de varios frentes de acción, entre ellos larigurosidad editorial, las plataformas digitales, y el apoyoinstitucional. A esto lo hemos denominado la necesidad de reali-zar una reingeniería a la Revista INGENIERÍA. El proceso dereingeniería lleva en marcha ya cerca de un año. En nuestras notaseditoriales iremos comentando los diferentes aspectos que se va-yan cubriendo. Comenzaremos por el tema de la plataformadigital. Nos complace comunicar a nuestra audiencia que a partirdel presente número y gracias a la colaboración del Centro de Inves-tigaciones y Desarrollo Científico de la Universidad Distrital, nuestraRevista cuenta desde ahora con un portal Web institucional:http://revistas.udistrital.edu.co/ojs/index/reving. En este si-tio nuestros lectores podrán consultar de manera abierta elcontenido de los artículos del número en curso, así como suarchivo digital completo desde 1993. La plataforma es una herra-mienta de gestión documental y editorial, OJS (Open JournalSystem), con lo que esperamos más adelante, sistematizar igual-mente el proceso de recepción, evaluación, corrección,diagramación y seguimiento a la comunicación con nuestros auto-res, evaluadores, editores y lectores. Por el momento, lacomunicación con todos ellos la realizamos de manera electróni-ca en nuestro buzón: [email protected]. Esperamoseste sea un paso adelante en la evolución que nos proponemos.

EditorialIn

geni

ería

RE

VIS

TA

RE

VIS

TA

Inge

nier

íaCitación: Rojas, S.A.. (2010). Reingeniería a la RevistaINGENIERÍA. En: Ingeniería, Vol. 15, No. 1, pág. 3-4.

Page 5: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS4

Por otra parte, hemos tomado la desición de aumentar losestándares de rigurosidad editorial. Entre otras medidas, he-mos promocionado la exogeneidad de los evaluadores, en loposible estamos buscando que tengan estudios de doctoradopreferiblemente con investigaciones en el tema del artículo enevaluación. Igualmente estamos realizando una revisión cui-dadosa de estilo en español, además de exigir medidas depresentación de gráficas, imágenes, seguimiento de normas yfiltros de plagio y de citación más estrictos. Contamos con unconsultor certificado Cambridge para revisar la traducción alinglés del título y resumen de los artículos. Ahora es comúntener hasta 3 y 4 rondas de revisión con nuestros autores.Nuestros lectores también notarán un aire fresco en ladiagramación de los artículos, con un nuevo formato en unacolumna, una tinta, que nos brinda mayor libertad particular-mente en la presentación de tablas, figuras y modelosmatemáticos.

La renovación de estas pautas tiene como intención alcanzarla meta mencionada en un comienzo. Aunque bienintenciona-das, indudablemente tiene un costo asociado. El factor derechazo ha subido a cerca de un 72%, de forma que el mate-rial con mérito de publicación ha menguado. Nos hemos vistoen la necesidad de conformar números menos voluminososen cantidad, pero más abundantes en pertinencia científica.Creemos que es un camino doloroso pero confiamos en queal recorrerlo, logremos posicionar la Revista en un lugar pre-ponderante. Agradecemos desde ya a nuestros autores,evaluadores y lectores por su paciencia y acompañamiento eneste proceso de reingeniería. Los dejamos pues con un núme-ro renovado de nuestra Revista donde se abarcan temáticascomo la representación del lenguaje escrito en estructurascomputacionales, el estudio del impacto de la certificación ISO9001 en la comptetitividad-país, y la descripción de una herra-mienta visual para generar especificaciones de hardware enVHDL. A nuestros autores provenientes de la UniversidadDistrital y el Instituto Politécnico de México, y a nuestrosevaluadores de la UNAM, el IPN de México, la UniversidadDistrital, la Universidad Tecnológica de Bolivar, The Universityof New Mexico, la Universidad Nacional de Colombia, laUniversidade Federal do Rio de Janeiro, y la Universidad delValle, nuestra inmensa gratitud.

Ing. Sergio A. Rojas, MSc., PhD.Editor General Revista INGENIERÍA

La Red Colombiana de Revistas de Ingeniería

Page 6: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 5

Con

teni

do Representación computacionaldel lenguaje natural escritoComputational representationof written natural language

Sonia Ordoñez Salinas • Alexander Gelbukh

Estudio del impacto de la certificaciónISO 9001:2000 en la competitividad-paísImpact of the ISO 9001:2000 standardon countries competitiveness

Luz Esperanza Bohórquez Arévalo

Herramienta de software para el desarrollode descripciones de hardware utilizandoVHDL a partir de modelos gráficosA software tool for the development of graphic-model-based hardware descriptions using VHDL

Jose Roberto Vargas Rivero

REVISTA CIENTÍFICA SEMESTRAL

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS, FACULTAD DE INGENIERÍAPublicación admitida en el Índice Nacional de Publicaciones Seriadas Científicas y Tecnológicas de Colciencias

Volumen 15 • Número 1 • Año 2010 • ISSN 0121-750X

IngenieríaREVISTA

Páginas

6 - 21

22 - 34

35 - 46

Page 7: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS6

Representación computacionaldel lenguaje natural escritoComputational representation ofwritten natural language

ResumenCuando el ser humano lee o escucha una palabra, inmedia-

tamente la relaciona con un concepto. Esto es posible graciasa la acumulación de información y a la posibilidad de filtrar,procesar y relacionar dicha información. Para la máquina,una expresión escrita en el lenguaje natural es una cadena debits que no aporta información por sí sola. Un computadorinterpreta esta cadena de bits, modelando el proceso quetiene lugar en la mente humana, estructurando y relacionadola cadena con información previamente almacenada. En elproceso, así como al momento de describir los resultados, eltexto es representado por estructuras formales que permi-ten el procesamiento automático, la interpretación y lacomparación de la información. Este artículo presenta unadescripción detallada de estas estructuras.

Palabras claves: Procesamiento de lenguaje natural, es-tructuras computacionales.

AbstractWhen humans read, or hear, words, they immediately rela-

te them to a concept. This is possible due to the informationalready stored in the brain and also to human’s ability toselect, process, and associate such information with words.However, for a computer, natural language text is only asequence of bits that does not convey any meaning on itsown, unless properly processed. A computer interprets thisbit sequence by modeling the processing that takes place inhuman minds, namely structuring and linking the text withpreviously stored information. During this process, as wellas when describing its results, the text is represented usingvarious formal structures that permit automatic processing,interpretation, and comparison of information. In this paper,we present a detailed description of these structures.

Key words: Natural language processing, computationalstructures.

Citación: Ordoñez, S.S. y Gelbukh, A. (2010). Representación computacionaldel lenguaje natural escrito. En: Ingeniería, Vol. 15, No. 1, pág. 6 -21.

Sonia OrdoñezSonia OrdoñezSonia OrdoñezSonia OrdoñezSonia OrdoñezSa l inasSa l inasSa l inasSa l inasSa l inas

Universidad DistritalFrancisco José de Caldas

Facultad de Ingeniería [email protected]

Alexander GelbukhAlexander GelbukhAlexander GelbukhAlexander GelbukhAlexander GelbukhLaboratorio de Lenguaje Natural y

Procesamiento de Texto del Centro deInvestigación en Computación del

Instituto Politécnico Nacional, México www.gelbukh.com

Page 8: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 7

1. IntroducciónLa mayor parte de la información que posee la humanidad se encuentra almacenada

en forma de lenguaje natural. La gran necesidad de los usuarios de esta información esgestionarla: almacenarla, consultarla, entenderla y actualizarla.

Para el ser humano una frase expresada en lenguaje natural leída, escuchada, hablada oescrita adquiere inmediatamente un significado. Cada palabra o conjunto de palabras, seasocia con un conjunto de experiencias e imágenes que al ser relacionadas y filtradas traea la mente exactamente el significado correcto. El hombre identifica de quien se habla, laacción que realiza, el tiempo, los sinónimos, el dominio y todas las particularidades dellenguaje natural. Para una máquina computacional, un texto escrito en lenguaje natural,corresponde a una cadena de bits (símbolos) sin significado alguno. Para que una máqui-na pueda entender su significado, se debe recurrir a técnicas propias del procesamiento dellenguaje natural (PLN) y de la lingüística computacional (LC) y a artificios computacionalescomo el de estructurar la información de tal forma que esta pueda ser gestionada yrelacionada con algún significado. Significado que puede buscarse usualmente en ele-mentos especializados para tal fin, tales como ontologías, tesauros, bases de conocimiento,entre otros (ver Figura No 1).

Figura 1. Procesamiento del lenguajenatural por el humano vs. la máquina (fuente: autores)

El proceso de estructurar el texto escrito en lenguaje natural o de representar la cadenade símbolos en una estructura computacional como un vector, un árbol, una pila, unmodelo relacional, entre otras, permite que se pueda gestionar la cadena a través dealgoritmos computacionales. Para transformar de forma automática el texto a la estruc-tura escogida se utilizan las partes de dicha cadena, es decir las palabras y sus interrelacionesy de acuerdo a la estructura escogida, es deseable que, por un lado, dicha estructurapermita incluir la mayor cantidad de información —entendida información como aque-lla que aporta al significado de la cadena—, y por el otro, que el proceso de transformarla cadena a esta estructura sea factible de ser automatizado.

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 9: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS8

Representación computacional del lenguaje natural escrito

En términos generales se podría afirmar que el PLN, es una disciplina que con apoyode la LC se encarga de proveer soluciones para la interpretación y gestión del lenguajenatural. Dichas disciplinas se soportan en técnicas y métodos propios de la estadística,las matemáticas, la lingüística, la inteligencia artificial, entre otras. Lo correspondiente a lageneración de herramientas y aplicativos que incluyen la gestión del lenguaje natural sepuede enmarcar dentro de lo que se conoce como ingeniería lingüística.

En la actualidad ya no es solo el deseo de que las máquinas computacionales puedanestablecer una comunicación utilizando el lenguaje natural, tal y como lo hacen las perso-nas sino que se ha convertido en una exigencia. Es así que responder a un sinnúmero denecesidades actuales como la utilización de la información almacenada a través de laWeb o de aplicativos ya sea para buscar información específica, patrones de comporta-miento o predicciones han hecho que cada vez se busquen y optimicen alternativas paraque de alguna manera las máquinas interpreten el contenido de los documentos digitalesexpresados en lenguaje natural. Consecuentemente, entre las aplicaciones más comunesen las áreas en mención son la recuperación de información, la respuesta automática apreguntas, la traducción automática y la clasificación de documentos.

En este artículo se presenta una revisión del primer aspecto mencionado, es decir de lasestructuras computacionales utilizadas para el procesamiento del lenguaje natural escrito.El artículo está organizado como sigue. En la sección 2 se presenta brevemente la infor-mación general sobre dichas estructuras. En la sección 3 se presentan las estructurasbásicas, las cuales no representan la semántica detallada. En la sección 4 se presentanestructuras más avanzadas. En la sección 5 presenta detalles sobre las estructuras concep-tuales que tienen un estándar claro para su construcción. Finalmente la sección 6 concluyeel artículo.

2. Estructuras computacionales en el PLNUna gran variedad de formalismos estructurados han sido propuestos para represen-

tar los textos en el lenguaje natural. Estos formalismos van desde las representacionesmás simples como las vectoriales hasta las más complejas como los lenguajes estructurados,estructuras conceptuales y formalismos matemáticos como los grafos. Los formalismosmás simples, en el sentido de que pueden capturar menos cantidad de elementos queconduzcan a la interpretación del significado o semántica y su procesamiento, incluida latransformación de la cadena de caracteres a dicha estructura requiere de una algoritmia.Por su parte los formalismos más complejos, si bien permiten incluir más elementos quepueden contribuir a la interpretación del significado inmerso dentro de la cadena, elprocesamiento —la transformación de lenguaje natural al formalismo y viceversa— esmás complicado y, lo más importante, mucho menos confiable con la tecnología actual.En la sección 4 se amplia y detallan estas estructuras y se justifica del porqué se hacen talesafirmaciones.

En las siguientes secciones se presenta una revisión de las estructuras computacionales,empezando por las más básicas y continuando con más avanzadas.

Page 10: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 9

3. Estructuras básicasDentro de esta categoría se clasifican aquellas estructuras que se usan cuando no se

requiere mayor nivel de detalle, resultados aceptables y bajo costo computacional. Tantoel proceso de convertir el texto en una estructura, como el de gestionar dicha estructura,requiere de una algoritmia básica y por ende un bajo costo computacional. Es de anotarque estas estructuras también son la base para las estructuras más avanzadas.

3.1 Modelo de espacio vectorialTeniendo en cuenta el conjunto de palabras que hacen parte de una sentencia, una

representación muy clásica es la propuesta por Salton [1], autor del trabajo pionero enrepresentar los documentos como un vector de frecuencias, donde cada entrada (coor-denada) del vector corresponde a una determinada palabra dentro del documento y suvalor es la frecuencia de aparición de dicha palabra. Se puede decir que la mayoría detrabajos de recuperación de información y clasificación utilizan dicha representación,como en [2], [3] y [4].

Trabajar con las palabras que pertenecen a un lenguaje conlleva al manejo de un grannúmero de variables y por ende el procesamiento de alta dimensionalidad. El procesar ellenguaje a través de alguna estructura no elimina, por sí solo, la problemática de ladimensionalidad, por lo que aparecen trabajos que estudian el comportamiento de laspalabras con análisis estadístico [5] y los que permiten asimilar las palabras a sus raíces(stemming) como el presentado en [6] o el algoritmo propuesto por Porter, llamado Porterstemmer [7].

Otra representación basada también en vectores, es aquella donde cada entrada delvector significa la presencia o ausencia de una palabra en el documento, es decir que eldocumento se representa como un vector de entradas binarias [8].

La representación de documentos con la estructura vectorial, puede darse a través detuplas como un conjunto de parejas (término, peso), donde el peso corresponde a unvalor dado de acuerdo a la parte del documento donde aparece la palabra —por ejem-plo, un título tendrá mayor peso que un subtítulo.

La colección de palabras puede ser extraída de todo el documento o de alguna parteespecífica como de los títulos o el resumen: por ejemplo, en [9] las palabras se extraenúnicamente de los enlaces de un hipertexto, para así cumplir con un trabajo de clasifica-ción.

Con esta representación se pueden utilizar diferentes técnicas en las tareas propias delprocesamiento del lenguaje natural. Por ejemplo, en los trabajos de recuperación deinformación y de indexación se utilizan métodos de semántica latente que buscan visualizarlas relaciones ocultas que existen entre las palabras a través de la aplicación de vectores yvalores propios [10]. Estas técnicas se aplican sobre vectores de frecuencia o sobrevectores cuyo contenido corresponde a valores binarios [11].

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 11: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS10

3.2 ListasLas colecciones de palabras representadas con estructuras básicas no solo se han teni-

do en cuenta de forma vectorial sino también como listas. Den-tro de esta clasificaciónse pueden referenciar las estructuras utilizadas para indexar documentos a través de losíndices invertidos. Un índice invertido es una lista de términos acompañados por losnúmeros o referencias de los documentos en los cuales aparecen dichos términos. Elcontenido de dicha lista puede tener algunas variaciones como por ejemplo que a demásde contener el documento, contenga las posiciones donde se encuentra la palabra dentrodel documento o la presentada en [12], donde cada documento se representa por mediode una lista de tuplas (palabra, valor).

3.3 GrafosExisten varios métodos para representar los documentos como grafos. En [13], se

clasifican los métodos en: estándares, simples, distancia n, distancia n-simple, frecuenciaabsoluta y frecuencia relativa. Cada método se basa en examinar los términos en cadadocumento y sus adyacencias. Al igual que en otros métodos, los términos se extraen deldocumento y se realiza un pre-procesamiento, que generalmente consiste en eliminar laspalabras que no aportan significado a los documentos (stop words) para así tratar dedisminuir la dimensionalidad. A continuación brevemente se expondrá en qué consistecada una de las representaciones.

• Estándar. Cada palabra corresponde a la etiqueta de un nodo y si una palabra ainmediatamente precede a una palabra b en una sección s, entonces existe una aristaque comienza en a y termina en b etiquetada con s. En este caso se tiene en cuentala puntuación y las secciones propias de un documento como el título o resumen,entre otros.Simple. A diferencia de la estándar, no se etiquetan las aristas con las secciones yno se tienen en cuenta todas las secciones sino aquellas que sean más visibles.

• Distancia n. Se buscan las n palabras siguientes a partir de un término dado, y lasaristas se etiquetan con la distancia al punto inicial. El parámetro n es definido porel usuario.

• Distancia simple. Es similar a la anterior, con la diferencia de que las aristas noson etiquetadas y lo único que se sabe es que la distancia entre dos nodos conecta-dos es menor que n.

• Frecuencia absoluta. Es similar a la representación simple, pero cada nodo y aristason etiquetados con una medida de frecuencia. Para un nodo esto indica cuántasveces los términos aparecen en el documento; para las aristas esto significa el númerode veces que dos términos conectados aparecen en el orden específico. Bajo estarepresentación, el tamaño del grafo se define como la suma de las frecuencias de losnodos más la suma de las frecuencias de las aristas.

• Frecuencia relativa. Es similar a la frecuencia absoluta con la diferencia de quelas frecuencias son normalizadas entre 0 y 1. Los nodos se normalizan por el valormáximo de frecuencia de los nodos y las aristas similarmente por el máximo valorde frecuencia en las aristas.

Representación computacional del lenguaje natural escrito

Page 12: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 11

Varias propuestas utilizan la representación con grafos. Por ejemplo, en [6] se represen-ta un documento por un grafo que tiene en cuenta la frecuencia de ocurrencia de laspalabras. En [14] se incluyen varias formas de representar los documentos a través de losgrafos. Además, en [6] se propone una metodología para la construcción de grafos: apartir de análisis del dominio se presentan objetos o entidades que son agrupados dentrode clases o tipos.

3.4 Estructuras estadísticasCon base a la teoría de la información se han realizado investigaciones sobre el com-

portamiento de las palabras y la información que más aporta a un documento.

El primer modelo estadístico del lenguaje fue propuesto por Claude Shannon [39]. Deacuerdo a la teoría de la información, el lenguaje se modela como una fuente estadísticade información. La estadística se ha constituido en una herramienta fundamental para elanálisis de lenguaje natural. De igual forma se han propuesto estructuras que incluyenfunciones probabilísticas para representar el contenido de un texto. Dentro de estasestructuras están, por ejemplo, los modelos de Markov, las gramáticas probabilísticas, losanalizadores probabilísticos [22]. En general, cualquier estructura (un vector, un grafo olista, entre otros) puede ser marcada con probabilidades o funciones de probabilidad.

En los modelos probabilísticos, se construyen distribuciones de los documentos quepertenecen a una clase. En el caso de recuperación de información, por ejemplo, seasume una distribución para los documentos relevantes y otra para los no relevantes. Seestablecen suposiciones sobre las distribuciones, como independencia, y se aplican pro-cedimientos como el clasificador de Bayes simplificado (naïve Bayes) [22]. En los trabajoscomo [18], la representación de los documentos se logra a través de funcionesprobabilísticas, y se asume que un documento fue generado a partir de una función dedensidad. En dicha investigación, se utiliza un método de agrupamiento (clustering)discriminativo distribucional para extractar las características relevantes de los documen-tos y así representar los documentos como una distribución de probabilidad.

En otros trabajos se mezclan algunas de las técnicas previamente ya expuestas conmodelos del lenguaje. En [19], por ejemplo, se presenta un modelo probabilístico pararepresentar el grafo de un documento, con la esperanza de que en el marco de la recupe-ración de información, un modelo de grafo pueda generar o estimar un grafo de laconsulta.

Los modelos estadísticos diferentes a los modelos probabilísticos incluyen las depen-dencias directas que se presentan por la proximidad o adyacencia entre palabras comoen los bigramas y en general los n-gramas ([19], [21]).

4. Estructuras avanzadasPara este documento se asumen como estructuras avanzadas aquellas que permiten

incluir elementos propios de la lingüística. Entendida la lingüística como el estudio de laestructura de las lenguas naturales [52]. La ventaja de incluir más información propia dellenguaje (mayor significado) se torna en desventaja a la hora de su procesamiento. La

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 13: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS12

tarea para una máquina de entender que elemento debe ubicar, donde lo debe ubicar y conquien lo debe relacionar, no es tan trivial como se quisiera. El proceso tanto de transfor-mar de manera automática el texto a la estructura en cuestión como el de gestionar laestructura puede llegar a requerir de métodos heurísticos propios de la inteligencia artifi-cial, el aprendizaje estadístico, entre otros, que por su fundamentación teórica basadageneralmente en supuestos estadísticos, arrastran un margen de inexactitud.

Estas afirmaciones se hacen en virtud a que algunas de estas estructuras permitenincluir elementos propios de la sintáctica y la semántica, entre otros, por lo que exige laubicación y la relación de elementos propios de la interpretación del lenguaje. Si se hablade elementos sintácticos, se requiere de la ubicación, las interrelaciones y las dependenciasdel verbo, el sustantivo, el predicado, entre otros. Si se habla de elementos semánticos, elobjeto, el actor, el recipiente, la herramienta, sus relaciones y dependencias, entre otros.

El proceso de automatización de los anteriores elementos, exige de la interpretacióndel lenguaje con todos los fenómenos propios, como por ejemplo, que una palabrapuede referirse a un sujeto que previamente o posteriormente se ha hecho referencia(anáforas y catáforas), que dos palabras diferentes significan lo mismo (sinonimia), queuna palabra significa diferente dependiendo del contexto (homonimia), que un sustanti-vo puede ejercer la función de adjetivo, que una palabra o conjunto de palabras hacenreferencia a un nombre propio (entidad nombrada).

Dentro de esta categoría se pueden ubicar las representaciones a través de las gramáti-cas y a la lógica, así como los lenguajes orientados a objetos y aquellos usados para lacreación de repositorios de datos como el Lenguaje de Definición de Datos (DDL, porsus siglas en inglés: Data Definition Language).

4.1 Representación gramaticalUna forma que se podría utilizar para representar un documento es a través de la

descripción morfológica y sintáctica. La descripción morfológica establece la clase gra-matical de cada una de las palabras del texto. Dicha clase se define de acuerdo a lafunción gramatical en el proceso que se denomina etiquetamiento de categorías grama-ticales (part of speech tagging).

El análisis sintáctico se encarga de analizar la sentencia teniendo en cuenta tanto lafunción que ejerce cada palabra así como las relaciones existentes entre las mismas. Paradicho análisis se construyen estructuras sintácticas mediante las técnicas de constituyentes,de dependencias o de enlaces, entre otras.

La técnica de análisis de constituyentes consiste en construir un árbol a partir de lateoría de gramáticas generativas expuestas por Noam Chomsky [53] y de un procesoiterativo de segmentación y clasificación gramatical de la oración, hasta que las partesconstituyentes sean indivisibles.

Desde el punto de vista de la teoría de las dependencias [36] se puede construir unajerarquía —esquematizada en un árbol— de acuerdo al papel que ejercen las palabrasdentro de la frase como la cabeza o raíz del árbol, las subordinadas y rectoras [37]. Las

Representación computacional del lenguaje natural escrito

Page 14: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 13

relaciones se marcan con flechas y varias palabras pueden depender de una sola, aunquecada palabra excepto la raíz depende de exactamente de otra palabra.

Las gramáticas de enlace (link grammars) introducidas en [40] se definen como un conjun-to de palabras que requieren de un enlace. Una sucesión de palabras equivale a una frase dellenguaje natural si existe una forma de dibujar los enlaces entre las palabras que la confor-man. Dichos enlaces no se cruzan y satisfacen los requerimientos de cada palabra.

4.2 Lógica de primer orden y otros métodos basados en lógicaEn la lógica de primer orden (FOL por sus siglas en inglés: First Order Logic), con

pocos símbolos básicos se pueden representar elementos del mundo real y a través depredicados se pueden establecer las relaciones entre los elementos. Es así que usandoelementos, proposiciones y operadores simples se puede representar el texto [15].

La lógica del primer orden es un sistema deductivo formal usado en las matemáticas,filosofía, lingüística e informática. Se conoce también como cálculo de predicados deprimer orden (FOPC por sus siglas en inglés: First Order Predicate Calculus), el más bajocálculo de predicados, el lenguaje lógico de primer orden o lógica de predicados.

Con esta técnica se pueden representar texto y por ende documentos. Por ejemplo, en[16] un documento se presenta como una sentencia lógica proposicional de la formad = (recuperación ∧ información) ∨ (recuperación ∧ datos).

Siguiendo la representación a través de la lógica, se encuentran investigaciones como[17], donde a través de la lógica difusa se representa el documento para implementarposteriormente una forma de recuperación de documentos.

4.3 Lenguaje de representación de marcosLos lenguajes de tipo FRL (por sus siglas en inglés: Frame Representation Language) clasi-

ficados bajo esta categoría, se definen como metalenguajes basados en el concepto demarco (frame), orientado al reconocimiento y descripción de objetos y clases. La ideaprincipal del razonamiento basado en estos lenguajes es la simplificación, ya que la uni-dad primaria de organización es el marco. Un marco tiene un nombre y puede tenervarios atributos. Cada atributo tiene a su vez un nombre y un valor. Los diferentes tiposde valores pueden ser de una amplia variedad de acuerdo al sistema de marcos. Losvalores más comunes son las cadenas y los símbolos [41].

En los FRLs, la herencia es el mecanismo de inferencia central basado en la organiza-ción jerárquica. Muchos sistemas que se basan en este lenguaje, permiten la herenciamúltiple, como los lenguajes de programación y en particular los orientados a objetos.Los FRLs, contrario a las ontologías que buscan representar el conocimiento en detalle[15], solo se ocupan de representar el conocimiento como objetos. Sin embargo, algunasimplementaciones y lenguajes basados en FRLs, pueden asumir un lenguaje ontológico.Dentro de las implementaciones basadas en FRLs destacan los siguientes:

Protégé. Protégé [42] es una plataforma de desarrollo de ontologías definida en mar-cos y bajo el estándar del lenguaje ontológico para la Web (OWL: Web Ontology Language),

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 15: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS14

desarrollada en Java. Las ontologías definidas pueden ser exportadas en una ampliavariedad de formatos.

Capa de inferencia ontológica. La Capa de Inferencia Ontológica o lenguaje deintercambio ontológico (OIL: Ontology Inference Layer o Ontology Interchange Language) [43]se define como una estructura ontológica para la semántica en la Web.

Lógica de marcos. La lógica de marcos (Frame logic o F-logic) [44] es un lenguajeontológico que permite representar el conocimiento. Su estructura está basada tanto enel FRL como en la orientación a objetos.

Sistema para representación de conocimiento. El sistema para representación deconocimiento (Knowledge Representation One o KL-ONE) [45] es un lenguaje muy similar almismo FRL (aunque los marcos en este lenguaje se llaman conceptos) con la diferenciade que se permite el manejo de subclase, superclase y múltiple herencia.

Lógica de descripciones. La lógica de descripciones (DL: Descriptions Logics) [46]corresponde a una familia de lenguajes definidos para representar el conocimiento. Sunombre se refiere por un lado a la descripción de conceptos para describir dominios ypor otro a la semántica basada en lógica de predicados de primer orden. Las DLsfueron diseñadas como una extensión de los FRLs y las redes semánticas con el fin defortalecer la parte semántica formal.

La lógica descriptiva no solamente representa el conocimiento como objetos sinojustifica el proceso con un razonamiento estrictamente lógico basado en conceptos, rolesy relaciones. Los conceptos corresponden a clases de elementos y son tratados comosubconjuntos del universo. Las relaciones corresponden a vínculos entre elementos y sontratados como relaciones binarias.

5. Estructuras conceptua-les estandarizadasLas estructuras conceptuales para la representación de conocimiento son modelos

(artefactos) que representan una realidad percibida. Con base en técnicas como la inteli-gencia artificial, estos modelos además de representar el conocimiento, pueden lograrreconstruir conocimiento a través de métodos como la inferencia [23].

Dentro de esta clasificación se encuentran las redes semánticas, los grafos conceptuales,el formato de intercambio de conocimiento (KIF: Knowledge Interchange Format) [47], ellenguaje de descripción de recursos (RDF: Resource Description Framework) [48] del con-sorcio World Wide Web Consortium (W3C) y los diferentes lenguajes ontológicos para laWeb (OWL: Web Ontology Language) propuestos por el W3C [24].

Otra estructura conceptual que se puede mencionar, es la Lógica Común (CL: CommonLogic) que no hace parte del grupo W3C pero se posiciona al lado de RDF y de OWL.CL es un marco (framework) para una familia de lenguajes basados en lógica. La lógica deprimer orden tiene como objetivo el intercambio y la transmisión de información. Elobjetivo de este framework es proveer la sintaxis y semántica abstracta de las sintácticas

Representación computacional del lenguaje natural escrito

Page 16: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 15

concretas o dialectos. El CL preserva el modelo teórico de primer orden, pero cuentacon características muy particulares como la de permitir construcciones de orden supe-rior tales como cuantificaciones sobre clases o relaciones.

5.1 Redes semánticasLas redes semánticas aparecen a partir de trabajos lingüísticos presentados en el año

1968, y de ahí en adelante los diferentes aportes llevaron a que a finales de los años 70, sepuedan observar dos tendencias: por un lado, las redes estructuradas y los sistemas derepresentación del conocimiento y por el otro, las multiredes orientadas a las cienciascognitivas.

De forma general se pude definir una red semántica como un modelo matemáticoque consiste de una estructura conceptual formada por un conjunto de conceptos yrelaciones cognitivas entre éstos. Son representadas por un grafo generalizado donde losconceptos corresponden a los nodos y las relaciones entre los conceptos correspondena los arcos [25] y, desde el punto de vista semántico, como una colección de las diferentesrelaciones que los conceptos tienen entre si [26]. Generalmente, la construcción de unafrase se logra con la ayuda de los analizadores sintácticos. Sin embargo, esto es aún unproblema para aquellos idiomas que no cuentan con un orden estricto de palabras,como el español [27]. Las redes semánticas se catalogan en tres categorías [28]:

Red de relaciones es-un. Se construye desde los conceptos más generalizados hastamás específicos, que se representan de forma jerárquica. Dado que la filosofía de estasredes gira en torno a la herencia y la explicación de los conceptos mediante otros con-ceptos, son generalmente complejas. Entre las investigaciones que utilicen una red semánticadel tipo red de relaciones es-un (is-a en inglés) se puede mencionar, por ejemplo [29],donde se construye una red en forma de árbol; sus atributos y palabras se seleccionan através del método de entropía condicional.

Red de marcos. Este tipo de red se representa a través de estructuras de datos llama-das marcos. Cada marco se corresponde a una clase o a una instancia. Las clases describenlos conceptos mediante un conjunto de propiedades y los marcos son las instancias delas clases. Ellos describen objetos concretos y heredan propiedades de los marcos clase.Los atributos y valores se esquematizan a través de ranuras (slots).

Grafos conceptuales. Durante los años 60 la representación semántica basada engrafos fue popular tanto a nivel teórica como en la lingüística computacional. Esta repre-sentación se conoce como grafo conceptual. Esta estructura, propuesta por Sowa [26],está basada en los grafos existenciales de Pierce [32].

El estándar para los grafos conceptuales especifica la sintaxis, la semántica y la repre-sentación de cadenas de caracteres en el formato de intercambio de grafos conceptuales(CGIF: Conceptual graph interchange form). CGIF ha sido diseñado para intercambio deinformación entre los sistemas que hacen parte del estándar “Formato para elmodelamiento de esquemas conceptuales” (CSMF: Conceptual Schema Modeling Facilities)especificado por el estándar ISO/IEC 14481. El estándar de los GC provee una guíapara implementar sistemas que usan los grafos conceptuales en la representación interna

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 17: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS16

o externa. Las representaciones externas se definen para la comunicación humano—máquina, y la interna, para la comunicación entre las máquinas [33].

Los grafos conceptuales para representar texto fueron introducidos por Sowa [33].Los grafos conceptuales manejan dos tipos de nodos: conceptos y relaciones conceptua-les. Los conceptos tienen un tipo (clase de concepto) y un referente (la instancia de estetipo de objeto). Las relaciones conceptuales señalan la manera en que los conceptos serelacionan [34]. Cada relación conceptual tiene uno o más (usualmente dos) arcos, cadauno de los cuales debe estar enlazado a un concepto [33].

Dado que la representación por medio de un grafo conceptual denota los términosque contribuyen a la semántica de la sentencia y que cada término se escoge de acuerdoa la posición dentro de la sentencia [35], los grafos conceptuales cuentan con una serie decaracterísticas que hacen que sean muy ricos semánticamente y se utilicen no solo para elintercambio de información sino para la creación de bases de conocimiento y ontologías.

5.2 Formato de intercambio de conocimientoEl Formato de Intercambio de Conocimiento (KIF: Knowledge Interchange Format) se

basa en caracteres que pueden ser combinados en lexemas; los lexemas a su vez puedenser combinados en expresiones. La sintaxis del KIF [47] generalmente se presenta conuna modificación de la notación de las formas BNF (Backus-Naur forms).

El alfabeto de KIF consiste de seis bloques de datos para referenciar las mayúsculas, lasminúsculas, los dígitos, los caracteres alfa —caracteres específicos que se usan de la mismaforma que las letras—, los caracteres especiales y otros caracteres como el espacio.

El proceso de convertir los caracteres a lexemas se llama análisis léxico. Al procesoentra una cadena de caracteres y se obtiene una cadena de lexemas. Este proceso escíclico: en este proceso se leen las cadenas de caracteres hasta que se encuentra un carácterque no puede ser combinado con los caracteres previos y dentro del lexema actual.Cuando esto ocurre, el proceso se vuelve a empezar con el nuevo carácter y otro lexema.

KIF maneja cinco clases de lexemas: lexemas especiales, palabras, referencias al carác-ter, cadenas de caracteres y bloques de caracteres.

Los lexemas se forman de acuerdo a una serie de reglas. Se presentan tres tipos deexpresiones: términos, sentencias y definiciones. Los términos son usados para denotarobjetos, las sentencias para expresar hechos y las definiciones para definir constantes. Lasdefiniciones y las sentencias se llaman formas; una base de conocimiento es un conjuntofinito de formas.

La base de la semántica de KIF es la conceptualización del mundo en términos deobjetos y relaciones entre los objetos. El universo del discurso es el conjunto de todos losobjetos que hipotéticamente existen en el mundo. La noción de objeto es amplia. Losobjetos pueden ser concretos o abstractos, primitivos o compuestos y pueden ser deficción.

Representación computacional del lenguaje natural escrito

Page 18: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 17

Además de permitir incluir listas, el lenguaje permite incluir sentencias matemáticas, decontrol, de relaciones y lógicas.

5.3 Infraestructura para la descripción de recursosEl leguaje RDF (Resource Description Framework) [48] ha sido definido para representar

información sobre recursos en la Web. En particular, intenta representar metadatos so-bre los recursos de la Web como el título, el autor, fechas, derechos y en general cualquierinformación relevante. Por otro lado, proporciona interoperabilidad entre las diferentesaplicaciones que intercambian información en la Web. Su desarrollo se ha basado nosolo en las necesidades de la Web sino en los demás estándares que definen las diferentescomunidades, tales como los presentados a continuación.

Lenguaje de metadatos para publicar hipertexto en Internet. El lenguaje HTML(HyperText Markup Language) es estandarizado por el grupo W3C y es el más popular paraescribir las páginas Web. Permite describir la estructura y el contenido en forma de texto,incluir imágenes, tablas, vínculos y muchos otros aspectos de presentación y diseño.

Plataforma para la selección de contenido en Internet. Esta especificación (PICS:Plataform for Internet Content Selection) [49] habilita los metadatos que pueden ser asociadoscon el contenido de Internet. PICS fue inicialmente diseñada para ayudar al control decontenido que acceden los menores de edad en la Web; sin embargo actualmente esampliamente utilizada en los filtros. En general este estándar permite etiquetar el conteni-do propio o relacionado, creando así el principal parámetro de control.

Lenguaje de marcado generalizado. El lenguaje SGML (Standard Generalized MarkupLanguage) se define como un sistema para la organización y etiquetado de documentos.Al igual que el HTML, fue normalizado por la Organización Internacional de Estándares(ISO) en 1986.

Lenguaje de marcado extensible. El Lenguaje de Marcado Extensible (XML: Ex-tensible Markup Language) es un metalenguaje extensible de etiquetas desarrollado por elW3C. Es una simplificación y adaptación del SGML. Permite definir la gramática delenguajes específicos, como HTML. En general XML no es un lenguaje en particular,sino una manera de definir lenguajes para diferentes necesidades. XML estandariza elintercambio de información estructurado entre las diferentes plataformas computacionales.

5.4 Lenguaje ontológicoEl Lenguaje de Ontologías para la Web (OWL: Web Ontology Language) [50] es un lenguaje

de marcado desarrollado por el grupo W3C para publicar y compartir ontologías en laWeb. Fue desarrollado como una extensión del RDF y del lenguaje de marcado semánticopara recursos en la Web DAML+OIL fusión de los lenguajes (DARPA1 Agent MarkupLanguage) DAML y (Ontology Inference Layer or Ontology Interchange Language) OIL [43].

1 Defense Advanced Research Projects Agency (DARPA)

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 19: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS18

Una ontología OWL es un grafo RDF que permite expresar relaciones complejasentre las diferentes clases de RDFs. Provee los recursos para determinar propiedades yelementos y para construir nuevas clases a partir de otra u otras.

5.5 Lógica comúnLógica Común (CL: Common Logic) es una estructura definida para una familia de lengua-

jes lógicos basados en lógica de primer orden. Define estándares para el intercambio deinformación basados en formas sintácticas llamadas dialectos. Un dialecto puede usar cual-quier sintaxis que conforme una semántica abstracta CL. Todos los dialectos son equivalentes,es decir que pueden automáticamente ser traducidos entre ellos aunque algunos pueden sermás expresivos que otros, en cuyo caso se pueden traducir solo a menos expresivos. Elestándar ISO 24707 para la Lógica Común especifica tres tipos de dialectos:

• Formato de Intercambio de Lógica Común (CLIF: Common Logic Interchange Format),• Formato de Intercambio de Grafos Conceptuales (CGIF: Conceptual Graph Interchange

Format),• Notación basada en XML para la Lógica Común (XCL: XML based notation for Common

Logic).

Son muchos los lenguajes que hereden de una sintaxis abstracta de la CL, entre loscuales destaca el que se presenta en [30].

Lenguajes naturales controlados. Los lenguajes naturales controladas sonsubconjuntos de los lenguajes naturales restringidos en la gramática y el vocabulario conel fin de reducir o eliminar la ambigüedad y la complejidad [31]. Los lenguajes controla-dos pueden ser desarrollados con dos objetivos: aquellos que mejoran la legibilidad paralos lectores humanos y aquellos que permiten el análisis semántico automático confiabledel texto. Dentro de estos lenguajes están el inglés, el chino y el español controlados [30].

Diagramas FLIPP (Format for Logical Information Planning and Presentation). Se conocencomo una representación lógica conceptual que no hace uso de texto ni símbolos. Cadadiagrama consiste en un conjunto de bloques dependientes a nivel jerárquico [54]. Eldiagrama total represente un grafo acíclico. Cada sub-bloque puede contener informa-ción en lenguaje declarativo, natural o matemático.

Mapas de tópicos y mapas conceptuales. Los mapas conceptuales son artefactospara la organización y representación del conocimiento. Tienen su origen en teorías so-bre psicología [51]. El objetivo de estos mapas es de representar relaciones entre conceptosen forma de proposiciones. Los conceptos están incluidos en cajas o círculos, mientrasque las relaciones entre ellos se explicitan mediante líneas que unen las cajas respectivas.Las líneas, a su vez, tienen palabras asociadas que describen la naturaleza de la relaciónque liga los conceptos.

Lenguaje de modelamiento unificado2. Es un lenguaje de modelado de software(UML: Unified Modeling Language). Su estándar es definido por el grupo Object Management

2 Ver http://www.omg.org

Representación computacional del lenguaje natural escrito

Page 20: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 19

Group (OMG). El estándar define el modelo estático y dinámico de todos los compo-nentes que pueden hacer parte de un sistema de software incluidos los referentes a lasontologías para la representación, manejo e interoperabilidad y aplicaciones para la se-mántica de los negocios.

Otros lenguajes. El lenguaje de consulta estructurado (SQL: Structured Query Language3)es un lenguaje declarativo que permite recuperar información estructurada de las basesde datos relacionales. El lenguaje de restricción de objetos (OCL: Object ConstraintLanguage4) definido por el grupo OMG, para describir las reglas que aplican al UML.Prolog5 es un lenguaje de programación lógico e interpretativo. Datalog, una derivacióndel Prolog, es un lenguaje de consulta para bases de datos deductivas. Esquema RDF,una extensión semántica de RDF, es un lenguaje primitivo para la descripción de vocabu-lario ontológico.

6. ConclusionesLa búsqueda de nuevas alternativas para la representación y procesamiento del lengua-

je natural que permitan no solo la inclusión de la semántica propia del lenguaje sino quefaciliten operaciones que lleven a la inferencia del conocimiento, es un tema que aún estáen espera de mostrar resultados.

Como se puede concluir de la revisión presentada, si bien existen muchas estructuras,a mayor cantidad de elementos semánticos que se pueden incluir, mayor es su dificultadpara el procesamiento. Gran parte del camino a recorrer con estas estructuras aún estapor explorar, no solo en lo que se refiere a la representación del lenguaje natural, sinoigualmente, a la creación de ontologías y bases de conocimiento.

Agradecimientos. El trabajo fue realizado parcialmente con el soporte que el segundoautor recibió del Gobierno de México (CONACYT 50206-H, SIP-IPN 20113295, pro-grama CONACYT de estancias Sabáticas 2010-2011) y de Universidad Waseda, Japón.

7. Referencias

[1] Salton, G. y Lesk, M. E. (1965). The SMART automatic document retrieval systems and illustration. Commun. ACM.

[2] Farkas, J. (1966). Improving the classification accuracy of automatic text processing systems using context vectors and back-propagation algorithms. Canadian Conference on Electrical and Computer Engineering.

[3] Henderson, J., Merlo, P., Petroff, I. y Schneider, G. (2002). Using NLP to efficiently visualize text collections with SOMs. Proceedings:13th International Workshop on Database and Expert Systems Applications.

[4] Kimura, M., Saito, K., Ueda, N. (2005). Multinomial PCA for extracting major latent topics from document streams. Neural Networks2005, IJCNN ’05. Proceedings. 2005 IEEE International Joint Conference.

[5] Maron, M.E. y Kuhns, J.L. (1960). On relevance, probabilistic indexing and information retrieval. Journal of the ACM.

[6] Badia, A. y Kantardzic, M. (2005). Graph building as a mining activity: finding links in the small. LinkKDD ’05: Proceedings of the3rd international workshop on Link discovery. 17-24. ACM.

3 En las especificaciones ISO/IEC 9075-1:2008; ISO/IEC 9075-2:2008; ISO/IEC 9075-11:2008, se incluyen los mínimos requerimientos del lenguaje.4 Ver http://www.omg.org5 ISO/IEC 13211-1 ISO-Prolog

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 21: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS20

[7] Rijsbergen C.J. van, Robertson S.E. y Porter M.F. (1980). New models in probabilistic information retrieval. London: BritishLibrary. (British Library Research and Development Report, No. 5587.

[8] Klabbankoh B. y Pinngern Q. (2000). Applied Genetic Algorithms in Information Retrieval. Faculty of Information Technology,King Mongkut´s Institute of Techology Ladkrabang.

[9] Varlamis I., Vazirgiannis M., Halkidi M., Nguyen B. (2004). Thesus, A Closer View on Web Content Management Enhanced withLink Semantics. IEEE Transactions on Knowledge and Data Engineering, Vol. 16. No. 6. 685-700.

[10] Deerwester S., Dumais S. T., Furnas G. W., Landauer T. K. y Harshman R. (1990). Indexing by Latent Semantic Analysis. Journalof the American Society for Information Science, Vol. 41. No. 6. 391-407.

[11] Hensman S. (2004). Automatic Construction of Conceptual Graphs from Texts using Computational Linguistics Techniques.Department of Computer Science, University College Dublin. Belfield, Dublin 4. Proceedings of Student Research Workshop atHLT-NAACL.

[12] Rijsbergen Van C.J. (1979). Information Retrieval. Department of Computing Science, University of Glasgow Second edition.

[13] Schenker A., Bunke Horst, M. L. A. K. (2005). Graph-theoretic techniques for Web content mining. World Scientific Publishing.

[14] Schenker A., Bunke H., M. L. y Kandel, A. (2004). A Graph-Based framework for Web document mining. Lecture Notes inComputer Science Publisher Springer Berlin Heidelberg, Vol. 3163. 401-412.

[15] Barski C. (2009). The enigmatic art of knowledge representation. Consultado: www.lisperati.com//ex.html. (5 de marzo, 2009).

[16] Losada, D. y Barreiro A. (2001). Rating the impact of logical representations on retrieval performance. Database and ExpertSystems Applications Proceedings. 12th International Workshop, 247-253.

[17] Chang C. y Chen A. (1998). Supporting conceptual and neighborhood queries on WWW. Systems, Man, and Cybernetics, PartC: Applications and Reviews, IEEE Transactions, Vol. 28. No. 2. 300-308.

[18] Peltonen, J., Sinkkonen J. y Kaski, S. (2002). Discriminative clustering of text documents. 9th International Conference NeuralInformation Processing, 2002. ICONIP ’02, Vol. 4. 1956-1960.

[19] Maisonnasse L., Gaussier E., J. C. (207). Multiplying Concept Sources for Graph Modeling. LIG contribution to the CLEF 2007medical retrieval task (ImageCLEFmed).

[20] Gao J., Nie J.-Y, Wu G., Cao G. (1999). Dependence Language Model for Information Retrieval. Microsoft Research, Asia, BrooksCole Publishing Co., Pacific Grove.

[21] Williams R. (2007). A Computational Effective Document Semantic Representation. DEST’07. Digital EcoSystems and TechnologiesConference, IEEE-IES.

[22] Manning C., Schütze H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. Cambridge, MA: May.

[23] Mineau, G. W., Stumme, G. y Wille, R. (1999). Conceptual Structures Represented by Conceptual Graphs and Formal ConceptAnalysis. International Conference on Conceptual Structures.

[24] Delugach H. S. Towards. (2008). Conceptual Structures Interoperability Using Common Logic Computer. Science DepartmentUniv. of Alabama in Huntsville. Third Conceptual Structures Tool Interoperability Workshop.

[25] Helbig H. (2006). Knowledge Representation and the Semantics of Natural Language. Lecture Notes in Computer Science.Springer.

[26] Sowa, J. F. (2008). Conceptual Graphs. Handbook of Knowledge Representation.

[27] Gelbukh A., Sidorov G. (2006). Procesamiento automático del español con enfoque en recursos léxicos grandes. InstitutoPolitécnico Nacional, México.

[28] Hernández Cruz, M. (2007). Generador de los grafos conceptuales a partir del texto en español. Tesis de Maestría. InstitutoPolitécnico Nacional. Centro de Investigación en computación.

[29] Last M., Maimon O. (2004). A compact and Accurate Model for Classification. IEEE Transactions on Knowledge and DataEngineering., Vol. 16. No. 2. 203-215.

[30] Sowa, J. F. (2008). Common Logic, A Framework for a Family of Logic-Based Languages.

[31] Barceló, G., Cendejas, E., Bolshakov, I. y Sidorov G. (2009). Ambigüedad en nombres hispanos. Revista Signos. Estudios deLingüística 42 (70). 153-169.

[32] Shin S-J. (1994). The Logical Status of Diagrams. Cambridge University Press.

[33] Committee on Information Interchange and Interpretation. Sowa, J. F. (2008). Conceptual Graph Standard. Consultado:www.jfsowa.com/cg/cgstandw.htm. (12 de noviembre, 2008).

[34] Montes-y-Gómez M. (2001). Minería de texto: Un nuevo reto computacional. 3er Taller Internacional de Minería de DatosMINDAT-2001, Universidad Panamericana, Ciudad de México.

[35] Shehata, S., Karray, F. y Kamel, M. (2006). Enhancing Text Retrieval Performance using Conceptual Ontological Graph. DataMining Workshops, 39-44, Sixth IEEE International Conference on Data Mining - Workshops (ICDMW’06).

Representación computacional del lenguaje natural escrito

Page 22: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 21

[36] Tesnière, A. L. (1959). Elements de syntax e structurale. Klincksieck Paris.

[37] Castro-Sánchez, N. A., y Sidorov, G. (2010). Analysis of Definitions of Verbs in an Explanatory Dictionary for Automatic Extractionof Actants based on Detection of Patterns. Lecture Notes in Computer Science, No. 6177. 233-239.

[38] Abdulrub S., Polovina S. y Hill, R. (2008). Implementing Interoperability through an Ontology Importer for Amine. ConceptualStructures Tools and the Web - Third Conceptual Structures Tool Interoperability Workshop.

[39] Shannon, C. (1948). A mathematical theory of communication. The Bell System Technical Journal, Vol. 27, 379–423.

[40] Sleator, D. D. y Temperley, D. (1993). Parsing English with a link grammar. Third International Workshop on Parsing Technologies.

[41] Roberts R, Goldstein I,. (1977). The FRL manual. Memo 409, Massachusetts Institute of Technology, Artificial IntelligenceLaboratory.

[42] Noy N., Grosso W, Musen A. (2000). Knowledge acquisition Interfaces for Domain Experts: An Empirical Evaluation of Protege-2000. Twelfth International Conference on Software Engineering and Knowledge Engineering (SEKE 2000), Chicago, IL.

[43] McGuinness D. L., Fikes R., Hendler J., Stein L. A., (2002). DAML+OIL: An Ontology Language for the Semantic Web. IEEEIntelligent Systems, Vol. 17, No. 5. 72-80, Sep./Oct.

[44] Kifer M, Lausen G, Wu J. (1995). Logical Foundations of Object-Oriented and Frame-Based Languages. Journal of ACM, May.

[45] Brachman R., Schmolze J. (1985). An overview of the KL-ONE Knowledge Representation System. Cognitive Science, Vol. 9,No. 2, 171-216.

[46] Baader F., Nutt W. (2002). Basic Description Logics. The Description Logic Handbook, Cambridge University Press. 47-100.

[47] Ginsberg M. (1991). Knowledge Interchange Format: The KIF of Death. Journal AI Magazine, Vol. 12. 57-63.

[48] Lassila O., Swick R. y World Wide and Web Consortium. (1999). Resource Description Framework (RDF) Model and SyntaxSpecification. Consortium, Cambridge (MA). W3C Recommendation.

[49] Krauskopf T., Miller. J, Resnick P., Treese W. (1996). PICS Label Distribution Label Syntax and Communication Protocols.Version 1.1, W3C Recommendation.

[50] Sirin E., Hendler J., Parsia B. (2002). Semi-automatic Composition of Web Services using Semantic Descriptions. Web Services:Modeling, Architecture and Infrastructure workshop in ICEIS 2003. 17-24.

[51] Ausube l, D., Novak, J. Hanesian, H. (1978). Psicología Educacional: Una visión cognitiva. Halt, Reinhart and Winston, New York.

[52] Bally C, Sechehaye C. (1945). Curso de Linguistica General. Editorial losada, Buenos Aires. 31-32.

[53] Chomsky, N. (1957). Syntactic structures. La Haya, Mouton.

[54] Croitoru M., Jäschke R. (2008). Conceptual Structures Tools and the Web. Third Conceptual Structures Tool InteroperabilityWorkshop.

Sonia Ordoñez SalinasSonia Ordoñez SalinasSonia Ordoñez SalinasSonia Ordoñez SalinasSonia Ordoñez SalinasDocente Universidad Distrital – Facultad de ingeniería. Estadística de la Universidad Nacional. Ingeniera de Sistemas de la Univer-sidad Distrital. Especialista Teleinformática Universidad Distrital. Magíster en Ingeniería de Sistemas Universidad Nacional. DoctorIng. Sistemas y Computación, Universidad Nacional de Colombia. Grupo de Investigación Gesdatos U.D.

Alexander GelbukhAlexander GelbukhAlexander GelbukhAlexander GelbukhAlexander GelbukhProfesor-Investigador y Jefe del Laboratorio de Lenguaje Natural y Procesamiento de Texto del Centro de Investigación en Com-putación del Instituto Politécnico Nacional, México. Doctor en la ciencia de la computación por el Instituto de la Información Científicay Técnica de toda Rusia (VINITI). Maestro en Ciencias en matemáticas por la Universidad Nacional “Lomonósov” de Moscú (MGU),Rusia. Miembro de la Academia Mexicana de Ciencias, Investigador Nacional de México nivel II.

Sonia Ordoñez Salinas • Alexander Gelbukh

Page 23: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS22

Estudio del impacto de lacertificación ISO 9001:2000en la competitividad-paísImpact of the ISO 9001:2000 standardon countries competitiveness

Citación: Bohórquez, L.H. (2010). Estudio del impacto de la certificaciónISO 9001:2000 en la competitividad-país. En: Ingeniería, Vol. 15, No.1, pág. 22-34

Luz EsperanzaLuz EsperanzaLuz EsperanzaLuz EsperanzaLuz EsperanzaBohórquez ArévaloBohórquez ArévaloBohórquez ArévaloBohórquez ArévaloBohórquez Arévalo

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

ResumenEl estudio analiza el nivel de correlación que se presenta entre la posición

competitiva obtenida por los diferentes paises y el número de certificacionesISO 9001:2000 que cada uno de estos posee. Para tal fin, se consideran losdatos publicados por el observatorio de competitividad mundial Instituteof Management Development – IMD y la Organización Internacional delestándares ISO, durante la serie de tiempo 2001-2005.

Los resultados muestran la existencia de una relación positiva débil entrela posición competitiva y el número de empresas certificadas. Adicionalmente,indican que la principal relación entre la certificaciones en el contexto de lacompetitividad pais se encuentra en el fortalecimiento de la infraestructurasectorial y no en la mejora de la eficiencia de los negocios. De lo anterior, sedesprende que el impacto de las certificaciones ISO 9001 no se encuentra en ladiferenciación que le pueda generar a una organización en particular, sino en elfortalecimiento que le puede otorgar a un sector en general cuando un amplionúmero de empresas alcanzan la certificación.

Palabras clave: calidad, competitividad, ISO, IMD.

AbstractThis study analyzes the correlation found between the competitive

position gained by the different countries and the number of ISO9001:2000 certifications such countries hold. For this purpose, datareleased by the world observatory Institute of ManagementDevelopment – IMD and also by the International Organization forStandardization – ISO – for the 2001-2005 time span were used.

The results evidence the existence of a weak positive relationshipbetween the competitive position and the number of certifiedcompanies. Results also indicate that the main relationship betweenthe different certifications, within a country’s competitiveness context,lies in the strengthening of sector-wise infrastructure, rather than inthe improvement of business efficiency. Accordingly, it may beinferred that the impact of ISO 9001 certifications cannot be seenin the differentiation status experienced by a specific organizationbut rather in the potential strengthening of a whole sector when asignificant number of companies obtain the certification.

Key words: Quality, Competitiveness, ISO, IMD.

Page 24: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 23

1. IntroducciónDesde 1987, año en el cual se publicó la primera serie de estándares para la administra-

ción de la calidad ISO 9000, el número de compañías que ha buscado certificarse coneste estándar ha crecido en más del 2000%, tal como se puede observar en los resultadospublicados por la Organización Internacional de Estándares - ISO [1]. De igual maneray con el fin de coadyuvar en el logro de este propósito, organizaciones como el BancoInteramericano de Desarrollo – BID, han asignado, en el marco de programas decompetitividad país, recursos financieros para que en los países cada vez más empresaspuedan implementar y certificar los sistemas de gestión de la calidad.

Los beneficios esperados con la implementación y certificación del sistema de gestiónde la calidad (SGC) son diversos [2] destacándose principalmente el impacto en la pro-ductividad a través de incremento en ingresos y reducción de costos [17], en dondeexiste una amplia cantidad de trabajos de investigación. De igual manera, algunos autoresafirman que los SGC impactan en la competitividad, resaltando que los estudios desdeesta perspectiva son relativamente recientes y, a la fecha, escasos [3].

Sin embargo, si se tiene en cuenta que la competitividad está determinada por la pro-ductividad y la estrategia [4], se podría afirmar que los diferentes esfuerzos por mejorarla productividad empresarial redundan en un incremento de la competitividad. De estamanera si los SGC, en particular ISO 9001:2000, impactan en la productividad, como seafirma por ejemplo en los trabajos de Adams y Dale (2001) [5] se podría aseverar quetambién lo realizan en la competitividad, lo cual constituye precisamente la premisa cen-tral del presente trabajo.

En este sentido, el propósito de esta investigación es evaluar si la certificación de lacalidad ISO 9001:2000 puede impactar en la posición competitiva de un país lo anteriorteniendo en cuenta que no es posible un país competitivo si sus empresas no son compe-titivas. De igual manera, se busca analizar si es posible afirmar que un país es máscompetitivo en la medida en que tenga una mayor proporción de empresas certificadasen sistema de gestión de la calidad.

Para tal fin, la investigación analizó la correlación existente entre el número empresascertificadas con la norma ISO 9001:2000 por país y la posición competitiva del mismo,acorde con los resultados publicados por el Institute of Management Development(IMD), siendo la ventana de observación desde el año 2001 al año 2005. Es de resaltarque el estudio consideró este espacio de tiempo buscando homogeneidad en la muestra,dado que la versión 2000 de la norma ISO, es emitida en diciembre del año 2000, y porende las primeras empresas certificadas con esta norma surgen en el año 2001, cambian-do la norma nuevamente en el año 2008.

En concreto, la hipótesis principal que se busca corroborar en el presente estudio esque el número de certificados ISO 9001:2000 presenta correlación positiva con la posi-ción competitiva de los países, seguidamente y como segunda hipótesis se busca establecerque el factor de mayor nivel de correlación es eficiencia en los negocios (Tabla No. 3).

Luz Esperanza Bohórquez Arévalo

Page 25: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS24

800.000,00

700.000,00

600.000,00

500.000,00

400.000,00

300.000,00

200.000,00

100.000,00

-

2. Evolución de la certificación ISO 9001 en el mundo.Desde la primera publicación de la serie de estándares de administración de la calidad

ISO 9000 realizada en 1987 por la Organización Internacional para la Estandarización -ISO, el crecimiento del número de compañías que obtienen el certificado se haincrementado notablemente [1].

El total de los certificados ISO 9001:2000 creció en el año 2003 en un 200% en com-paración con el año 2002 (Figura No. 1), marcando así un importante aumento a 500.125empresas certificadas en 149 países con esta norma internacional, cifra que es 10 vecesmayor a la registrada en el año 2001, en el cual existían 44.388 empresas certificadas en98 países (Tabla No. 1).

Figura No. 1. Crecimiento de lascertificaciones ISO 9001 en el mundo [1]

Datos a nivel mundial dic-03 dic-04 dic-05 dic-06 dic-07

Total 497.919 660.132 773.867 896.929 951.486

Crecimiento 330.795 162.213 113.735 123.062 54.557

Num. países 149 154 161 170 175

Tabla I. Comportamiento de la certificación ISO 9001:2000 [1].

Desde la perspectiva regional, Europa continúa manteniendo el porcentaje más alto decertificados ISO 9000 con el 48,52 % del total general, seguida por el Lejano Orientecon el 33,05 %, América del Norte con el 8,03 %, Australia/Nueva Zelanda con el 4,56%, África/Asia Oriental con 3,99 % y América Central y del Sur con 1,86 %.

En el contexto sectorial, la encuesta ISO muestra que si bien no todos los organismoscertificadores suministran esta información, la industria de la construcción continúaliderando con 51.188 certificados, seguida por los productos metálicos básicos y pro-ductos metálicos fabricados con 41.455, los equipos eléctricos y ópticos con 38.782,maquinarias y equipos con 27.705, el comercio mayorista y minorista, las reparaciones devehículos, ciclomotores y bienes personales y domésticos con 23.751 certificados [1].

A nivel país, los primeros 10 países en términos de crecimiento de la certificación ISO9001:2000 en 2003 incluyen: China (55.718) certificados nuevos, Italia (49.387), el Reino

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Ene-01 Ene-02 Ene-03 Ene-04 Ene-05

Page 26: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 25

Tabla II. Países con mayor número de certificados ISO 9001 en el mundoy posición competitiva según el IMD [1, 7]

Unido (36.164), los EE.UU (25.707), España (22.964), Japón (21.938), Australia (12.951),Alemania (12.787), Corea del Sur (9.904) y Francia (8.544). Tendencia que se sostienesegún datos de la ISO al año 2009 [6].

Los resultados referentes al número de certificados por país llaman la atención alcompararlos con la posición obtenida por éstos en el Índice Global de Competitividademitido por el IMD en el año 2006, en donde Estados Unidos se encuentra en el primerlugar, Australia en el puesto 6o, Japón en el 17o, China en el 19o y Reino Unido en el 21o

(Tabla No. 2). Posiciones favorables si se tiene en cuenta que el IMD considera para elestudio 59 países industrializados y emergentes.

No. certificados ISO 9001 Posición competitiva (IMD)

2003 2003 2006

China 143.823 29 19

Italia 98.028 41 56

Japón 53.771 25 17

España 47.445 27 36

Reino Unido 45.612 19 21

Estados Unidos 44.270 1 1

Alemania 39.816 20 26

India 26.660 50 29

Francia 24.441 23 35

Australia 16.922 7 6

El crecimiento experimentado en los últimos años por las certificaciones ISO 90001:2000es atribuible a los beneficios determinados por el Comité Técnico (TC) 176 de la ISO,en el documento No. 595 Quality Management Principles [8], que menciona entre otrosel incremento de los ingresos, las mejoras en la eficacia de los procesos, el incremento enla satisfacción del personal que labora en la organización, el fortalecimiento de la ventajacompetitiva la reducción de costos, el aumento en la productividad, y la mejora en lasrelaciones con los proveedores.

Es de resaltar, que la búsqueda de tales beneficios surge como respuesta a estímulosdel mercado, del gobierno, del sector financiero, entre otros. Así, por ejemplo, el merca-do lleva a que las empresas busquen la certificación como medio para mejorar la imagena través de la satisfacción de los clientes, aspecto que redunda en la fidelización de losmismos, el aumento en la participación de mercado, así como el incremento de lasexportaciones.

Por su parte ante los estímulos del gobierno, las empresas buscan la certificación a finde aprovechar las oportunidades que diferentes entidades del estado ofrecen para acce-der a programas de formación, consultoría y principalmente financiación para el desarrollode procesos de mejoramiento de la calidad. De igual manera, la certificación surge, enalgunas oportunidades, dada la reglamentación exigida a la empresa para producir, co-mercializar o prestar determinados productos y/o servicios.

Luz Esperanza Bohórquez Arévalo

Page 27: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS26

De otro lado, el sector financiero estimula la búsqueda de certificación al exigirla comouno de los requisitos para acceder a determinados productos de financiación.

Es decir, los motivos que llevan a que una organización se certifique son diversos,aunque todos se orientan a la búsqueda de beneficios de impacto en la competitividad.Lo anterior conduce a plantear la pregunta de si son, realmente, las certificaciones ISO9001:2000 un elemento generador de competitividad.

2.1. Competitividad país.La competitividad país se puede entender como “el grado en que una nación en condiciones de

mercado libre y justo produce bienes y servicios que satisfacen la prueba de los mercados internacionales entanto que, simultáneamente, mantiene y expande el ingreso real de los ciudadanos” [9]. Con esteobjetivo, las naciones tienen la necesidad de proporcionar un entorno que propenda porestructuras eficientes e instituciones y políticas que alienten la competitividad de las em-presas [10]

Actualmente, existen dos estudios destacados a escala mundial que analizan y cuantifi-can los factores que determinan la competitividad de las naciones: el GlobalCompetitiveness Report [11] y el World Competitiveness Yearbook [12]. El primero lorealiza el World Economic Forum (WEF), el segundo el International Institute forManagement Development (IMD), ambos con sede en Suiza. Desde 1989 hasta 1995ambos institutos habían publicado su informe en cooperación, pero desde 1996 hanestado publicando dos informes anuales por separado.

Tanto el WEF como el IMD publican sus estudios cada año y utilizan informaciónprocedente de datos estadísticos y de datos obtenidos de la Encuesta de Opinión Ejecu-tiva enviada a nivel mundial a fin de obtener sus conceptos acerca de la competitividadactual y futura de un país. Asimismo, cada uno de estos estudios se sustenta en unadefinición de competitividad basada en el mediano y largo plazo. El WEF, define lacompetitividad país como “la capacidad de alcanzar un rápido crecimiento económicosostenible”, por otro lado, mientras que el IMD, define la competitividad país como “lacapacidad del entorno de una nación para mantener la creación de valor añadido y, porconsiguiente, la competitividad de sus empresas” [13].

Los informes de competitividad generados por el IMD y el WEF ofrecen la informa-ción necesaria para analizar las debilidades y fortalezas de las naciones incluidas en estos.También los informes entrañan gran cantidad de oportunidades para identificar áreas deexpansión y diversificación de la base productiva de los países [14].

Teniendo en cuenta que tanto el IMD como el WEF, si bien utilizan metodologíasdiferentes, arrojan resultados similares, la presente investigación se soportó en los facto-res de competitividad, considerados por el IMD, el cual clasifica sus datos en cuatrofactores de entrada:

• Desarrollo Económico: considera los datos de la evaluación macroeconómica de la eco-nomía nacional.

• Eficiencia Gubernamental: grado en que las políticas de gobierno favorecen la

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Page 28: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 27

competitividad de las empresas y del país.• Eficiencia de los Negocios: resultados alcanzados por el sector empresarial del país.• Infraestructura: la medida en que la base tecnológica y científica satisface las necesidades

de las empresas y las personas.

Cada uno de los 4 factores, se subdivide a su vez en 20 subfactores y 286 criterios,resumidos en la Tabla No. 3.

Tabla III. Factores y subfactores para medición de competitividad país según IMD

ACTUACIÓN ECONÓMICA EFICIENCIA DEL GOBIERNO EFICIENCIA DE NEGOCIOS INFRAESTRUCTURA68 CRITERIOS 84 CRITERIOS 60 CRITERIOS 74 CRITERIOSEconomía doméstica Finanzas publicas Productividad Infraestructura básicaComercio Internacional Política Fiscal Mercado Laboral Infraestructura tecnológicaInversión Internacional Modelo Institucional Mercado Financiero Infraestructura científicaEmpleo Modelo Empresarial Practicas de gestión Salud y medio ambientePrecios Educación Impacto de la globalización Sistemas de valores

2.2. Calidad y competitividadLa adopción de herramientas para la mejora de la calidad en diferentes sectores ha

sido ampliamente estudiada, en la mayor parte de los casos se han utilizado metodologíascualitativas de investigación. Dentro de los estudios realizados se encuentran los trabajosde Adams y Dale [15]. en empresas manufactureras, Cleary [16] en el sector educativo,Jackson [17] en el sector sanitario e incluso en su aplicación a situaciones cotidianas,como el realizado por Bamford y Greatbanks citados por Heras, et al [18].

El análisis realizado en dichas investigaciones permite concluir que a pesar de los resul-tados exitosos que algunas empresas han tenido con la implementación de modelos degestión de la calidad, estos no pueden generalizarse.

En el trabajo realizado por Honnaker P. et al [19] se hace alusión a un estudio adelan-tado por McIntyre & Kirscheman (2000) en 1500 empresas del sector de la construcción,en las cuales encontraron impactos positivos en la situación financiera de aquellas empre-sas que implementaban la estrategia de certificación de la calidad. De igual manera, estosautores citan los estudios realizados por Torbica y Stroh (1999) quienes resaltan el impac-to en la satisfacción del cliente, y los trabajos de Liu (2003) en los que identificaron que lasempresas certificadas presentaban menor cantidad de defectos en los proyectos de cons-trucción que las empresas sin certificación. Ahmed y Hassan (2003)1, citados por Heras,Marimon, & Casadesús [18], concluyen de manera general que las empresas que adoptanherramientas de gestión de la calidad obtienen usualmente mejores resultados que las queno lo hacen, aunque si bien en estos trabajos no se logra relacionar el desempeño con laimplementación efectiva de las herramientas para la gestión de la calidad. De igual mane-ra en el trabajo desarrollados por Nava Caballido & Rivas Tobar [20], en empresasmexicanas se demuestra como el desempeño de las empresas certificadas es superior alde las no certificadas con la norma ISO 9001:2000 en aspectos tales como costos, ventasy satisfacción del cliente.

1 Esta investigación fue de carácter empírico y en ella se analizó la aplicación y los resultados generados por la implementación de herramientasde gestión de la calidad en 63 pymes.

Luz Esperanza Bohórquez Arévalo

Page 29: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS28

En contraposición se encuentra los trabajos realizados por Lambert, G., & Ouedraogo,N. [21] en un grupo de empresas francesas en las cuales se implementó el ISO 9001:2000:en esta investigación se resaltan críticas al modelo, argumentando su falta de orientaciónal aprendizaje. De igual manera se manifiesta que posterior a la implementación un altoporcentaje de empresas abandonaron el modelo por considerarlo rígido, inflexible yburocrático. En la misma línea se sitúa el trabajo realizado por Kaziliûnas [22] en dondese citan los resultados de las investigaciones de autores tales como Dimara, et al (2004)quien luego de observar el comportamiento financiero durante 6 años de un grupo deempresas certificadas con la norma ISO 9001, encontró que no habían grandes diferen-cias con respecto a empresas no certificadas. Resultados similares fueron obtenidos en lainvestigación realizada por Bonilla García [23], quien encontró que no existen diferenciasen lo referente a la gestión de los recursos humanos entre empresas certificadas y nocertificadas con el modelo ISO 9001:2000, planteando la necesidad de modelos menosgenéricos. De igual manera Kaziliûnas, [22] cita los trabajos de Kasadeus & Karapetrovic,(2005) quienes afirman que la implementación del SGC, demanda altos costos, tiempo,recursos y en general esfuerzos que no compensan los resultados obtenidos.

Como se puede observar los estudios frente al impacto que la gestión de la calidadgenera en la organización son diversos, sin embargo el análisis de si dichas metodologíashan impactado en la competitividad de las organizaciones no ha sido tan prolijo [18]. Deigual manera los estudios empiricos acerca del impacto externo de la gestión de la cali-dad son relativamente recientes [3]. De hecho investigaciones acerca del impacto de lagestión de la calidad en la competitividad pais, son realmente escasos, aunque se espera-ría que si el desempeño de las organizaciones mejora, esto redundaría en mejores resultadosen el factor de competitividad y eficiencia de los negocios, medido por el IMD [18], lacual es la premisa central del presente trabajo.

3. MetodologíaComo se mencionó inicialmente el propósito del presente trabajo es identificar cual es

el nivel de correlación que se presenta entre el número de empresas certificadas por paíscon la norma ISO 9001:2000 y los resultados por factor de competitividad medidospor el IMD obtenido por 51 países en la serie de tiempo 2001-2005.

La metodología consideró los siguientes pasos:

• Identificar las posiciones de competitividad según el IMD, de los diferentes países,desde el año 2001, hasta el año 2005. Aspecto desarrollado a nivel general, y para cadauno de los factores, subfactores y criterios evaluados por el IMD.

Los factores de competitividad del IMD se encuentran agrupados en cuatro categorias:a) desarrollo Económico: considera los datos de la evaluación macroeconómica de laeconomía nacional, b) eficiencia Gubernamental: grado en que las políticas de gobiernofavorecen la competitividad de las empresas y del país, c) eficiencia de los Negocios:resultados alcanzados por el sector empresarial del país, d) infraestructura: la medida enque la base tecnológica y científica satisface las necesidades de las empresas y las personas(Tabla No.3).

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Page 30: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 29

• Identificar el número de empresas certificadas con la norma ISO 9001:2000 en los 59países evaluados por el IMD, desde el año 2001, hasta el año 2005.

• Identificar el PIB de los diferentes países del mundo, desde el año 2001 hasta el año2005.

• Calcular la variable de control para cada uno de los países, durante la serie de tiempo2001 a 2005. La cual corresponde al número de empresas certificadas sobre el PIB:

(1)Variable control = ____________No. certificados pais

PIB

La variable de control es aplicada a fin de buscar homogeneidad en la muestra porcuanto cada país posee un número diferente de empresas y por ende el potencial decertificaciones ISO 9001 cambia para cada nación. Adicionalmente, y acorde con inves-tigaciones previas el producto interno bruto (PIB) es la variable macroeconómica quepresenta el mayor coeficiente de correlación con el número de empresas certificadas porpaís [24]. Es decir a mayor número de empresas certificadas en un país mayor es el PIBobtenido por este. De esta manera, la variable de control presentará un valor cercano a1 en la medida en que aumente el número de empresas certificadas o aumente el PIB,siendo este último aspecto abordado en investigaciones previas [24], [30].

• Calcular la relación entre la variable de control y la posición competitiva de cada paíspublicada por el IMD durante la serie de tiempo 2001-2005. Para tal fin, se utilizó lacorrelación de Pearson, calculado mediante SPSS, dado que esta permite determinar siexiste relación lineal entre dos variables aleatorias cuantitativas [25]. Lo anterior a fin devalidar la primera hipótesis del estudio en la cual se plantea que el número de certificacio-nes ISO 9000 presenta correlación positiva con la posición competitiva-país.

• De igual manera, se determinó el nivel de relación entre el número de certificacionesISO 9001 con las posiciones obtenidas por los diferentes países para cada cada unode los factores, subfactores y criterios aplicados por el IMD (Tabla No.3). Lo ante-rior, a fin de validar la hipótesis No. 2 del estudio, en la cual se plantea que el númerode certificados ISO 9001 presenta el mayor índice de correlación con el factor eficien-cia de los negocios dado el impacto de los SGC en la productividad.

4. ResultadosLos resultados muestran que existe un coeficiente de correlación de Pearson de 0,32

entre la variable de control y la posición país en el índice de competitividad generadopor el IMD. Resultado que surge al promediar el coeficiente de correlación obtenidopor los diferentes países durante la serie de tiempo 2001-2005. Es de resaltar, que elresultado obtenido indica que el nivel de asociación que existe entre el número de em-presas certificadas por país con la norma ISO 9001:2000 y la posición competitiva delos mismos, es positiva, confirmándose de esta manera la hipótesis No.1. Sin embargo,si bien el resultado muestra que existe relación entre las certificaciones ISO 9001 y laposición competitiva, esta no es fuerte.

De los resultados obtenidos (Tabla No. 4), el 25% de los países estudiados presentócorrelación negativa, encontrándose dentro de estos, países como Australia, Canadá,Chile, Dinamarca, Hong Kong, India, Islandia, Japón, Jordania, Malasia, Noruega, Nue-

Luz Esperanza Bohórquez Arévalo

Page 31: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS30

Tabla IV. Coeficiente de correlación de Pearson entre la variablede control y la posición competitiva del país, durante la serie de

tiempo 2001-2005País Correlación País Correlación

de Pearson de PearsonAlemania 0,99 Korea 0,65Grecia 0,97 Francia 0,58Sudáfrica 0,96 Suiza 0,50Venezuela 0,94 Luxemburgo 0,46Portugal 0,93 Colombia 0,21Indonesia 0,92 China 0,19México 0,92 Turquía 0,19Rumania 0,91 Finlandia 0,12Italia 0,91 Austria 0,05Irlanda 0,90 Rep. Eslovaca 0,02Polonia 0,89 Hong Kong -0,21Brasil 0,87 Singapur -0,26Eslovenia 0,87 India -0,26Argentina 0,86 Malasia -0,35Filipinas 0,84 Chile -0,37Inglaterra 0,79 Japón -0,39España 0,74 Jordania -0,44Estonia 0,74 Noruega -0,44Rep. Checa 0,74 Nueva Zelandia -0,67Holanda 0,73 Australia -0,76Bélgica 0,71 Canadá -0,82Hungría 0,70 Islandia -0,84Rusia 0,69 Dinamarca -0,88Israel 0,66 Thailandia -0,98

va Zelanda, Singapur. Resultados que llaman la atención por cuanto como se mencionóen la primera parte del documento países como Japón y Australia se caracterizan por lagran cantidad de empresas certificadas así como por ocupar posiciones favorables en elranking de competitividad publicado por el IMD (Tabla No. 2).

Adicionalmente, el 75% de los países estudiados presentaron correlación positiva en-contrándose que de estos el 62% presenta un coeficiente de correlación fuerte, tal comoes el caso de Alemania (0,98), Grecia (0,97), Indonesia (0,92), Portugal (0,93), México(0,92), Inglaterra (0,79), Irlanda (0,90), Polonia (0,89), entre otros, países que para efectosdel presente análisis se han denominado de primer grupo. El 38% de países restantespresenta correlación positiva débil, tal como es el caso de China (0,19), Colombia (0,20),Austria (0,05), República Checa (0,02), Luxemburgo (0,45), países que para el análisis dehan denominado de segundo grupo.

De lo anterior, se podría considerar que los países en los cuales se presenta correlaciónpositiva son aquellos en donde los sistemas de gestión son implementados no necesaria-mente por la certificación, si no, por realmente obtener la mejora continua de sus procesosorganizacionales. Lo anterior, por cuanto en el primer grupo, se encuentran países prin-cipalmente desarrollados en los cuales la certificación ISO 9001:2000 es una necesidadnatural de las organizaciones, mientras que en los países del segundo grupo como es elcaso de Colombia, la certificación ISO 9001:2000 aun es vista como el fin, mas no comoel medio para promover la mejora de los procesos, llegando a considerase en algunosespacios como moda empresarial pasajera [26].

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Page 32: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 31

0,60

0,50

0,40

0,30

0,20

0,10

-Factor Desarrollo

Económico

Figura No. 2. Resultados nivel de correlación entre losfactores de competitividad del IMD (Tabla No.3) y el

número de empresas certificadas por país

Respecto a la comprobación de la segunda hipótesis de la presente investigación, en lacual se plantea que el factor de competitividad de mayor nivel de correlación con elnúmero de empresas certificadas es eficiencia en los negocios, los resultados indicaronque no lo es. De esta forma como se puede observar en el Figura No. 2, el factor con elcual se presentó mayor índice de correlación es Infraestructura (0,50), seguido de eficien-cia del factor gobierno (0,30), y en tercer lugar se encuentra el factor eficiencia en losnegocios (0,28).

Así, el factor que presenta mayor índice de correlación es infraestructura, el cual repre-senta la medida en que la base tecnológica y científica de un país satisface las necesidadesde las empresas y las personas, por lo cual los anteriores resultados podrían llevar apensar que el impacto de la certificación ISO 9001:2000 en la competitividad país estádado por la fortaleza global que adquiere el sector empresarial al mejorar de maneraconjunta sus procesos organizacionales, creando con esto las condiciones necesarias parael fortalecimiento científico y tecnológico de un país, es decir la relación de las certifica-ciones ISO 9001:2000 en la competitividad país depende de los efectos positivos queestas generen en el sector empresarial, y no en cada unidad independiente.

El segundo factor que presentó mayor índice correlación con el número de empresascertificadas fue eficiencia del gobierno, permitiendo establecer que las certificaciones engestión de la calidad ISO 9001:2000 pueden mejorar la competitividad en la medida enque el Estado cree marcos legales que exijan o promuevan en las empresas la certifica-ción del sistema de gestión de la calidad. Aspecto que evidentemente llegará a impactaren la relación de estas entidades con sus proveedores generando de esta forma unacadena de mejora continua.

Los resultados obtenidos del índice de correlación entre el número de certificaciones yel factor eficiencia en los negocios, indican que la segunda hipótesis formulada en elpresente trabajo es falsa. Dado que si bien existe correlación positiva (0,28), esta seencuentra debajo de la obtenida con el factor infraestructura (0,50).

Luz Esperanza Bohórquez Arévalo

Factor Eficienciadel Gobierno

Factor Eficienciade Negocios

FactorInfraestructura

Page 33: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS32

0,25

0,20

0,15

0,10

0,05

-Productividad Mercado Laboral Finanzas Prácticas de

Gestión

Figura No. 3. Subfactores del factor eficiencia de los negocios(Tabla No.3) que presentan mayor relación

con el número de empresas certificadas

Por otro lado, al analizar los subfactores que comprenden el factor eficiencia de losnegocios (Figura No. 3), se encuentra el mayor índice de correlación con el subfactorproductividad (0,21), seguido de finanzas (0,15), tal como se muestra en la Figura No. 3,aspecto que se puede dar por cuanto los sistemas de gestión de la calidad pueden contri-buir a disminuir costos o a incrementar los ingresos [27].

Sin embargo es de resaltar, que en el 68% de los países estudiados se presenta correla-ción negativa entre la variable de control y la productividad. Lo cual implica que laafirmación realizada por autores como Deming [28], Feigenbaum [29], Honnaker P. et al[19], Nava Caballido & Rivas Tobar [20], entre otros, no es posible generalizarla y puededepender para su logro de otros criterios y enfoques que complementan a los sistemasde gestión de la calidad o incluso que no se encuentran relacionados con estos. Es decir,si bien la implementación y certificación del SGC puede impactar la productividad estono ocurre en todos los casos, lo cual concuerda con los hallazgos presentados en eltrabajo de Lambert & Ouedrago [21].

Adicionalmente, en el estudio se muestra que tan solo el 39% de los países analizadospresenta correlación positiva tanto en productividad como en el factor finanzas, y un33% de los países analizados presentaron correlación positiva en uno de los dos factores.Tal es el caso de Colombia, en el cual se encontró que la relación más fuerte de lacertificación del sistema de gestión de la calidad está dada con la productividad (0,37),mientras que en las finanzas presentó un resultado negativo del (-0,12). Lo anterior per-mite evidenciar que las certificaciones ISO: 9001 no necesariamente impactan en eldesempeño financiero de las empresas y por el contrario, tal como lo afirman autorescomo Kaziliûnas, [22] estos demandan altos costos, tiempo y esfuerzo que no compen-san los resultados obtenidos.

5. Implicaciones de los resultados obtenidosLos resultados de la presente investigación, permiten evidenciar que el principal aporte

de las certificaciones ISO 9001, no se encuentra en la productividad de las organizacio-nes. De hecho de los cuatro factores de competitividad del IMD estudiados es el terceroen importancia. Siendo el factor de mayor relevancia el correspondiente a infraestructura

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Actitudesy Valores

Page 34: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 33

sectorial lo cual permite denotar que el verdadero impacto de la certificación se logracuando un alto porcentaje de las empresas de un sector la alcanzan.

En este sentido se llama la atención a los organismos certificadores, firmas consultorasy directores de empresa, acerca de la responsabilidad que representa para la competitividadde un país, que la implementación del sistema de gestión de la calidad se enfoque en lamejora continua y no en la simple obtención de un certificado. Lo anterior soportado enel hecho de que en los países donde se presentaron los índices de correlación más altosentre la variable de control y la posición competitiva se caracterizan por un alto nivel dedesarrollo, donde la mejora continua es parte de la cultura empresarial.

Por otro lado, el nivel de correlación que se presenta entre la variable de control y elfactor eficiencia del gobierno considerado por el IMD, permite evidenciar la importan-cia de las decisiones que en materia de gestión empresarial toma el Estado para lacompetitividad país. Llevando a formular nuevas preguntas de investigación tales comola evaluación del impacto, en el caso colombiano, de la Ley 872 del 2003, o de la acredi-tación de los programas e instituciones de educación superior, en la eficiencia de lasorganizaciones y por ende en la competitividad país.

De igual manera es importante considerar que dadas las implicaciones que los resulta-dos encontrados en la presente investigación tienen para el sector empresarial en suconjunto, es conveniente la aplicación de herramientas complementarias que permitanrobustecer el análisis, tales como el análisis envolvente de datos (DEA), con el cual semide el nivel de eficiencia de las diferentes variables estudiadas.

6. ConclusiónEl principal aporte de la certificación de los sistemas de gestión ISO 9001 a la

competitividad país es el fortalecimiento de la infraestructura sectorial, por cuanto sepromueven las condiciones para el desarrollo científico y tecnológico de una nación. Loanterior, permite inferir que la certificación ISO 9001 no es una fuente de ventaja com-petitiva para la organización y por ende no se debe esperar diferenciación a partir deesta. La certificación ISO 9001 es una necesidad para competir sectorialmente.

7. Referencias [1] Organización Internacional de Estándares. (2008). The ISO Survey of ISO 9001:2000 and ISO 14001 Certificates. Ginebra -

Suiza: ISO.

[2] International Organization for Standardization, ISO. (2001). Quality management principles. Consultado: http://www.iso.org/iso/iso_catalogue/management_and_leadership_standards/quality_management/qmp.htm. (2 de Noviembre, 2009).

[3] Santos Vijande, M. L., & Álvarez González, L. I. (2009). TQM’s contribution to marketing implementation and firm’s competitiveness.Total Quality Management & Business Excellence, 20 (2). 171-196.

[4] Porter, M. (1996). ¿Que es la estrategia? Harvard Business Review, 3.

[5] Adams, A., & Dale, B. (2001). The use of quality management tools and techniques: a study in plastic injection moulding manu-facture. Proceedings of the institution of mechanical engineers part b-journal of engineering manufacture, 215 (6). 847-855.

[6] International Organization for Standardization, ISO. (2009). The ISO Survey of ISO 9001:2000 and ISO 14001 Certificates.Ginebra - Suiza: ISO.

[7] IMD. (2006). IMD World Competitiveneness Yearbook 2005. Consultado: http://formedia.pt/downloads/imd/PressRelease.pdf.(2 de Noviembre, 2009).

Luz Esperanza Bohórquez Arévalo

Page 35: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS34

[8] International Organization for Standardization, ISO. (2001). Quality management principles. Consultado: http://www.iso.org/iso/iso_catalogue/management_and_leadership_standards/quality_management/qmp.htm. (23 de abril, 2009).

[9] Porter, M. (1991). La ventaja competitiva de las naciones. Barcelona: MacGraw Hill.

[10] Linard, M. (2005). Informe Anual de la Competitividad Mundial. Metodología y principios de análisis. Washington: BancoInteramericano de Desarrollo.

[11] World Economic Forum, WEF. (2009). Consultado: http://www.weforum.org/. (5 de julio, 2009).

[12] IMD. (2009). IMD- Real world. Real Learning. Consultado: http://www.imd.org/. (5 de julio, 2009).

[13] ITAM. (n.d.). El Concepto de Competitividad Sistémica.

[14] Linard, M. (2005). Informe Anual de la Competitividad Mundial. Metodología y principios de análisis. Washington: BancoInteramericano de Desarrollo.

[15] Adams, A., & Dale, B. (2001). The use of quality management tools and techniques: a study in plastic injection moulding manu-facture. Proceedings of the institution of mechanical engineers part b-journal of engineering manufacture, 215 (6). 847-855.

[16] Cleary, B. (1997). Promoting the use of quality management tools in the classroom. Quality Progress, 30 (5), 8.

[17] Jackson, S. (2001). Successfully implementing total quality management tools within healthcare: what are the key actions?International Journal of Health Care Quality Assurance, 14 (4). 157-163.

[18] Heras, I., Marimon, F., & Casadesús, M. (2009). Impacto competitivo de las herramientas para la gestión de la calidad. Cuader-nos de Economía y Dirección de la Empresa (CEDE) (4). 417-435.

[19] Hoonakker, P., Carayon, P., & Loushine, T. (2010). Barriers and benefits of quality management in the construction industry: Anempirical study. Total Quality Management & Business Excellence, 21 (9). 953-969.

[20] Nava Caballido, V. M., & Rivas Tobar, L. A. (2008). Desempeño de las organizaciones certificadas en la norma ISO 9001:2000.Estudios gerenciales, 24 (108). 107-128.

[21] Lambert, G., & Ouedraogo, N. (2008). Empirical investigation of ISO 9001 quality management systems’ impact on organisationallearning and process performances. Quality Management & Business Excellence, 19 (10). 1071-1085

[22] Kaziliunas, A. (2010). Impacts of different factors on the implementation of quality management systems and performanceoutcomes. Current Issues of Business & Law. 575-592.

[23] Bonilla Garcia, J. (2009). La Calidad de los sistemas de gestión de recursos humanos en función de la tenencia o no de lacertificación ISO 9001:2000. Algunas evidencias, indicadores asociados. Estudios Gerenciales, 26 (115). 39-64.

[24] Jimenez, A. (2007). Descripción y análisis de la relación entre los indicadores macroecnómicos y el número de compañías concertificación ISO 9001:2000, en los países miembros de la ALADI. Universidad Catolica de Colombia. Bogotá: UniversidadCatolica de Colombia.

[25] Walpole, R., & Myers, R. (2004). Probabilidad y estadística (Cuarta ed.). México: McGraw Hill.

[26]. Marimon, F., Heras, I., & Casadesús, M. (2004). La difusión internacional de las normas ISO 9000 e ISO 14000. XIV CongresoNacional ACEDE. Murcia: Universidad Internacional de Catalunya.

[27] Bohorquez Arevalo, L. E., Lozano Montaña, A., y Forero, J. (2008). Impacto de la calidad en la rentabilidad. Revista de Ingenieria,Vol. 1. Universidad Distrital Francisco José de Caldas. 49-64.

[28] Deming, E. (1989). Calidad, productividad y competitividad - La salida de la crisis. Madrid: Ediciones Diaz de Santos.

[29] Feigenbaum, A. (1977). Control Total de la Calidad: Ingenieria y Admiistración. Mexico: CECSA.

[30] Sarmiento, X. (2007). Evaluar el Impacto del numero de empresas certificadas con ISO 9001:2000 en la competitividad paíssegún el IMD. Bogotá: Universidad Católica de Colombia.

Luz Esperanza Bohórquez ArévaloLuz Esperanza Bohórquez ArévaloLuz Esperanza Bohórquez ArévaloLuz Esperanza Bohórquez ArévaloLuz Esperanza Bohórquez ArévaloEstudiante del Doctorado en Ciencias de la Dirección de la Universidad del Rosario. Magister en Administración de Empresas, conespecialización en Pensamiento Estratégico y Prospectiva, al igual que en Ingeniería de la Calidad y el Comportamiento. Se hadesempeñado como consultora en procesos de diseño e implementación de sistemas de gestión. Actualmente se desempeñacomo docente de planta de la Universidad Distrital Francisco José de Caldas.

Estudio del impacto de la certificación ISO 9001:2000 en la competitividad-país

Page 36: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 35

Herramienta de software para eldesarrollo de descripciones dehardware utilizando VHDLa partir de modelos gráficos

A software tool for the developmentof graphic-model-based hardwaredescriptions using VHDL

ResumenCon el objetivo de agilizar y facilitar el proceso de diseño de

hardware se han realizado investigaciones relacionadas con la ge-neración automática de descripciones VHDL a partir de modelosgráficos. En este documento se describe una herramienta de soft-ware que permite obtener la descripción VHDL a partir de undiagrama ASM o de un diagrama de componentes. Esta herra-mienta tiene la característica de que pueden reutilizarse descripcionesya creadas como nuevos componentes y la información contenidaen diagramas ASM como parte de nuevos diagramas ASM. Laherramienta es utilizada para generar la descripción VHDL de 15circuitos comunes a partir de sus diagramas de componentes yASMs, obteniéndose en un 53% de los casos descripciones equiva-lentes y en el resto de casos aproximadas.

Palabras clave: VHDL, ASM, componentes, herramienta, XML,jerarquía.

AbstractWith the purpose of making the process of hardware design

quicker and easier, a number of investigations have been conductedconcerning the automatic generation of VHDL descriptions basedon graphic models. In this document, a software tool that generatesVHDL descriptions based on either ASM diagrams or componentsdiagrams will be presented. The characteristics of this tool allow aVHDL description already created to be reused like a newcomponent. Additionally, the information contained in an ASMdiagram can be reused as part of new ASM diagrams. The tool isused to generate the VHDL description of 15 well-known circuitsfrom both their component diagrams and their ASM diagrams,obtaining an equivalent description in 53% of the cases andapproximate descriptions in the remaining cases.

Key words: VHDL, ASM, components, tool, XML, hierarchy.

Citación: Vargas, J.R. (2010). Herramienta de software para el desarrollo de descripciones dehardware utilizando VHDL a partir de modelos gráficos. En: Ingeniería, Vol. 15, No. 1, pág. 35-46.

José RobertoJosé RobertoJosé RobertoJosé RobertoJosé RobertoVargas RiveroVargas RiveroVargas RiveroVargas RiveroVargas Rivero

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

Page 37: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS36

1. IntroducciónA medida que el tamaño de los transistores disminuye más funcionalidad puede ser

incluida en un dispositivo como una FPGA (Field Programmable Gate Array) y el sistemadigital a desarrollar puede crecer en tamaño y complejidad; se utilizan dos técnicas paratratar con esta complejidad [1], [2]:

• Considerar niveles de jerarquía.• Aumentar el nivel de abstracción del lenguaje en el cual el sistema puede ser desarro-

llado, hacia lenguajes gráficos.

Teniendo como objetivo implementar estas características se han desarrollado herra-mientas libres [2],[3],[4],[5],[6] que permiten la construcción de modelos gráficos dediagramas FSM (Finite State Machine) [3] y recientemente de diagramas de estado UML(Unified Modeling Language) [2], a partir de los cuales puede obtenerse de forma automá-tica la descripción VHDL (Very-high-speed integrated circuits Hardware Description Language)correspondiente. Sin embargo los diagramas ASM (Algorithmic State Machine) son másdescriptivos que los FSM y se adaptan mejor a diseños más complejos debido a suestructura similar a un diagrama de flujo [4], además de ser una representación alternativamucho más común que los diagramas UML para los diseñadores de hardware [1],[7].Por otra parte los diagramas mencionados permiten hacer descripciones funcionales [1]y no se cuenta con elementos para desarrollar descripciones estructurales. Por último nose cuenta con una herramienta libre que permita desarrollar diseños gráficos jerárquicosutilizando diagramas ASM y componentes en conjunto.

Con base en lo anterior se plantea el desarrollo de una herramienta de software quepermita a partir de modelos gráficos simples de diagramas ASM y componentes ex-traer código VHDL sintetizable con la característica que estos modelos puedanorganizarse de forma jerárquica.

2. ReferentesOgubi y David [4] muestran las ventajas en tiempo de diseño y tamaño del circuito al

emplear un lenguaje de nivel intermedio, entre aquellos de alto nivel como Java o C y losde descripción de hardware como VHDL, inspirado en la estructura de los ASM, queresulte más familiar a los programadores de software que los HDLs (Hardware DescriptionLanguage) y a la vez permita un manejo de las temporizaciones más preciso que otrasherramientas existentes como Handel-C y HardwareC, y que adicionalmente pueda sersintetizado en alto nivel. Para este lenguaje intermedio se desarrolla un compilador. Comose evidenciará en este artículo la representación de ASM en texto facilita que desarrolladoresde software implementen circuitos sin un conocimiento profundo de diseño hardware,reduciendo el tiempo de diseño.

En [8] se desarrolla una investigación sobre la optimización de descripciones VHDL anivel funcional. Para lograrlo se interpretan las estructuras implícitas en una descripciónVHDL. Dentro de esta investigación se desarrolló una herramienta de software. Uno delos elementos que conforman este software reconoce las palabras clave presentes en unadescripción VHDL. A partir de estas palabras se crea una estructura jerárquica de obje-

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

Page 38: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 37

tos en la cual se almacena cada tipo de elemento existente. De la declaración de entidadse extraen los puertos de entrada y salida mientras que de la arquitectura se extraen loselementos definidos por las palabras clave: case, component, if, else, elseif, null, portmap, process ywhen. A partir de las palabras clave y los elementos contiguos se generan objetos Java.

Con relación a herramientas con interfaz gráfica, en [9] se presenta una herramientacapaz de obtener el código VHDL funcional de una representación FSM gráfica. Lametodología que los autores manejan es partir de una herramienta de edición gráfica yaexistente llamada Graphviz que les permite a los usuarios de forma interactiva explorargrandes espacios de estados y diagramar gráficas de estado transición (STG) del diseñorequerido. La salida de este programa es un archivo en lenguaje (dot) el cual es unarepresentación textual de la máquina FSM. La herramienta convierte el archivo dot aformato estándar kiss2 usado para representar FSMs. Este archivo kiss2 se utiliza porotro módulo de la herramienta para directamente generar código VHDL.

En [5] se presenta una aproximación al proceso inverso que es la extracción de unmodelo gráfico, es decir un STG a partir del código HDL, antecediéndolo un procesode optimización de los FSM obtenidos, teniendo como única limitante sobre el códigoHDL que este sea sintetizable.

Con relación a los modelos gráficos a utilizar, en [6] se propone un estándar gráficopara la representación de VHDL estructural, dejando abierto a los vendedores de herra-mientas de software la representación gráfica funcional, de forma similar a como serealizó con lenguajes de descripción formales como SDL y MSC.

Más recientemente, en [2] se describe un proceso y una herramienta de software parapasar de los diagramas de estado de UML a código VHDL automáticamente. Loselementos que los autores contemplan en tal proceso son los siguientes:

1. Editor de diagrama de estado: Provee las herramientas necesarias para permitir que elusuario ingrese especificaciones de diagramas de estado de forma cómoda, los auto-res comentan que para esta etapa hay dos alternativas, la primera utilizar una herra-mienta ya creada y emplear un formato de intercambio o construir una nueva herra-mienta.

2. Metamodelo de diagrama de estado y metamodelo de VHDL: En esta etapa seindica que el metamodelo de diagrama de estado para UML está definido de maneraestándar, pero en el caso de VHDL los autores lo definen.

3. Transformación de modelo de diagrama de estado a modelo VHDL: En esta etapase aplican un conjunto de reglas para la transformación de cada uno de los elementosdel metamodelo de diagrama de estado al de VHDL.

4. Obtención del código VHDL: La etapa final del proceso consiste en pasar del mode-lo VHDL obtenido a texto utilizando nuevamente un conjunto de reglas.

3. DesarrolloEl proceso de obtención de la descripción VHDL es abordado utilizando como interfaz

gráfica la herramienta Draw de OpenOffice.org [10] que tiene como característica gene-

Jose Roberto Vargas Rivero

Page 39: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS38

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

rar un archivo estándar compuesto por un conjunto de documentos XML, los cualesalmacenan la información sobre la estructura y contenido de los modelos gráficos. Exa-minando el código XML de estos archivos, se puede extraer la información necesariapara la reconstrucción de la descripción VHDL. Esta información debe organizarse ylos elementos de sintaxis necesarios deben agregarse.

Por otra parte, la posibilidad de hacer uso de niveles de jerarquía en modelos gráficosde ASM y componentes, se logra mediante la definición de elementos que permiten lainclusión de un diagrama ya elaborado, dentro de otro.

Por último, mediante un software desarrollado en el lenguaje de programación Java seaplican los métodos propuestos. Esta herramienta permite corroborar la metodología alutilizarla para generar descripciones VHDL a partir de varios modelos gráficos dediagramas ASMs y de componentes, en los cuales se utilizan niveles de jerarquía.

3.1 Elementos gráficos utilizados para larepresentación de diagramas ASM y de componentes

A continuación se presentan algunos equivalentes entre el modelo gráfico convencionalde los elementos que conforman un diagrama ASM y el modelo obtenido utilizandoelementos gráficos provistos por la herramienta Draw de OpenOffice.org, que fue uti-lizada en esta propuesta.

En relación con los diagramas ASM, se dispone de bloques de estado, condición, ycondicionales (ver Figura 1). Adicionalmente ya que a partir de los modelos gráficosdesarrollados con esta herramienta se debe obtener código VHDL sintetizable, es nece-

Figura 1. Diagrama de un bloque de estado ycondición, (arriba) modelo, (medio) estructura,

(abajo) ejemplo

Asignación de variabley salida incondicionales

Nombre del estadoAsignación de variable ysalida incondicionales

SOA=“0001”

D=´0´&B(7downto 0)

Nombre delEstado

Código delEstado

Condición

Nombrede estadocondición

SO¿A= ´0´? or

¿B=´1´?1 0

1 0

1 0

sario que se definan elementos que no seencuentran en un diagrama ASM conven-cional. Por ejemplo, se requiere que elusuario tenga la posibilidad de definircuales serán las entradas, salidas y señales(signals) que compondrán la declaración deentidad de la descripción VHDL, paraeste propósito se definió el bloque I/O.

A su vez para identificar los puntos enlos cuales comienza y termina un diagra-ma ASM se definieron los bloques deRESET y de FIN. Una representación dela forma en que se conectarían estos blo-ques se presenta en la Figura 2, el bloquede FIN es opcional debido a que el últi-mo estado puede saltar a un estadoanterior.

Adicionalmente, dado que se requiereque el usuario pueda reutilizar estructuraspara poder implementar niveles de jerar-

Page 40: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 39

Jose Roberto Vargas Rivero

quía se utiliza la palabra reservada HNAME, lacual en caso de incluirse al inicio del bloque I/Oindica que el diagrama ASM será reutilizado comoparte de un nuevo diagrama, en este caso losindicadores A y B se usan para marcar el inicio yfin de la estructura, como se ilustra en la Figura 3.

La información que se extrae de un gráficoASM para reutilización se guarda en un archivode texto simple (.txt) en una serie de caracterescon sus elementos separados por viñetas y orga-nizados por secciones que luego pueden ser leídascon facilidad, este tipo de elementos se llamaránelementos heredados. Un ejemplo se presenta enla Figura 4.

Con relación a los diagramas de componentesse utilizan compuertas AND, OR y NOT dadoque con estas se puede generar cualquier otracompuerta. Sin embargo dado que no es prácti-co elaborar circuitos complejos únicamente apartir de estas compuertas, se emplean los com-ponentes VHDL los cuales son creados a partirde una descripción VHDL. Así por ejemplo apartir del archivo ‘xor_of.vhd’ que contiene ladescripción funcional o estructural de una com-puerta ‘xor’ se genera automáticamente unelemento gráfico que puede ser conectado a otroselementos permitiendo la creación de circuitoscada vez más complejos como se ilustra en laFigura 5. En ella puede observarse la estructurade un componente VHDL, este elemento estaconstituido por un número (m) de entradas y unnúmero (p) de salidas que dependerán de la de-claración de entidad de la cual se genere. Y cuyonombre sigue la estructura: ‘nombre del archivosin extensión’ +’.’+un número único de compo-nente 1,2,…n.

Los componentes que se pueden importar noestán limitados a aquellos cuya descripción VHDL

Figura 2. Diagrama de conexión bloquesadicionales

Conjunto de bloques

Bloque fin

Bloque Reset

Bloque I/O

Figura 3. Diagrama de conexión parareutilización

Conjunto de bloques

B

A

HNAME: hnameBLOQUE I/O

Figura 4. Ejemplo de generación de uncomponente VHDL

xor_of.1D

E

H

ENRITY xor_of ISPORT (D,E: IN stcl_logic;H: OUT stcl_logic);END xor_of;Arquitectura{Descripciónfundacional oestructural}

Figura 5. Modelo general de un componenteVHDL

nombre #

Entrada 1

Entrada 1

Entrada m

Salida 1

Salida 2

Salida p

ha sido generada con la herramienta, lo cual permite al diseñador hacer uso de su libreríaparticular de componentes para incorporar al modelo gráfico.

En la Figura 6 se muestra el elemento de entrada, salida o señal (I/O/S), el cual seutiliza para representar las entradas, salidas y señales en un diagrama estructural.

Page 41: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS40

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

3.2 Estructura y características del códigoXML generado

El archivo context.xml es uno de los archivos queconforman un documento guardado en Draw deOpenOffice.org. Este contiene la información sobretodas las figuras que hayan sido creadas. Cada figurase transforma en un elemento XML específico quetiene un grupo de atributos como un identificador“draw:id”, la posición del elemento “svg:x” y “svg:y”,entre otros. El texto interno se transforma en elemen-tos subordinados tipo “text:p”. En la Figura 7 sepresenta un elemento tipo “rect” en el cual se trans-forman los componentes VHDL, nótese la presenciade elementos hijos tipo draw:gluepoint que corres-ponden a las entradas o salidas del componente. Loselementos I/O/S a su vez se transforman en elemen-tos tipo “circle” o “ellipse”.

A nivel de los diagramas ASM también encontra-mos elementos tipo “rect” o “custom-shape”, elelemento subordinado tipo “text:p” contiene la in-formación sobre el nombre del estado y lasasignaciones que en este se realicen, como se observaen la Figura 8.

En ambos tipos de diagramas la interconexión delos diferentes elementos se hace con el uso deconectores los cuales se transforman en elementos tipo

Figura 6. Elemento I/O/S, (izquierda)elemento de 1 bit (derecha) vector

A A(0) A(1) A(2)

Figura 7. Elemento XML tipo rect

rectdraw: id, otros atributos <draw:gluepoint> draw: id, svg:x, otros atributos <text:p> nombrecomponente.#

Figura 8. Elemento XML tipocustom-shape o rect

custom-shape o rectdraw: id, svg:y otros atributos <text:p>

Figura 9. Elemento XML tipo connector

connectordraw:stat-shapedraw:end-shapeotros atributos

Estado 2Asignaciones ycondiciones

“connector”. Estos elementos tienen los atributos “draw:start-shape” y “draw:end-shape”que corresponden al atributo “draw:id” del elemento del cual parten y al cual lleganrespectivamente, esto permite identificar las conexiones en un diagrama de componentey la secuencia de estados en un diagrama ASM (ver Figura 9).

3.3 Extracción del contenido del código XMLrequerido para construir la descripción VHDL

La información contenida en cada uno de los elementos XML debe extraerse parapoder construir la descripción VHDL correspondiente; con este objetivo se utilizó XPath[11] el cual es un lenguaje de consulta que utiliza expresiones con sintaxis simple, com-puesta por una ruta y uno o más predicados opcionales, y que retorna todos los nodosque concuerdan con la expresión [8].

La estructura genérica de una consulta XPath es:

(Tipo de variable retornada) nombre = xpath.evaluate (ruta+[expresión],documento, XPathConstants.(Tipo de variable))

Page 42: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 41

Jose Roberto Vargas Rivero

Así por ejemplo para extraer el número de elementos tipo “circle” se utiliza la expresión:

Número de elementos tipo circulo=

XPath(documentcontent/body/drawing/page/circle, doc,XPathConstants.NUMBER)

3.4 Construcción de objetos VHDL paradiagramas de componentes y ASMs

A partir de las variables obtenidas con base en las consultas XPath, es necesario recons-truir la descripción VHDL tanto de un diagrama de componentes como ASM. Paraesto se requiere definir un método en el cual se organice la información de una maneramas adecuada. Con este objetivo se definieron los objetos VHDL, que son piezas de ladescripción VHDL en las cuales se agrupan los datos extraídos del XML.

A continuación se describe de forma general la secuencia de pasos a seguir para cadatipo de diagrama.

Para diagramas de componentes:

1) Identificar las entradas (Objeto entradas).2) Identificar las salidas (Objeto salidas).3) Identificar elementos comunes a entradas y salidas que corresponden a señales (Obje-

to señales).4) Relacionar las entradas, las salidas y las señales con los componentes utilizando los

atributos “draw:id”.5) Clasificar los componentes según su texto interno.6) Organizar las entradas y salidas en listas de asociación (Objeto instancias de compo-

nentes).7) Añadir las declaraciones de los componentes a partir de la carpeta que agrupa los

archivos VHDL del usuario (Objeto declaraciones de componentes).

Para diagramas ASM:

1) Identificar si se debe generar un arreglo o una descripción VHDL.

Si es el primer caso generar el arreglo a partir de la secuencia de bloques y el bloque I/O. Si es el segundo caso:

2) Construir la entidad a partir del bloque I/O (Objeto entradas, Objeto salidas y Obje-to señales).

3) Organizar los bloques a partir de su posición vertical.4) Leer la secuencia a partir del bloque Reset, utilizando los atributos “draw:id” para

identificar los estados siguientes (Objeto asignaciones de reset).5) Añadir la información de los elementos heredados.6) Identificar los nombres de los estados y las acciones que se realizan en cada estado.

Page 43: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS42

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

7) Identificar los bloques de decisión y los estados siguientes (Objeto estados).

3.5 Construcción de la descripción VHDL a partir de los objetos VHDLUtilizando las reglas de sintaxis del lenguaje VHDL y los objetos obtenidos, es posible

obtener una descripción VHDL sintetizable correspondiente al diagrama inicial. La es-tructura que se propone para cada tipo de diagrama es la siguiente:

Para diagramas ASM:Para diagramas de componentes:

Figura 10. Diagrama ASM del contador ascendente descendente de 4 bits

Entidad{Objeto entradas, Objeto salidas}

Objeto componenteArquitectura{Objeto señalesObjeto asignaciones de resetObjeto estados}

Entidad{Objeto entradas, Objeto salidas}

Objeto componenteArquitectura{Objeto señalesObjeto declaraciones de componentesObjeto instancias de componentes}

4. Resultados

4.1 EjemplosA continuación se presentan tres ejemplos contruidos con la herramienta: el primero es

un diagrama ASM para la serie de Fibonacci (Figura 11); el segundo es un diagrama decomponentes correspondiente a un contador ascendente descendente de 4 bits (Figura10) con su modelo gráfico; el tercero es un diagrama ASM de un circuito arbitrador conprioridad alternada utilizando niveles de jerarquía (Figura 12) en el cual se reutiliza dosveces la estructura del arbitrador simple; además se presenta la arquitectura de la descrip-ción VHDL obtenida en los dos primeros casos.

Nótese que en el caso del diagrama de componentes, el HAS (Half adder substractor)y el DedgeflipflopRQ (flip-flop tipo D con disparo por flanco positivo) son incorpora-dos automáticamente como componentes al igual que su entidad.

Page 44: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 43

Jose Roberto Vargas Rivero

Figu

ra 1

1. D

iagr

ama

ASM

par

a el

cál

culo

de

la s

erie

de

Fibo

nacc

iFi

gura

12.

Dia

gram

a A

SM p

ara

un a

rbitr

ador

con

prio

rida

d al

tern

ada

utili

zand

o ni

vele

s de

jer

arqu

ía

Page 45: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS44

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

4.1.2. Contador ascendente descendente de 4 bitscomponent HAS isport ( Ci : in std_logic;a : in std_logic;Down : in std_logic;Co : out std_logic;s : out std_logic);end component;component DedgeflipflopRQ isport ( clear : in std_logic;clk : in std_logic;D : in std_logic;Q : out std_logic);end component;

beginHAS4: HAS port map (C(2),K(3),Down,Overflow,D(3));DedgeflipflopRQ4: DedgeflipflopRQ port map (Clear,Clock,D(3),K(3));HAS3: HAS port map (C(1),K(2),Down,C(2),D(2));

DedgeflipflopRQ3: DedgeflipflopRQ port map (Clear,Clock,D(2),K(2));HAS2: HAS port map(C(0),K(1),Down,C(1),D(1));DedgeflipflopRQ2: DedgeflipflopRQ port map (Clear,Clock,D(1),K(1));HAS1: HAS port map (Count,K(0),Down,C(0),D(0));DedgeflipflopRQ1: DedgeflipflopRQ port map (Clear,Clock,D(0),K(0));Q(3)<=K(3);Q(2)<=K(2);Q(1)<=K(1);Q(0)<=K(0);

4.1.1. Serie de Fibonacci null; if (n_reg=”00001") thensx<=S4;elsesx<=S5;end if;when S4 =>done_tick<=’1';sx<=S0;f<=t1_reg;when S5 =>t1_next<=t1_reg+t0_reg;t0_next<=t1_reg;n_next<=n_reg-’1';sx<=S6;when S6 =>t0_reg<=t0_next;t1_reg<=t1_next;n_reg<=n_next;sx<=S2;end case; end if; end process;

when S0 =>ready<=’1';done_tick<=’0';if (start=’1') thent0_next<=(others=>’0');t1_next<= (0=>’1', others=>’0');n_next<=i;sx<=S1;elsesx<=S0;end if;when S1 =>n_reg<=n_next;t1_reg<=t1_next;sx<=S2;when S2 =>null; if (n_reg=”00000") thent1_next<=(others=>’0');sx<=S4;elsesx<=S3;end if;when S3 =>

4.2 SimulacionesLa herramienta de software se creó utilizando el lenguaje de programación Java el cual

es libre y multiplataforma. Para propósitos de validación de la herramienta, se generaronlas descripciones VHDL de 15 circuitos; 5 a partir de su diagrama de componentes, 5 apartir de su diagrama ASM y 5 en los que se aplican características adicionales como eluso de vectores, niveles de jerarquía y reutilización de código existente [1], [7], [9], [12].

Page 46: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 45

Jose Roberto Vargas Rivero

Circuito EFCodificador BCD 7 segmentos SiSumador Restador SiDecodificador 3 a 8 SiFlip-Flop tipo D con disparo por flanco positivo SiEjemplo de un FSM de Moore SiTiempo promedio de generación (segs.) 13.32Cálculo polinomio ParcialPromedio ParcialRaíz cuadrada ParcialMedidor de periodo ParcialSerie de Fibonacci ParcialTiempo promedio de generación (segs.) 2.74Unidad aritmética lógica SiContador ascendente-descendente 4 bits SiRaíz cuadrada con niveles de jerarquía ParcialMedidor de baja frecuencia SiArbitrador ParcialTiempo promedio de generación (segs.) 44.8

Tabla I. Resultados obtenidos

Con respecto a los resultados obtenidos la equivalencia funcional parcial que se obser-va en algunas simulaciones es consecuencia de que el número total de estados es mayoren las descripciones obtenidas con la herramienta desarrollada. Esto se debe a que losbloques ASM complejos deben descomponerse en bloques que solo tengan 1 bloque dedecisión. Esta limitante del algoritmo se basa en el número creciente de posibilidades quese generan sobre la descripción VHDL a obtener, cuando aumenta el número de blo-ques de decisión en un mismo estado. En estos casos la descripción generada por laherramienta y la original corresponden a diferentes circuitos. Se establece el calificativode parcial para indicar que aunque el circuito obtenido es distinto la misma funcionalidadse puede replicar.

Otro punto a mencionar es que en la Tabla I se presentan tiempos de generaciónmayores cuando la descripción VHDL se obtiene a partir de un diagrama de compo-nentes que cuando se obtiene a partir de un diagrama ASM, lo cual se puede explicar araíz de que el análisis de la estructura de este tipo diagramas es computacionalmente masexigente que el de un diagrama ASM, el cual es primordialmente lineal. Por último puedeobservarse el impacto en el tiempo de generación en los últimos cinco circuitos en loscuales se implementaron niveles de jerarquía.

4.3 Trabajo futuroEl algoritmo para interpretación de diagramas ASM debe mejorarse de tal forma que

se puedan interpretar diagramas con más de un bloque de decisión por estado. Al mis-mo tiempo el algoritmo que realiza la lectura de las declaraciones de entidad para crearlos componentes VHDL puede mejorarse de tal forma que existan menos limitantescon respecto al contenido y organización de las declaraciones que se pueden interpretar.También puede mejorarse el manejo de vectores ya que si se genera una entrada o salida

En la Tabla I se resumen los resultados obtenidos comparando las simulaciones de ladescripción VHDL original y la obtenida con la herramienta utilizando el simuladorModelsim XEIII 3.4b. La comparación se basa en la equivalencia funcional (EF) según latabla de verdad o descripción del circuito.

Page 47: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS46

por cada elemento de un vector, el tamaño del componente VHDL a nivel gráficoaumenta drásticamente; por otra parte, si solo se genera una entrada o salida para todoel vector se pierde la posibilidad de conectar individualmente cada uno de sus elementos.

Finalmente se planea lograr una mayor integración con el trabajo desarrollado en [8]de tal forma que se pueda realizar optimización sobre la descripción VHDL generada apartir del modelo gráfico.

5. ConclusionesEn este estudio se encontró que el uso de XML como lenguaje intermedio para la

transformación entre un diagrama de componentes o ASM y una descripción VHDLgenera ventajas en cuanto a la portabilidad al ser un archivo de texto y la facilidad deextracción de la información con herramientas como XPath.

De la misma forma, se evidencia que las descripciones VHDL de diagramas de com-ponentes o ASMs pueden ser representadas en modelos gráficos con el uso de un númeropequeño de elementos de construcción.

Por último, se resalta que el uso de niveles de jerarquía en modelos gráficos de diagramasASMs y de componentes puede implementarse a partir de la definición de elementosque simbolicen la información contenida en una descripción VHDL o algoritmo previa-mente elaborado.

6. Referencias bibliográficas[1] Pong P Chu. (2006). RTL Hardware Design Using VHDL. Jhon Wiley & Sons, Inc. Hoboken, New Jersey. 21, 25,317,357,474,475.

[2] Wood, Steve K, Akehurst David H, Uzenkov Oleg, Howells W, McDonald-Maier, Klaus D. (2008). A Model-Driven DevelopmentApproach to Mapping UML State Diagrams to Synthesizable VHDL. IEEE Transactions on Computers. Vol. 57. 1357-1371.

[3] Abdel-Hamid, Mohamed Zaki, Sofiéne Tahar. (2004). A tool converting finite state machine to VHDL. Canadian Conference onElectrical and Computer Engineering. Vol. 4, 2-5. 1907-1910.

[4] Etienne Ogoubi, Jean Pierre David. (2004). Automatic synthesis from high level ASM to VHDL: a case study. The 2nd Annual IEEENortheast Workshop on Circuits and Systems. 81-84.

[5] Chien-Nan Liu, Jing-Yang Jou. (2000). An Automatic controller extractor for HDL Descriptions at the RTL. IEEE Design & Testof Computers. Vol. 17. 72-77.

[6] Thomas Hadlich. (1997). Proposing graphic extensions to VHDL. VHDL International User’s Forum (VIUF ’97). 109-115.

[7] Enoch O Wang. (2005). Digital Logic and Microprocessor Design with VHDL Brooks/Cole. 80, 84, 110, 116, 118, 185, 210, 271,367, 368.

[8] Oscar Javier Méndez Zuluaga. (2007). Modificación de ASMs sobre descripciones funcionales de VHDL. Trabajo de gradoUniversidad Distrital Francisco José de Caldas.

[9] Volnei A Pedroni. (2004). Circuit Design with VHDL. MIT Press. Cambridge Massachusetts. 3.

[10] Open Office. (2010). OpenOffice.org 3.3.0. OpenOffice.org project. 2011. Consultado: http://www.openoffice.org. (7 de marzo,2010).

[11] Oracle. (2010). Package javax.xml.xpath . Oracle. 2011. Consultado: http://download.oracle.com/javase/1,5.0/docs/api/javax/xml/xpath/package-summary.html. (7 de marzo, 2010).

[12] Pong P Chu. (2008). FPGA prototyping by VHDL examples. Jhon Wiley & Sons, Inc. Hoboken, New Jersey. 109,110,153.

Jose RJose RJose RJose RJose Roberto Voberto Voberto Voberto Voberto Vargas Riveroargas Riveroargas Riveroargas Riveroargas RiveroIngeniero Electrónico de la Universidad Distrital Francisco José de Caldas, de Bogotá, Colombia. Miembro del grupo de investigaciònLAMIC, Universidad Distrital Francisco Jose de Caldas, Bogota, Colombia.

Herramienta de software para el desarrollo de descripciones de hardware utilizando VHDL a partir de modelos gráficos

Page 48: Revista Ingenieria 2010 Vol. 1 y 2

IngenieríaREVISTAREVISTA

IngenieríaREVISTA CIENTÍFICA SEMESTRAL

Volumen 15 • Número 2 • Año 2010 • ISSN 0121-750X

20

10

UNIVERSIDAD DISTRITALFRANCISCO JOSÉ DE CALDAS

FACULTAD DE INGENIERÍA

Page 49: Revista Ingenieria 2010 Vol. 1 y 2

REVISTA CIENTÍFICA SEMESTRALPublicación admitida en el Índice Nacional de Publicaciones

Seriadas Científicas y Tecnológicas de Colciencias

Vol. 15 • No. 2 • Año 2010 • ISSN 0121-750X

REVISTAREVISTA

IngenieríaIngeniería

UNIVERSIDAD DISTRITAL FRANCISCOJOSÉ DE CALDAS, FACULTAD DE INGENIERÍA

Carrera 7 No. 40-53 Piso 4 Bogotá, ColombiaTeléfono: + 57 (1) 323 93 00 ext. 2413

Correo electrónico: [email protected]://revistas.udistrital.edu.co/ojs/index.php/reving

EDITOR

Inocencio Bahamón C., MSc.Rector

María Elvira Rodríguez, PhD.Vicerrectora Académica

Octavio Salcedo Parra, MSc.Decano Facultad Ingeniería

Luz Esperanza Bohorquez, MSc.Universidad Distrital Francisco José de Caldas

Marco Alzate, PhD.Universidad Distrital Francisco José de Caldas

Rodrigo Herrera, Magister.Universidad Distrital Francisco José de Caldas

Ana María Peña, PhD.Universidad Distrital Francisco José de Caldas

Edwin Rivas, PhD.Universidad Distrital Francisco José de Caldas

Juan Carlos Figueroa, MSc.Universidad Distrital Francisco José de Caldas

COMITÉ CIENTÍFICO

Germán Méndez, PhD.Universidad Distrital Francisco José de Caldas

Víctor Hugo Grisales, PhD.Universidad Nacional de Colombia

Jose Luis Villa, PhD., Universidad Tecnológica de Bolivar

Danilo Rairán, MSc., Universidad Distrital

Luis Farley Ortiz, Universidad Nacional de Colombia

Bell Manrique Losada, MSc., Universidad de Medellin

Javier Orjuela, MSc., Universidad Distrital

Andrés Gaona, MSc., Universidad Distrital

Edgar Forero Granados, TecnoParque Colombia

María Eugenia Calderón, PhD., Universidad Distrital

Camilo Eduardo Prieto, MSc., Universidad Nacional de Colombia

José J. Martínez, MSc., Universidad Nacional de Colombia

Jorge Rodríguez, MSc., Universidad Distrital

Deicy Alvarado, PhD., Universidad Distrital

ÁRBITROS EN ESTA EDICIÓN

Los textos de los artículos incluidos en esta edición pueden serutilizados y reproducidos con fines sin ánimo de lucro y dando créditoa los autores.

PERMISO DE REPRODUCCIÓN

Cra. 7 No. 40-53 P. 4 Decanatura Facultad de IngenieríaTeléfono: + 57 (1) 323 93 00 ext. 2413

SUSCRIPCIÓN

INDIZADA EN

Ni la Revista INGENIERÍA, Editor, Comité Editorial, Facultad de Ingenieríade la Universidad Distrital F.J.C., otorgan ninguna garantía, expresa o implí-cita, o asumen responsabilidad alguna por la exactitud, completitud o utilidadde cualquier información, aparato, producto o proceso divulgado, o que repre-sente que su uso no infrinja derechos privados. La mención o referencia aalgún producto, proceso o servicio comercial en específico, por su marcacomercial, marca registrada, fabricante o cualquier otra denominación, noimplica ni constituye su endoso, recomendación o favorecimiento por partede la Revista INGENIERÍA. Los juicios y opiniones expresadas por los autoresen este medio son de su responsabilidad, y no establecen, reflejan o compro-meten los de la Revista INGENIERÍA.

COMITÉ EDITORIAL

Maquetación, indización, copyedición, diseño gráfico e impresión:

Grupo Editorial Gaia

Sergio A. Rojas, PhD.Universidad Distrital Francisco José de Caldas

La Revista INGENIERÍA es editada por la Universidad Distrital, ypublicada con periodicidad semestral. Su principal objetivo es difundiry debatir avances en investigación y desarrollo en las diferentesáreas de la ingeniería. El contenido de la revista está dirigido ainvestigadores, especialistas, docentes, estudiantes de pregrado yposgrado, ingenieros en ejercicio y al sector empresarial.

POSTURA EDITORIAL Y AUDIENCIA

DIRECTIVASColciencias

UNAM

UNAM

Directory of Open Access Journals

Universidad de la Rioja

Sergio A. Rojas, PhD.Universidad Distrital Francisco José de Caldas

REVISOR DE ESTILO

Ing. Felipe Forero, CAE (Cambridge).

SCIENTIFIC WRITING ADVISOR

Page 50: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 49

La Red Colombiana deRevistas de Ingeniería

Mencionábamos en un editorial anterior, que nuestra Revistapodía entenderse como un entramado de lectores, autores, edi-tores, revisores, pares y árbitros, conformando una red socialávida y poseedora del saber disciplinar y las buenas prácticas quegarantizan la divulgación auto-regulada, veraz y oportuna denuevo conocimiento en las diferentes especialidades de la inge-niería. Esta apreciación podría aplicarse a cualquier revista dedivulgación de resultados científicos, en particular, a las demásrevistas de ingeniería que se publican en el país. En razón de loanterior, cabe preguntarse si siguiendo el espíritu de trabajocolaborativo que ha venido caracterizando el nuevo milenio, yapoyándonos en las tecnologías de la conectividad y la ubicui-dad, ¿tiene sentido mantener aisladas las redes sociales científicasque conforman a estas revistas? La respuesta inmediata es un no,puesto que de facto, las revistas ya se encuentran conectadas pormedio de los autores, revisores y lectores que participan indistin-tamente en varias de ellas. Realmente solo faltaría definir loscanales efectivos y formales para el intercambio, reparto y distri-bución mutua de información entre las mismas. Esto sería, desdenuestro punto de vista, escalar un nivel en la jerarquía deconectividad de la red social científica-ingenieril colombiana.

La anterior reflexión está íntimamente ligada al surgimiento dela Red Colombiana de Revistas de Ingeniería (RCRI), iniciativa que bus-ca la integración de publicaciones arbitradas en el campo de laingeniería, en aras de mejorar la visibilidad, el impacto y en tér-minos generales, la calidad científica de los avances y resultadosen ellas divulgados. La RCRI tiene como misión además, conso-lidar una estructura que facilite la comunicación y cooperación(por ejemplo, intercambio de experiencias, controles, material,bases de datos de pares y autores, entre otros), así como la pro-moción de la profesionalización e institucionalización de losequipos editoriales de sus revistas integrantes. Originalmente

EditorialIn

geni

ería

RE

VIS

TA

RE

VIS

TA

Inge

nier

íaCitación: Rojas, S.A. (2010). La Red Colombiana de Revistasde Ingeniería. En: Ingeniería, Vol. 15 No. 2, pág. 75-76.

Page 51: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS50

Reingeniería a la Revista INGENIERÍA

propuesta por la Revista Ingeniería e Investigación de la Uni-versidad Nacional, sede Bogotá, la Revista de Ingeniería de laUniversidad de los Andes y la Revista Educación en Ingenieríade la Asociación Colombiana de Facultades de Ingeniería(ACOFI), la idea ha tenido eco en los editores de las demásrevistas colombianas, al punto de haberse realizado ya variosencuentros en diferentes universidades y tener casi cerca decuarenta (40) revistas adscritas. La RCRI opera en cinco mesasde trabajo organizadas así: Tecnologías de Información y Co-municación, Mejores Prácticas, Política Editorial, Impacto Sociale Indicadores y Ética.

La Revista INGENIERÍA de la Universidad Distrital se haadherido de manera entusiasta como miembro fundador de laRCRI y para impulsarla, su emblema distintivo, de cuyo diseñosomos co-autores, tendrá presencia desde hoy en nuestras pá-ginas. A nuestros lectores asiduos les extendemos gentil invitacióna visitar y tener entre sus favoritos el sitio Web de la RCRI(http://www.rcri.co), donde podrán encontrar mayor infor-mación respecto a las actividades de la Red y un repositoriocentral de enlaces a todas las revistas miembro. Este será sinduda una fuente valiosa de divulgación y corroboración de losavances científicos de la ingeniería de todo el país. Avances comolos que, a propósito, presentamos en este nuevo número, y queincluyen temáticas como el diseño de sistemas de inferenciadifusa booleanos, continuando con la descripción de un len-guaje de metamodelos para sistemas gestores de aprendizaje, yfinalizando con un modelo de optimización para eldimensionamiento del servicio Web-hosting. Reiteramos nues-tro agradecimientos a nuestros autores de la UniversidadDistrital, la Universidad de Oviedo y el Banco de la República,y de la misma forma a nuestros evaluadores de la UniversidadDistrital, la Universidad Tecnológica de Bolivar, la UniversidadNacional de Colombia, la Universidad de Medellín, yTecnoParque Colombia.

Ing. Sergio A. Rojas, MSc., PhD.Editor General Revista INGENIERÍA

Page 52: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 51

Con

teni

do

Sistema de inferencia difusabasado en relaciones BooleanasA fuzzy inference system based on Boolean relations

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Desarrollo de un lenguaje de dominio específicopara sistemas de gestión de aprendizaje y suherramienta de implementación “KiwiDSM”mediante ingeniería dirigida por modelosDeveloping a domain-specific language forlearning management systems, and acorresponding implementation tool (“KiwiDSM”)through model-driven engineering

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Modelo de dimensionamiento del servicioweb hosting dirigido a proveedores de lapequeña y mediana empresa colombianaA capacity planning model for web hostingproviders serving small- and medium-scalebusinesses in Colombia

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

REVISTA CIENTÍFICA SEMESTRAL

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS, FACULTAD DE INGENIERÍAPublicación admitida en el Índice Nacional de Publicaciones Seriadas Científicas y Tecnológicas de Colciencias

Volumen 15 • Número 2 • Año 2010 • ISSN 0121-750X

IngenieríaREVISTA

Páginas

52 - 66

67 - 81

82 - 95

Page 53: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS52

Sistema de inferenciadifusa basado enrelaciones BooleanasA fuzzy inference system basedon Boolean relations

ResumenEste documento describe la estructura de un sistema de

inferencia difusa basado en relaciones booleanas. La teoríarelacionada con lógica y conjuntos booleanos es una buenaherramienta para el diseño de automatismos y sistemasdigitales. Una variación con la cual se busca mejorar los siste-mas basados en automatismos consiste en emplear conjuntosdifusos en lugar de booleanos. Lo anterior se realiza con elobjetivo de tener una acción continua en el actuador del au-tomatismo. Al realizar esta variación y al aplicar lametodología de diseño de los sistemas de automatismos,aparecen los sistemas de inferencia difusa basados en rela-ciones booleanas.

Aunque inicialmente esta propuesta se realizó consideran-do sistemas de automatismos, se observa que es posibleextenderla a sistemas de inferencia difusa.

Palabras clave: Sistemas de inferencia Lógica difusa, ló-gica booleana.

AbstractThis paper describes a fuzzy-inference system that is based

on Boolean relations. Boolean logic is recognized as a usefultool for automata and digital systems design. An alternativeto improve automata systems consists in smoothing the crispsets into fuzzy sets. The purpose to perform a continuousaction on the actuator; by making this change, a new fuzzyinference system based on Boolean relations arises.

Although the original proposal was formulated so as toconsider automata systems, it is clear that this approach canbe extended to more general fuzzy inference systems.

Key words: Fuzzy logic Inference systems, Boolean logic.

Helbert EduardoHelbert EduardoHelbert EduardoHelbert EduardoHelbert EduardoEspitia CuchangoEspitia CuchangoEspitia CuchangoEspitia CuchangoEspitia Cuchango

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

José JairoJosé JairoJosé JairoJosé JairoJosé JairoSoriano MéndezSoriano MéndezSoriano MéndezSoriano MéndezSoriano Méndez

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

Citación: Espitia, H.E. y Soriano, J.J. (2010). Sistema de inferencia difusabasado en relaciones Booleanas. En: Ingeniería, Vol. 15, No. 2, pág. 52-66.

Page 54: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 53

1. IntroducciónLa lógica booleana es una herramienta útil en el diseño de sistemas automáticos [1,2].

Sin embargo este tipo de sistemas de control presentan un desempeño limitado debidoa su no linealidad. Una forma de mejorar el desempeño de estos sistemas consiste enreemplazar conjuntos booleanos por difusos.

Un trabajo donde se busca aprovechar las características del diseño de automatismosbasados en álgebra booleana se presenta en [3], donde se propone un método deminimización de expresiones en sistemas de inferencia difusa, empleando lógica booleana.En un principio la metodología propuesta se consideró como un posible mecanismopara la implementación del proceso asociado a la defusificación [4,5], sin embargo conel tiempo se apreció que se podía interpretar propiamente como un sistema de inferen-cia difusa por sí mismo [13].

El Concresor Basado en Relaciones Booleanas (CBR) o como se denominó original-mente en inglés Defuzification Based on Boolean Relations (DBR), busca plantear un mecanismode implementación para los sistemas de lógica difusa tomando como referencia el dise-ño de automatismos, ya que estos sistemas son muy empleados en control de procesospor su facilidad de implementación. Esta técnica de diseño considera los sensores,actuadores y las relaciones booleanas empleadas en las estrategias de control [6].

Debido a la evolución que ha tenido la metodología desde su propuesta inicial, se obser-vó que el término DBR solo es adecuado para hacer referencia al proceso simplificadoasociado a la defusificación, mientras que la caracterización como CBR (Concretion Based onBoolean Relations) propuesta para el diseño del sistema de inferencia como tal, se consideramás acorde para expresar el fundamento de esta metodología. En aplicaciones anterioresa este documento, se puede encontrar comúnmente empleado el término DBR. De igualmanera, como la forma de implementación de este tipo de sistemas difiere de aquel de lossistemas difusos tradicionales, se decidió denominarlo Sistemas de Inferencia Difusa Basa-dos en Relaciones Booleanas FIS-BBR (Fuzzy Inference System - Based on Boolean Relations).Dado que la anterior definición no ha sido considerada en trabajos anteriores es muycomún encontrar los términos FIS-DBR o FIS-CBR para referirse al sistema de inferenciadifusa. Las definiciones anteriormente expuestas y la relación jerárquica o de subordinaciónexistente entre ellas se pueden apreciar en la Figura 1.

Figura 1. Relación entreFIS-BRB, CBR y DBR.

FIS - BBRSistema de

inferencia difusa

CBRMetodologíade diseño

DBRDefusificación

Las características que se esperan logran con este nuevoenfoque son:

• Facilitar la implementación computacional del sistemade inferencia difusa.

• Debido a la anterior característica se espera tener unmejor desempeño en cuanto al tiempo de procesa-miento del sistema de inferencia difusa.

• Proporcionar una metodología de diseño para siste-mas de lógica difusa.

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Page 55: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS54

Sistema de inferencia difusa basado en relaciones Booleanas

2. ReferentesUna de las características importantes

a considerar en esta propuesta es la rela-ción (isomorfismo [7]) observada entre:teoría de conjuntos, lógica y sistemas ma-temáticos (retículos y álgebra booleanas[8]); algunas de las equivalencias más im-portantes de estos isomorfismos sepueden observar en la Tabla I.

Otro aspecto de importancia a considerar en la propuesta desarrollada consiste en lasoperaciones entre conjuntos difusos.

2.1. Intersección de conjuntos difusosEn el contexto de lógica difusa se denomina T-norma a la operación de intersección.

Una forma general para representar esta operación es:

Conjuntos Lógica Elgebra booleana

Pertenencia Veracidad Valor

Pertenece (∈) Verdad ( V ) 1

No pertenece (∉) Falso ( F ) 0

Intersección (∩) Conjunción (∧ ) Producto ( X )

Unión (∪) Disyunción (∨) Suma (+)

Complemento ( — ) Negación (¬) Complemento (′)

Tabla I. Equivalencia entre conjuntos,

lógica y álgebra booleana.

• Conmutativa:μA ⊗ μB = μB ⊗ μA , .

• Asociativa:μA ⊗ (μB ⊗ μC ) = (μA ⊗ μB ) ⊗ μC μA, μB ,μC ∈ [0 ,1]

• Condiciones de frontera:μA ⊗ 0 = 0, μA ∈ [0 ,1].

μA ⊗ 1 =μA , μA ∈ [0 ,1].

Existen varios métodos para el cálculo de esta operación, siendo el más empleado lafunción mínimo.

2.1.1. Mínimo y T-norma de Lukasiewicz

Sean Αi y Βi conjuntos difusos, con funciones de pertenencia μA (ui) y μB (ui), definidasen el universo Ui , se tiene un conjunto intersección Αi ∩ Βi , cuya función de pertenenciase define como el mínimo en el caso de la ecuación (2-1) o la T-norma de Lukasiewicz

Una T-norma es una función de la forma T : [0,1] → [0,1], que cumple con las siguientespropiedades:

T[ μA (ui),μB (ui)] = μA∩B (ui) = μA (ui) ⊗ μB (ui)

A μA , μB ∈ [0 ,1]

• Si μA ≤ μB y μC ≤ μD entoncesμA ⊗ μC ≤ μB ⊗ μD

A(1)

Page 56: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 55

2.2. Unión de conjuntos difusosLa operación de unión en lógica difusa es conocida como S-norma. Una forma gene-

ral para la representar la operación difusa de unión es:

Una S-norma es una función de la forma: S : [ 0,1] x [ 0,1] → [ 0,1] que cumple con lassiguientes propiedades:

2.3. Complemento difusoEn lógica difusa existen diferentes formas para calcular el complemento de un conjun-

to difuso Ai, con base en su función de pertenencia μA (ui). Una forma general pararepresentar el complemento de un conjunto difuso es:

La forma más empleada del complemento difuso, consiste en definir el conjunto difu-so complemento con la función de pertenencia (6).

(5)

(6)

μA∩B (ui) = min {μA (ui), μB (ui)}μA∩B (ui) = max {0, μA (ui) + μB (ui) - 1}

S[ μA (ui),μB (ui)] = μA∪B (ui) = μA (ui) ⊕ μB (ui)

Al igual que el caso anterior la S-norma presenta varios métodos de cálculo, siendo elmás empleado el máximo.

2.2.1. Máximo y s-norma de Lukasiewicz

Sean Ai y Bi conjuntos difusos, con funciones de pertenencia μA (ui) y μB (ui), definidasen el universo Ui , se tiene un conjunto unión Αi ∪ Βi , cuya función de pertenencia sedefine como el máximo en el caso de la ecuación (4-1) o la S-norma de Lukasiewicz enla ecuación (4-2):

• Conmutativa:μA ⊕ μB = μB ⊕ μA ,

• Condiciones de frontera:μA ⊕ 0 = 0, μA ∈ [0 ,1].μA ⊕ 1 =1, μA ∈ [0 ,1].

AμA , μB ∈ [0 ,1]

• Si μA ≤ μB y μC ≤ μD entonces μA ⊕ μC ≤ μB ⊕ μD

• Asociativa:μA ⊕ (μB ⊕ μC ) = (μA ⊕ μB ) ⊕ μC μA, μB ,μC ∈ [0 ,1] A

μA∪B (ui) = max {μA (ui), μB (ui)}μA∪B (ui) = min {1, μA (ui) + μB (ui) }

C {μA ( ui)}=μ − ( ui)A

C {μA ( ui)}= 1−μA ( ui)

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

(2-1)(2-2)

(3)

(4-1)(4-2)

Page 57: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS56

Sistema de inferencia difusa basado en relaciones Booleanas

Figura 2. Sistema de inferencia FIS-BBR.

Base de reglasdifusas:

Si Entonces

Motor de inferenciadifusa:

1. Operador difuso2. Implicación3. Agregación

Fusificación Defusificación

Concresor y en vx en u

Salida (Crisp)

Entrada (Crisp)

3. Concepción de los sistema de inferenciadifusa basados en relaciones booleanas

Los sistemas de inferencia difusa basados en relaciones booleanas son concebidoscomo una alternativa para mejorar el desempeño de los sistemas de control basados enautomatismos, por lo tanto, esta propuesta se basa en los principios del diseño deautomatismos y circuitos digitales.

Desde el punto de vista de automatismos se tiene una acción sobre uno o variosactuadores, esta acción suele ser todo o nada generando transiciones bruscas en el proce-so. La propuesta aquí presentada pretende lograr que estas transiciones no sean bruscasal convertir conjuntos booleanos en difusos y al mismo tiempo poder aprovechar lametodología de diseño de automatismos desde el dominio booleano. En [3] se presentaun concepto similar, pero solo se considera como un proceso de optimización y nocomo una posible forma para implementar sistemas de lógica difusa.

El concepto de los sistemas de inferencia basados en relaciones booleanas se encuen-tran fundamentados en las siguientes premisas:

• Segmentación de los universos con conjuntos booleanos.• Transiciones monótonas entre regiones booleanas.

Al momento de realizar un diseño para un sistema de control teniendo en cuenta lasanteriores características, surgen los siguientes aspectos a considerar:

• Mecanismo de inferencia para determinar la salida.• Metodología para convertir conjuntos booleanos en difusos.• Restricciones y/o consideraciones presentes al momento de implementar la metodo-

logía de diseño basada en conjuntos booleanos.

Aunque las anteriores consideraciones están siendo abordadas en la actualidad, los resul-tados se esperan reportar en futuras publicaciones. Este trabajo se limita a presentar elesquema de los sistemas de inferencia basados en relaciones booleanas. Los bloques estruc-turales de un sistema de inferencia difusa basado en relaciones booleanas, son en esencia, lafusificación y la concre-ción de la informacióndifusa, ya que el proce-so de defusificación esuna tarea intrínseca a lamanera como se reali-za la concreción. Unesquema de dicho pro-ceso se observa en laFigura 2.

Page 58: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 57

4. Diseño de automatismos basado en álgebra booleanaEl álgebra de Boole ha sido una poderosa herramienta para el diseño de automatismos

[9, 10]. La lógica booleana es básicamente bi-valuada donde las proposiciones verdade-ras son valoradas con uno mientras que las falsas con cero; en general una relaciónbooleana es una función que asigna un valor de verdad a una proposición. Las proposi-ciones son definidas como variables y las combinaciones de ellas determinan si la salidase cumple o no, dichas combinaciones se presentan por lo general en una tabla.

Considerando el operador lógico de conjunción ∧ y el operador lógico de disyunción∨, [10], entonces desde el punto de vista de lógica, el controlador basado en lógicabooleana se puede describir como un sistema de inferencia con reglas de la forma:

Si (Â1 ∧ Â2 ∧ ...∧ Âp) Entonces f

Para p variables, cuando la k-ésima salida es verdadera, se aplica la definición de minterm[8-10]:

fk = Â1k ∧ Â2

k ∧ ... Âj

k )... ∧ Âp

k

donde

Para q salidas parciales, la salida global Y puede expresarse de manera compacta como:

Para efectos de síntesis (mínimo número de términos) de un sistema booleano sepueden aplicar las siguientes simplificaciones [1]:

1. (a ∧ b) ∨ (a ∧ c) ≡ a ∨ (b ∧ c). 2. (a ∨ b) ∧ (a ∨ c) ≡ a ∧ (b ∨ c). 3. a ∨ (a ∧ b) ≡ a ∨ b. 4. a ∧ (b ∨ b) ≡ a.

En un sistema de w salidas la m-ésima salida es:

4.1. Síntesis mediante mapas de KarnaughUna metodología utilizada para hacer síntesis de automatismos, es el mapa de Karnaugh

[1, 9], (Veitch para otros autores), que se basa en una unidad fundamental de 2 elemen-tos, que representan los valores que puede tomar una variable binaria, para lograr de undeterminado efecto. A medida que el número de variables (p) aumenta, también seincrementa el número de elementos (cuadros) 2p; otra forma de visualizarlo es la asigna-

Y=q p

∨ ∧ Âjk

k⏐fk=1 j=1

Ym=q p

∨ ∧ Âjk

k⏐fk,m=1 j=1

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

(7)

(8)

(9)

Â= A si A = 1,A si A = 0.

(10)

Page 59: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS58

Sistema de inferencia difusa basado en relaciones Booleanas

ción de cada combinación de la tabla de verdad a una posición en los cuadros del mapade Karnaugh.

El siguiente paso es la agrupación de los cuadros adyacentes que contengan el valor de1 en grupos de 2n para n=1,2,4... cuadros adyacentes, donde n es el número de varia-bles. Para el caso de dos variables las posibilidades de agrupar serán de uno, dos o cuatrocuadros.

Cuando un sistema no tiene todas las posibles combinaciones 2p, las combinacionesque no se dan se denominan condiciones “no importa’’. En este caso el mapa de Karnaughtiene una aplicación muy importante, ya que tales condiciones se pueden asumir según laconveniencia para efectos de simplificar la expresión.

4.2. Acción de salida del automatismoPara determinar la acción de control total del automatismo se pueden considerar las

acciones parciales como el producto de la respectiva salida lógica Ym y la correspondien-te acción de control vm, de tal forma que la salida total es la suma de los anterioresproductos.

En general un proceso interpretado por reglas del tipo Si-Entonces, puede ser represen-tado de diferentes maneras por variables de tipo booleano.

4.2.1. Sistemas de inferencia difusa basados en relaciones booleanas

Debido a los procesos involucrados en este esquema, las operaciones lógicas emplea-das son:

• T-norma: Mínimo.• S-norma: Máximo.

Los anteriores operadores se escogen por su facilidad de implementación [11] y porciertos requerimientos al momento de realizar la simplificación de términos [3]. A pesar delo anterior, se puede extender el siguiente planteamiento para otros operadores difusossegún las prestaciones que se espera tener del sistema.

Para un sistema de w funciones de activación, p conjuntos, q posibles implicaciones,siendo Ym la m -ésima salida de activación y μ Âj

k la j-ésima función de pertenencia de la

k-ésima implicación, el proceso de inferencia de Ym, considerando conjuntos difusos, sepuede expresar como [13]:

(12)

Y= Σm=1

Ymvm

w

(11)

Ym=q p

Âjk

k⏐fk,m=1 j=1

Page 60: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 59

En el caso de considerar funciones de pertenencia se tiene la siguiente expresión:

(13)

la salida concreta del sistema se puede calcular como:

(14)

donde vm corresponde al m-ésimo actuador virtual, entonces la m-ésima salida virtual es:

(15)

La ecuación (12) puede ser asociada con la Tabla II. La T-norma se aplica sobre lasfilas correspondientes a la parte de entradas en la Tabla II, las cuales representan las reglasque aportan a una salida de activación. La S-norma es aplicada sobre las columnas de laparte de salidas de activación de la misma tabla. La S-norma se puede considerar comoun operador de agregación, de las reglas que aportan para cada una de las salidas deactivación.

En el esquema se distinguen dos partes, una correspondiente a la codificación booleanade las funciones de pertenencia de cada universo de discurso de entrada y otra, corres-pondiente a las salidas de activación asociadas a las salidas virtuales del sistema. En laparte de las entradas cada fila representa una regla de inferencia, en la sección de lassalidas cada columna representa una salida de activación.

Para el cálculo de la salida (sin simplificar), como primer paso se aplica por separadola T-norma (mínimo) entre los conjuntos a lo largo de las filas, cuya salida de activaciónen la tabla de verdad es activa (reglas de inferencia). El siguiente paso consiste en aplicarla S-norma (máximo) entre todos los resultados obtenidos del paso anterior para cadacolumna, las cuales corresponden a las salidas de activación (proceso de agregación). LaTabla II muestra un esquema general de la respectiva colección de reglas en la tabla deverdad.

Finalmente, dadas las funciones difusas que determinan las salidas de activación difu-sas, se procede a realizar la ponderación de cada una de ellas por el respectivo valor delactuador virtual, este producto se llama salida virtual. Sumando los anteriores productosse obtiene una sola salida concreta de acción.

4.3. Salida virtualEn el diseño de automatismos, la salida se puede considerar como el consecuente de

una función booleana de las entradas que corresponden a los antecedentes. El sistema deinferencia difusa basado en relaciones booleanas toma este esquema, el cual es el mismoen lógica difusa, sin embargo la salida desde el punto de vista de automatismos se con-sidera como la acción total que se tiene por parte de los actuadores que están afectandoel sistema. En el caso donde solo se dispone de un elemento de acción, este se puedeconsiderar como la suma de varios actuadores los cuales se denominan virtuales y que asu vez tienen asociada una salida virtual.

Ym=q p

⊕ ⊗ μ Âjk

k⏐fk,m=1 j=1

y= Σm=1

Ymvm

w

yvm= Ymvm

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Page 61: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS60

Sistema de inferencia difusa basado en relaciones Booleanas

5. Metodología de diseño para sistemas deinferencia basados en relaciones booleanas

Inicialmente la presente propuesta se trabajó como un proceso de concresión y/odefusificación para simplificar los cálculos en sistemas de inferencia difusa, sin embargoesta también se puede considerar como una metodología de diseño de sistemas deinferencia difusa, tratando el problema a solucionar como un sistema de control basadoen automatismos.

La figura 3 permite ilustrar el proceso de diseño para sistemas de inferencia difusabasados en relaciones booleanas. Este inicia definiendo los conjuntos booleanos del uni-verso de entrada, que en sentido práctico pueden estar asociados al funcionamiento deun elemento sensor.

El siguiente paso consiste en definir las respectivas acciones de control a realizar, estasacciones pueden estar asociadas a un elemento que puede ser real o no, la acción de

Dependiendo de los conjuntos empleados y de las acciones a realizar en las regiones deoperación, es posible tener un solapamiento de las acciones, por lo cual, la salida totalpuede ser mayor que las acciones virtuales parciales.

En esta propuesta los actuadores virtuales son constantes y en un esquema tradicionalde lógica difusa tipo Mamdani se pueden considerar como conjuntos singleton (univaluados)en el universo de discurso de salida. Dependiendo el caso, los actuadores virtuales pue-den ser positivos o negativos y sus valores también pueden ser definidos según la aplicación.

Para el sistema de inferencia, la salida corresponde a la suma de las respectivas salidasvirtuales:

donde yvm esta dado por (15). El término de salida virtual fue concebido bajo unacorrespondencia física real en aplicaciones de control, para la salida total del sistema deinferencia. A manera de ilustración, el concepto de salida virtual se puede observar laacción que tiene una válvula de para el llenado de un tanque; en este caso el flujo permi-tido por la válvula se puede considerar como el aporte que darían tres válvulas virtuales(que tienen una existencia aparente y no real) de diferente diámetro que dan lugar a losactuadores virtuales:

• La ejecución del proceso de concresión en un sistema difuso, trata de la formacomo la información difusa es procesada para proporcionar una salida de acciónsobre la planta controlada

• Flujo pequeño: v1 = 0.5”

• Flujo mediano: v2 = 1.0”

• Flujo grande: v3 = 1.5”

y = yv1 + yv2 +... + yvm + yvw = Σm=1

w

yvm

Page 62: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 61

Figura 3. Esquema del proceso de diseño CBR.

control considerada en este punto es elmáximo valor posible que suministra elrespectivo actuador.

La asignación de acciones de salida (sa-lidas de activación), se realizaconsiderando la información que sumi-nistra el experto de la planta a controlar.Cada regla de inferencia es almacenadaen la tabla de verdad como una fila. Porotro lado, la salida de activación se en-cuentra consignada en la tabla como unacolumna. La Tabla II muestra la formageneral como son expresadas las reglas.

Una vez establecidas las reglas de infe-rencia y almacenado cada antecedente ycada consecuente en la tabla de verdad,se tiene la opción de utilizar una de lasdiferentes herramientas de la lógicabooleana (mapas de Karnaugh, álgebrade Boole o el método de Quine

Tabla II. Tabla de verdad donde se establecen las reglas de control.

Partición Booleana de universos de discurso

Identificación mediante una codificaciónBooleana regiones de los universos de discurso

Reglas de inferencia

Establecer las reglas lingüísticas de inferenciaconsiderando las particiones Booleanas

Tabla de verdad

Traducir las relaciones lingüísticas enuna tabla de verdad

Simplificación de relaciones Booleanas

Simplificación empleando mapas deKarnaugh o un algoritmo computacional

Implementación del sistema de inferencia

Se implementa el sistema empleando losrespectivos operadores difusos

Mccuskley [14]) para la simplificación de cada salida de activación.

El paso siguiente consiste en generalizar las expresiones lógicas booleanas en expresio-nes difusas (T-norma y S-norma), esto para la implementación del sistema de inferencia.Tal como fue mencionado anteriormente, en esta propuesta la operación lógica de inter-sección se implementa con la T-norma del mínimo, la operación lógica de unión seimplementa con la S-norma del máximo y se usa el complemento estándar.

El paso siguiente consiste en generalizar las expresiones lógicas booleanas en expresio-nes difusas (T-norma y S-norma), esto para la implementación del sistema de inferencia.Tal como fue mencionado anteriormente, en esta propuesta la operación lógica de inter-sección se implementa con la T-norma del mínimo, la operación lógica de unión seimplementa con la S-norma del máximo y se usa el complemento estándar.

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Page 63: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS62

Sistema de inferencia difusa basado en relaciones Booleanas

6. Principios de diseñoPara una adecuada implementación de los sistemas de lógica difusa basados en relacio-

nes booleanas se tiene dos principios:

• Partición booleana de universos de discurso.• Conmutación monótona y continua entre regiones booleanas.

El primer principio consiste en realizar una partición de los universos de discursomediante conjuntos booleanos, de tal forma que es posible definir las regiones de ope-ración que se tienen para los diferentes universos de discurso.

El segundo principio consiste en lograr transiciones continuas y monótonas entre lasregiones booleanas definidas anteriormente. Este principio es formulado para tener uncomportamiento interpolado del caso booleano empleando conjuntos difusos.

7. Comparación entre sistemas de inferencia difusaMandani, Sugeno y sistemas de inferencia difusabasados en relaciones booleanas

Con la finalidad de ilustrar el funcionamiento de los sistemas de inferencia basados enrelaciones booleanas se propone una comparación con los sistemas de inferencia Mamdaniy Sugeno.

7.1. Sistemas tipo MamdaniEn la Figura 4 se muestra la configuración básica de un sistema tipo Mamdani, [12], en

el cual se se distinguen tres elemntos principales: fusificación, motor de inferencia difusay defusificación.

Figura 4. Sistemas tipo Mamdani.

Base de reglasdifusas:

Si Entonces

Motor de inferenciadifusa:

1. Operador difuso2. Implicación3. Agregación

Fusificación Defusificación

y en vx en u

Salida (Crisp)

Entrada (Crisp)

La Figura 5 muestra un ejemplo gráfico del funcionamiento de un sistema de inferen-cia difusa tipo Mamdani, donde se observan los siguientes pasos:

• Un valor puntual ingresa al sistema difuso y luego es convertido en un nivel de perte-nencia para cada regla.

Page 64: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 63

Figura 5. Funcionamiento de unsistema difuso tipo Mamdani.

• En cada regla se aplican los respectivosoperadores difusos para los valores depertenencia asociados con las entradas.

• Con el anterior resultado y la respecti-va función de pertenencia de la salidaasociada a la regla, se aplica el opera-dor difuso correspondiente al métodode implicación.

• Luego mediante un operador difuso seagregan todas las implicaciones.

• Finalmente se obtiene el resultado apli-cando algún método de defusificación.

6.2. Sistemas tipo SugenoUna alternativa de procesamiento en los sistemas difusos fue la propuesta por Takagi

Sugeno en los sistemas difusos que llevan su nombre, [12]. La figura 6 presenta el esque-

Figura 6. Sistema difuso tipo Sugeno.

Para calcular la salida del sistema difuso se ponderan los diferentes consecuentes te-niendo en cuenta el valor con el cual se activó el antecedente de cada una de las reglas,para un sistema con dos reglas la salida del sistema difuso sería:

Base de reglasdifusas:

Si Entonces

Motor de inferenciadifusa:

1. Operador difuso2. Implicación3. Agregación

Fusificacióny en v

x en u

Salida (Crisp)

Entrada (Crisp)

ma de un sistema de inferenciadifusa tipo Sugeno. En estos sis-temas la fusificación eimplicación son similares a losempleados en los sistemas tipoMamdani, mientras que la di-ferencia se presenta en la formacomo se calcula la salida.

Cada regla tiene asociada una función que depende de las variables de entrada, para uncaso donde se tengan dos variables de entrada las funciones serían:

y1 = f1 (x1, x2)y2 = f2 (x1, x2)

La Figura 7 presenta de forma gráfica el funcionamiento de un sistema difuso Sugeno,donde se observan los siguientes pasos:

• Un valor puntual ingresa al sistema difuso y luego es convertido en un nivel depertenencia para cada regla.

y = w1y1 +w2y2

w1 +w2

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Page 65: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS64

Sistema de inferencia difusa basado en relaciones Booleanas

• En cada regla se aplican los respectivos operadores difusos obteniendo comoresultado w1 y w2.

• La salida se calcula como:

Figura 7. Funcionamiento de unsistema difuso tipo Sugeno

Los bloques estructurales de un sistemade inferencia basado en relacionesbooleanas, son en esencia, la fusificación yla concreción de la información difusa, yaque el proceso de defusificación es unatarea intrínseca a la manera como se realizala concreción. Un esquema de dicho pro-ceso se observa en la Figura 8.

En la Figura 9 se presenta un ejemplo dela implementación de un sistema de infe-rencia difusa basado en relacionesbooleanas, donde se tienen dos universosde discurso x1, x2 y dos funciones de per-tenencia por cada universo de discurso.

Figura 8. Sistema de inferencia FIS-BBR.

Base de reglasdifusas:

Si Entonces

Motor de inferenciadifusa:

1. Operador difuso2. Implicación3. Agregación

Fusificación Defusificación

y en vx en u

Salida (Crisp)

Entrada (Crisp)

Concresor

Figura 9. Ejemplo gráfico del funcionamiento FIS-BBR

y = w1y1 +w2y2

w1 + w2

Page 66: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 65

A1 (x1) A2 (x2) A3 (x3) A4 (x4) Y1 Y2

1 0 1 0 1 10 1 0 1 1 01 X 1 X X XX 1 X 1 X X

Tabla III. Tabla de verdad asociada a la figura 9.

0 0 0 0

0 1 X 0

0 X X X

0 0 X 1

A1

A2

A3

A4

Y1 , Y1 :

Figura 10. Mapa de Karnaughpara la tabla de verdad III

La salidas de activación tienen asociados los respectivos actuadores virtuales v1 y v2 , detal forma que la salida del sistema de inferencia es:

y = Y1 v1 + Y2 v2

La Figura 9 presenta de forma gráfica el funcionamiento de un sistema difuso FIS-BBR, con los siguientes pasos:

• Un valor puntual ingresa al sistema difuso y luego es convertido en un nivel de perte-nencia para cada regla.

• Para cada salida de activación se realiza primero la operación difusa de T-norma yluego la S-norma obteniendo así Y1 y Y2 .

• La salida se calcula como: y = Y1 v1 + Y2 v2 .

8. Conclusiones y expectativas futurasLos sistemas de inferencia difusa basados en relaciones booleanas se fundamentan en la

relación existente entre los sistemas que emplean algebra booleana y lógica difusa. Lo anteriorpermite emplear herramientas de diseño de algebra booleana para sistemas de lógica difusa.

En la metodología CBR se pueden utilizar menos conjuntos para tener el mismo nú-mero de particiones de los universos de discurso. Lo anterior, sumado a la posibilidadde realizar una simplificación de reglas, permite tener una menor cantidad de operacio-nes disminuyendo tiempos, costos computacionales o de hardware, todo esto sin llegara perder interpretabilidad.

La Tabla III contiene las rela-ciones asociadas al proceso deinferencia, en esta tabla se repre-senta con una X los casos dondelas variables se pueden conside-rar como verdaderas o falsassegún la conveniencia para lograruna expresión más simplificada.

Con el objetivo de lograr unaexpresión simpli-ficada se pue-de emplear el mapa de Karnaughde la Figura 10.

Al realizar la simplificación pro-puesta en la figura 10, lasrelaciones para las salidas de ac-tivación activación Y1 y Y2 son:

Y1 = [μA1 (x1) ⊗ μA3(x2)] ⊕ [μA2 (x1) ⊗ μA4

(x2)]

Y2 = μA1 (x1) ⊗ μA3(x2)

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Page 67: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS66

Sistema de inferencia difusa basado en relaciones Booleanas

Una posible desventaja de esta metodología radica en el proceso gráfico asociado a lasimplificación de reglas lo cual por lo general se realiza fuera de línea, adicionalmentecuando se tenga un número elevado de conjuntos el método gráfico resulta ser inviable.Para solucionar la anterior situación se pueden emplear métodos computacionales desimplificación que permitan manejar un número elevado de variables y que puedantrabajar en línea para aplicaciones de tiempo real.

En este trabajo se expone el fundamento y concepción de los sistemas de inferenciadifusa basa-dos en relaciones booleanas y fueron presentados ejemplos con los cuales seespera mostrar el concepto que involucran los sistemas de inferencia basados en relacio-nes booleanas. En trabajos futuros se espera presentar los resultados para realizar lasimplificación de reglas de inferencia y la formulación para construir conjuntos difusospartiendo de conjuntos booleanos.

9. Referencias[1] Dougherty, E. y Giardina, C. (1988). Mathematical methods for artificial intelligence and autonomous systems, Prentice-Hall. 7-133.

[2] Ogata, K. (1987). Dinámica de Sistemas, Prentice-Hall Hisp. 285-299.

[3] Rovatti, R., Guerrieri, R. yBaccarani, G. (1995). An Enhanced Two-Level Boolean Synthesis Methodology for Fuzzy Rules Minimization.IEEE Transactions On Fuzzy Systems, Vol. 3, No. 3. 288-299.

[4] Ballén, A. y Rodriguez, C. (2003). Diseño e implementación de un controlador difuso autosintonizado sobre microcontroladores, aplicado alcontrol del péndulo invertido, Tesis de pregrado, Ingeniería Electrónica, Universidad Distrital Francisco José De Caldas.

[5] Soriano, J., Gálvez, C. y Vargas, D. (2005). Identificación de personas por medio de biometría en la planta de la mano usando técnicasdigitales de procesamiento de imágenes y concresor difuso basado en relaciones booleanas, Tesis de pregrado, Ingeniería Electrónica,Universidad Distrital Francisco José de Caldas.

[6] Soriano, J., González, O., Munar, F. y Ramos, A. (2001). Propuesta de concresor basado en relaciones booleanas, Revista Ingeniería,Universidad Distrital Francisco José de Caldas, Vol. 6, No. 1. 42-50.

[7] Peña, C. (2004). Coevolutionary Fuzzy Modeling, Springer Verlag. 1-18.

[8] Dubisch, R. (1964). Lattices to Logic, Blaisdell Publishing Company. 1-62.

[9] Soriano, J. (2001). Un enfoque moderno para el diseño de automatismos, Sorytel.

[10] Irazo, P. (2005). Lógica Simbólica para informaticos, Alfaomega Ra-Ma. 15-45.

[11] Wang, L. (1996). A course on Fuzzy Systems and Control, New Jersey, Prentice Hall. 19-86.

[12] Klir, G. y Yuan, B. (1995). Fuzzy Sets and Fuzzy Logic, Prentice Hall, Upper Saddle River, New Jersey. 1-175.

[13] Espitia, H. (2009). Aplicación del concresor basado en relaciones booleanas para sistemas de lógica difusa tipo dos, Tesis de MaestriaUniversidad Distrital Francisco José de Caldas.

[14] Gajski, D. (1997). Principios de Diseño Digital, Pearson Prentice Hall. 100-200.

Helbert EspitiaHelbert EspitiaHelbert EspitiaHelbert EspitiaHelbert EspitiaIngeniero Electrónico, Universidad Distrital FJC. Ingeniero Mecatrónico, Universidad Nacional de Colombia. Especialista en Tele-comunicaciones Móviles, Universidad Distrital FJC. Magister en Ingeniería Industrial, Universidad Distrital FJC. Magister en Inge-niería Mecánica, Universidad Nacional de Colombia. Docente de Planta, Universidad Distrital Francisco José de Caldas.

Jairo SorianoJairo SorianoJairo SorianoJairo SorianoJairo SorianoIngeniero Químico, Universidad Nacional de Colombia. Ingeniero Electrónico, Universidad Distrital FJC. Magíster en IngenieríaIndustrial, Universidad Distrital FJC. Docente de Planta, Universidad Distrital. Director Grupo LAMIC (Laboratorio de Automática,Microelectrónica e Inteligencia Computacional), Universidad Distrital Francisco José de Caldas, Colombia.

Page 68: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 67

Desarrollo de un lenguaje de dominioespecífico para sistemas de gestión deaprendizaje y su herramienta deimplementación “KiwiDSM” medianteingeniería dirigida por modelos

Developing a domain-specific language forlearning management systems, and acorresponding implementation tool (“KiwiDSM”)through model-driven engineering

ResumenEl artículo presenta la creación de KiwiDSM: herramienta de len-

guaje de dominio específico (DSL), que apoyada en ingeniería dirigidapor modelos (MDE), permite modelar módulos que conforman unsistema de gestión del aprendizaje (LMS) en el área de comunicacio-nes; esta herramienta es independiente de la plataforma. La validaciónde la propuesta se realizó desplegando un modelo hecho con KiwiDSMsobre una plataforma LMS particular llamada Atutor. Las pruebas rea-lizadas evidenciaron que al trabajar con MDE se reduce el tiempo yesfuerzo en la creación y despliegue de los módulos modelados sobreAtutor y que el metamodelo planteado es compatible con los requeri-mientos de dicho LMS.

Palabras clave: Lenguaje de Dominio Especifico (DSL), IngenieríaDirigida por Modelos (MDE), Arquitectura Dirigida por Modelos(MDA), Transformación de Modelos, Sistema de gestión del Aprendi-zaje (LMS), XML Metadata Interchange (XMI), Modelo y Metamodelo.

AbstractThis article presents the creation of a domain-specific-language

(DSL) tool called WikiDSM, which is supported by model-drivenengineering (MDE) and allows modeling the different modules thatconform learning management systems (LMS), particularly in thefield of communications. Such a tool is platform-independent. Thevalidation of the proposal was performed by deploying a model builtwith WikiDSM on Atutor platform. The tests showed that using MDEreduces the time and effort when creating and deploying the Atutor-modeled modules. Moreover, it is shown that the meta-modelproposed is compatible with Atutor requirements.

Key words: Domain Specific Language (DSL), Model DrivenEngineering (MDE), Model Driven Architecture (MDA),Transformations of Models, Learning Management System (LMS),XML Metadata Interchange (XMI), Model, Metamodel.

Carlos EnriqueCarlos EnriqueCarlos EnriqueCarlos EnriqueCarlos EnriqueMontenegro MarínMontenegro MarínMontenegro MarínMontenegro MarínMontenegro Marín

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

Juan ManuelJuan ManuelJuan ManuelJuan ManuelJuan ManuelCueva LovelleCueva LovelleCueva LovelleCueva LovelleCueva LovelleUniversidad de Oviedo

Departamento de Informá[email protected]

Óscar SanjuánÓscar SanjuánÓscar SanjuánÓscar SanjuánÓscar SanjuánMart inezMart inezMart inezMart inezMart inez

Universidad de OviedoDepartamento de Informática

[email protected]

Paulo AlonsoPaulo AlonsoPaulo AlonsoPaulo AlonsoPaulo AlonsoGaona GarcíaGaona GarcíaGaona GarcíaGaona GarcíaGaona García

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

Citación: Montenegro, C. E., Cueva, J.M., Sanjuán O., y Gaona P.A. (2010). Desarrollo de un lenguajede dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación“KiwiDSM” mediante ingeniería dirigida por modelos. En: Ingeniería, Vol. 15, No. 2, pág. 67-81.

Page 69: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS68

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

1. IntroducciónDentro de la gran gama de dificultades que existen en el área de los sistemas de gestión

del aprendizaje (LMS), destaca el problemas de la interoperabilidad entre ellos como loaseguran Grob y Moreno [1, 2], éste articulo presenta una solución al problema desde elenfoque de la ingeniería dirigida por modelos (MDE) y también demostrará medianteun caso práctico la hipótesis que al trabajar con MDA (Model Driven Architecture) eltiempo y esfuerzo en la generación de soluciones se reducen.

El enfoque a utilizar parte de desde la perspectiva de uso de materiales u objetos deaprendizaje para migración de contenidos bajo especificaciones y/o estándares y losproblemas que aparecen de forma repetitiva durante el desarrollo de software; ademásen muchas ocasiones estos problemas pertenecen a un dominio concreto, para dar solu-ción a estos problemas se puede utilizar un GPL (General Purpose Language) como esJava y C# o se puede recurrir a la utilización de un DSL (Domain Specific Language),que no es más que un lenguaje definido específicamente para resolver los problemas deun dominio concreto.

A partir del contexto de DSL se puede hablar de DSM (Modelado de DominioEspecifico) que tiene su origen en la existencia de muchos desarrollos de software simi-lares para un mismo dominio, una parte común y una parte variable. La parte comúnpodría desarrollarse utilizando las técnicas de desarrollo tradicionales y la parte variablepodría desarrollarse utilizando un DSL y es bajo este contexto que se pretende darsolución al problema plateado.

El artículo se organiza de la siguiente forma: primero una pequeña descripción de lametodología utilizada y del problema, luego un estado del arte acerca de ingenieríadirigidas por modelos y lenguajes de dominio especifico para ubicar al lector en elcontexto del trabajo, después se explicará mediante un caso práctico y enfocado al pro-blema anteriormente descrito, como aplicar la ingeniería dirigida por modelos al contextode los LMS, en éste sentido se utilizará metodológicamente para su desarrollo las etapasque define el proceso de despliegue de una solución bajo MDE (ver Figura 1), por ellose hablará acerca de la construcción de la herramienta KiwiDSM, la siguiente seccióntratará la temática de el metamodelado con KiwiDSM, posteriormente se explicará elproceso de generación de código, después se hablará de las pruebas de despliegue reali-zadas, por último las conclusiones y referencias del trabajo.

2. MetodologíaMetodológicamente hablando se han contemplado las siguientes etapas:

1. Recopilación de información: Generar una base documental que soporte la elabora-ción de la investigación en las áreas de: estándares de representación de contenidospara plataformas virtuales de aprendizaje (LMS), estructura de plataformas LMS,modelamiento de plataformas LMS, ontología y construcción de un metamodeloLMS, construcción de DSLs basados en metamodelos.

2. Desarrollo y elaboración de la propuesta: Una vez realizada toda la base documentalse procederá al desarrollo y elaboración de la propuesta en el siguiente orden: mode-lado y construcción de una ontología para LMS, generación de un metamodelo y un

Page 70: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 69

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

DSL, asistido por ontologías, aplicación de MDA y transformaciones de modelos.3. Despliegue de la propuesta: Construir varios módulos LMS empleando el DSL creado

y aplicar transformaciones de modelos hasta obtener su despliegue en una plataformaLMS.

4. Pruebas del contenido: Probar el funcionamiento del contenido desplegado en laplataforma LMS previamente seleccionada.

Se aclara que los resultados a esbozar en el presente artículo son los relacionados con elárea de ingeniería dirigida por modelos en el contexto de los LMS.

3. Interoperabilidad entre plataformas LMSAutores como Grob y Moreno [1, 2] han identificado un problema de interoperabilidad

entre plataformas LMS, si este problema no existiera se podría migrar un curso que estádesplegado sobre la plataforma LMS-A a la plataforma LMS-B manteniendo todos suscontenidos y funcionalidades, pero esto no es posible ya que cada LMS está construidobajo un estándar diferente o si están bajo el mismo estándar cada una hace su propiainterpretación. En este artículo se plantea la solución a este problema desde la perspecti-va de los modelos, para ello se aumentará el nivel de abstracción para obtener un frameworkindependiente de la plataforma, con el cual se pueda modelar un LMS para su posteriordespliegue en una u otra plataforma especifica.

Existen propuestas orientadas a trabajar éste problema con MDA como las de Grob,Moreno y Bizoòová [1-5] pero que no incluyen los módulos que componen a un LMSni la utilización de un DSL, también existen otros planteamientos de solución como el deMuñoz [6] que se orientan a la utilización de servicios pero agrega el problema de lamantenibilidad de mas plataformas; en el presente estudio se propone una herramientade lenguaje de dominio especifico, que empleando MDA desplegará módulos en unaplataforma LMS especifica como es Atutor [24].

4. Ingeniería dirigida por modelos (MDE)La ingeniería dirigida por modelos surge como la respuesta de la ingeniería de software

a la industrialización del desarrollo de software, MDA es la propuesta de la OMG (ObjectManagement Group), que centra sus esfuerzos en reconocer, que la interoperabilidad esfundamental y el desarrollo de modelos permite el desarrollo de otros modelos queluego al ser juntados proveerían la solución a todo un sistema e independiza el desarrollode las tecnologías empleadas [7]. MDA plantea que el artefacto que reúne los requisitosdel sistema se llama el CIM (Modelo Independiente de la Computación), el resultado demodelar éste sistema es un PIM (Modelo Independiente de la Plataforma) que se hace através de de un DSL construido previamente. Éste DSL genera a través de un procesode transformación un PSM (Modelo Especifico de la Plataforma), que por ultimo através de otra transformación se convierte en código desplegable ó ISM (Modelo Espe-cífico de Implementación), éste proceso se visualiza en la Figura 1.

4.1. Metamodelos

Page 71: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS70

Los metamodelos según Atkinson [8] sonuno de los pilares de la ingeniería dirigidapor modelos. Sin embargo, cuando se tra-baja con modelos se suelen encontrardificultades en la definición de losmetamodelos por la gran variedad de re-presentaciones posibles para los mismosy la ausencia de manuales que guíen su de-finición.

4.1.1. Metamodelos y la arquitectura demetadatos

Un modelo es una abstracción de la rea-lidad, que la presenta de una manerasimplificada. Un metamodelo es un mo-delo que describe un Lenguaje deModelado (LM), con el que se describenotros modelos.

La noción de metamodelo se basa en laFigura 1. Proceso de despliegue de

una solución completa con MDE

Modelo Independientede la Computación

(CIM)

Se hace con

Requerimientosdel sistema

Modelo Independientede la Plataforma

(PIM) Lenguaje deDominio

Específico(DSL)

Modelodel sistema

Proceso detransformación

Modelo Específicode la Plataforma

(PSM)

Proceso detransformación

Modelo Específicode Implementación

(ISM)

“interfase”Interfaces IDLModelos

UML

“interfase”Interfaces IDLModelos

UML

“interfase”Interfaces IDLModelos

UML

ModeloMOF

MetamodeloUML

MetamodeloIDL

“interfase”Interfaces IDLModelos

UML

Capa M3Meta-metamodelo

Capa M2metamodelos

Capa M1Modelos

Capa M0

Figura 2. Arquitectura de Metadatos en MOF

arquitectura de metadatos que se muestra en la Figura 2, adoptada por el consorcio OMGen la especificación del Meta-Object Facility (MOF) [9]. Ésta figura muestra la diferenciaentre información, modelos, metamodelos y meta-metamodelos. MOF nombra cada unade estas capas o niveles con los nombres M0, M1, M2 y M3 respectivamente. Es impor-tante fijarse en que estos conceptos están en capas diferentes y poseen significadosdiferentes aunque usen la misma notación.

El nivel más alto es el nivelde los meta-metamodelos,M3. Algunos ejemplos de len-guajes en éste nivel son MOF[9] usado por OMG, ECore[10] usado por EMF (EclipseModeling Framework), yGOPRR (Grafo, Objeto, Pro-piedad, Relación, y Rol) [11].Las instancias de los lenguajesde M3 son los metamodelos,que definen LMs y correspon-den al nivel M2. Un ejemplobien conocido demetamodelos es la definiciónde UML (Unified Modeling

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

Page 72: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 71

Language) [12]. Luego están los mo-delos que representan, por ejemplo,diseños de aplicaciones, estos son ins-tancias de los metamodelos yconstituyen el nivel M1, cualquier di-seño concreto de una aplicación enUML podría servir como ejemplo. Porúltimo se encuentra el nivel M0, quesería la implementación de los dise-ños, por decirlo en términos deprogramación orientada a objetos, enel nivel M0 se considerarían los ob-jetos de las clases en ejecución y enel nivel M1 estarían las definicionesde las clases de objetos. Para éste tra-bajo todo lo que haga referencia amodelos se serializará en ficherosXMI (XML Metadata Interchange).

Figura 3. Transformaciones entre modelos

4.1.2. XML Metadata Interchange (XMI)

El estándar de la OMG XMI [9] es una especificación basada en XML para compartirmetadatos MDA. Actualmente XMI es la base para conseguir interoperabilidad entreherramientas de apoyo a MDA, una de las grandes ventajas de XMI es que sobre él sepude almacenar todos los modelos basados en MOF utilizando un mismo esquema. Sinembargo, tiene inconvenientes, como su complejo formato para ser comprendido porhumanos o que muchas herramientas que trabajan con XMI no se ajustan a las especifi-caciones de la recomendación.

4.2. Transformaciones entre modelos (M2M)Una transformación de modelos significa convertir un modelo de entrada (o un con-

junto de modelos) descritos por un determinado metamodelo, en otro modelo descritopor un segundo metamodelo, como se muestra en la Figura 3.

5. Lenguajes de dominio específico (DSL)Los DSL intercambian generalidad por expresividad en un dominio limitado. Ofrecen

notaciones y construcciones orientadas a un dominio particular, presentando gananciassustanciales en términos de expresividad y facilidad de uso en comparación con los GPLpara el dominio en cuestión. Estas ganancias se corresponden en mejoras de la produc-tividad y reducción de los costes de mantenimiento.

5.1. Tipos de DSLLos DSLs se pueden clasificar desde un punto de vista de la construcción del lenguaje en:

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Meta-metamodeloE C O R E - M O F

Metamodelo dellenguaje de

transformación

Instancia delmodelo de

transformación

Modelodestino

Modeloorigen

MetamodeloB

MetamodeloA

Descrito por Descrito porDescrito por

Descrito porDescrito por Descrito por

Motor detransformaciones

Ejecuta

Entrada Sal ida

usausa

M3

M2

M1

Page 73: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS72

• Internos: Utilizan un determinado lenguaje anfitrión para darle la apariencia de otrolenguaje concreto. Un ejemplo claro son lo que actualmente se conoce como FluentInterfaces [13].

• Externos: Tiene su propia sintaxis y es necesario un parser para poder procesarlos. Unejemplo claro de DSL externo es SQL (Structured Query Language).

Desde el punto de vista del formato del lenguaje:

• Textuales: La mayoría de los lenguajes informáticos son textuales y están formadospor un conjunto ordenado de sentencias. Un ejemplo muy conocido de DSL textuales SQL utilizado para realizar consultas a una base de datos. Una forma de crearDSLs textuales es mediante la creación de una determinada gramática (por ejemploutilizando EBNF - Extended Backus-Naur Form) y posteriormente crear o utilizarun parser para dicha gramática, que en etapas posteriores puede interpretar el DSL ogenerar código.

• Gráficos: En los últimos años están ganando gran aceptación los lenguajes gráficos,podrían citarse como ejemplo UML. La creación de un lenguaje grafico es similar a lade un lenguaje textual, la única diferencia es que en lugar de usar texto para representarlos conceptos, se utilizan conectores y figuras simples.

Desde el punto de vista del dominio del problema:

• Horizontales: Los DSL horizontales son aquellos en los que el cliente que utilizará ellenguaje no pertenece a ningún dominio específico. Un ejemplo son los editores visua-les de entornos de desarrollo que permiten generar interfaces de usuarioautomáticamente (por ejemplo Windows Forms de visual Studio).

• Vertical: A diferencia de los DSL horizontales, el cliente que utilizará el lenguaje perte-nece al mismo dominio que el lenguaje en sí. Por ejemplo un lenguaje de definición deencuestas, los usuarios finales serían los expertos en estadística encargados de definirdichas encuestas.

5.2. Partes de un DSLLos lenguajes de dominio específico son el elemento principal de cualquier solución de

dominio específico. El lenguaje se define como un metamodelo, una notación específicay generalmente una herramienta informática que lo soporta para facilitar la usabilidad.La idea básica es no utilizar conceptos de lenguajes de programación de propósitogeneral. En su lugar, se utilizan conceptos y reglas de dominio.

La sintaxis abstracta de un lenguaje especifica su estructura, es decir, las construcciones,propiedades y conectores que pueda tener dicho lenguaje. La sintaxis concreta es necesa-ria para especificar la notación específica con la que los usuarios del lenguaje podránutilizarlos. Idealmente cada concepto del dominio y del lenguaje se mapearán a unarepresentación en la notación especifica. Es importante reseñar que una misma sintaxisabstracta podría tener diferentes sintaxis concretas.

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

Page 74: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 73

Como ya se ha puesto en contexto lo que es la ingeniería dirigida por modelos y loslenguajes de dominio especifico, en éste trabajo se construirá un DSL grafico. En elsiguiente apartado se explicará el desarrollo de la propuesta.

6. Construcción de KiwiDSM

6.1. Meta-metamodeloEl meta-metamodelo que se empleará será Ecore, éste se encuentra en el paquete

org.eclipse.emf.ecore y es la especificación más alta que existe en la pirámide de losmodelos (M3), sobre ella se construirá el metamodelo del proyecto, la especificación deEcore se puede consultar en [14].

6.2. MetamodeloPara la utilización de Ecore en Eclipse es necesario tener instalado el plugin de EMF,

éste plugin provee básicamente dos herramientas para construir un modelo basado enEcore, una el Ecore Model que es un editor manual y funciona en un estilo de árbol denavegación para la creación del modelo basado en Ecore, la otra es el Ecore Diagramsiendo éste un editor gráfico similar a las herramientas gráficas para la creación de diagramasde clases UML. Cualquiera de las dos forma que se utilice para crear el diagrama basadoen Ecore, genera un fichero XMI[9].

Figura 4. Metamodelo para módulos de comunicaciones de un LMS.

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Forum Chat Wiki Announcement News

messageForum:EString sendTextChat:EString wikiBody:EString newsBody:EString

Note

messageNote:EString

0..* 0..* 0..*0..* 0..*

LMSModel_Has_NewsLMSModel_Has_Wiki

LMSModel_Has_Forum

LMSModel_Has_ChatLMSModel_Has_Announcement

LMSModel_Has_Note

0..*

0..1

0..*

LMSModel_Has_Communications

Communications_Has_ModulemoduleName:EString

ModuleCommunications Tools

nameCourse:EString

LMSModel

Page 75: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS74

Para la construcción del metamodelo, se ha acotado el dominio únicamente a lo con-cerniente a los módulos de comunicaciones que tiene un LMS, por ello, ésta propuestase basa en el metamodelo LMS planteado en el trabajo de Montenegro [15], éstemetamodelo está construido sobre Ecore y se puede ver en la Figura 4. El metamodeloen esencia posee seis módulos llamados EClass en Ecore, que son: Forum, Chat, Wiki,Annoncement, News y Note, todos están relacionados con la EClass Module medianteherencia, ya que todos los módulos poseen el atributo moduleName. La razón paradefinir esta herencia fue para eliminar la gran variedad de conexiones que habían en laherramientas DSL por una sola que está representada por la relación entre las EClassCommunications y Module, de ésta forma una Communications puede tener cero o mu-chos Module; ésta EClass Communications hereda de la EClass Tools y todas las EClassque se visualizarán en KiwiDSM están contenidas en la EClass LMSModel, ésta relaciónes obligatoria en todo metamodelo pues es quién representará el contenedor de EClasses,y allí será en donde se desplieguen los módulos a modelar o mejor dicho donde estaráncontenidos. Es necesario aclarar que la EClass LMSModel solo almacenará cero o unaEClass Communications, esto tiene sentido pues no puede haber más de un móduloCommunications en un LMS, ya que éste a su vez almacena las herramientas deCommunications tales como Forum, Chat, Wiki, Annoncement, News y Note. Por últi-mo cada EClass tiene sus propios atributos que la compone.

6.3. Construcción del editor para el modelo o DSLComo se está trabajando bajo eclipse, para ésta etapa se empleó EMF Tooling

(Graphical Modeling Framework Tooling) que hace parte del proyecto GMP (GraphicalModeling Project)[16]. El proceso para la construcción del DSL gráfico se visualiza en laFigura 5; para mayor información para este tipo de herramientas el lector puede referir-se a Budinsky [10] ó los tutoriales que ofrece su Web oficial [17].

Según el dashboard de la Figura 5, lo primero que se debe crear es el Domain Model,éste corresponde al metamodelo LMS descrito en la sección anterior. El siguiente pasoes crear el Domain Gen Model, que es un modelo que permite transformarautomáticamente el modelo Ecore a código fuente. El código se genera aplicando pa-trones de transformación. El resultado es un conjunto de clases Java, que serán utilizadasmás adelante en la herramienta DSL.

Figura 5. GMF Overview o dashboard. Tomado de T. E. Foundation [17]

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

Graphical Def Model<not specified>

Select / Edit / Create

Domain Gen Model<not specified>

Select / Edit / Reload

Tooling Def Model<not specified>

Select / Edit / Create

Diagram Editor Gen Model<not specified>

Select / Edit / CreateGenerate diagram editor

Mapping Model<not specified>

Select / Edit / Create

Domain Model<not specified>

Select / Edit / Create

Derive

Derive

Derive

CombineTransform

RPC

Page 76: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 75

Seguidamente, se crea el Graphical Def Model, éste es usado para definir las figuras,nodos, conexiones, etc. El resultado es un fichero con la siguiente estructura; un Canvas(lienzo) en la raíz con una galería de figuras base que contiene elementos de Rectángulos,Etiquetas y Conexiones de Polilineas. Estas son usadas por el correspondiente elementoNodo, Etiqueta del diagrama y Conexión para representar los temas del Domain Model.

El siguiente paso en el dashboard es el Tooling Def Model, éste es usado para especifi-car la paleta (Pallete) de herramientas de creación, acciones, etc, para los elementosgráficos. Allí existe un elemento en el nivel superior “Tool Registry”, en el que seencuentra la paleta. La paleta contiene un “Tools Group” con elementos de tipo “CreationTool” para los nodos tema y conexiones para elementos de subtemas.

El Mapping Model es el siguiente paso en el dashboard, el Mapping Model combina lostres modelos: el “Domain Model”, el “Graphical Def Model”, y el “Tooling Def Model”.

El último paso es la creación del Diagram Editor Gen Model. El modelo generadorestablece las propiedades para la generación de código, similar al EMF Gen Model. Apartir de éste modelo se obtiene un plugin para eclipse que contiene la herramienta DSMconstruida. La apariencia de la herramienta se muestra en la Figura 6.

Figura 6. Apariencia de KiwiDSM

7. Modelado utilizando KiwiDSMEn la sección anterior se describió como se creó la herramienta KiwiDSM para mode-

lar módulos de un LMS, ahora se mostrará cómo utilizar dicha herramienta para poderobtener un modelo de ella. El diagrama que se obtenga como resultado de emplear eleditor de KiwiDSM, tendrá asociado un fichero XMI [9] que basará su sintaxis en elmetamodelo creado.

El funcionamiento de la herramienta es muy sencillo, para crear los módulos basta conarrastrar los nodos de la “Pallete” al área de trabajo, rellenar los campos y conectarlosrespetando las siguientes reglas:

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

nameChat

messageChat

nameForum

messageForum

messageAnnouncement

nameNews

messageNews

*

[email protected]

messageNotenameWiki

messageWiki

Palette

Communications

Announcement

Chat

Forum

News

Note

Wiki

Connection

Page 77: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS76

Figura 7. Modelo generado con KiwiDSM y su correspondencia con XMI.

• Un curso solo puede tener un módulo de “Communications”, esto es validado por laherramienta.

• El módulo de “Communications” tiene cero o muchos: “Announcements”, “Chat”,“Forum”, “News”, “Note”, y “Wiki”.

• Cuando se genere el código a desplegar, aquellos nodos que estén sueltos (sin co-nexión) no serán tenidos en cuenta para la creación del curso.

Es muy importante tener en cuenta que los elementos modelados con ésta herramientase desplegarán en un solo tema del curso, con lo cual es necesario considerar los nom-bres de los campos en cada elemento (Nodo o Módulo) como genéricos, para no tenerque cambiar el modelo cada vez que se despliegue sobre el curso. En la Figura 7 sepuede visualizar un ejemplo, esta figura también muestra la relación de cada nodo y conel código XMI que genera la herramienta.

Algunas observaciones a tener en cuenta en el modelado son:• Para enviar una “Note” a todos los inscritos en un curso, el primer campo debe estar

marcado con asterisco (“*”).• Para enviar una “Note” a un solo inscrito en un curso, en el primer campo debe ir el

correo completo con el que la persona se inscribió en la plataforma virtual. Si éstecorreo no corresponde con el de la persona el mensaje no será enviado.

• Todos los campos en los nodos deben estar diligenciados, pues aquellos campos enlos cuales el usuario no ponga información serán tomados en blanco y la herramientano procesará esos nodos.

• Todos los campos aparecen con información por defecto pero ésta información soloes de carácter orientativo, no implica información en los nodos.

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

Connection

nameChat

messageChat

nameForum

messageForum

messageAnnouncement

nameNews

messageNews

*

[email protected]

messageNotenameWiki

messageWiki

platform:/resorce/DslLmdNew/default.upmodelo

LMS ModelCommunications

Forum nameForum

Chat nameChat

Wiki nameWiki

Announcement messageAnnouncement

News NameNews

Note*

Page 78: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 77

En resumen, hasta el momento se ha hablado de cómo se creó KiwiDSM (M1), basadaen un metamodelo generado (M2) y que a su vez se estructura sobre el meta-metamodelo Ecore (M3), el siguiente paso es convertir éste nuevo modelo que se obtuvo conKiwiDSM y hacerle una transformación a código (M0), ésta idea se explicará en la si-guiente sección.

8. Proceso de generación de código a partir del modelo hechocon KiwiDSM

En éste último paso, existen varias tecnologías que se integran a Eclipse, como sonAcceleo [18], Jet [19], Xpand [20] y MOFScript [21], todas emplean el mismo principio,la creación de reglas de transformación basándose en un metamodelo. Estas reglas seránaplicadas al modelo, para generar código en el lenguaje deseado, éste tipo de tecnologíasreciben el nombre M2T o Model to Text. Para éste caso se empleará MOFScript [21].

MOFScript es un lenguaje basado en reglas, presentado por la OMG, para realizartransformaciones de modelo a texto (M2T). Se puede instalar como un plugin de Eclip-se y su uso no es complicado de entender. El lector puede referirse al manual para el usode MOFScript aportado por Oldevik [22].

Para poder comprender el contenido del fichero MOFScript es necesario entendercómo se desarrolla un módulo para la plataformas LMS Atutor, cuya guía se encuentraen su web oficial [23, 24]. Los detalles de este tema están por fuera del alcance de esteartículo.

Para transformar el modelo que se obtiene con KiwiDSM es necesario considerar queeste modelo estará basado en el metamodelo LMS construido anteriormente. Lo pri-mero que se debe hacer es definir el modelo de entrada a las plantillas MOFScript, paraello se debe declarar la transformación con texttransformation darle un nombre a latrasformación y enviarle como parámetro de entrada el nombre del metamodelo conextensión Ecore, para éste caso upmodelo, también se debe dar un nombre al modeloenviado, para éste caso se llamo mlms. Lo anterior se puede visualizar el siguiente frag-mento de código Figura 8.

Figura 8. Declaración de una transformación en MOFScript.

texttransformation modellmsTransformationAtutor (inmlms:”upmodelo”) {//Cuerpo de la transformación}

La funciona principal o punto de partida para las transformaciones en MOFScript estáncontendidas en la función “main()”

Finalmente aplicando las tecnologías de transformación sobre el modelo creado seobtiene el código en el formato definido para su despliegue sobre la plataforma seleccio-nada Atutor. El proyecto completo está disponible para su descarga enhttp://www.vicegd.com/KiwiDSMCode.rar.

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Page 79: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS78

9. Pruebas de despliegueEl objetivo de esta sección es validar el metamodelo planteado así como comprobar la

validez de la siguiente hipótesis “al trabajar con MDA (Model Driven Architecture) eltiempo y esfuerzo en la generación de soluciones se reducen”. Las pruebas medirán eltiempo y esfuerzo (usabilidad) de los usuarios para crear exactamente los mismos mó-dulos en Atutor y KiwiDSM; el esfuerzo será medido, de acuerdo a la definición deYamada [25], como la “cantidad de ocasiones en las que usuario selecciona o ingresaalgún tipo de información al sistema”. Cada uno de los usuario creará 5 temas y cadauno de los temas tendrá en éste orden: 1 Chat, 1 Forum, 1 Wiki, 1 Announcement, 1News y 1 Note a todas las personas inscritas en ese curso, la información de cadamódulo será la misma en todos los casos y los valores son normalizados con respecto almayor, las pruebas se aplicaron a un total de 16 personas con conocimientos básicos enel uso de Atutor.

Las mediciones se realizaron tanto a la plataforma Atutor como a KiwiDSM y abar-caron: tiempo y esfuerzo en la creación de cada herramienta por tema, tiempo y esfuerzoen la creación de todas las herramientas que conforman un tema, tiempo y esfuerzo totalen la creación de los cinco temas acompañados de sus herramientas. En las pruebas se haconsiderado que el envío de las notas (mensajes) a los inscritos en el curso son unaherramienta del tema. Para poder comparar las mediciones se hizo necesario que todoslos módulos fueran creados en el mismo orden para los dos sistemas.

La Figura 9 muestra los tiempos promedio normalizados al mayor (el mayor tiempopara éste caso es el tiempo total de crear todos los temas con sus módulos en Atutor)por tema, allí se ve que la diferencia al final de crear el primer tema, es tan solo de 7.65%más tiempo, en crear los módulos en KiwiDSM que en Atutor, pero ésta diferenciacambia a partir del segundo tema en adelante, logrando reducir hasta en un 58.87% lostiempos; también se observa que los tiempos para la creación de módulos en Atutorcrecen más rápido que con la herramienta KiwiDSM.

Figura 9. Comparación de tiempos entre la creación demódulos usando la plataforma Atutor Vs la creación de

módulos con la herramienta KiwiDSM.

La Figura 10 muestra un compor-tamiento muy similar pero midiendoel esfuerzo promedio normalizadoal mayor (el mayor esfuerzo para éstecaso se obtiene en la creación de to-dos los módulos para el primer temacon KiwiDSM y despliegue sobreAtutor), allí la diferencia al final decrear el primer tema, es de 17.98%menos esfuerzo con Atutor que conla herramienta KiwiDSM, pero des-de el segundo tema en adelante, elesfuerzo en la creación de móduloscon la herramienta KiwiDSM, es porlo menos 71.16% menor que al ha-cerlo en Atutor.

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

Page 80: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 79

Figura 10. Comparación de usabilidad (esfuerzo) entre lacreación de módulos usando la plataforma Atutor y lacreación de módulos usando la herramienta KiwiDSM.

Figura 11. Comparación de tiempo total en la creación demódulos usando la plataforma Atutor Vs la herramienta

KiwiDSM.

Figura 12. Comparación de usabilidad (esfuerzo) total en lacreación de módulos usando la plataforma Atutor Vs la

herramienta KiwiDSM.

Las Figuras 11 y 12 muestran eltiempo promedio total y esfuerzototal normalizados al mayor valor(que para éste caso se obtienen alcrear todos los temas con sus mó-dulos en Atutor), en la creación de5 temas cada uno con sus respecti-vos módulos, y se concluye que lacreación de módulos con la herra-mienta KiwiDSM, es por lo menos58.87% más eficiente que al hacer-lo en Atutor.

Los resultados de estas pruebasevidencian que al trabajar con mo-delos se disminuye el tiempo y elesfuerzo del usuario durante la crea-ción de módulos para unaplataforma LMS, caso particular,Atutor. Igualmente de esta manerase verifica el funcionamiento delmetamodelo, ya que no se generoningún fallo en la creación de losmódulos con la herramienta DSL,que tiene como base fundamentalel metamodelo LMS planteado.

10. ConclusionesSe ha descrito una herramienta

DSL que se basa en un metamodeloLMS; la herramienta funciona parala creación de módulos indepen-dientes de la plataforma y solocubre algunos módulos de comu-nicaciones. Las pruebas a laherramienta han demostrado que lostiempos y esfuerzos necesarios enla creación de diversos módulos enuna plataforma LMS se minimizanen más del 50% y que este rendi-miento mejora a medida que seutiliza más la plataforma. El siguien-te paso es probar con mas módulosy distintas plataformas, y compro-bar si éste comportamiento semantiene.

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Page 81: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS80

El metamodelo planteado es acorde al LMS trabajado y su validez se soporta en elcorrecto despliegue del modelo creado con KiwiDSM. Dicho metamodelo podría ex-tenderse para integrar más módulos y plataformas LMS. De igual forma es posible que,a partir de la definición de este metamodelo, se plantee un proceso inverso en el cual losmódulos que ya estén creados en un LMS específico se conviertan a instancias delmetamodelo y de esta forma establecer un mecanismo de transformación a cualquierotra plataforma LMS.

En esta propuesta se han explorado los niveles M0, M1, M2 y M3 planeados en laingeniería dirigida por modelos (MDE). El metamodelo LMS construido representa elnivel M2, el meta-metamodelo Ecore es el nivel M3, el resultado de modelar los módu-los con KiwiDSM representa al nivel M1 y finalmente, las conversiones y despliegue deesos módulos construidos en Atutor representan el nivel M0. El alcance de esta propues-ta se limitó a la utilización de MDE para crear un modelo independiente de la plataformay lograr un despliegue real de este sobre una plataforma LMS.

Finalmente, respecto al diseño de la herramienta DSL, mediante la aplicación del pa-trón Fabrica Abstracta se solucionó el inconveniente de mantener muchos conectorespara un mismo módulo. Se deja abierta la posibilidad de plantear otros mecanismos quese apoyen en los patrones de diseño orientados por objetos, aplicables a este tipo desituaciones en ingeniería de metamodelos.

11. Referencias bibliográficas[1] Grob, H. L. et al. (2010). eleed - Model Driven Architecture (MDA): Integration and Model Reuse for Open Source eLearning

Platforms, FernUniversität Hagen, CampusSource Muenster, Germany.

[2] Moreno, N. y Romero, J. R. (2005). Recent Research Developments in Learning Technologies, en: The A MDA-based framework for buildinginteroperable e-learning platforms, Badajoz, Spain.

[3] Bizoòová, Z. et al. (2007). Model Driven E-Learning Platform Integration, en: 2nd European Conference on Technology Enhanced LearningEC-TEL PROLEARN 2007 Doctoral Consortium, Crete, Greece. 8-14.

[4] Bizonova, Z. y Ranc, D. (2007). Model Driven LMS Platform Integration, en: Telecommunications, 2007. AICT 2007. The Third AdvancedInternational Conference. 25-25.

[5] Bizonova, Z. y Ranc, D (2008). Interoperability and Reuse Between Systems in eLearning, en: World Conference on Educational Multimedia,Hypermedia and Telecommunications 2008, Vienna, Austria. 1700-1705.

[6] Muñoz-Merino, P. J. et al. (2009). Enabling interoperability for LMS educational services, en: Computer Standards & Interfaces, Vol. 31. 484-498.

[7] Stephen, J. M. et al. (2004). MDA Distilled: Principles of Model-Driven Architecture, Addison Wesley.

[8] Atkinson, C. y Kuhne, T. (2003). Model-driven development: a metamodeling foundation, en: Software, IEEE, Vol. 20. 36-41.

[9] OMG. (2007). MOF 2.0/XMI Mapping, Version 2.1.1, ed: Object Management Group. 120.

[10] Budinsky, F. et al. (2009). EMF: Eclipse Modeling Framework: Addison-Wesley.

[11] Tolvanen, J. P. et al. (1993). An integrated model for information systems modeling, en: System Sciences, 1993, Proceeding of the Twenty-Sixth Hawaii International Conference. Vol.3. 470-479

[12] OMG. (1999). OMG Unified Modeling Language Specification, Version 1.3, ed: Object Management Group. 808.

[13] Freeman, S. y Pryce, N. (2006). Evolving an embedded domain-specific language in Java, en: Companion to the 21st ACM SIGPLANsymposium on Object-oriented programming systems, languages, and applications, Portland, Oregon, USA.

[14] I. C. a. others. (2010). Package org.eclipse.emf.ecore. Consultado: http://download.eclipse.org/modeling/emf/emf/javadoc/2.6.0/org/eclipse/emf/ecore/package-summary.html (5 de Septiembre, 2010).

[15] Montenegro, C. et al. (2011). Generation of metamodel in ecore with start point in an ontology for learning management systems (lms), Journalof Web Engineering, (en prensa).

Desarrollo de un lenguaje de dominio específico para sistemas de gestión de aprendizaje y su herramienta de implementación “KiwiDSM”

Page 82: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 81

[16] T. E. Foundation. (2010). Graphical Modeling Project (GMP). Consultado: http://www.eclipse.org/modeling/gmp/ (2 de diciembre, 2010).

[17] T. E. Foundation. (2011). GMF Tutorial. Consultado: http://wiki.eclipse.org/GMF_Tutorial. (6 de Agosto, 2010)

[18] Obeo. (2010). Acceleo. Consultado: http://www.eclipse.org/acceleo/. (1 de Septiembre, 2010).

[19] T. E. Foundation. (2010). M2T-JET. Consultado: http://wiki.eclipse.org/M2T-JET. (5 de Septiembre, 2010)

[20] T. E. Foundation. (2010). XPand. Consultado: http://wiki.eclipse.org/Xpand. (5 de Septiembre, 2010).

[21] T. E. Foundation. (2010). MOFScript Consultado: http://www.eclipse.org/gmt/mofscript/. (2 de Septiembre, 2010)

[22] Oldevik, J.. (2010). MOFScript User Guide Version 0.8 (MOFScript v 1.3.6), 2009. Consultado: http://www.eclipse.org/gmt/mofscript/doc/. (5 de Septiembre, 2010)

[23] ATutor. (2010). Module Development Documentation. Consultado: http://atutor.ca/development/documentation/modules.html#structure. (5 deSeptiembre, 2010)

[24] ATutor. (2010). ATutor Learning Managment Tools. Consultado: http://atutor.ca/ (5 de Septiembre, 2010)

[25] Yamada, S. et al. (1993). Software-reliability growth with a Weibull test-effort: a model and application, Reliability, IEEE Transactions on, Vol.42.100-106.

Carlos Enrique Montenegro MarínCarlos Enrique Montenegro MarínCarlos Enrique Montenegro MarínCarlos Enrique Montenegro MarínCarlos Enrique Montenegro MarínIngeniero de Sistemas de la Universidad Distrital Francisco José de Caldas, de Bogotá, Colombia. Obtuvo su título de Maestría en Ciencias de lainformación y las comunicaciones en la Universidad Distrital Francisco José de Caldas de Bogotá, Colombia. Es estudiante del Doctorado en sistemasy servicios informáticos para internet en la Universidad de Oviedo, de Oviedo, España. Actualmente se desempeña como profesor de la Facultad deIngeniería en la Universidad Distrital Francisco José de Caldas, de Bogotá, Colombia, y pertenece como investigador al grupo GIIRA donde realizaestudios sobre Ingeniería Dirigida por Modelos MDE.

Juan Manuel Cueva LovelleJuan Manuel Cueva LovelleJuan Manuel Cueva LovelleJuan Manuel Cueva LovelleJuan Manuel Cueva LovelleIngeniero Superior E.T.S.I. de Minas de Oviedo de, Oviedo, España. Obtuvo su PhD. en ingeniería en la Universidad Politécnica de Madrid,España. Catedrático de Escuela Universitaria de Lenguajes y Sistemas Informáticos de la Universidad de Oviedo (España). Director de la EscuelaUniversitaria de Ingeniería Técnica en Informática de Oviedo (Universidad de Oviedo) desde Julio-1996 a Julio-2004. Socio de ATI y miembro convoto de ACM e IEEE. Sus áreas de investigación son Tecnologías Orientadas a Objetos, Procesadores de Lenguaje, Interacción Persona-Ordenador e Ingeniería Web. Ha dirigido varios proyectos de Investigación y tesis doctorales en Ingeniería Informática. Es autor de libros, artículosy comunicaciones a congresos. Coordina el laboratorio de investigación de Tecnologías Orientadas a Objetos del departamento de Informática dela Universidad de Oviedo (www.ootlab.uniovi.es).

Óscar Sanjuán MartínezÓscar Sanjuán MartínezÓscar Sanjuán MartínezÓscar Sanjuán MartínezÓscar Sanjuán MartínezIngeniero Informático de la Universidad Pontificia de Salamanca, España. Obtuvo su título de PhD. en Ingeniería Informática en la Universidad laUniversidad Pontificia de Salamanca, España. Se ha desempeñó en el sector empresarial de la informática a nivel mundial, ha sido catedrático enel área de informática en la Universidad la Universidad Pontificia de Salamanca y la Universidad de Oviedo, España, también ha sido profesorinvitado en varias universidad a nivel mundial. Actualmente se desempeña como profesor e investigador en el departamento de informática de launiversidad de Oviedo, España.

PPPPPaulo Alonso Gaona Garcíaaulo Alonso Gaona Garcíaaulo Alonso Gaona Garcíaaulo Alonso Gaona Garcíaaulo Alonso Gaona GarcíaIngeniero de Sistemas de la Universidad Distrital Francisco José de Caldas, de Bogotá, Colombia. Obtuvo su título de Maestría en Ciencias de lainformación y las comunicaciones en la Universidad Distrital Francisco José de Caldas de Bogotá, Colombia. Es estudiante del Doctorado enInformática de la Universidad Pontificia de Salamanca, España. Actualmente se desempeña como profesor de la facultad de Ingeniería en laUniversidad Distrital Francisco José de Caldas, de Bogotá, Colombia, y es director del grupo de investigación GIIRA.

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Page 83: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS82

Modelo de dimensionamiento del servicioweb hosting dirigido a proveedores de lapequeña y mediana empresa colombiana

A capacity planning model for web hostingproviders serving small- and medium-scalebusinesses in Colombia

ResumenLa administración y dimensionamiento de recursos de infraestructu-

ra de un servicio web hosting, que consiste en proveer alojamiento paraque una página web funcione correctamente [21], se realiza con unalto costo en servidores de elevado tamaño y disponibilidad, medianteel monitoreo de indicadores del nivel de ocupación de la capacidadque establecen reactivamente necesidades de modificación de la mis-ma, o de otra forma, mediante una infraestructura redundante quesignifica incrementar el número de componentes para garantizar ladisponibilidad del servicio. En un servicio dirigido a pequeñas y me-dianas empresas, se requiere cumplir ciertos niveles de disponibilidada bajo costo. El presente artículo contiene los resultados de una inves-tigación acerca del diseño, desarrollo y validación de un modelo deoptimización de capacidades para el dimensionamiento y selección dela mejor combinación de recursos de infraestructura (servidor, discoduro, memoria RAM y procesador) en el servicio web hosting dirigido aPYMES colombianas.

Palabras clave: Capacidades, dimensionamiento, investigación deoperaciones, minería de datos, optimización, PYME, web hosting.

AbstractInfrastructure resource management and capacity planning of a web

hosting service, which consists on assigning shared resources of acomputer server to run multiple websites [21], are achieved at a highcost in terms of large-scale high-availability servers. This is carried outby monitoring capacity indicators that reactively establish the capacityneeds, or else, by using redundant IT infrastructure, which impliesincreasing the number of hardware components to ensure serviceavailability. When providing services intended for small- and medium-scale businesses, it is necessary to meet certain availability requirementsat low cost. This paper presents research results on the design,development and validation of a capacity optimization model that allowssizing and selecting the best combination of server infrastructureresources (hard disk, RAM and processor) in a web hosting service,intended for small- and medium-scale businesses in Colombia.

Key words: Capacity, data mining, operations, research, SBM, sizing,web hosting.

Olga LucíaOlga LucíaOlga LucíaOlga LucíaOlga LucíaRamírez CaleroRamírez CaleroRamírez CaleroRamírez CaleroRamírez Calero

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

Jairo HumbertoJairo HumbertoJairo HumbertoJairo HumbertoJairo HumbertoTTTTTorres Acostaorres Acostaorres Acostaorres Acostaorres Acosta

Universidad DistritalFrancisco José de Caldas

Facultad de Ingenierí[email protected]

Citación: Ramírez, O.L., y Torres, J.A. (2010). Modelo de dimensionamiento del servicio web hosting dirigidoa proveedores de la pequeña y mediana empresa colombiana. En: Ingeniería, Vol. 15, No. 2, Pág. 82 - 95

Page 84: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 83

1 IntroducciónLa pequeña y mediana empresa (PYME) colombiana genera un impacto significativo

en el dinamismo de su economía [11], lo cual unido al actual auge de los mercadoselectrónicos, hacen patente la necesidad de ofrecer sus servicios a través de Internet. Noobstante, las PYMES colombianas presentan acceso limitado a las Tecnologías de Infor-mación y Comunicación (TIC), como lo indican algunos estudios [6][12], dificultandoasí su participación en el mercado virtual de forma competitiva. La publicación de talesservicios requiere del diseño y puesta en marcha de una página Web y de la adquisiciónde un servicio de web hosting, el cual ha experimentado crecimientos del 10% en el año2009 y del 9,1% en el 2010 situándose en 420 millones de euros, con una tendencia a laalza que permite estimar un incremento del mercado del 13% para el año 2011 [13].

Pese al crecimiento del servicio web hosting, se presentan en Colombia debilidades en suoferta debido principalmente a la inestabilidad de los proveedores y el sobre-dimensionamiento de la capacidad de recursos necesarios, lo que implica incurrir en altoscostos de infraestructura tecnológica, o el sub-dimensionamiento que, en un sentido másamplio, implica baja cobertura, baja disponibilidad e insatisfacción del cliente [8][17][21].

La revisión sobre el estado del arte de trabajos relacionados con modelos de capaci-dad de recursos tecnológicos [1] [3] [5] [10] [15] [16] [17] [18][22] [23] [26][27], noevidenció un tratamiento específico de modelos matemáticos para optimización de lacombinación de recursos e infraestructura tecnológica para garantizar la disponibilidaddel servicio web hosting en los niveles acordados con el cliente. Actualmente, eldimensionamiento de la infraestructura tecnológica, se realiza mediante el monitoreo yseguimiento a indicadores sobre disponibilidad del servicio, que señalan el nivel de utili-zación de la capacidad y sus necesidades de su ampliación. En nuestra opinión se requieretrascender de la administración basada en el seguimiento de indicadores reactivos, haciauna gestión con base en planeación preventiva [9].

El principal objetivo de esta investigación consiste en el diseño, desarrollo y validaciónde un modelo matemático basado en análisis de capacidades, para optimizar o por lomenos definir eficazmente y de manera anticipada el dimensionamiento y selección de lamejor combinación de recursos de infraestructura tecnológica, de manera que se puedasatisfacer la demanda de alojamiento y procesamiento de solicitudes de visitas a las pági-nas Web, en el servicio web hosting dirigido a las PYMES colombianas. Los parámetrospara el dimensionamiento se delimitaron en torno a recursos de infraestructura de servi-dor, disco duro, memoria RAM y procesador. El articulo presenta una breve descripcióndel servicio web hosting y de las herramientas utilizadas para la administración de la capa-cidad. Continúa con un resumen del análisis de capacidades. Luego expone la metodologíade desarrollo y validación del modelo matemático, los resultados y las conclusiones.

2 Marco teórico

2.1 Servicio web hostingEl servicio web hosting, debe proporcionar disponibilidad durante las 24 horas del día,

capacidad para abastecer la demanda de solicitudes de visita a las páginas Web alojadas,una conexión rápida a internet y un espacio para almacenamiento de información quesea flexible a las necesidades de crecimiento.

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

Page 85: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS84

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

En el caso de las PYMES colombianas se utiliza principalmente el servicio sharedhosting,hosting de tipo compartido, que consiste en alojar clientes de varios sitios en un mismoservidor, de forma económica y con adecuado rendimiento [3] [9].

Entre los principales recursos de infraestructura que componen el hardware de un servi-cio sharedwebhosting se encuentran el servidor, el disco duro, la memoria RAM, el procesadory la red con sus componentes como repetidores, switches, bridges, routers y fierwalls [5] [15][16] [27]. En la actualidad, éstos recursos de infraestructura, son administrados mediantelos mecanismos explicados a continuación, los cuales no se consideran dentro del desa-rrollo del modelo de dimensionamiento objeto del presente artículo, debido a que suinstalación implica elevados costos para aumentar el número de componentes o unagestión reactiva ante necesidades de ampliación o reducción de capacidad [1] [16] [17][18] [22] [27]:

• Redundancia: Aumentar o duplicar el número de componentes de hardware de la infra-estructura. Incrementa de manera significativa los costos y gastos de la operación [6][10].

• Monitoreo de los niveles de servicio: Medición de los niveles a través de indicadoresy señales de alerta que establecen reactivamente necesidades de ampliación o reduc-ción de capacidad [6][16] [17] [18][22] [27]:

• Arquitectura de múltiples capas: Infraestructura en la que los requerimientos hechospor estaciones de trabajo, son transmitidos a servidores que se ocupan del desarrollode una actividad específica correspondiente a cada una de las capas del modelo [6] [9][19] [21] [22] [27].

• Esquema de failover y clúster: Instalación de servidores duplicados funcionando comopares redundantes, que actúan automáticamente en caso de falla de los principales [1][6] [9][16] [17] [18] [19] [21][22][27].

2.2 Análisis de capacidadesEl desarrollo del modelo matemático se aborda desde la perspectiva de la teoría de

análisis y programación de capacidades de los medios de trabajo, que permite el diseñode modelos de optimización para la planeación de la capacidad en sistemas productivos.El modelo presentado aquí es una transferencia del dominio de capacidades en sistemasproductivos al de capacidades de infraestructura en las Tecnologías de la Información yde la Comunicación (TIC), lo cual es el principal aporte del estudio.

La capacidad se define como la cantidad de producto o servicio que puede ser obte-nido por una determinada unidad productiva, durante un cierto periodo de tiempo [7][20]. Se destacan los siguientes tipos de capacidad:

• Capacidad instalada (Ci): Capacidad máxima de producción prevista con la construc-ción de máquinas, instalaciones y equipos, disminuida por las necesidades de manteni-miento y funcionamiento normal del medio de trabajo.

• Capacidad disponible (Cd): Capacidad instalada disminuida por los días no laborales delaño, horas perdidas por ausentismos, organizacionales y por factores de fuerza mayor.

• Capacidad necesaria (Cn): Nivel de capacidad requerida en un periodo de tiempo.

Page 86: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 85

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

Para el desarrollo del modelo, se tuvo en consideración el concepto de capacidad dispo-nible (Cd) para calcular el número máximo de kilobytes que puede procesar un tipo derecurso de infraestructura, enmarcado en el contexto de programación lineal, la cual per-mite describir y optimizar una función objetivo sujeta a unas restricciones, asignando de lamejor manera posible recursos limitados entre actividades competitivas [7] [14].

3. MetodologíaLa metodología de la investigación presentada en este artículo, parte de la elaboración

de una propuesta del modelo matemático, continúa con la validación del mismo me-diante el análisis de datos de entrada y la estimación de parámetros, la solución y elanálisis de datos salida, y finaliza con ajustes y calibraciones al modelo.

Como parte de la metodología y aporte a la comprensión del problema, la Figura 1presenta el contexto del servicio web hosting, restricciones, variables de decisión, parámetrosy proceso necesarios para la elaboración del modelo.

4. Desarrollo del modelo matemático

4.1 PlanteamientoLa solución del problema busca determinar el número mínimo de recursos de infraes-

tructura tipo servidor, disco duro, memoria RAM y procesador, necesario para abastecerla demanda de alojamiento y solicitudes de visita a páginas Web de los proveedores deservicios web hosting dirigido a PYMES colombianas. Se definieron un máximo de 32unidades de procesamiento o núcleos de procesador por servidor, 4 GB de memoria y8 discos duros de 500 GB. El tamaño de red o ancho de banda se considera un parámetroconstante y se asume que el recurso de infraestructura no podrá procesar una mayorcantidad de kilobytes de los que puede procesar la red. Para el cálculo de la demanda, seda como supuesto que el conjunto de proveedores utilizados en la muestra para valida-ción del modelo, desea alcanzar un porcentaje del 0,05% de participación en el mercadocolombiano de alojamiento de páginas Web para PYMES.

La capacidad disponible de los recursos se reduce como resultado del almacenamien-to y operación normal del sistema operativo y de la ejecución de tareas y aplicacionesbásicas del servidor. La capacidad disponible del procesador se reduce en un 2%, la dela memoria RAM en 500 MB y la del disco duro en 20 GB.

El modelo considera máximo cinco (5) tipos diferentes de combinaciones de recursosde infraestructura, es decir, máximo cinco (5) tipos diferentes de servidores, con su(s)respectivo(s) disco(s) duro(s), memoria RAM y procesador(es). Cada combinación serealiza basada en el siguiente supuesto: el servidor tipo 1 (j=1) está conformado por losrecursos de infraestructura j con estándar k tipo 1, el servidor tipo 2 (j=2) está confor-mado por los recursos de infraestructura j con estándar k tipo 2, y así sucesivamentehasta el servidor tipo 5 (j=5).

Page 87: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS86

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

4.2 Desarrollo del modelo Se diseñó un modelo de optimización que utiliza como técnica base la programación

lineal entera y binaria, con una función objetivo que minimiza el número de recursos deinfraestructura necesarios para abastecer la demanda de alojamiento y solicitudes devisita a las páginas Web, entendiéndose que al minimizar el número de recursos de infra-estructura necesarios, se reducen sustancialmente los costos de procesamiento, debidoque es menor la inversión en máquinas, mantenimiento, instalaciones y energía.

Según lo observado en el contexto del modelo presentado en la Figura 1, el servicioweb hosting contiene elementos cuya magnitud se busca conocer para hallar la soluciónóptima del problema (variables de decisión), elementos que caracterizan el costo, el be-neficio o el ritmo al cual se consume un recurso (parámetros), limitaciones que restringenel cumplimiento del objetivo (restricciones) y un objetivo claramente definido que co-rresponde al interés principal del decisor (función objetivo).

Figura 1. Contexto del servicio web hosting para eldesarrollo del modelo matemático.

Cdisjk = [ KBjk * P * 1 ( 1-uj ) - gjk ]

Un aporte complementario de este estudio y el punto de partida para el planteamientodel modelo, es la definición de una regla para el cálculo de capacidad disponible de losrecursos de infraestructura tecnológica, como se describe en la siguiente sección.

4.2.1 Capacidad disponible

Considerando que el servicio web hosting opera de manera automatizada a través demáquinas o recursos de infraestructura, para el cálculo de la capacidad se tuvo en cuentael número de kilobytes que puede procesar y/o almacenar el recurso tipo j, reducidospor el porcentaje de tiempo requerido para el mantenimiento preventivo de las máqui-nas y el porcentaje de tiempo que el servicio no se encuentra disponible por otrosfactores diferentes a mantenimiento preventivo (protocol status), es decir,

Donde:

(1)

Page 88: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 87

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

KBjk = Número máximo de kilobytes que puede procesar el recurso de infraestructuratipo j, con el estándar de tamaño tipo k.

P = Porcentaje de solicitudes que no han sido rechazadas por el servidor. En conse-cuencia, el parámetro protocol status corresponde al número de solicitudes que han sidorechazadas por el servidor.

gjk = Consumo normal del recurso tipo j con el estándar tipo k (en kilobytes), quereduce la capacidad disponible como resultado de la operación normal del sistemaoperativo y de la ejecución de tareas básicas del procesador.

uj: Porcentaje de tiempo necesario para mantenimiento preventivo del recurso de in-fraestructura tipo j.

Obsérvese que para todo el modelo:

j = 1,2,3,4 (Tipo de recurso de infraestructura: 1. Disco duro, 2. Memoria RAM, 3.Procesador, 4. Servidor).

k = 1,2,…,s (Tamaño del recurso en unidades de kilobytes).

4.2.2 Forma general del modelo

Optimizar f (Xj,k; j = 1,2,...,n;k = 1,2...,s) = MinΣj=1 k=1

Xjk

ñ s

ΣSujeto a:

Σk=1

Cdisp 1k * X1k - s

Σi=1

m

a1 * Y1 ≥ 0

W1 ≤ Y1

Σk=1

Cdisp jk * Xjk - s

Σi=1

m

bij * D1 * Y1 ≥ 0

Σk=1

Zk = 1 s

Σi=1 j=1

bij * D1 * Y1 ≤m n

Σ Σk=1

hk * X4k * Zk

s

Cdisp 1k * X1k ≤ 8 * 500 Mb * X4k

Σk=1

Xjk ≥ 1 s

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

Cdisp 2k * X2k ≤ 500 Mb * X4k

Cdisp 3k * X3k ≤ 32 * Cdisp 3k * X4k

Xjk ≥ X4k

(10)

(11)

(12)

Page 89: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS88

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

Σj=1

uj * Xjk ≤ Tmanj

n

Xjk , Yi ≥ 0

Xjk , Yi Enteras

Zk = 0 ó 1

Cada una de las restricciones corresponde a:

(3) Capacidad de almacenamiento en el disco duro.(4) Capacidad de procesamiento y almacenamiento en la memoria RAM.(5) Demanda del número de páginas web.(6) El número de kilobytes procesados por solicitud de acceso, debe ser menor al

ancho de banda.(7) Solamente se puede seleccionar un tipo de ancho de banda.(8) Se debe seleccionar al menos un recurso de infraestructura tipo j con el estándar de

tamaño k.(9) Solamente se permiten ocho (8) discos duros de 500 Mb por servidor.(10) Solamente se permiten 500 Mb de memoria RAM por servidor.(11) Solamente se permiten 32 unidades o núcleos de procesamiento por servidor.(12) Debe seleccionarse al menos un recurso de infraestructura j tipo k, por cada servi-

dor tipo k que sea seleccionado.(13) Tiempo máximo permitido para mantenimiento del recurso tipo j.(14) No negatividad de las variables.(15) Variables enteras.(16) Variable binaria.

Se asumieron los siguientes subíndices para los parámetros y variables:

j = 1,2,3,4 (Tipo de recurso de infraestructura: 1. Disco duro, 2. Memoria RAM,3. Procesador, 4. Servidor).

k = 1,2,…,s (Tamaño del recurso en unidades de kilobytes).

i = 1,2,…,m (Tipo de conjuntos de páginas Web alojadas en el servicio webhosting, obtenido a partir de la segmentación del comportamiento de visitas a las mismas.Para mayor detalle, ver la sección 5).

4.2.3 Parámetros

h: Ancho de banda.Di: Número de solicitudes de acceso a la página Web tipo i.Wi: Demanda mínima de páginas Web alojadas en el hosting por unidad de tiempo.

(13)

(14)

(15)

(16)

A

A

A

Page 90: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 89

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

ai: Número de kilobytes usados del disco duro por página Web tipo i por unidad detiempo.

bij: Número de kilobytes procesados por solicitud de acceso a la página Web tipo i en elrecurso de infraestructura tipo j por unidad de tiempo.

Cdisj: Capacidad disponible del recurso de infraestructura tipo j en unidades de kilobytes.ej: Máximo número de unidades de almacenamiento o procesamiento permitidas por

recurso de infraestructura tipo j.Tmanj: Tiempo máximo de mantenimiento permitido para el recurso de infraestructura

tipo j.P: Porcentaje de solicitudes no defectuosas según el protocol status.

4.2.4 Variables de decisión

Xjk: Número de máquinas o recursos de infraestructura tipo j, con tamaño estándar tipok.

Yi: Número de páginas web tipo i a alojar en el hosting.Zk: Variable binaria que indica si se selecciona o no el ancho de banda con el estándar

tipo k.

5. Validación del modeloPara la validación del modelo y estimación de parámetros, se tomó una población de

setecientas treinta y cinco (735) páginas Web con aproximadamente cincuenta (50) millo-nes de registros de solicitudes de acceso o visitas a las páginas, las cuales se encuentranalojadas en un servicio web hosting dirigido a PYMES colombianas. De dicha población,se seleccionó una muestra probabilística de cuarenta y dos (42) páginas web que conte-nían 3.199.600 registros de solicitudes de acceso. Debido al alto volumen de información,dentro del análisis de datos de entrada para la estimación de parámetros se utilizarontécnicas de minería de datos.

Se realizaron los siguientes análisis utilizando los datos de entrada:

1. Determinación del tamaño de la muestra probabilística, de páginas Web a seleccionarcomo unidades experimentales, a partir la población de 735 páginas web.

2. Estadística descriptiva y análisis exploratorio de datos de los parámetros ai, Di y bijdefinidos anteriormente, comparado por tipo de página web, con el fin de establecersi las medias diferían para cada página o conjuntos de páginas Web, y determinar si sedebían establecer segmentos de páginas sobre los cuales realizar de manera indepen-diente la estimación de parámetros y el análisis de comportamiento de los datos.

3. Segmentación de las unidades experimentales, es decir, definición de conjuntos ho-mogéneos de páginas Web, de acuerdo con el resultado obtenido en el inciso anterior.

4. Estadística descriptiva y análisis exploratorio para conocer el comportamiento de losdatos, por segmentos o conjuntos de páginas Web.

5. Estimación de parámetros a partir de las estadísticas descriptivas y cálculo de los

Page 91: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS90

intervalos de confianza de los mismos, con el fin de realizar un análisis de sensibilidaddel modelo, utilizando como datos de entrada la media, el límite máximo y mínimodel intervalo de cada parámetro.

6. Aplicación del modelo matemático, generación de resultados y análisis de sensibilidadde los mismos bajo los escenarios del comportamiento medio, máximo y mínimo delos parámetros.

7. Análisis de resultados.

5.1 Análisis de datos de entradaPara determinar el tamaño de la muestra, se utilizó una ecuación de muestra probabilística

tomada de Hernández Sampieri [22].(17)

n′ = s2(18)

n = n ′

1 + n′N

V2

s2 = p (1 - p ) (19)V2 = se2 (20)

Donde:

p: Probabilidad de que la media de la muestra X estime el valor real de la media de lapoblación µ.

s2: Varianza de la muestra expresada como la probabilidad de ocurrencia de X.se2:Error estándar del tamaño de la muestra determinado por el investigador.V2: Varianza de la población. Corresponde al cuadrado del error estándar.N: Tamaño de la población.n´: Tamaño de la muestra sin ajustar.n: Tamaño de la muestra ajustada.

Se seleccionó como p, el valor de 0,99, es decir un 99% de probabilidad de que lamedia de la muestra estime el valor real de la media de la población. Por lo tanto, el errorde estimación de la media de la población corresponde a 1%. Como error de estima-ción del tamaño de la muestra se seleccionó un 1,5% de error.

El tamaño de muestra obtenido fue de cuarenta y dos (42) páginas Web; para la selec-ción de la misma se definió como unidad de análisis la variable Di, multiplicado por lavariable bij. La muestra seleccionada correspondió a las cuarenta y dos (42) páginas webcon el mayor producto Di*bij, teniendo en cuenta que lo que se buscaba era determinarel dimensionamiento del servicio web hosting y por lo tanto, era importante conocer lascaracterísticas de las PYMES que generan un mayor consumo de capacidad cuando serealizan visitas a sus páginas, es decir, tanto las páginas con el mayor número de kilobytesprocesados por minuto, como las páginas con el mayor número de solicitudes de accesopor minuto.

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

Page 92: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 1 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 91

A partir de la muestra de las 42 páginas Web se realizó un análisis exploratorio de losparámetros Di y bij, encontrándose la necesidad de realizar una segmentación de losdatos por tipo de página Web, dado que los resultados tanto de las medias de Di y bi soninferiores a los resultados de sus respectivas desviaciones estándar, lo cual permite presu-mir que existen diferencias significativas en la muestra. En la Tabla I se presentan losresultados del análisis exploratorio preliminar.

N Mín Máx Media Desv.

Di: Sol 3199600 1 3965 91,022 147,419

bi: Kb 3199600 1 497081 1108,02 5404,84

Tabla I. Estadísticos descriptivos parámetros Di y bij

Con el fin de confirmar o descartar la sospecha que puede existir una diferencia signi-ficativa entre las medias de las diferentes páginas Web, se realizó un análisis de varianzaANOVA para los parámetros Di y bij. Como resultado se encontró que a un nivel designificancia del 5% existe suficiente evidencia estadística para rechazarla hipótesis nulaque la media de los parámetros Di y bij son iguales. Se concluye que existe una diferenciasignificativa entre las medias de los parámetros y es necesario segmentar el análisis dedatos de entrada y la corrida del modelo matemático por tipo de página i.

De la misma forma los resultados del análisis exploratorio para el parámetro ai indica-ron que se debía realizar una segmentación de los datos por tipo de página Web.

La segmentación de los datos se realizó a través del algoritmo de k-medias para defi-nición de clúster de información, utilizando el software “R” para minería de datos. Apartir de la segmentación se obtuvieron cinco (5) tipos diferentes de páginas Web, repre-sentados con el subíndice i.

A partir de los segmentos o conjuntos de páginas Web, se realizaron estimaciones porintervalos de los parámetros ai, Di y bij.; dado que la desviación estándar σxera descono-cida y n era mayor que 30, se utilizó el intervalo de confianza para estimar la media μxcon muestras grandes [2] [24]. En la Ecuación (21) se presenta la fórmula para el cálculode este intervalo de confianza:

Donde:

(19)X - z ____ < μx < X + z ____SxSx

n n

X: Media de los datos.Sx: Desviación estándar de los datos.z: Estandarización de la distribución normal para un nivel de significancia del 5%.n: Tamaño de la muestra.

En la Tabla II se presentan los resultados del cálculo de los intervalos de confianzautilizando la Ecuación (21) para los diferentes parámetros del modelo, obteniendo como

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

Page 93: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS92

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

resultado los escenarios mínimo, medio y máximo de dichos parámetros, que son utili-zados para la aplicación y validación del modelo.

Parámetro Tipo página

1,0 2,0 3,0 4,0 5,0Di (medio) 11,0 292,0 634,0 59,0 140,0

Di (mínimo) 11,0 292,0 633,0 59,0 139,0

Di (máximo) 11,0 292,0 636,0 59,0 140,0

bi (medio) 691,0 12769,0 386860,0 206484,0 44676,0

bi (mínimo) 690,0 12724,0 362091,0 204339,0 44351,0

bi (máximo) 692,0 12815,0 411629,0 208629,0 45001,0

ai (medio) 1829059,0 4225825,0 886201,0 5547400,0 107965,0

ai (mínimo) 1808702,0 4193094,0 872468,0 5547400,0 105443,0

ai (máximo) 1849417,0 4258557,0 899935,0 5547400,0 110488,0

Wi 181,0 4,0 23,0 1,0 925,0

Di * bi (medio) 7599,0 3730365,0 245350436,0 12267217,0 6235862,0

Di * bi (mín.) 7577,0 3714345,0 229066710,0 12131887,0 6186537,0

Di * bi (máx.) 7621,0 3746405,0 261712858,0 12402712,0 6285245,0

Di * bi * Wi (medio) 1375403,0 675196042,0 44408428953,0 2220366244,0 1128691044,0

Di * bi * Wi (mín.) 1371368,0 672296360,0 41461074527,0 2195871625,0 1119763258,0

Di * bi * Wi (máx.) 1379444,0 678099277,0 47370027281,0 2244890934,0 1137629413,0

P 0,997

Cdis Disco Duro 135803671,0 222552611,0 466076743,0 709600874,0 976118700,0

Cdis Memoria RAM 2623503,0 3668671,0 1578335,0 533167,0 N/A

Cdis Procesador 762373478,0 700559386,0 608982995,0 549458342,0 425830215,0

(Cdis Procesador)*32 24395951296,0 22417900352,0 19487455840,0 17582666944,0 13626566880,0

Cdis Servidor j=4 N/A N/A N/A N/A N/A

Ancho de banda h 3145728000,0 4194304000,0 6291456000,0 8388608000,0 10485760000,0

Tabla II. Datos de entrada para la corrida del modelo en kilobytes

Tipo de Recurso Xj,k Demanda

Tabla III. Resultados de la aplicación del modelo para los escenarios mínimo, medio y máximo de los parámetros

Tipo j j=4 j=1 j=2 j=3 Yi Y2 Y3 Y4Estándar k-Tamaño 4 4 – 750 GB 4 – 2 GB 4 – 2,4 GH Cant. 4 23 1Cantidad 1 3 2 14N = 4P Di * bij 3.714.345 229.066.710 12.131.887

Tipo j j=4 j=1 j=2 j=3Estándar k-Tamaño 5 5 – 1 TB 4 – 2GB 5 – 1,86 GH Ancho de banda 10000 GBCantidad 1 3 2 19N = 5P

Tipo j j=4 j=1 j=2 j=3 Yi Y2 Y3 Y4Estándar k-Tamaño 4 4 – 750 GB 4 – 2 GB 4 – 2,4 GH Cant. 4 23 1Cantidad 1 3 2 16N = 4P Di * bij 3.714.345 229.066.710 12.131.887

Tipo j j=4 j=1 j=2 j=3Estándar k-Tamaño 5 5 – 1 TB 4 – 2GB 5 – 1,86 GH Ancho de banda 10000 GBCantidad 1 3 2 18N = 5P

Tipo j j=4 j=1 j=2 j=3 Yi Y2 Y3 Y4Estándar k-Tamaño 4 4 – 750 GB 4 – 2 GB 4 – 2,4 GH Cant. 4 23 1Cantidad 1 3 2 15N = 6P Di * bij 3.714.345 229.066.710 12.131.887

Tipo j j=4 j=1 j=2 j=3Estándar k-Tamaño 5 5 – 1 TB 4 – 2GB 5 – 1,86 GH Ancho de banda 10000 GBCantidad 1 3 2 19N = 5P

Esce

nario

Mín

imo

Serv

idor

1Se

rvid

or 2

Esce

nario

Med

ioSe

rvid

or 1

Serv

idor

2

Donde, N = NúcleosP = ProcesadoresDi * bij Se encuentra en unidades de kilobytes

Esce

nario

Máx

imo

Serv

idor

1Se

rvid

or 2

Page 94: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 93

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

5.2 Aplicación del modeloDespués de estimar todos los parámetros del modelo utilizando la muestra de 42

páginas Web, se calculó la capacidad disponible para los recursos de infraestructura:Disco duro, memoria RAM y procesador, utilizando la Ecuación (1).

La aplicación del modelo se realizó utilizando el software de optimización GAMSIDE.Los resultados bajo el escenario mínimo, medio y máximo de los parámetros ai, Di y bijse presentan en la Tabla III.

5.3 Análisis de resultadosDespués de aplicar el modelo para los escenarios mínimo, medio y máximo de los

parámetros ai, bij y Di, se encontró que las variables X1k: Número de servidores requeri-dos con el estándar tipo k, X2k: Número de memorias RAM requeridas con el estándartipo k y X4k: Número de servidores requeridos con el estándar tipo k, presentaron elmismo resultado, lo cual indicó que no existe diferencia significativa entre el número derecursos de infraestructura tipo disco duro, memoria RAM y servidor, independiente dela desviación estándar y el comportamiento extremo de los parámetros.

En el caso de la variable X3k: Número de procesadores requeridos con el estándar tipok, los resultados obtenidos fueron diferentes en las soluciones del modelo bajo los esce-narios mínimo, medio y máximo de los parámetros. Con el fin de establecer si diferíansignificativamente, se realizó una prueba de ANOVA, con las siguientes hipótesis:

H0: µ1= µ2 = µ3. No existe diferencia significativa entre el número de recursos deinfraestructura tipo X3k para los escenarios mínimo, medio y máximo de los parámetrosai, bij y Di.

H1: µ1≠ µ2≠ µ3. Al menos un par de medias del número de recursos de infraestructuratipo X3k para los escenarios mínimo, medio y máximo de los parámetros ai, bij y Di,difiere entre sí.

Como resultado de la prueba ANOVA, se encontróque a un nivel de significancia del5% existe suficiente evidencia estadística para no rechazar la hipótesis nula de que lamedias de la variable X3kson iguales para los tres escenarios de los parámetros ai, bij y Di.Por lo tanto, independiente de la desviación estándar y el comportamiento extremo delos parámetros ai, bij y Di, el número de procesadores requeridos para satisfacer la de-manda de alojamiento y solicitudes de visitas a las páginas Web, no presenta una diferenciasignificativa desde el punto de vista estadístico.

Lo anterior confirma la viabilidad de utilizar un modelo matemático basado en pro-gramación lineal y análisis de capacidades, ya que la solución del modelo para los escenariosmínimo, medio y máximo de los parámetros arroja resultados del número de recursosde infraestructura tipo servidor, disco duro, memoria RAM y procesador que no difie-ren significativamente entre sí.

Page 95: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS94

Modelo de dimensionamiento del servicio web hosting dirigido a proveedores de la pequeña y mediana empresa colombiana

6. ConclusionesEl modelo matemático es viable en la medida que permite cumplir el objetivo general

de la investigación, ya que es útil para el dimensionamiento eficaz de recursos y selecciónde la mejor combinación de infraestructura tecnológica del servicio web hosting dirigido aPYMES colombianas, en condiciones promedio y extremas de demanda del servicio, esdecir, escenarios mínimo, medio y máximo de los parámetros, pues los resultados delnúmero de recursos de infraestructura tipo servidor, disco duro, memoria RAM yprocesador arrojados por el modelo, no difieren significativamente entre sí, desde elpunto de vista estadístico.

Se presentó una propuesta inicial para un método ingenieril que pueda contribuir en elfuturo a sustituir la gestión reactiva de infraestructura mediante la estimación de recursos,compra e instalación de máquinas, monitoreo de su utilización, identificación de necesi-dades de reducción o ampliación de capacidad de inversión, por un nuevo métodobasado en un modelo matemático para realizar un análisis prospectivo de la demanda yestimar la capacidad y cantidad de recursos de infraestructura tipo disco duro, procesadory memoria RAM, necesarios para satisfacerla.

7. Referencias[1] Anandasivam, A. (2009). A Heuristic Approach for Capacity Control in Clouds. IEEE Conf. onCommerce+Enterprise Computing.

[2] García Sipolis, A. y Simón de Blas, C. (2000). Manual de Estadística. Universidad Rey Juan Carlos. Ed. Dykinson, Madrid.

[3] Daccach, C. (2000). Arquitectura para comercio electrónico. Revista Sistemas, Asociación Colombiana de Ingenieros de Sistemas (ACIS),Colombia, Vol. 78. 37-49.

[4] Figallo, C. (1998). Internet world: Hosting web communities. Editorial Wiley, USA.

[5] Huang, C-Y. (2007). Concentration of Web users’ online information behavior, Information Research. Consultado: http://InformationR.net/ir/12-4/paper324.html. (02 de noviembre, 2010).

[6] Jabba, D. y Márquez , J. (2003). Herramientas para Consulta y Modelado en la Web: una forma diferente del manejo de grandes volúmenesde información de los Web Sites en Internet. Revista de Ingeniería & Desarrollo, Universidad del Norte, Colombia, Vol. 13. 41-57.

[7] Kalenatic, D. (2001). Modelo Integral y Dinámico para el Análisis, Planeación, Programación y Control de las Capacidades Productivas enEmpresas Manufactureras, Universidad Distrital Francisco José de Caldas, Bogotá.

[8] Kaye, D. (2001). Strategies for web hosting and management services. Editorial Wiley John & Sons, USA.

[9] Martinez, D. y Sanchez, J. (2006). Los niveles de servicio en la ingeniería del software. El Cid Editor, Universidad Nacional del Nordeste,Departamento de Informática. Universidad de Málaga, Departamento de Lenguajes y Ciencias de la Computación, Argentina.

[10] Menascé, D. y Almeida, A. (2000). Scaling for E-Business: Tecnologies, Models, Performance and Capacity Planning. Prentice Hall, NewJersey.

[11] Puyana, D. (2002). Universidad Sergio Arboleda. La problemática de las PYMES en Colombia: internacionalizarse o morir. Consultado: http://www.usergioarboleda.edu.co/PYMES/noticia1.htm. (02 de noviembre, 2010).

[12] Departamento Nacional de Estadística Colombia, DANE. (2003). Modelo de la medición de las tecnologías de la información y las comunica-ciones (TIC).

[13] DBK, S.A. (2011). Informe Especial Hosting y Housing. (Análisis de sectores). Madrid, 5 Ed.

[14] Hillier, F. y Lieberman, G. (2001). Investigación de Operaciones, 7 Ed., McGraw Hill, México.

[15] IBM. (2009). Seeding the Clouds: Key Infrastructure Elements for Cloud Computing.

[16] Garbani, J., Washburn, D. y Chi, E. (2011). The New Capacity Planning Process Requires Three New Steps. Reboot Your Capacity PlanningProcess With Cost-Value Analysis, Governance, And Global Planning. Forrester Research, Inc., Technology Square, Cambridge, USA.

[17] Garbani, J., Cecere, M., Washburn, D., O’Donnell, G., Dines, R., Staten, J. y Chi, E. (2011). IT Infrastructure And Operations: The NextFive Years The Cloud On IT’s Horizon. Forrester Research, Inc., Technology Square, Cambridge, USA.

Page 96: Revista Ingenieria 2010 Vol. 1 y 2

INGENIERÍA • Vol. 15 • No. 2 • ISSN 0121-750X • UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 95

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

[18] Garbani, J., Whiteley, R. y Nelson, L. (2010). I&O’s New Capacity Planning Organization. Virtualization And Cloud Computing Force A NewOrganizational Model That. Decentralizes Capacity Management And Centralizes Capacity Planning. Forrester Research, Inc., TechnologySquare, Cambridge, USA.

[19] Applegate, L., Austin, R., y Warren, F. (2003). Estrategia y Gestión de la Informática Corporativa: Los retos de gestión de una economía enred, Ed. McGraw Hill, Madrid, 6 Ed.

[20] Dominguez, M. (1995). Dirección de Operaciones: Aspectos tácticos y operativos en la producción y los servicios. Ed. McGraw Hill, Madrid.

[21] Drowin, M. (2001). Web hosting and web site development a guide to opportunities. The Library of E-Commerce and Internet Careers, Ed. TheRosen Publishing Group.

[22] Johnston, M y Mahowald, R. (2010). HP Cloud Infrastructure Services Jump-Start Enterprise Decisions and Deployments. IDC, Analyze TheFuture. Marzo de 2010.

[23] Laoutaris, N. (2003). On the Optimization of Storage Capacity Allocation for Content Distribution, University of Athens.

[24] Delgado de la Torre, R. (2008). Probabilidad y estadística para ciencias e ingenierías. Delta, Publicaciones Universitarias. Madrid, 1 Ed.

[25] Hernández Sampieri, R., Fernández, C. y Baptista, L. (2003). Metodología de la Investigación. Ed. McGraw Hill, México.

[26] Agarwal, V. (2001). An Architecture for Virtual Server Farms, Research Report, IBM India Research Lab.

[27] Wenying, Z., Yuelong, Z., Kairi, O. y Wei, S. (2009). Research on cloud storage architecture and key technologies. ICIS ’09 Proceedings ofthe 2nd International Conference on Interaction Sciences: Information Technology, Culture and Human.

Olga Lucía Ramírez CaleroOlga Lucía Ramírez CaleroOlga Lucía Ramírez CaleroOlga Lucía Ramírez CaleroOlga Lucía Ramírez CaleroIngeniera Industrial de la Universidad Distrital Francisco José de Caldas, Bogotá, Colombia. Especialista en Gestión de RiesgosFinancieros, Universidad Sergio Arboleda, Bogotá, Colombia. Magíster en Ingeniería Industrial, Universidad Distrital Francisco Joséde Caldas, Bogotá, Colombia. Está certificada como CobitFoundationCertificate. Es Miembro de ISACA (InformationSystemsAuditand Control Association) Capítulo Colombia. Actualmente se desempeña como Profesional Especializado en Riesgos y Procesosdel Banco de la República de Colombia.

Jairo Humberto TJairo Humberto TJairo Humberto TJairo Humberto TJairo Humberto Torres Acostaorres Acostaorres Acostaorres Acostaorres AcostaIngeniero Industrial, Universidad Distrital Francisco José de Caldas, Bogotá, Colombia. Especialista en Ingeniería de Producción,Universidad Distrital Francisco José de Caldas, Bogotá, Colombia. Magíster en Investigación de Operaciones, Universidad NacionalAutónoma de México. Doctor en la Universidad Central Martha Abreu de las Villas, Cuba. Desarrollo su Investigación Post-doctoralen la Universidad de la Florida. Profesor de las áreas de investigación de operaciones, manufactura, ingeniería de calidad eingeniería de costos a nivel de pregrado y postgrado. Ha publicado cuatro libros en el área de Ingeniería de Manufactura y Costos.Profesor invitado de la Universidad de Oviedo y de la Universidad Pontificia de Salamanca campus de Madrid. Presidente de laempresa JHTA Inversiones, empresa del sector de transformación de la madera y director Sénior de la empresa SEIP LTDA. (Serviciode Ingeniería y Productividad). Integrante del Grupo de Investigación “Modelos Matemáticos Aplicados a la Industria (MMAI)” de laUniversidad Distrital Francisco José de Caldas.

Page 97: Revista Ingenieria 2010 Vol. 1 y 2

Volumen 15 • Número 2 • Año 2010 • ISSN 0121-750X

C o n t e n i d o :

Representación computacional del lenguaje natural escritoComputational representation of written natural language

Sonia Ordoñez Salinas • Alexander Gelbukh

Estudio del impacto de la certificación ISO 9001:2000en la competitividad-paísStudy of the Impact of ISO 9001:2000 Certificationon country-competitiveness

Luz Esperanza Bohórquez Arévalo

Herramienta de software para el desarrollo de descripcionesde hardware utilizando VHDL a partir de modelos gráficosSoftware tool to develop hardware descriptionsusing VHDL based on graphic models

Jose Roberto Vargas Rivero

Sistema de inferencia difusa basado en relaciones BooleanasFuzzy inference based on Boolean relations

Helbert Eduardo Espitia Cuchango • José Jairo Soriano Méndez

Desarrollo de un lenguaje de dominio específico para sistemasde gestión de aprendizaje y su herramienta de implementación“KiwiDSM” mediante ingeniería dirigida por modelosDeveloping a domain-specific language for the learningmanagement systems, and your tool of implementation “KiwiDSM” through model driven engineering

Carlos Enrique Montenegro Marín • Juan Manuel Cueva Lovelle • Óscar Sanjuán Martinez • Paulo Alonso Gaona García

Modelo de dimensionamiento del servicio web hosting dirigidoa proveedores de la pequeña y mediana empresa colombianaA capacity planning model for web hosting providersof Colombian small and medium businesses

Olga Lucía Ramírez Calero • Jairo Humberto Torres Acosta

Volumen 15 • Número 1 • Año 2010 • ISSN 0121-750X

IngenieríaREVISTA

Páginas

52 - 66

67 - 81

82 - 95

6 - 21

22 - 34

35 - 46


Recommended