+ All Categories
Home > Education > Minig text and audiovisual data

Minig text and audiovisual data

Date post: 13-Jul-2015
Category:
Upload: jonathan-klr
View: 321 times
Download: 0 times
Share this document with a friend
Popular Tags:
21
SISTEMAS INFORMÁTICOS Y COMPUTACIÓN REALIZACIÓN: Irina Anabel Veintimilla Toro, [email protected] Ana Karolis Paz Alberca, [email protected] Jonathan Gandin Calero Armijos, [email protected]
Transcript
Page 1: Minig text and audiovisual data

SISTEMAS INFORMÁTICOS Y COMPUTACIÓN

REALIZACIÓN:Irina Anabel Veintimilla Toro, [email protected] Karolis Paz Alberca, [email protected] Gandin Calero Armijos, [email protected]

Page 2: Minig text and audiovisual data

INTRODUCCIÓN

La información esta representada en lenguaje natural.

La búsqueda de información depende del contexto dela misma para extraer el conocimiento de los distintosrepositorios.

Para la extracción de información nos valemos de laminería de texto.

La minería de texto es el descubrimiento de patrones ynuevos conocimientos en un conjunto de textos.

Page 3: Minig text and audiovisual data

La ciencia encargada del tratamiento de lainformación mediante la minería de texto (textmining) es la lingüística computacional.

La lingüística computacional trata de la aplicación delos métodos computacionales en el estudio dellenguaje natural, investiga métodos computacionalespara la manipulación de sistemas complejos.

El objetivo primordial es transformar la informaciónen lenguaje natural a una representación formal delconocimiento, como por ejemplo una red semántica.

Page 4: Minig text and audiovisual data

Tradicionalmente la solución para resolver éste tipo deproblemas, es mediante un procesador lingüístico queconsta de los módulos:

El módulo morfológico, se encarga de reconocer laspalabras. Y convierte las cadenas de letras a unaentrada de un diccionario, y ubica las marcas detiempo, género y número.

El módulo sintáctico reconoce oraciones, convierte lascadenas de palabras marcadas a una estructuragráfica, en donde se hacen explicitas algunasrelaciones entre las palabras de la oración.

El módulo semántico reconoce la estructura completadel texto y lo convierte a una “red semántica”.

Page 5: Minig text and audiovisual data

La lingüística computacional también se encargada delprocesamiento automático de textos, que consideradiversidad de tareas y dentro de éstas la minería detexto, que es el objeto a tratar en ésta investigación.

La minería de datos incluye tecnología de base dedatos, aprendizaje demáquinas, estadísticas, reconocimiento depatrones, inteligencia artificial, visualización de datos.

Page 6: Minig text and audiovisual data

MINERÍA DE DATOS Minería de datos, se refiere a la extracción de

conocimientos de grandes cantidades de datos queson parte de repositorios de información.

Conocida también como Knowledge Discovery fromData, o KDD.

La minería de datos envuelve una integración detécnicas como tecnologías de BD ywarehouses, estadísticas, aprendizaje demáquinas, reconocimiento de patrones, análisisespacial y temporal de datos.

Page 7: Minig text and audiovisual data

Descubrimiento de conocimiento consiste:

Limpieza de datos.

Integración de datos.

Selección de datos.

Transformación de datos.

Minerías de datos

Evaluación de patrones.

Presentación del conocimiento.

Page 8: Minig text and audiovisual data

Tipo de datos donde realizar minería de datos

La minería de datos se aplica a cualquier repositorio dedatos, estos repositorios incluyen BD relacionales, datawarehouses, BD transaccionales, sistemas avanzadosde BD, archivos planos, data streams, y el WWW.

Los sistemas avanzados de bases de datos incluyen BDde objetos relacionados y especificas, BD orientadas aaplicaciones, BD espaciales, BD textuales.

Los desafíos y técnicas de minería pueden diferir paracada uno de los sistemas repositorios.

Page 9: Minig text and audiovisual data

MINERÍA DE TEXTOLa minería de texto, se basa en documentos de texto no

estructurados, los cuales son la base para eldescubrimiento de nueva información. Para realizarminería de texto se debe realizar las siguientesactividades:

Agrupamiento de documentos.

Identificación de categorías.

Categorización.

Clasificación.

Asociaciones.

Page 10: Minig text and audiovisual data

La minería de texto realiza el descubrimiento de conocimientosque no existían explícitamente en ningún texto de lacolección, pero que surgen de relacionar el contenido de varios deellos. Consiste de dos etapas:

Primera etapa, los textos se transforman tipo derepresentación estructurada o semi-estructurada; la segundaetapa las representaciones intermedias se analizan paradescubrir en ellas algunos patrones interesantes o nuevosconocimientos.

Page 11: Minig text and audiovisual data

Pre procesamientoEn ésta etapa de procesamiento las técnicas utilizadas

intentan transformar a una representaciónsemiestructurada o estructurada los documentos dedatos textuales en crudo.

Las representaciones intermedias de los textos deben sersencillas y completas.

Existen representaciones que son utilizadas en ésta etapade la minería de texto , que son de dos tipos:

A nivel documento y a nivel de concepto.

A nivel concepto.

Page 12: Minig text and audiovisual data

APLICACIONES

Las prácticas de minería de datos se utilizan en diversasindustrias y funciones de negocios:

Empresas de telecomunicaciones.

La industria del comercio.

La industria de la medicina.

Bancos e Instituciones Financieras.

Page 13: Minig text and audiovisual data

REDES NEURONALES EN LA MINERIA DE DATOS Las Redes Neuronales (Neural Networks) son

utilizadas para la predicción, la minería de datos (datamining), el reconocimiento de patrones y los sistemasde control adaptativo. Constituyen una parte muyimportante en el estudio y desarrollo de la inteligenciaartificial (AI) y el de la vida artificial (a-life).

Las Redes Neuronales pueden ser combinadas conotras herramientas como la lógica difusa (lógicafuzzy), los algoritmos genéticos, los sistemasexpertos, las estadísticas, las transformadas deFourier, etc.

Page 14: Minig text and audiovisual data

TÉCNICAS BASADAS EN REDES NEURONALES ARTIFICIALESSu ventaja principal es que, cuando están bien

ajustadas, obtienen precisiones muy altas. Además sonmuy expresivas y permiten capturar modelos nolineales.

Entre sus inconvenientes se suelen nombrar susensibilidad a valores anómalos (aunque son robustosal ruido no extremo y a los atributos nosignificativos), necesitan muchos ejemplos para elaprendizaje y son relativamente lentas yfundamentalmente, su incomprensibilidad.

Son técnicas muy eficientes que permiten trabajar condatos con alta dimensionalidad y precisión.

Page 15: Minig text and audiovisual data

APLICACIONES DE LAS REDES NEURONALES EN LA MINERÍA DE DATOS

Minería de Datos con Redes Neuronales Artificiales:Aplicación en Vacunas – Tuberculosis.La Minería de Datos se apoya en la aplicación de métodosmatemáticos de análisis, y específicamente del uso redesneuronales artificiales.Esta revolución de la Tecnología de la Información coincide conla revolución que paralelamente está teniendo lugar en laBiotecnología, debido a un mundo de avances tecnológicos quehan permitido la obtención y acumulación automática deinmensas cantidades de información biológica.Del encuentro de estas dos revoluciones nace la Bioinformáticacomo una multidisciplina estratégica que pone al servicio de laBiotecnología los recursos de la nuevas Tecnologías de laInformación.

Page 16: Minig text and audiovisual data

Aplicación de redes neuronales artificiales paradeterminar la distribución Espacial de la humedad delsuelo en una pequeña cuenca de drenaje.

Este estudio trata de demostrar que es posible realizar unapredicción razonable de la distribución espacial de lahumedad edáfica superficial, estudiar sus patronesespaciales y contrastar la importancia de cada variable apartir de un número limitado de mediciones mediante eluso de redes neuronales artificiales multicapa de tipofeedforward con aprendizaje mediante mecanismos deretro propagación del error utilizando principalmentevariables derivadas de un modelo digital de elevaciones(MDE) y de fotografía aérea.

Page 17: Minig text and audiovisual data

CONCLUSIONES

La minería de datos (DM, Data Mining) nos ayuda apreparar, y explorar los datos para sacar la informaciónoculta en ellos.

Está fuertemente ligado con la supervisión de procesosindustriales ya que resulta muy útil para aprovechar losdatos almacenados en las bases de datos.

Al momento de utilizar técnicas de minería de datos seaborda la solución a problemas depredicción, clasificación y segmentación.

Page 18: Minig text and audiovisual data

Las redes neuronales artificiales han sido claramenteaceptadas en la minería de datos como nuevossistemas eficaces para el tratamiento de la informaciónen muchas disciplinas. Pues esto ha dado comoresultado sus diferentes aplicaciones en áreas deCiencia e Ingeniería, Medicina y Salud, Transporte yComunicaciones, Finanzas, Negocios, etc.

Las redes neuronales artificiales se hacen muyevidentes en la minería de datos, específicamente lasbasadas en el modelo Kohonen, ya que pueden seraplicadas como una herramienta de análisis.

Page 19: Minig text and audiovisual data

RECOMENDACIONES Hacer uso de aplicaciones que permitan mejorar el proceso

de formación académica de los estudiantes.

Fomentar el desarrollo de proyectos de descubrimiento deConocimiento en BD en la Universidad.

Las redes neuronales no constituyen una área nueva deconocimiento, pero actualmente no se le está prestando lasuficiente atención es por esto que se recomendaría que setome en cuenta las ventajas que presentan sobre otrastécnicas en la minería de datos para resolver los diferentesproblemas.

Una recomendación importante de las redes neuronales esque con el estudio de ellas, después su empleo esrelativamente fácil y adaptable a diferentes series.

Page 20: Minig text and audiovisual data

APORTE PERSONAL En el desarrollo de la presente temática que hemos escogido nos hemos

podido dar cuenta ya que debido a la abundancia de información de texto, larecuperación de información ha encontrado algunas aplicaciones. Por lo cualexisten algunos sistemas de recuperación de formación, como sistemas decatálogos de bibliotecas en línea, sistemas de gestión de documentos y losdesarrollados más recientemente motores de búsqueda Web.

Es de gran importancia la minería de Datos ya que es una de las ramas de lalingüística computacional que trata de obtener información y conocimiento apartir de conjuntos de datos que en principio no tienen un orden o no estándispuestos en origen para transmitir esa información.

Estas redes poseen dos tipos de aprendizaje tales como aprendizaje supervisadoy no supervisado. Como en toda aplicación existen ventajas y desventajas alutilizar este método, algunas de la ventajas son: aprendizaje adaptativo: autoorganización: tolerancia a fallos: operación en tiempo real.

Una de las desventajas es que las redes neuronales padecen de falta dehardware, debido a que su habilidad radica en procesar información enparalelo.

Page 21: Minig text and audiovisual data

BIBLIOGRAFÍA Y REFERENCIAS

Montes Manuel -y- Gómez.- Minería de texto: Un nuevo reto computacional.

Carmen Gálvez, PhD.- TEXT-MINING: THE NEW GENERATION OF SCIENTIFIC LITERATURE ANALYSIS IN MOLECULAR BIOLOGY AND GENOMICS

Machine Learning: An Artificial Intelligence Approach Vol I-IV [Michalski and Teccuci, 1994].

M. Montes-y-Gómez y A. Gelbukh.- Un método de agrupamiento de grafos conceptuales para minería de texto*.

Hernandez josé, Ramírez Ma Jose, Ferri cesar.- Introducción a la minería de datos.

Redes Neuronales (Neurales). (Neural Networks), disponible enhttp://www.answermath.com/redes_neuronales_o_neurales.htm

Aplicación de la minería de datos al estudio de las alteraciones respiratorias durante el sueño, Carlos Zamarrón Sanz, Vanesa García Paz, Uxío Calvo Álvarez, Fernanda Pichel Guerrero, José Ramón Rodríguez, Pdf disponible en http://www.sogapar.org/pneuma/pneuma6/pneuma-n-6-5c.pdf

Minería de datos con redes neuronales artificiales: aplicación en Vacunas – tuberculosis, M.v.Guzmán, h. Carrillo , e. Villaseñor , e. Valencia, r. Calero, L. E. Morán y a. Acosta,Pdf disponible en: http://www.dynamics.unam.edu/DinamicaNoLineal/Articulos/MineriaRedesNVacunas.pdf

Aplicación de redes neuronales artificiales para determinar la distribución Espacial de la humedad del suelo en una pequeña cuenca de drenaje. Estudios Preliminares, M. Maneta y S. Schnabel, Pdf disponible en: http://www.zonanosaturada.com/publics/V6/p295-304.pdf


Recommended