+ All Categories
Home > Documents > Machine learning and data science MLDS · Introducción al Análisis y visualización de datos con...

Machine learning and data science MLDS · Introducción al Análisis y visualización de datos con...

Date post: 28-Oct-2018
Category:
Upload: tranduong
View: 215 times
Download: 0 times
Share this document with a friend
15
Programa de formación Machine learning and data science MLDS
Transcript

Programa de formación

Machine learningand data science MLDS

Bienvenido,Resumen del programa

Martes a Jueves

39 horas presencialespor módulo

Valor por módulo.El programa constade múltiples módulos.Consultar tabla devalores más adelante.

Universidad Nacionalde ColombiaSede Bogotá

6:00pm a 9:00pm

Inicio14 de Agosto 2018

Machine Learningand Data Science MLDS

Presentación

Programa de formación

El aprendizaje computacional (machine learning en Inglés) está en el centro de una nueva área de conocimiento, la ciencia de datos (o data science en Inglés), que aborda el análisis y explotación del creciente volumen de datos. Los métodos de aprendizaje computacional permiten extraer información y conocimiento en forma de patrones, modelos predictivos y descriptivos, automáticamente inducidos a partir de estos datos. Estas tecnologías forman parte integral de lo que se ha denominado como la 4ta revolución industrial, la cual se refiere al cambio dramático que está experimentado la sociedad y la industria gracias a la adopción de diferentes tecnologías tales como la robótica, el procesamiento de grandes volúmenes de datos (Big data), la inteligencia artificial, la nanotecnología y la biotecnología entre otras.

1’600.000

El propósito del programa de formación en MLDS es ofrecer un conjunto de módulos de formación en las diferentes áreas de fundamentación y aplicación del aprendizaje computacional y la ciencia de datos. Los módulos que componen el programa tienen un enfoque práctico que enfatiza la aplicación de los conceptos y métodos a la solución de problemas reales. A la par con el estudio de los conceptos fundamentales, los asistentes desarrollan implementaciones de diferentes sistemas analíticos usando diversas tecnologías actuales para el procesamiento, análisis y visualización de datos.

En un estudio de prospectiva patrocinado por IEEE, el aprendizaje computacional ha sido identi�cado como una de las tecnologías innovadoras que pueden liderar el cambio de la industria de la computación en los siguientes años. Pero aún, más allá de esta distinción, el aprendizaje computacional juega un papel fundamental en el éxito de otras tecnologías identi�cadas en el mismo estudio. En algunos casos, el aprendizaje computacional proveerá los métodos básicos que permitan abordar los retos particulares de algunas tecnologías, como la visión por computador, la biología computacional, las interfaces de usuarios naturales o el denominado big data analytics. En otros casos, los métodos de aprendizaje computacional permitirán analizar y aprovechar los inmensos volúmenes de datos generados por tecnologías, tales como los cursos abiertos masivos en línea, el internet de las cosas o la bioinformática. El programa de formación en MLDS provee los elementos necesarios para afrontar esta revolución y aprovechar estas herramientas conceptuales y tecnológicas para la solución de problemas prácticos en sus organizaciones.

Introducción al Análisis y visualización de datos con Python

El programa de formación en MLDS está organizado en módulos que abordan diferentes áreas conceptuales y de aplicación. El diseño curricular es �exible y modular, de tal manera que el asistente puede planear su ruta de formación de acuerdo con sus intereses y necesidades. Las siguientes son algunas de las áreas por los módulos ofrecidos actualmente o que se ofrecerán en el futuro:

Programa formativo MLDS

Introducción al Aprendizaje Computacional Machine learning

Procesamiento de grandes volúmenes de información (Big data)

Desarrollo de Sistemas Analíticos en la nube

Procesamiento y entendimiento de lenguaje natural

Deep learning

MLDS-1

MLDS-2

MLDS-4

MLDS-3

MLDS-5

MLDS-6

Objetivo

Perfil

Metodología

30%: Presentación de temas70%: Talleres guiados

El programa de formación en MLDS está dirigido a todas las personas que desde sus roles tienen responsabilidad o incidencia en los procesos de análisis de datos y desarrollo de sistemas inteligentes y analíticos: gerentes de informática, analistas, desarrolladores y responsables de área. Igualmente, el programa de formación en MLDS también está dirigido a aquellos profesionales en áreas tales como la ingeniería, ciencias naturales, economía, matemáticas y estadística, interesados en diversas aplicaciones del aprendizaje computacional y el desarrollo de sistemas inteligentes y analíticos. Dado el enfoque práctico del programa de formación en MLDS se requiere que los estudiantes tengan familiaridad previa con conceptos de programación.

Formar a los asistentes en las competencias y habilidades técnicas que les permitan aplicar herramientas conceptuales y tecnológicas del análisis de datos y el aprendizaje computacional a la solución de problemas reales.

En el programa de formación en MLDS se asume la educación como un proceso de interacción dinámica centrada en los participantes, donde el rol del profesor, además de proveer su experiencia profesional y los elementos conceptuales, se concentra en ser un dinamizador de las actividades de aprendizaje. Desde esta perspectiva, la metodología debe re�ejar el enfoque propiciando el desarrollo de las competencias propuestas. Se pretende entonces una participación activa y productiva en el desarrollo de cada uno de los módulos, a través de: a) exposición magistral, b) talleres de trabajo en equipo c) sustentación y argumentación de los trabajos.

Módulos ofertados para esta edición

Ago/14Sep/12Oct/10

Introducción al Análisis y visualización de datos con Python

Introducción al Aprendizaje Computacional Machine learning

Desarrollo de Sistemas Analíticos en la nube

MLDS-1

MLDS-2

MLDS-3

Fechas

Este curso ofrece certi�cación expedida por la Facultad de Ingeniería de la Universidad Nacional de Colombia Sede Bogotá si el estudiante cursa con éxito el 80% o más del tiempo efectivo del curso/diplomado/programa.

También es necesario aprobar con una nota mínima los exámenes o talleres en el desarrollo de la metodología.

Este es un Programa de formación en Machine Learning, el cual se compone de un determinado número de módulos. Los usuarios que los cursen (tres o más dentro del semestre en el que son ofertados) obtendrá el Certi�cado Diplomado, adicional al certi�cado individual de cada módulo.

El programa de formación contará con nuevos módulos que se irán abriendo y ofertando al público.

El programa de formación está organizado en módulos que abordan diferentes áreas conceptuales y de aplicación. El diseño curricular es �exible y modular, de tal manera que el asistente puede planear su ruta de formación de acuerdo con sus intereses y necesidades. A continuación se listan los valores dependiendo del tipo de inscripción:

Tipo inscripción Descuento Valor matrícula

Tarifa plena Módulo 0% 1’600.000

Grupos de 4 o máspersonas con mismo

soporte de pago10% 1’440.000

Docentes, funcionarios,egresados y contratistas

Universidad Nacional20% 1’280.000

Tabla de valores

Pago de 3 módulosantes del inicio del

Programa 20% 3’840.000

Profesores

Ingeniero de SistemasFelipe Restrepo Calle, PhD

Ingeniero de Sistemas y Computación, Universidad Tecnológica de Pereira, 2004; Magíster en Instrumentación Física, Universidad Tecnológica de Pereira, 2007; Doctor en Ingeniería Informática, Universidad de Alicante (España), 2011. Ha participado en varios proyectos de investigación a nivel nacional e internacional. Estancias posdoctorales: Universidad de Sevilla (España) durante 2012 y 2013, Universidade Federal do Rio Grande do Sul (Brasil) durante el primer semestre de 2014.

Profesor del Departamento de Ingeniería de Sistemas e Industrial en la Universidad Nacional de Colombia, sede Bogotá. Sus áreas de interés incluyen: lenguajes de programación, análisis automático de código fuente, procesadores de lenguaje, diseño de sistemas embebidos y educación en ingeniería. Cuenta con más de 30 publicaciones científicas en revistas, libros y conferencias internacionales. Actualmente lidera el grupo de investigación PLaS (Programming Languages and Systems) y es el Coordinador de la Maestría en Ingeniería de Sistemas y Computación.

Ingeniero de SistemasFabio Augusto González Osorio

Ingeniero de Sistemas,Universidad Nacional de Colombia (1993); MSc. en Matemáticas, Universidad Nacional de Colombia [1998]; Ph.D. & M.Sc. in Computer Science, The University of Memphis (2003); Profesor visitante University of Louisville, USA (2009); Profesor visitante Ecole Nationale Superieure de Techniques Avancees (ENSTA-ParisTech), Francia (2010); Profesor visitante University of Houston, USA (2017). Profesor Titular del Departamento de Ingeniería de Sistemas e Industrial. Coordinador del programa de Doctorado en Ingeniería de Sistemas y Computación, Universidad Nacional de Colombia, Bogotá. Amplia experiencia en investigación en aprendizaje computacional, minería de datos, recuperación de información, procesamiento de lenguaje natural y visión por computador. Participación en diversos proyectos de investigación internacionales y nacionales. Más de 100 publicaciones científicas en revistas, libros y conferencias internacionales. Lidera el grupo de investigación MindLab ( M a c h i n e L e a r n i n g P e r c e p t i o n a n d D i s c o v e r y L a b , http://mindlaboratory.org)

El programa es diseñado y soportado por un cuerpo de profesores con formación doctoral, con una amplia experiencia investigativa y profesional en las diferentes áreas de énfasis.

Ingeniero de SistemasJorge Eliecer Camargo, PhD

Profesor del Departamento de Ingeniería de Sistemas e Industrial de la Universidad Nacional de Colombia, Sede Bogotá. Cuenta con más de 50 publicaciones científicas en revistas, libros y conferencias internacionales relacionadas con el manejo de grandes volúmenes de datos y aplicaciones de machine learning en grandes volúmenes de datos en imágenes, audio y texto (big data). Ingeniero de Sistemas de la Universidad Nacional de Colombia, Magíster en Ingeniería de Sistemas y Computación de la Universidad de los Andes, Doctor en Ingeniería - Sistemas y Computación de la Universidad Nacional de Colombia. Ha participado en diferentes proyectos de investigación a nivel nacional e internacional. Trabajó en el Departamento de Policía Científica en Lausana (Suiza) en el proyecto "Detección automática de medicamentos falsos utilizando técnicas de procesamiento de imágenes y Machine Learning" y en el proyecto "Monitoreo de redes de tráfico de drogas sintéticas utilizando técnicas de procesamiento de imágenes y Machine Learning".

Co-Fundador de BigData Solutions S.A.S, compañía colombiana de base tecnológica que presta servicios de Consultoría en Big Data. Experiencia en Avantel S.A.S a cargo de la fábrica de software interna de la compañía. Consultor asesor en Arquitectura de Software, Machine Learning y Big Data para entidades tales como ICFES, DANE, MinTIC, Secretaría de Gobierno, Agencia de Defensa Jurídica del Estado, Superintendencia de Servicios Públicos, Ministerio de Transporte, CINTEL, entre otras.

Contenido / Programa del curso

Módulo MLDS-01

39 horas - Teórico/práctico

Introducción al Análisis y Visualización de Datos con Python

El objetivo de este módulo es entrenar al estudiante en el uso del lenguaje de programación Python como herramienta para el análisis y visualización de datos. El módulo abordará los elementos básicos del lenguaje, los ambientes de programación que soportan su uso interactivo y las bibliotecas especializadas para el análisis y visualización de datos.

Introducción

Introducción a Phyton

Librería numérica de Python: NumPy

Análisis de datos con Pandas: parte 1

Análisis de datos con Pandas: parte 2

Análisis de datos con Pandas: parte 3

¿Qué es el análisis de datos?

Tipos de dato, listas, tuplas, diccionarios, set, fecha, hora

Tipos de arreglos, creación de arreglos, entrada/salida, índices, operaciones, funciones universales, troceado e iteraciones de arreglos

Introducción a Pandas

Combinaciones y concatenaciones, operaciones, estadísticas, valores faltantes, duplicados, permutaciones, tablas pivote, outliers. Entrada/salida de datos: texto, CSV, JSON, HTML, Excel

Visualización de datos con PandasAplicación práctica usando Pandas

Retos y aplicaciones del análisis de datos

Funciones, lambda, map, list comprehensions

Introducción librería para computación científica SciPy

Series, DataFrames, índices, consultas, agrupaciones y agregaciones

Taller 2 Pandas

Configuración entorno de trabajo: Notebooks iPython/Jupyter

Importar datos: archivo texto, CSV, Excel, SQLite DB

Taller NumPy

Taller 1 Pandas

»

»

»

»

»

»»

»

»

»

»

»

»

»

»

»

Principios de visualización de información

Visualización de datos con Matplotlib

Visualización de datos con Seaborn

Visualización de datos con Plotly y Cu�inks

Visualizaciones interactivas web con Bokeh

Visualización de datos complejos

Presentación proyecto final del módulo y cierre (4 horas)

Bibliografía

Data-ink ratio, Chart junk (Edward Tufte)

Introducción a Matplotlib

Introducción a Seaborn

Introducción a Plotly

Introducción a Bokeh

Visualización de grafosVisualización de datos geográficos: mapas cloropléticosTaller

¿Qué visualizar y para qué?

Plots y subplots, line plots, bar charts, scatterplots, histograms, box plots, heatmaps

Distribution Plots, Categorical Plots, Matrix Plots, Regression Plots, Grids

Plotly y Cu�inks

Taller Bokeh

Abstracción de datos y tareasGráficos mentirosos y engaños visuales

Taller Matplotlib

Taller Seaborn

Taller Plotly

»

»

»

»

»

»»»

»

»

»

»

»

»»

»

»

»

1. Wes McKinney. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly Media, Inc., 2012.2. Tamara Munzner. Visualization Analysis and Design. A K Peters Visualization Series, CRC Press, 2014.3. Igor Milovanović. Python Data Visualization Cookbook. Packt Publishing Ltd, 2013.4.UCLA Statistical Computing Resources. Disponible en: http://wiki.stat.ucla.edu/socr/index.php/EBook

Módulo MLDS-02

39 horas - Teórico/práctico

Introducción al Aprendizaje Computacional (Machine Learning)con Python

El objetivo de este módulo es dotar al estudiante con la capacidad de abordar problemas de análisis de datos, usando técnicas de aprendizaje computacional. El módulo parte de una aproximación conceptual al aprendizaje computacional para llevar al estudiante, a través de prácticas concretas basadas en Python y bibliotecas especializadas, al diseño e implementación de modelos de aprendizaje supervisado y no supervisado.

¿Qué es el machine learning?

Introducción a scikit-learn

Aprendizaje supervisado

Modelos probabilísticos de clasificación

Árboles de decisión

Taller de aprendizaje supervisado

Historia

Arquitectura

ClasificaciónRegresión

Teoría de la decisión

Ganancia de informaciónÁrboles

Métodos

Carga y preprocesamiento de datos

Aplicaciones

Naïve Bayes

Random forest

Aplicaciones

Evaluación de modelos supervisados

Regresión logística

»

»

»»

»

»»

»

»

»

»

»

»

»

»

Aprendizaje no supervisadoAgrupamientoReducción de la dimensionalidad Evaluación de modelos no supervisados

»»»

Agrupación

Reducción de la dimensionalidad

Otros métodos

Selección de modelos

Bibliografía

k-medias

Análisis de componentes principales

Redes neuronales

Optimización de parámetros

Mezcla de Gaussianas

Factorización de matrices

Métodos de kernel

Pipelines

»

»

»

»

»

»

»

»

1. Trevor Hastie Robert Tibshirani Jerome Friedman; The Elements of Statistical Learning, Second Edition, Springer, 20092. Ethem Alpaydin, Introduction to Machine Learning, MIT Press, 20103. Géron, Aurélien. Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems, O'Reilly Media, 2017

Taller de aprendizaje supervisado

Presentación proyecto final del módulo y cierre (4 horas)

Módulo MLDS-03

39 horas - Teórico/práctico

Desarrollo de Sistemas Analíticos en la Nube

El objetivo de este módulo es presentar al asistente las diferentes alternativas que existen para realizar flujos analítica de datos utilizando servicios en la nube. Se abordarán los conceptos básicos de computación en la nube enfocándose en lo relacionado con servicios de Machine Learning. Se espera que el asistente pueda utilizar este tipo de servicios para dotar de “inteligencia” a las aplicaciones web y móviles que construya. En el módulo se desarrollarán talleres prácticos que permitan realizar análisis de datos mediante el uso de servicios en la nube de Machine Learning.

Machine learning con Databricks

Carga de datos

Librería de Machine Learning (MLib)

Machine Learning con Amazon

Entorno de trabajo

Bases de datos y tablas

Algoritmos de Machine LearningEstadística básica, clasificación y regresión, filtrado colaborativo, agrupamiento, reducción de la dimensionalidad, extracción de características, evaluación de modelos

Amazon Lambda para la ejecución escalable de modelos de machine learning

Clusters

Manejo de DataframesImportar librerías

Publicación de servicios analíticos con Amazon API Gateway

Creación de notebooks

»

»

»»

»

»

»»

»

»

Servicios de Machine Learning (APIs)Servicios de reconocimiento de vozServicio de procesamiento de lenguaje natural, transcripción automática voz-textoServicios para análisis de imágenes, reconocimiento de objetos, rostros, y escenas en imágenes.

»»»

Azure Machine Learning Studio

Servicio de Agentes de Conversación Natural (chatbots)

Cloud Machine Learning de Google

Servicios de ML en Google Cloud

Bibliografía

Creación de proyectos de ML

Google Dialog Flow

API para procesamiento de lenguaje natural

Servicios de predicción por lotes

API para traducción automática

Servicios webNotebooks

Google Cloud Dataflow

API para reconocimiento de voz

API para visión por computador API de extracción de metadatos en videos

»

»

»

»

»

»»

»

»

»»

1. Je� Barnes, Azure Machine Learning: Microsoft Azure Essentials, Microsoft Press, 20152. Vlentine Fontama, Roger Barga, Wee Hyong Tok, Predictive Analytics with Microsoft Azure Machine Learning: Build and Deploy Actionable Solutions in Minutes, Apress, 20143. AWS, amazon Machine Learning: Developer Guide, Amazon Web Services, 20174. Valliappa Lakshmanan, Data Science on the Google Cloud Platform, O´Reilly, 2017

Presentación proyecto final del módulo y cierre (4 horas)

Formalización de la inscripción

Modalidades de pago

1 2 3La Unidad de Educación Continua y Permanente de la Facultad de Ingeniería de la Universidad Nacional de Colombia maneja 3 pasos para habilitar un cupo para un usuario en alguno de nuestros cursos, diplomados y eventos. Estos pasos corresponden a la pre inscripción, formalización y legalización.

1) Pre inscripciónProcedimiento de toma de datos personales para llevar registro de su interés en participar en determinada actividad y recibir información de las actualizaciones de la misma. Es gratuita y no compromete a participar. Puede realizarla llamándonos al 3165000 ext. 10689 / 10686.

2) FormalizaciónUna vez haya tenido la oportunidad de recibir la información, revisarla y tomar la decisión de cursar con nosotros; debe acercarse a alguno de nuestros medios de pago para realizar la consignación respectiva al valor de cada curso/diplomado.

3) LegalizaciónUna vez se ha realizado el pago es necesario enviar el comprobante de pago (soporte de consignación, recibo de pago…) junto con un escaneado de su documento de identidad (cédula) al correo [email protected] En caso de aplicar al descuento de integrante de la UN, adjuntar también el carnet o diplomado de la Institución.

Pre inscripción Formalización Legalización

https://ingenieria.bogota.unal.edu.co/uec/?page_id=8779

Encuentre la opción más cómoda para formalizar su inscripción e información detallada de la misma en el siguiente enlace:


Recommended