+ All Categories
Home > Technology > Data warehousing con hadoop y el paradigma map reduce

Data warehousing con hadoop y el paradigma map reduce

Date post: 13-Apr-2017
Category:
Upload: ismel-diaz
View: 15 times
Download: 5 times
Share this document with a friend
29
Data Warehousing con Hadoop y el paradigma MapReduce Ismel Martínez Díaz
Transcript
Page 1: Data warehousing con hadoop y el paradigma map reduce

Data Warehousing con Hadoop y el paradigma MapReduce

Ismel Martínez Díaz

Page 2: Data warehousing con hadoop y el paradigma map reduce

Motivación y Antecedentes de Hadoop• Alto volúmenes de datos• Variedad de formatos• Alta velocidad de generación de datos

• Sistemas de bases de datos distribuidos• Programación funcional

Page 3: Data warehousing con hadoop y el paradigma map reduce

Historia• Creador: Doug Cutting• 2002 Nutch• 2004 GFS y MapReduce• 2006 – 2008 Hadoop (HDFS y MapReduce)• Actualidad: CloudEra y HortonWorks (Hive, Pig, HBase, etc)

Page 4: Data warehousing con hadoop y el paradigma map reduce

Hadoop• Proyecto Open Source• Procesamiento de grandes cantidades de datos• Computación distribuida• Escalable, fiable, eficiente y económico

Page 5: Data warehousing con hadoop y el paradigma map reduce

HDFS• Fallos en el hardware y uso de heartbeats• Millones de archivos y espacio de nombres único• Portabilidad• Escribir una vez, leer varias• Archivos divididos en bloques y replicación.• Acceso directo a los datos y validación.

Page 6: Data warehousing con hadoop y el paradigma map reduce

MapReduce• Programación funcional para la computación distribuida.

Page 7: Data warehousing con hadoop y el paradigma map reduce

HDFS y MapReduce• Útil• Sencillo• Pensamiento funcional y distribuido

Page 8: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

OutputFormar

Page 9: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

OutputFormar

Page 10: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

OutputFormar

Page 11: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 12: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormat

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 13: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 14: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 15: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 16: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 17: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

MapTask

OutputFormar

Page 18: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

OutputFormar

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

Page 19: Data warehousing con hadoop y el paradigma map reduce

Cliente JobTracker

TaskTracker

map

InputFormar

combine()reduce()

regionregion

ram TaskTracker

read

sort

reduce()

OutputFormar

InputFiles

split

split

split

OutputFile

TaskTracker

TaskTracker

regionregion

regionregion

Page 20: Data warehousing con hadoop y el paradigma map reduce

Ejemplo

Page 21: Data warehousing con hadoop y el paradigma map reduce

HDFS y MapReduce

Page 22: Data warehousing con hadoop y el paradigma map reduce

Ecosistema Hadoop

Page 23: Data warehousing con hadoop y el paradigma map reduce

Servicios profesionales

Page 24: Data warehousing con hadoop y el paradigma map reduce

RDBMS y Hadoop

Page 25: Data warehousing con hadoop y el paradigma map reduce

RDBMS y Hadoop

Page 26: Data warehousing con hadoop y el paradigma map reduce

Data Warehousing con Hadoop

Page 27: Data warehousing con hadoop y el paradigma map reduce

Data Warehousing con Hadoop

Page 28: Data warehousing con hadoop y el paradigma map reduce

Hive

Page 29: Data warehousing con hadoop y el paradigma map reduce

Gracias


Recommended