+ All Categories
Home > Documents > © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en...

© Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en...

Date post: 12-Oct-2018
Category:
Upload: letram
View: 214 times
Download: 0 times
Share this document with a friend
24
1 © Copyright 2010 EMC Corporation. All rights reserved.
Transcript
Page 1: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

1© Copyright 2010 EMC Corporation. All rights reserved.

Page 2: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

2© Copyright 2010 EMC Corporation. All rights reserved.

GreenPlum

El Futuro y el Presente del Data WareHouse

Page 3: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

3© Copyright 2010 EMC Corporation. All rights reserved.

Retos en los Data Warehouse actuales• Tanto las fuentes de los datos como la

cantidad de información a analizar crece exponencialmente

• Existe información obsoleta por que las soluciones actuales no pueden realizar los procesos de ingesta con la suficiente velocidad

• Problemas de rendimiento para análitica avanzada y queries complejos

• Tanto el número de usuarios como la concurrencia de los mismos está creciendo rápidamente

Page 4: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

4© Copyright 2010 EMC Corporation. All rights reserved.

¿Qué ocurriría si las soluciones de Data Warehouse …?

• Escalaran fácilmente para analizar las crecientes cantidades de información

• Pudiera ingestar grandes volúmenes de datos de múltiples y diversas fuentes de datos

• Ofreciera procesamiento paralelo de alto rendimiento para completar las analíticas

• Soportara un alto nivel de concurrencia de usuarios

Page 5: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

5© Copyright 2010 EMC Corporation. All rights reserved.

“Las fuerzas del mercado y las expectaciones de los usuarios están demandando entornos data warehouse pre-configurados y preparados mediante el uso de appliances.”

GARTNER 2009 MAGIC QUADRANT

Page 6: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

6© Copyright 2010 EMC Corporation. All rights reserved.

El mejor sistema de DW actualmente disponible con la empresa líder en

soluciones de almacenamiento

La unión hace la fuerza

Page 7: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

7© Copyright 2010 EMC Corporation. All rights reserved.

La Oferta Más Robusta del Mercado

Base de Datos Greenplum

La plataforma

de bbdd MPP más

escalable del mundo

Edición “Single Node”

Greenplum

Base de Datos

gratuita con funciones analíticas

Greenplum Data Computing Appliance (Nuevo)

El sistema de base de

datos más potente del mercado

Greenplum Chorus

Plataforma Enterprise Data Cloud

Infra. Virtualizada,

con capacidades analíticas de auto-servicio

Page 8: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

8© Copyright 2010 EMC Corporation. All rights reserved.

EMC Greenplum Database

Fastest data loading Advanced analytics

DATA IN DECISIONS OUTIN-DATABASE ANALYTICS

Tecnología Scatter/Gather para realizar las cargas de datos• Elimina los cuellos de botella• Permite limpiar e integrar

nuevos datos• Múltiples opciones de carga,

desde cargas masivas a micro-updates para permitir un procesamiento casi Real-Time

Optimizada para ejecución rápida de query y escalabilidad lineal• Acercando el proceso a los datos• Arquitectura scale-out, shared-

nothing, massively parallel processing (MPP)

• El proceso es automáticamente optimizado y distribuido

• Ofrece el mejor rendimiento concurrente

Acceso unificado a los datos para obtener un mejor valor de la información• Permite analisis paralelo

corporativo• Plataforma abierta con un gran

soporte de 3os.• Conectividad e integración

corporativa certificada con la mayoría de herramientas de BI, ETL y gestión

Page 9: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

9© Copyright 2010 EMC Corporation. All rights reserved.

Ofreciendo la carga de datos más rápida y el ratio precio/rendimiento más efectivo de toda la industria del DW

DATA IN. DECISIONS OUT.

EMC Greenplum Data Computing Appliance

Page 10: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

10© Copyright 2010 EMC Corporation. All rights reserved.

EMC Greenplum Data Computing Appliance

Rendimiento, escalabilidad, fiabilidad y el mejor TCO para entornos entornos data warehouse/BI

Rendimiento extremoOptimizado para ejecución rápida de query y carga de datos

Escalabilidad ElásticaCapacidad y rendimiento expandible online

TCO reducidoData marts consolidados con mejores costes

Alta disponibilidadAuto-recuperación y redundante

Private cloud-readyDatos y proceso son automática optimizados y distribuidos

Backup avanzado y D/RCon la incorporación de las tecnologías líderes del mercado

Rápido despliegueAppliance diseñado para entornos DW

Page 11: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

11© Copyright 2010 EMC Corporation. All rights reserved.

Beneficios del uso de Appliances

• Desplegable en días, no semanas o meses

• La pre-configuración asegura un rendimiento predecible

• Simplifica dramáticamente la infraestructura de DW y analítica

• Reduce los costes de administración

• Arquitectura Scale-out: añada capacidad y rendimiento según necesidades

– Diseñado para el análisis de volúmenes de datos desde 1 TB hasta petabytes

• Estructura de soporte integrada

Compute

Storage

Database

Network

EMC GREENPLUM DATA COMPUTING APPLIANCE

Page 12: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

12© Copyright 2010 EMC Corporation. All rights reserved.

Arquitectura EMC Greenplum Data Computing ApplianceMarco Flexible para el procesamiento de grandes volúmenes de datos

• Arquitectura Masivamente en Paralelo (MPP)

– Shared-nothing architecture– No hay coordinador único o cuello

de botella en rendimiento

• MPP everywhere– Optimización de query entre todos

los servidores de segmento

• Failover Automático– Alta seguridad y disponibilidad

• Escalabilidad Lineal

• Optimización del I/O

SQL - MapReduceMaster Master

Segment Segment Segment Segment Segment

Page 13: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

13© Copyright 2010 EMC Corporation. All rights reserved.

La Carga de Datos DisponibleMás Potente• Rendimiento líder en la

industria: • 10TB por hora por rack

• Arquitectuira Innovadora, completamente paralela:

• Scatter-Gather Streaming™ ofrece un escalado verdaderamente lineal

• Soporte de estrategias tanto para grandes batches como cargas en tiempo real

• Permite transformaciones complejas de datos “en-tránsito”

• Interfaces transparentes para la carga mediantes ficheros, aplicaciones y servicios

2X5X

Page 14: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

14© Copyright 2010 EMC Corporation. All rights reserved.

Opciones y Especificaciones

Especificaciones GP100:1/2 Rack

GP1000: Rack

Servidores Master 2 2

Serv. Segmento 8 16

Memoria por serv. 48 GB 48 GB

Memoria Total 384 GB 768 GB

HDDs Segmento 96 192

Capacidad Usable (sin compresión)

18 TB 36 TB

Capacidad Usable (compresión)

72 TB 144 TB

Scan rate 12 GB/s 24 GB/s

Data load rate 5 TB/hora 10 TB/hora

2 serv. Maestros

Bus Interconexión

Bus de Expansión

8 Servidores deSegmento

8 Servidores deSegmento

GP100 GP1000

¡VELOCIDAD!

Page 15: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

15© Copyright 2010 EMC Corporation. All rights reserved.

Rack 1 Rack 2 Rack 3 Rack 4 Rack 5 Rack 6 Rack 7 Rack 8 Rack 9 Rack 10 Rack 11 Rack 12

Rack 13 Rack 14 Rack 15 Rack 16 Rack 17 Rack 18 Rack 19 Rack 20 Rack 21 Rack 22 Rack 23 Rack 24

Escalabilidad Greenplum

Page 16: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

16© Copyright 2010 EMC Corporation. All rights reserved.

Greenplum DCA - Disaster Recovery

WANor

SAN

RecoverPoint RecoverPoint

Sin consumo de recursos en los servidores para realizar la replicación

o el failover-failback

EMC Data Computing Appliance

EMC Data Computing Appliance

Page 17: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

17© Copyright 2010 EMC Corporation. All rights reserved.

Backup Integrado con EMC Data Domain

• Backup y Recuperación– Con utilidades nativas de

EMC Data Domain/ Greenplum

• Reduce los requerimientos de almacenamiento en el backup

– Información de-duplicada

• Recuperación de datos rápida y fiable

– Reduce el tiempo de recuperación

• Flexible y eficiente– Backup a intervalos definidos– Copias point-in-time

EMC Greenplum DataComputing Appliance

EMC Data Domain

Segment serverNFS shares

Page 18: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

18© Copyright 2010 EMC Corporation. All rights reserved.

La Necesidad de Consolidar

• La información está en todos los sitios-DW corporativos, cientos de data marts, copias de bbdd e incluso hojas de cálculo

• El objetivo de centralizar esta información en un DW único hasta ahora no era alcanzable

Enterprise data warehouse~10% del volumen total

Data marts y bbdd “personales”

~90% del volumen total

Page 19: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

19© Copyright 2010 EMC Corporation. All rights reserved.

Múltitud de Appliances Aislados,Data Marts, Data Warehouses, Silos

Caro de Controlar, Caro de Gestionar

Virtual Compute EnvironmentVirtual DB Appliances

Fácil de Controlar y GestionarAlto rendimiento a un Coste Bajo

Hasta ahora: Ahora: Vblock

Consolidación de DW: La Nube Privada

Page 20: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

20© Copyright 2010 EMC Corporation. All rights reserved.

Servicios de Consultoria Data Warehouse

• Análisis Estratégicos DW/BI, definición de requerimientos, planes de transformación

• Migraciones desde Oracle, Teradata, DB2, SQL Server y otros a Greenplum

• Consolidación de múltiples data marts en Greenplum

• Diseño y creación de modelos de datos con presentación de datos consistentes con la visión de los usuarios de negocio

• Configuración de cubos OLAP para mejorar queries y permitir análisis root-cause

Page 21: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

21© Copyright 2010 EMC Corporation. All rights reserved.

Red de Partners

Soluciones

HerramientasBI

Consultoras

Page 22: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

22© Copyright 2010 EMC Corporation. All rights reserved.

Algunos clientes (por sector de actividad)

ServiciosFinancieros

Telco

Media & Internet

Distribución

Gobierno ySanidad

Page 23: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

23© Copyright 2010 EMC Corporation. All rights reserved.

EMC Greenplum Data Computing Appliance. ¿Por qué?

• La máquina más potente del mercado – Más de 10 TB por hora (load)– Más de 24 GB por segundo (query)

• Mejor aproximación a una nube privada, con infraestructura de DW y analítica virtualizada

DATA IN. DECISIONS OUT.Ofreciendo la carga de datos más rápida y el ratio precio/rendimiento más efectivo de la industria del DW

Page 24: © Copyright 2010 EMC Corporation. All rights reserved. 1 · • Arquitectura Masivamente en Paralelo (MPP) – Shared-nothing architecture – No hay coordinador único o cuello

24© Copyright 2010 EMC Corporation. All rights reserved.

GRACIAS


Recommended