1© Copyright 2010 EMC Corporation. All rights reserved.
2© Copyright 2010 EMC Corporation. All rights reserved.
GreenPlum
El Futuro y el Presente del Data WareHouse
3© Copyright 2010 EMC Corporation. All rights reserved.
Retos en los Data Warehouse actuales• Tanto las fuentes de los datos como la
cantidad de información a analizar crece exponencialmente
• Existe información obsoleta por que las soluciones actuales no pueden realizar los procesos de ingesta con la suficiente velocidad
• Problemas de rendimiento para análitica avanzada y queries complejos
• Tanto el número de usuarios como la concurrencia de los mismos está creciendo rápidamente
4© Copyright 2010 EMC Corporation. All rights reserved.
¿Qué ocurriría si las soluciones de Data Warehouse …?
• Escalaran fácilmente para analizar las crecientes cantidades de información
• Pudiera ingestar grandes volúmenes de datos de múltiples y diversas fuentes de datos
• Ofreciera procesamiento paralelo de alto rendimiento para completar las analíticas
• Soportara un alto nivel de concurrencia de usuarios
5© Copyright 2010 EMC Corporation. All rights reserved.
“Las fuerzas del mercado y las expectaciones de los usuarios están demandando entornos data warehouse pre-configurados y preparados mediante el uso de appliances.”
GARTNER 2009 MAGIC QUADRANT
6© Copyright 2010 EMC Corporation. All rights reserved.
El mejor sistema de DW actualmente disponible con la empresa líder en
soluciones de almacenamiento
La unión hace la fuerza
7© Copyright 2010 EMC Corporation. All rights reserved.
La Oferta Más Robusta del Mercado
Base de Datos Greenplum
La plataforma
de bbdd MPP más
escalable del mundo
Edición “Single Node”
Greenplum
Base de Datos
gratuita con funciones analíticas
Greenplum Data Computing Appliance (Nuevo)
El sistema de base de
datos más potente del mercado
Greenplum Chorus
Plataforma Enterprise Data Cloud
Infra. Virtualizada,
con capacidades analíticas de auto-servicio
8© Copyright 2010 EMC Corporation. All rights reserved.
EMC Greenplum Database
Fastest data loading Advanced analytics
DATA IN DECISIONS OUTIN-DATABASE ANALYTICS
Tecnología Scatter/Gather para realizar las cargas de datos• Elimina los cuellos de botella• Permite limpiar e integrar
nuevos datos• Múltiples opciones de carga,
desde cargas masivas a micro-updates para permitir un procesamiento casi Real-Time
Optimizada para ejecución rápida de query y escalabilidad lineal• Acercando el proceso a los datos• Arquitectura scale-out, shared-
nothing, massively parallel processing (MPP)
• El proceso es automáticamente optimizado y distribuido
• Ofrece el mejor rendimiento concurrente
Acceso unificado a los datos para obtener un mejor valor de la información• Permite analisis paralelo
corporativo• Plataforma abierta con un gran
soporte de 3os.• Conectividad e integración
corporativa certificada con la mayoría de herramientas de BI, ETL y gestión
9© Copyright 2010 EMC Corporation. All rights reserved.
Ofreciendo la carga de datos más rápida y el ratio precio/rendimiento más efectivo de toda la industria del DW
DATA IN. DECISIONS OUT.
EMC Greenplum Data Computing Appliance
10© Copyright 2010 EMC Corporation. All rights reserved.
EMC Greenplum Data Computing Appliance
Rendimiento, escalabilidad, fiabilidad y el mejor TCO para entornos entornos data warehouse/BI
Rendimiento extremoOptimizado para ejecución rápida de query y carga de datos
Escalabilidad ElásticaCapacidad y rendimiento expandible online
TCO reducidoData marts consolidados con mejores costes
Alta disponibilidadAuto-recuperación y redundante
Private cloud-readyDatos y proceso son automática optimizados y distribuidos
Backup avanzado y D/RCon la incorporación de las tecnologías líderes del mercado
Rápido despliegueAppliance diseñado para entornos DW
11© Copyright 2010 EMC Corporation. All rights reserved.
Beneficios del uso de Appliances
• Desplegable en días, no semanas o meses
• La pre-configuración asegura un rendimiento predecible
• Simplifica dramáticamente la infraestructura de DW y analítica
• Reduce los costes de administración
• Arquitectura Scale-out: añada capacidad y rendimiento según necesidades
– Diseñado para el análisis de volúmenes de datos desde 1 TB hasta petabytes
• Estructura de soporte integrada
Compute
Storage
Database
Network
EMC GREENPLUM DATA COMPUTING APPLIANCE
12© Copyright 2010 EMC Corporation. All rights reserved.
Arquitectura EMC Greenplum Data Computing ApplianceMarco Flexible para el procesamiento de grandes volúmenes de datos
• Arquitectura Masivamente en Paralelo (MPP)
– Shared-nothing architecture– No hay coordinador único o cuello
de botella en rendimiento
• MPP everywhere– Optimización de query entre todos
los servidores de segmento
• Failover Automático– Alta seguridad y disponibilidad
• Escalabilidad Lineal
• Optimización del I/O
SQL - MapReduceMaster Master
Segment Segment Segment Segment Segment
13© Copyright 2010 EMC Corporation. All rights reserved.
La Carga de Datos DisponibleMás Potente• Rendimiento líder en la
industria: • 10TB por hora por rack
• Arquitectuira Innovadora, completamente paralela:
• Scatter-Gather Streaming™ ofrece un escalado verdaderamente lineal
• Soporte de estrategias tanto para grandes batches como cargas en tiempo real
• Permite transformaciones complejas de datos “en-tránsito”
• Interfaces transparentes para la carga mediantes ficheros, aplicaciones y servicios
2X5X
14© Copyright 2010 EMC Corporation. All rights reserved.
Opciones y Especificaciones
Especificaciones GP100:1/2 Rack
GP1000: Rack
Servidores Master 2 2
Serv. Segmento 8 16
Memoria por serv. 48 GB 48 GB
Memoria Total 384 GB 768 GB
HDDs Segmento 96 192
Capacidad Usable (sin compresión)
18 TB 36 TB
Capacidad Usable (compresión)
72 TB 144 TB
Scan rate 12 GB/s 24 GB/s
Data load rate 5 TB/hora 10 TB/hora
2 serv. Maestros
Bus Interconexión
Bus de Expansión
8 Servidores deSegmento
8 Servidores deSegmento
GP100 GP1000
¡VELOCIDAD!
15© Copyright 2010 EMC Corporation. All rights reserved.
Rack 1 Rack 2 Rack 3 Rack 4 Rack 5 Rack 6 Rack 7 Rack 8 Rack 9 Rack 10 Rack 11 Rack 12
Rack 13 Rack 14 Rack 15 Rack 16 Rack 17 Rack 18 Rack 19 Rack 20 Rack 21 Rack 22 Rack 23 Rack 24
Escalabilidad Greenplum
16© Copyright 2010 EMC Corporation. All rights reserved.
Greenplum DCA - Disaster Recovery
WANor
SAN
RecoverPoint RecoverPoint
Sin consumo de recursos en los servidores para realizar la replicación
o el failover-failback
EMC Data Computing Appliance
EMC Data Computing Appliance
17© Copyright 2010 EMC Corporation. All rights reserved.
Backup Integrado con EMC Data Domain
• Backup y Recuperación– Con utilidades nativas de
EMC Data Domain/ Greenplum
• Reduce los requerimientos de almacenamiento en el backup
– Información de-duplicada
• Recuperación de datos rápida y fiable
– Reduce el tiempo de recuperación
• Flexible y eficiente– Backup a intervalos definidos– Copias point-in-time
EMC Greenplum DataComputing Appliance
EMC Data Domain
Segment serverNFS shares
18© Copyright 2010 EMC Corporation. All rights reserved.
La Necesidad de Consolidar
• La información está en todos los sitios-DW corporativos, cientos de data marts, copias de bbdd e incluso hojas de cálculo
• El objetivo de centralizar esta información en un DW único hasta ahora no era alcanzable
Enterprise data warehouse~10% del volumen total
Data marts y bbdd “personales”
~90% del volumen total
19© Copyright 2010 EMC Corporation. All rights reserved.
Múltitud de Appliances Aislados,Data Marts, Data Warehouses, Silos
Caro de Controlar, Caro de Gestionar
Virtual Compute EnvironmentVirtual DB Appliances
Fácil de Controlar y GestionarAlto rendimiento a un Coste Bajo
Hasta ahora: Ahora: Vblock
Consolidación de DW: La Nube Privada
20© Copyright 2010 EMC Corporation. All rights reserved.
Servicios de Consultoria Data Warehouse
• Análisis Estratégicos DW/BI, definición de requerimientos, planes de transformación
• Migraciones desde Oracle, Teradata, DB2, SQL Server y otros a Greenplum
• Consolidación de múltiples data marts en Greenplum
• Diseño y creación de modelos de datos con presentación de datos consistentes con la visión de los usuarios de negocio
• Configuración de cubos OLAP para mejorar queries y permitir análisis root-cause
21© Copyright 2010 EMC Corporation. All rights reserved.
Red de Partners
Soluciones
HerramientasBI
Consultoras
22© Copyright 2010 EMC Corporation. All rights reserved.
Algunos clientes (por sector de actividad)
ServiciosFinancieros
Telco
Media & Internet
Distribución
Gobierno ySanidad
23© Copyright 2010 EMC Corporation. All rights reserved.
EMC Greenplum Data Computing Appliance. ¿Por qué?
• La máquina más potente del mercado – Más de 10 TB por hora (load)– Más de 24 GB por segundo (query)
• Mejor aproximación a una nube privada, con infraestructura de DW y analítica virtualizada
DATA IN. DECISIONS OUT.Ofreciendo la carga de datos más rápida y el ratio precio/rendimiento más efectivo de la industria del DW
24© Copyright 2010 EMC Corporation. All rights reserved.
GRACIAS