Post on 03-Mar-2015
transcript
Microsoft Sql Server 2000 Analysis Services
Ruben Alonso Cebrianralonso@informatica64.com
Código: HOL-SQL05
Agenda– Introducción a Data Warehousing y sistemas OLAP– Características de un Data Warehouse– Componentes de un sistema de almacén de datos– Bases de datos OLAP– Diseño de un almacén de datos– Plataforma de Microsoft de BI– Instalación– Elementos de una base de datos OLAP de Microsoft SQL Server 2000– Orígenes de datos– Cubos– Gestión de Cubos en Análisis Manager– Dimensiones– Asistente para dimensiones– Modos de almacenamiento– Almacenamiento y agregado de datos– Examinar Datos– Asistentes del gestor de análisis de Sql Server 2000– Arquitectura de los servicios de análisis– Introducción a Datamining– Microsoft Excel Add-in para Sql Server Analysis Services– Microsoft Office Business Scorecards Accelerator
Introducción a Datawarehouse
Datos brutos frente a información de negocio
Captura de datos en brutoDerivando la información de negocio de los datos en brutoDevolución de datos en información valiosa
Sistema de Soporte de Decisiones
Proceso en tiempo real de transacciones del negocioContienen estructuras de datos optimizados para ediciónProvee de capacidades de soporte de decisión limitado
Sistemas de fuentes de datos OLTPSistema
transaccional de negocio
Características
• Proveen de datos para el proceso de análisis del negocio• Integran datos desde sistemas de fuentes de datos heterogéneos• Combinan datos validados frente a las reglas de negocio• Organiza información no volátil• Los datos se almacenan en estructuras que son optimizadas para extracción y consulta.
Características de un Datawarehouse
Característica de base de datos
Base de datos OLTP Base de datos OLAP
Orientación del sistema Ejecución y procesamiento de transacciones diarias Generación de información estratégica e histórica
Usuarios Oficinistas, contadores, personal informático, clientes, jefes de departamentos operativos
Gerentes, ejecutivos, juntas directivas, analistas de información.
Tipo de diseño de base de datos Modelo de datos entidad-relación y/o sistemas de base de datos orientados a aplicaciones OLTP
Base de datos multidimensionales, esquemas relacionales del tipo estrella, con objetivos estratégicos en la información
Nivel de detalle de los datos Se almacenan con el mayor detalle ya que se trata de las transacciones específicas
Datos agregados en distintos niveles, no interesa el detalle sino el resumen de los datos
Características del Hardware y configuración
Servidores de pequeños a medianos, sistemas de alta redundancia, configurados para tener recuperaciones ante fallos y optimizados para realizar transacciones puntuales en línea y con multitud de usuarios
Servidores de grandes a gigantes, optimizados para almacenar grandes volúmenes de datos y responder a consultas complejas que involucran mucha información y con pocos usuarios
Operaciones normales Mucha lectura y escritura: actualizaciones, inserciones, sistemas de seguridad con alta redundancia, consultas.
Básicamente, lectura de los datos: consultas complejas de los usuarios
Volúmenes de datos La información es siempre la actual, el volumen de datos no responde a la cantidad de transacciones que se almacenen. De 100 MB a 1 o 2 GB.
Se almacena información histórica, creciendo los Datawarehouse constantemente. Los volúmenes se miden en Gigabytes a Terabytes.
Componentes de un sistema de almacén de datos
Acceso a los datos por parte de los usuarios
Orígenes de datos (Data source)
Área de preparación de datos (Staging area)
Almacén de datos (Data Warehouse)
Componentes de un sistema de almacén de datos
Almacén de datos
Acceso a datos
Acceso a datosde usuariosOrigenes de
datos
Entrada de datos
Área depreparación
Centro departamental
Componentes de un sistema de almacén de datos
Herramientas de análisis y reporting
ERP
CRM ETL ETL
OLTP Área intermedia Área presentación Acceso a datos
Aplicación 1
Aplicación 2
Aplicación N
DataWarehouse
Cubos
Analysis Services
DTS herramienta ETL
• Conjunto de servicios para extracción, transformación y carga (herramienta ETL)• Modelo de objetos e interfaces gráficos• Pueden ser utilizados desde entornos de desarrollo que soporten COM• Incluyen asistentes que facilitan las tareas• Diseñador de paquetes• Permiten operar con los datos:
– Importación– Exportación– Transporte– Transformación
• Los datos pueden proceder de:– Cualquier fuente Ole Db– Cualquier fuente ODBC– Ficheros planos
El diseñador de paquetes
Diseñador de paquetes
• Conexiones
Proveedor OLE DB para SQL Server
Data Link
Controlador ODBC para Oracle (MS)
dBase 5
Microsoft Access
Archivo HTML (origen)
Microsoft Excel
Paradox 5.xArchivo de texto (origen)
Archivo de texto (destino)
Otras conexiones
Diseñador de paquetes
• Tareas
Transformar datos
Consulta controlada por datos
Inserción masiva
Ejecutar SQL
Copia de objetos de SQL Server
Transferencia de base de datos
Transferencia de mensajes de error
Transferencia de Inicios de sesión
Transferencia de trabajos
Transferencia de proced. almacenados
Diseñador de paquetes
• Tareas
Secuencia de comandos ActiveX
Propiedades dinámicas
Ejecutar paquete
Ejecutar proceso (.exe o .bat)
FTP
Cola de mensajes
Enviar correo
Procesar Analysis Services
Extracción de datos (consultas de predicción)
Bases de datos OLAP
Características:
1º- Tienen un esquema optimizado para la ejecución de consultas de usuario rápidas
2º- Poseen un robusto motor de cálculo para la realización de análisis numérico
3º- Es un modelo conceptual e intuitivo de datos, que no necesita de complejos desarrollos de aplicaciones de informes
4º- Proporciona una visión multidimensional de los datos, permitiendo una visión de los datos flexible, análisis y navegación
Diseño de un almacén de datos
Esquema de estrella
Componentes de la tabla de hecho
•Tabla de hecho
•Tabla de dimensiones
• Medidas
• Claves secundarias
Granularidad de tabla de hecho
• Nivel más bajo de detalle almacenado en cada una de las dimensiones asociadas con la tabla de hecho
Diseño de un almacén de datos
Tabla de hechos
Tabla de dimensiones
Employee_DimEmployee_DimEmployee_DimEmployee_Dim
EmployeeKeyEmployeeKey
EmployeeID...EmployeeID...
Time_DimTime_DimTime_DimTime_Dim
TimeKeyTimeKey
TheDate...TheDate...
Product_DimProduct_DimProduct_DimProduct_Dim
ProductKeyProductKey
ProductID...ProductID...
Customer_DimCustomer_DimCustomer_DimCustomer_Dim
CustomerKeyCustomerKey
CustomerID...CustomerID...
Shipper_DimShipper_DimShipper_DimShipper_Dim
ShipperKeyShipperKey
ShipperID...ShipperID...
Sales_FactSales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey
TimeKeyEmployeeKeyProductKeyCustomerKeyShipperKey
Sales AmountUnit Sales ...Sales AmountUnit Sales ...
Esquema de estrella
Diseño de un almacén de datos
Esquema de estrella
Diseño de un almacén de datos
Esquema de copo de nieve
Plataforma de Microsoft de Business Intelligence
Gestión de Proyectos
Análisis de Sitios Web
Análisis de ventas al por menor y finanzas
Visualización
Colaboración Análisis de datos
Análisis Geoespacial
Instalación
Instalación
Instalación
Elementos de una base de datos OLAP Sql Server 2000
Conjunto de información almacenada. Sql Server 2000 gestiona conexiones a diversos orígenes de datos. Algunos de los proveedores disponibles son Microsoft Jet, Sql Server, Oracle, ODBC , etc.
Orígenes de datos
Atributo estructural del cubo conformada por jerarquías de categorías y niveles que describen los datos de la tabla de hechos. Los niveles están conformados por conjuntos similares de miembros.
Dimensiones
Conjunto de datos que normalmente se construye a partir de un subconjunto de un almacén de datos y se organiza y resume en una estructura multidimensional definida por un conjunto de dimensiones y medidas
Cubos
Permiten analizar los datos para encontrar patrones y realizar predicciones a partir de esos patrones
Modelos de Minería de datos
Definen a los grupos o usuarios que van a poder acceder a los datos y realizar consultas sobre los mismos
Funciones de base de datos
Orígenes de datos
Cubos
• Tabla de Hechos– Claves externas– Medidas
• Dimensiones
Producto
Id
Nombre
Tamaño
…
Cliente
Id
Nombre
Provincia
…
Tiempo
Fecha
Año
Mes
Día
Tabla deTabla de
HechosHechos
1998
2000
1999 Barcelon
a Madrid
Sevilla
Producto 1
Producto 2
Producto 3
Estructura de datos multidimensional que se define mediante un conjunto de dimensiones y medidas.
Un cubo es la unidad fundamental de almacenamiento y análisis de las bases de datos multidimensionales, y se define o compone mediante dimensiones y medidas.
Gestión de Cubos en Analysis Manager
Gestión de Cubos en Analysis Manager
Asistente
Tabla de hechos
Medidas
Dimensiones
Recuento
Fin del asistente
Editor de cubos
Dimensiones• Agregaciones
– Son sumas precalculadas de los datos para acelerar el tiempo de respuesta• Jerarquías y niveles• Miembros• Dimensiones virtuales
Dimensiones lógicas creadas a partir de las
propiedades de dimensiones físicas
Miembros y propiedades
Miembros y propiedades
Dimensión virtual
Dimensión virtual
Dimensión virtual
Medidas y Miembros calculados
• Medidas– Conjunto de valores de una columna de la tabla de hechos del cubo
• Miembros calculados– Medidas calculadas mediante una fórmula MDX
Miembros calculados
Miembros calculados
Asistente para dimensiones
Modos de almacenamientoTres modos de almacenamiento:
Multidimensional OLAP (MOLAP)
Relacional OLAP (ROLAP)
Híbrido OLAP (HOLAP)
Almacenamiento y agregado de datos
Almacenamiento y agregado de datos
Almacenamiento y agregado de datos
Almacenamiento y agregado de datos
Examinar datos
Modelos de minería de datos
• Uso de métodos automatizados para obtener tendencias y pautas a partir de los datos del DW
• Se componen de– Escenarios (entidades a analizar)
• Ej: un cliente y sus ventas– Atributos (información sobre los escenarios)
• Ej: edad, número de hijos, total ventas, …• Una vez elegidos los escenarios y atributos, procesamos el modelo
• En Analysis Services disponemos de dos proveedores, diseñados para obtener agrupaciones eficazmente
– Microsoft Decision Trees• Árbol de clasificación, con diversas
ramificaciones– Microsoft Cluster
• Agrupación de escenarios
Modelos de minería de datos
Modelos de minería de datos
Modelos de minería de datos
Modelos de minería de datos
Modelos de minería de datos
Funciones de base de datos
Funciones de base de datos
Herramientas cliente OLAP
• SQL Server 2000 Reporting Services
• Microsoft Excel
• Microsoft Data Analyzer
• Herramientas desarrolladas– AddIn para Excel– Aplicaciones asp o asp.net– Webparts para Sharepoint
• Herramientas de terceros
Microsoft Excel Add-in para SQL Server Analysis Services
Definición:Definición:
Herramienta de inteligencia empresarial que permite a los empleados usar Microsoft Office Excel para tener acceso a información relevante y crear rápidamente informes personalizados
Características:Características:
• Administrador de metadatos del cubo: Recupera y comparte la información del cubo OLAP
• Administrador de consultas: Consolida y ejecuta consultas, devuelve los resultados y realiza reescritura en los cubos
• Interfaz de usuario del generador de informes: Interfaz tipo “Panel de tareas” usada para generar informes y establecer conexiones con orígenes de datos
• Administrador de metadatos de informes: Mantiene el diseño del informe y permite interacciones con el informe, como enfocar, eliminar, ampliar o contraer, y realizar una obtención de detalles ascendente o descendente.
• Administrador de informes: Crea y administra fórmulas y presenta los resultados de las consultas en celdas de Excel
Microsoft Excel Add-in para SQL Server Analysis Services
• Permite a los usuarios tener acceso y analizar datos de varios cubos de Analysis Services.• Crear informes detallados personalizados directamente en Microsoft Office Excel 2003 o Microsoft Excel 2002• Mejorar el análisis de datos así como acortar los ciclos de informes y mejorar la capacidad de su compañía para responder a sus clientes• Visibilidad en Excel de las tendencias del negocio• Mayor velocidad y calidad en el proceso de toma de decisiones• Análisis de datos funcional que acorta los ciclos de elaboración de informes y ahorra recursos• Mayor flexibilidad con informes detallados, actualizables y muy personalizados• Acceso a información relevante de diversos orígenes de datos
Microsoft Excel Add-in para SQL Server Analysis Services
Microsoft Excel Add-in para SQL Server Analysis Services
Microsoft Excel Add-in para SQL Server Analysis Services
Microsoft Office Business Scorecards Accelerator
Definición: Sistema de inteligencia empresarial consistente en una aplicación basada en Web que permite a una compañía:
• Simplificar la medición y administración de métricas de desempeño clave.• Definir, visualizar y administrar indicadores de rendimiento y estrategias de toda la organización.• Mayor rapidez, calidad y relevancia de la toma de decisiones.• Mayor capacidad de medir, controlar y administrar el rendimiento empresarial.
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Microsoft Office Business Scorecards Accelerator
Próximas Acciones
• 17/09/2005. HOL – Windows Server 2003. IPSec• 18/09/2005. Evento – Windows Update Services• 20/10/2005. Contramedidas Hacker.• 21/10/2005: Gira Seguridad Technet.• 17/09/2005. HOL – Windows Server 2003. IPSec• 18/09/2005. Evento – Windows Update Services• 20/10/2005. Contramedidas Hacker.• 21/10/2005: Gira Seguridad Technet.• 20/10/2005. Contramedidas Hacker.• 21/10/2005: Gira Seguridad Technet.
Boletín quincenal TechNews
Contactos
• Informática 64– http://www.informatica64.com– i64@informatica64.com– +34 91 665 99 98
• Profesor– ralonso@informatica64.com