Sfd 2013 pentaho

Post on 05-Dec-2014

1,000 views 0 download

description

 

transcript

DB OPEN SOURCE Y PENTAHO

Rolando Herrera Matos

rolando.herrera@apesol.org.pe@rollyherrera

QUE ES UN SGDB ?

Un Sistema de Gestión de Bases de Datos (SGBD) es un conjunto de programas que permiten el almacenamiento, modificación y extracción de la información en una base de datos, además de proporcionar herramientas para añadir, borrar, modificar y analizar los datos.

Componentes SGDB

¿LIBRE O PRIVATIVO?

LIBRE

PRINCIPALES BASE DE DATOS LIBRES

MYSQL: (GPL)

http://www.mysql.com/

PRINCIPALES BASE DE DATOS LIBRES

POSTREGRESQL: (BSD)

http://www.postgresql.org/

MongoDB : Es una base de datos Open Source de gran rendimiento, escalable, schema-free (NOSQL) y orientada a documentos (esquemas de datos tipo JSON). Hay drivers preparados para usar esta base de datos desde lenguajes como PHP, Python, Perl, Ruby, JavaScript, C++ y muchos más.

http://www.mongodb.org/

HyperTable (GPL) : Es un sistema de almacenamiento distribuido de datos de alto rendimiento diseñado para soportar aplicaciones que requieran máximo rendimiento, escalabilidad y eficiencia. Se ha diseñado y modelado a partir del proyecto BigTable de Google y se enfoca sobre todo a conjuntos de datos de gran escala.

http://hypertable.org/

APACHE COUCH DB (Apache License, Version 2.0) : Este proyecto está destinado a ofrecer una base de datos orientada a documentos que se pueden consultar o indexar en modo MapReduce usando JavaScript. CouchDB ofrece una API JSON RESTful a la que se puede acceder desde cualquier entorno que soporte peticiones HTTP.

http://couchdb.apache.org/

NEO4J (GPL) : Es un motor de persistencia completamente transaccional en Java que almacena los datos mediante grafos, y no mediante tablas. Neo4j ofrece una escalabilidad masiva. Puede manejar grafos de varios miles de millones de nodos/relaciones/propiedades en una única máquina, y se puede escalar a lo largo de múltiples máquinas.

http://www.neo4j.org/

RIAK (Apache License, Version 2.0) : Riak es una base de datos ideal para aplicaciones web y combina:

Un manejo de key descentralizado Un motor map/reduce flexible Una interfaz de consultas HTTP/JSON amigable.

http://docs.basho.com/riak/latest//

ORACLE BERKELY DB (Open Source OSI) :Bases de datos embebidas que proporciona a los desarrolladores persistencia local, rápida y eficiente con una administración nula. Oracle Berkeley DB se enlaza a nuestras aplicaciones y permite realizar llamadas simples a funciones en lugar de enviar mensajes a un servidor remoto para mejorar el rendimiento..

http://www.oracle.com/technetwork/products/berkeleydb/overview/index.html/

Apache CASSANDRA (Apache License, Version 2.0) :Cassandra es probablemente uno de los proyectos NoSQL más concoidos del mercado. Se trata de una base de datos distribuida de segunda generación con alta escalabilidad que está siendo usada por gigantes como Facebook (que es quien la ha desarrollado), Digg, Twitter, Cisco y más empresas.

http://cassandra.apache.org/

MenCached (GPL) :es un almacen del tipo in-memory key-value para pequeñas cadenas de datos arbitrarios (textos, objetos) de resultados de llamadas a base de datos, llamadas a API, o renderizado de páginas. Está orientado a acelerar aplicaciones web dinámicas al aliviar la carga de la base de datos.

http://memcached.org/

FIREBIRD (MPL) :Firebird es una base de datos relacional que puede ser utilizada en Linux, Windows y varias plataformas UNIX, y ofrece un alto rendimiento y potente soporte de lenguajes para procedimientos almacenados y triggers.

http://www.firebirdsql.org/

MariaDB (GPL) MariaDB es una rama compatible hacia atrás de MySQL® Database Server. Incluye soporte para la mayoría de los motores de almacenamiento Open Source, y además para el propio motor de almacenamiento Maria.

https://mariadb.com/

Drizzle (BSD-GPL): Es un fork de MySQL que se centra en ser una base de datos eficiente y estable, sobre todo optimizada para aplicaciones de Internet y que siguen la filosofía Cloud Computing.

https://launchpad.net/drizzle

hyperSql (BSD): Es un motor de bases de datos relacionales SQL escrito en Java. HyperSQL ofrece un pequeño pero veloz motor de bases de datos que dispone de tablas in-memory y basadas en disco, y que soporta los modos embebido y servidor. Además, dispone de herramientas como una consola de comandos SQL y una interfaz gráfica para las consultas.

http://hsqldb.org/

MonetDB (BSD): MonetDB es un sistema de bases de datos para aplicaciones de alto rendimiento dirigidas a la minería de datos, OAP, GIS, búsquedas XML, y recolección de información a partir de ficheros de texto y multimedia.

http://www.monetdb.org/Legal/MonetDBLicense

BUSSINES INTELLIGENCE CON PENTAHO

BUSSINES INTELLIGENCE

Conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.

PROCESOS BUSSINES INTELLIGENCE

PENTAHO• Es la unión de varios proyectos libres relacionados con BI• Reportes, dashboards, procesos ETL, cubos, data mining• Proporciona una plataforma Web • Basado en Java J2EE• Servidor Web Jboss o Tomcat• Sorporta MS-SQL, Oracle, PostqreSQL, MySQL• Windows XP, Windows 2003, Linux• Versión libre y versión Enterprise

PROCESOS BUSSINES INTELLIGENCE

PENTAHOEs la unión de varios proyectos libres relacionados con BIReportes, dashboards, procesos ETL, cubos, data miningProporciona una plataforma Web Basado en Java J2EEServidor Web Jboss o TomcatSorporta MS-SQL, Oracle, PostqreSQL, MySQLWindows XP, Windows 2003, LinuxVersión libre y versión Enterprise

PENTAHOPentaho cuenta con:Jfree Report: Motor para reportesMondrian: Motor para cubosWeka: Motor para minería de datosPlataforma Web para publicar y visualizar la información

Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes funciones:Para generar reportes: Report DesignerPara generar cubos: Cube designer, WorkBench.Para minería de datos: WekaPara generar procesos ETL: Kettle (Spoon/Pan)

PENTAHO

KETTLE (SPOON)

JFREE REPORT

MONDRIAN

WEKA

PLATAFORMA WEB

SISTEMAS OLAP

MS-SQL

ORACLE

MYSQL

EXCEL

PENTAHOPentaho cuenta con:Jfree Report: Motor para reportesMondrian: Motor para cubosWeka: Motor para minería de datosPlataforma Web para publicar y visualizar la información

Pentaho cuenta con herramientas “separadas” para llevar a cabo las siguientes funciones:Para generar reportes: Report DesignerPara generar cubos: Cube designer, WorkBench.Para minería de datos: WekaPara generar procesos ETL: Kettle (Spoon/Pan)

PENTAHO

PENTAHO

PENTAHO

PENTAHO

PENTAHO

PENTAHO

PENTAHO

¿PREGUNTAS ?

GRACIAS

rolando.herrera@apesol.org.perherrera@bladecode.com

@rollyherrera