+ All Categories
Home > Documents > Pentaho data integration

Pentaho data integration

Date post: 19-Jun-2015
Category:
Upload: pedro-neto
View: 3,076 times
Download: 2 times
Share this document with a friend
Description:
Palestra realizada na Universidade Tiradentes.
Popular Tags:
25
© 2009, Pentaho. All Rights Reserved. Pentaho Data Integration Pedro José
Transcript
Page 1: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Pentaho Data Integration

Pedro José

Page 2: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Quem sou

Pedro José

Técnico em desenvolvimento de sistemas

Graduando em ciências da computação

Sócio da empresa Moobi

Programador do Tribunal de Justiça

Page 3: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Roteiro

O que é ETL?

Algumas ferramentas para ETL

Por que usar o pentaho?

Um pouco mais sobre o pentaho

Desmistificando o pentaho data integration

Interface gráfica

Demonstração

Problemas?

Page 4: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

O que é ETL?

“Extração, transformação e carga(ETL), é o núcleo do processo de

integração de dados. É tipicamente associado com data warehousing.”

Page 5: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Ferramentas de ETL

Integration services(Microsoft)

Talend

Oracle warehouse builder

DataStage (IBM)

Pentaho Data Integration

Programador/DBA

Page 6: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Por que usar o PDI?

Alternativa livre

Multiplataforma

Pequena curva de aprendizado

Extensível

Integrada com diversas outras ferramentas do mercado

Access

Excel

LDAP

SAP

Salesforce

Json, Yaml, RSS, etc...

Page 7: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Por que comecei a usar o PDI?

Treinamento

Suíte Pentaho

Dores de cabeça de todo programador

Migração entre servidores

Migração entre diferentes versões de sistema

Rotinas de carga em bases de dados

Page 8: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Um pouco mais sobre o PDI

Inicialmente chamado de Kettle(Kettle Tranformation Transportation

Loading Environment)

Criada em 2001 a partir da frustação com outras ferramentas de ETL,

com foco na facilidade de utilização e na facilidade de manutenção

Em 2005 tornou-se open source ganhando colaboradores

Adquirida pela Pentaho em 2006

“Boom” em 2007. Adição de novos recursos, suporte a processamento

paralelo e diversos outros recursos para programadores

Page 9: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Componentes do PDI

Spoon – interface gráfica para criação de tranformations e jobs

Pan – ferramenta de linha de comando para execução de

tranformations

Kitchen – ferramenta de linha de comando para execução de jobs

Carte – servidor web para execução remota de tranformations e jobs

Page 10: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Instalação

Instale o Java Runtime Environment(JRE) versão 5.0 ou superior

http://www.java.com/pt_BR/download/

Faça o download da versão comunitária do PDI

http://sourceforge.net/projects/pentaho/files/Data%20Integration/

Descompacte o arquivo do PDI

Execute o Spoon

caso windows => spoon.bat

caso linux => spoon.sh

OBS: Alguns bancos de dados não possuem seus respectivos drivers no

pacote básico. Caso queria adicionar um driver que esteja faltando ou

substituir um existente, acesse a pasta “libext\JDBC”

Page 11: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Conceitos básicos

Tranformations - Sequência lógica de passos para realizar alguma

tranformação.

Page 12: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Conceitos básicos

Jobs - Forma de chamar e controlar a execução de uma sequência de

tranformations. Geralmente, jobs são agendados e executados em lote

de forma automática.

Page 13: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Conceitos básicos

Repositórios

Local onde as informações sobre as tranformations/jobs ficarão armazenadas.

Steps

Corresponde a um passo de uma determinada transformação. Este passo poderá ser a criação, leitura, escrita ou manipulação de alguma informação. Uma transformation é composta de um ou mais steps.

Page 14: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Tipos de step (Tranformation)

Input – entrada de dados

Output – saída de dados

Tranform – transformações nos

dados

Flow – fluxo da informações

Utility – utilitários

Scripting – execução de scripts

Lookup – consulta de dados

Joins – junções entre fontes

Validation – validação

Data warehouse – armazém de

dados

Page 15: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - INPUT

Input

Access input

CSV input

Excel input

Generate random values

Generate rows

Json input

LDAP input

RSS input

Table input

Page 16: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - OUTPUT

Output

Access output

Delete

Excel output

Json output

LDAP output

RSS output

Table output

SQL output

XML output

Page 17: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - TRANSFORM

•Tranform

Add constants

Replace in string

Unique rows

Value mapper

Split fields

Add sequence

Strings cut

Calculator

Page 18: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - UTILITY

Utility

Change file encoding

Run SSH commands

Write to log

Execute a process

Send message to syslog

Mail

Page 19: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - FLOW

Flow

Blocking step

Filter rows

Abort

Dummy (do nothing)

Java filter

Switch / case

Page 20: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - SCRIPTING

Scripting

Execute SQL script

Execute row SQL script

Modified Java script value

Regex Evaluation

User defined Java class

Page 21: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - LOOKUP

Lookup

Web services lookup

Check if ws is available

Call DB procedure

Database join

Database lookup

Table exists

File exists

HTTP Post

Page 22: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Interface gráfica / Demonstrações

Page 23: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Links e livros

Site da comunidade [ http://kettle.pentaho.org/ ]

Fórum [ http://forums.pentaho.org/forumdisplay.php?f=69 ]

Mais informação [ http://pentahobrasil.blogspot.com ]

Mais informação [ http://blog.professorcoruja.com/ ]

Page 24: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Problemas?

Page 25: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Dúvidas

Pedro José <[email protected]>


Recommended