+ All Categories
Home > Documents > Base de Datos Distribuidas

Base de Datos Distribuidas

Date post: 25-Oct-2015
Category:
Upload: marvin-mba
View: 49 times
Download: 7 times
Share this document with a friend
Popular Tags:
23
BASE DE DATOS BASE DE DATOS DISTRIBUIDAS DISTRIBUIDAS
Transcript

BASE DE DATOS BASE DE DATOS DISTRIBUIDASDISTRIBUIDAS

OBJETIVOS.-OBJETIVOS.-

Conocer las Bases de Datos Conocer las Bases de Datos Distribuidas y sus diferentes Distribuidas y sus diferentes aplicacionesaplicaciones

Relacionar las Bases de Datos Relacionar las Bases de Datos distribuidas con las diferentes distribuidas con las diferentes arquitecturas de redesarquitecturas de redes

IntroducciónIntroducción Una Base de Datos Distribuida es, una base de Una Base de Datos Distribuida es, una base de

datos construida sobre una red computacional. datos construida sobre una red computacional. La información que constituye la base de datos La información que constituye la base de datos

esta almacenada en diferentes sitios en la red.esta almacenada en diferentes sitios en la red.

IntroducciónIntroducción Un sistema de base de datos distribuidas se compone de un Un sistema de base de datos distribuidas se compone de un

conjunto de sitios, conectados entre sí mediante algún tipo conjunto de sitios, conectados entre sí mediante algún tipo de red de comunicaciones, en el cual:de red de comunicaciones, en el cual:– Cada sitio es un sistema de base de datos en sí mismo.Cada sitio es un sistema de base de datos en sí mismo.– Los sitios han convenido en trabajar juntos (si es necesario) Los sitios han convenido en trabajar juntos (si es necesario)

con el fin de que un usuario de cualquier sitio pueda obtener con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red , tal como si acceso a los datos de cualquier punto de la red , tal como si todos los datos estuvieran almacenados en el sitio propio del todos los datos estuvieran almacenados en el sitio propio del usuario.usuario.

IntroducciónIntroducción En otras palabras, cada sitio tiene sus propias bases de En otras palabras, cada sitio tiene sus propias bases de

datos "reales" locales, sus propios usuarios locales, sus datos "reales" locales, sus propios usuarios locales, sus propios DBMS y programas para la administración de propios DBMS y programas para la administración de transacciones (incluyendo programas de bloqueo, transacciones (incluyendo programas de bloqueo, bitácoras, recuperación, etc.), y su propio administrador bitácoras, recuperación, etc.), y su propio administrador local de comunicación de datos (administrador DC). local de comunicación de datos (administrador DC).

IntroducciónIntroducción El sistema de administración de Base de Datos Distribuida El sistema de administración de Base de Datos Distribuida

(DDBMS), esta formado por las transacciones y los (DDBMS), esta formado por las transacciones y los administradores de base de datos distribuidos de todas las administradores de base de datos distribuidos de todas las computadoras. Tal DDBMS en un esquema genérico implica computadoras. Tal DDBMS en un esquema genérico implica un conjunto de programas que operan en diversas un conjunto de programas que operan en diversas computadoras computadoras

Un Un administrador de transacciones distribuidasadministrador de transacciones distribuidas (DTM) es un (DTM) es un programa que recibe so- licitudes de procesamiento de los programa que recibe so- licitudes de procesamiento de los programas de consulta o de transacciones ya su vez las traduce en programas de consulta o de transacciones ya su vez las traduce en acciones para los administradores de la base de datos. Una función acciones para los administradores de la base de datos. Una función importante del DTM es coordinar y controlar dichas acciones. importante del DTM es coordinar y controlar dichas acciones.

Un Un administrador de la base de datosadministrador de la base de datos (DBM) es un programa (DBM) es un programa que procesa cierta porción de la base de datos distribuida, como es que procesa cierta porción de la base de datos distribuida, como es el hecho de recuperar y actualizar datos del usuario y generales, de el hecho de recuperar y actualizar datos del usuario y generales, de acuerdo con comandos de acción recibidos de los DTM. acuerdo con comandos de acción recibidos de los DTM.

Definición de Base de Datos Definición de Base de Datos DistribuidaDistribuida

Una Base de Datos Distribuida (BDD) es un Una Base de Datos Distribuida (BDD) es un conjunto de múltiples bases de datos lógicamente conjunto de múltiples bases de datos lógicamente relacionadas que se encuentran distribuidas entre relacionadas que se encuentran distribuidas entre diferentes sitios interconectados por una red de diferentes sitios interconectados por una red de comunicaciones, los cuales tienen la capacidad comunicaciones, los cuales tienen la capacidad de procesamiento autónomo lo cual indica que de procesamiento autónomo lo cual indica que puede realizar operaciones locales o distribuidaspuede realizar operaciones locales o distribuidas

Características de las Base Características de las Base de Datos Distribuidas.de Datos Distribuidas.

Autonomía Local:Autonomía Local: Los sitios distribuido deben ser Los sitios distribuido deben ser autónomos, es decir que todas las operaciones en un sitio autónomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio. dado se controlan en ese sitio.

No dependencia de un sitio centralNo dependencia de un sitio central:: No debe de haber No debe de haber dependencia de un sitio central para obtener un servicio. dependencia de un sitio central para obtener un servicio.

Operación Continua:Operación Continua: Nunca debería apagarse para que se Nunca debería apagarse para que se pueda realizar alguna función, como añadir un nuevo sitio. pueda realizar alguna función, como añadir un nuevo sitio.

Características de las Base Características de las Base de Datos Distribuidas.de Datos Distribuidas.

Independencia con respecto a la localización:Independencia con respecto a la localización: No debe de ser necesario que los No debe de ser necesario que los usuarios sepan dónde están almacenados físicamente los datos, sino que más bien usuarios sepan dónde están almacenados físicamente los datos, sino que más bien el usuario debe ver como si solo existiera un sitio local el usuario debe ver como si solo existiera un sitio local

Independencia con respecto a la fragmentación:Independencia con respecto a la fragmentación: La fragmentación es deseable La fragmentación es deseable por razones de desempeño, los datos, pueden almacenarse en la localidad donde se por razones de desempeño, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean sólo locales y se reduzca el tráfico en la red. sólo locales y se reduzca el tráfico en la red.

Independencia de réplica:Independencia de réplica: Si una relación dada (es decir, un fragmento dado de Si una relación dada (es decir, un fragmento dado de una relación) se puede presentar en el nivel físico mediante varias copias una relación) se puede presentar en el nivel físico mediante varias copias almacenadas o réplicas, en muchos sitios distintos. almacenadas o réplicas, en muchos sitios distintos.

Características de las Base Características de las Base de Datos Distribuidas.de Datos Distribuidas.

Procesamiento Distribuido de ConsultasProcesamiento Distribuido de Consultas: El objetivo es convertir : El objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos, y así transacciones de usuario en instrucciones para manipulación de datos, y así reducir el tráfico en la red implica que el proceso mismo de optimización de reducir el tráfico en la red implica que el proceso mismo de optimización de consultas debe ser distribuido. consultas debe ser distribuido.

Manejo Distribuido de Transacciones:Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el Tiene dos aspectos principales, el control de recuperación y el control de concurrencia, cada uno de los cuales control de recuperación y el control de concurrencia, cada uno de los cuales requiere un tratamiento más amplio en el ambiente distribuido. requiere un tratamiento más amplio en el ambiente distribuido.

Independencia con respecto al equipoIndependencia con respecto al equipo Independencia con respecto al Sistema OperativoIndependencia con respecto al Sistema Operativo

Alternativas de Alternativas de Procesamiento de Base de Procesamiento de Base de

Datos Multiusuario.Datos Multiusuario. Una responsabilidad importante para un Una responsabilidad importante para un

administrador de base de datos es la administrador de base de datos es la confiabilidad de la misma, es decir, confiabilidad de la misma, es decir, asegurar que los programas y asegurar que los programas y procedimientos proporcionen la procedimientos proporcionen la confiabilidad de los datos a pesar de malas confiabilidad de los datos a pesar de malas operaciones del equipo, errores de operaciones del equipo, errores de programas y errores humanos. programas y errores humanos.

Sobresalen dos aspectos en los que hay que Sobresalen dos aspectos en los que hay que poner especial atención para lograr aportar poner especial atención para lograr aportar confiabilidad a una base de datos en un confiabilidad a una base de datos en un ambiente multiusuario: ambiente multiusuario:

Control del procesamiento Control del procesamiento concurrenteconcurrente

Se conoce como procesamiento concurrente al Se conoce como procesamiento concurrente al procesamiento que se realiza cuando dos o más procesamiento que se realiza cuando dos o más transacciones están interconectadas, lo que ocurre transacciones están interconectadas, lo que ocurre con más frecuencia en un ambiente multiusuario con más frecuencia en un ambiente multiusuario

Bloqueo de recursosBloqueo de recursos Los bloqueos pueden colocarse, ya sea de manera Los bloqueos pueden colocarse, ya sea de manera

automática por el DBMS o por medio de un comando automática por el DBMS o por medio de un comando emitido al DBMS partiendo del programa de aplicación o del emitido al DBMS partiendo del programa de aplicación o del usuario de la consulta usuario de la consulta

Los bloqueos pueden ser aplicados a distintos niveles: Los bloqueos pueden ser aplicados a distintos niveles: registro, página, tabla o base de datos. registro, página, tabla o base de datos.

Recursos CompartidosRecursos Compartidos

Compartir HardwareCompartir Hardware– Discos, Discos, – Printers, Printers, – Justificación: CostosJustificación: Costos

Compartir Objetos SoftwareCompartir Objetos Software– ArchivosArchivos– Base de DatosBase de Datos– ProcesosProcesos– Justificación: requerimiento esencial para Justificación: requerimiento esencial para

desarrollo y aplicaciones .Manejador de desarrollo y aplicaciones .Manejador de recursos. Conjunto de recursos distintos.recursos. Conjunto de recursos distintos.

Procesamiento de Base de Procesamiento de Base de Datos DistribuidosDatos Distribuidos

VENTAJAS DEL PROCESAMIENTO VENTAJAS DEL PROCESAMIENTO DISTRIBUIDO.-DISTRIBUIDO.-– La primera, puede dar como resultado un mejor La primera, puede dar como resultado un mejor

rendimiento que el que se obtiene por un rendimiento que el que se obtiene por un procesamiento centralizadoprocesamiento centralizado

– Segundo,Segundo, los datos duplicados aumentan su confiabilidad. los datos duplicados aumentan su confiabilidad. Cuando falla una computadora, se pueden obtener los Cuando falla una computadora, se pueden obtener los datos extraídos de otras computadoras datos extraídos de otras computadoras

– Una terceraUna tercera ventaja es que los sistemas distribuidos ventaja es que los sistemas distribuidos pueden variar su tamaño de un modo más sencillo. Se pueden variar su tamaño de un modo más sencillo. Se pueden agregar computadoras adicionales a la red pueden agregar computadoras adicionales a la red conforme aumentan el número de usuarios y su carga de conforme aumentan el número de usuarios y su carga de procesamiento procesamiento

– Por último,Por último, los sistemas distribuidos se pueden adecuar los sistemas distribuidos se pueden adecuar de una manera más sencilla a las estructuras de la de una manera más sencilla a las estructuras de la organización de los usuarios. organización de los usuarios.

Procesamiento de Base de Procesamiento de Base de Datos DistribuidosDatos Distribuidos

DESVENTAJAS DEL PROCESAMIENTO DESVENTAJAS DEL PROCESAMIENTO DISTRIBUIDODISTRIBUIDO– Las primeras dos desventajas de las bases de Las primeras dos desventajas de las bases de

datos distribuidas son las mismas que las dos datos distribuidas son las mismas que las dos primeras ventajas.primeras ventajas.

– Primero, el rendimiento puede ser peor para el Primero, el rendimiento puede ser peor para el procesamiento distribuido que para el procesamiento distribuido que para el procesamiento centralizado. Depende de la procesamiento centralizado. Depende de la naturaleza de la carga de trabajo, la red, el naturaleza de la carga de trabajo, la red, el DDBMS y las estrategias utilizadas de DDBMS y las estrategias utilizadas de concurrencia y de falla, así como las ventajas del concurrencia y de falla, así como las ventajas del acceso local a los datos y de los procesadores acceso local a los datos y de los procesadores múltiples, ya que éstos pueden ser abrumados por múltiples, ya que éstos pueden ser abrumados por las tareas de coordinación y de control requeridaslas tareas de coordinación y de control requeridas

– Segundo,Segundo, el procesamiento de base de datos distribuida el procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento puede resultar menos confiable que el procesamiento centralizado. De nuevo, depende de la confiabilidad de centralizado. De nuevo, depende de la confiabilidad de las computadoras de procesamiento, de la red, del las computadoras de procesamiento, de la red, del DDBMS, de las transacciones y de las tasas de error en DDBMS, de las transacciones y de las tasas de error en la carga de trabajo. la carga de trabajo.

Componentes de los Componentes de los sistemas de Base de Datos sistemas de Base de Datos

DistribuidosDistribuidos HardwareHardware .-El hardware que compone una base de datos distribuida se .-El hardware que compone una base de datos distribuida se

reduce a servidores y la red.reduce a servidores y la red. Software.-Software.-

– Sistema de Administración de Base de Datos Distribuida (DDBMS)Sistema de Administración de Base de Datos Distribuida (DDBMS)– Administrador de transacciones distribuidas (DTM)Administrador de transacciones distribuidas (DTM)– Administrador de la base de datos (DBM)Administrador de la base de datos (DBM)– Nodo o SitioNodo o Sitio

Cuatro Metas para un Cuatro Metas para un DBMS Distribuido. DBMS Distribuido. 

Las transacciones necesitan tener Las transacciones necesitan tener acceso a la base de datos vía un acceso a la base de datos vía un DDBMS que proporcione los cuatro DDBMS que proporcione los cuatro siguientes tipos de transparencia:siguientes tipos de transparencia:

Transparencia de LocalizaciónTransparencia de Localización Transparencia de Duplicación Transparencia de Duplicación Transparencia de ConcurrenciaTransparencia de Concurrencia Transparencia de FallaTransparencia de Falla

TRANSPARENCIA DE TRANSPARENCIA DE LOCALIZACIÓNLOCALIZACIÓN

Se puede conseguir la transparencia de localización si los Se puede conseguir la transparencia de localización si los administradores de transacciones distribuidas (los DTM en la administradores de transacciones distribuidas (los DTM en la Figura 1) son responsables de determinar la localización de los Figura 1) son responsables de determinar la localización de los datos y de emitir las acciones a los DBM apropiados, lo cual se datos y de emitir las acciones a los DBM apropiados, lo cual se puede llevar a cabo si los DTM poseen acceso a los directorios de puede llevar a cabo si los DTM poseen acceso a los directorios de las localizaciones de los datos. Si los datos se mueven, sólo el las localizaciones de los datos. Si los datos se mueven, sólo el DTM necesita involucrarse. Todas las transacciones quedan DTM necesita involucrarse. Todas las transacciones quedan aisladas de la modificación en la localización.aisladas de la modificación en la localización.

TRANSPARENCIA DE TRANSPARENCIA DE DUPLICACIÓNDUPLICACIÓN

Con la transparencia de duplicación, se pueden Con la transparencia de duplicación, se pueden crear nuevos duplicados, o los duplicados crear nuevos duplicados, o los duplicados existentes pueden ser eliminados, sin provocar existentes pueden ser eliminados, sin provocar efecto alguno sobre la transacción del usuario o efecto alguno sobre la transacción del usuario o el procesamiento de la consulta.el procesamiento de la consulta.

TRANSPARENCIA DE TRANSPARENCIA DE CONCURRENCIACONCURRENCIA

Aunque múltiples transacciones que involucran la base de Aunque múltiples transacciones que involucran la base de datos distribuida se lleven a cabo al mismo tiempo, los datos distribuida se lleven a cabo al mismo tiempo, los resultados de las transacciones no deberán afectarse. El resultados de las transacciones no deberán afectarse. El DDBMS proporciona transparencia de concurrencia si los DDBMS proporciona transparencia de concurrencia si los resultados de todas las transacciones concurrentes son resultados de todas las transacciones concurrentes son consistentes de manera lógica con los resultados que se consistentes de manera lógica con los resultados que se habrían obtenido si las transacciones se hubieran ejecutado habrían obtenido si las transacciones se hubieran ejecutado una por una, en algún orden serial arbitrario. una por una, en algún orden serial arbitrario.

TRANSPARENCIA DE TRANSPARENCIA DE FALLASFALLAS

La cuarta meta del DDBMS es proporcionar transparencia La cuarta meta del DDBMS es proporcionar transparencia de fallas, lo que significa que las transacciones sean de fallas, lo que significa que las transacciones sean procesadas de un modo correcto a pesar de fallas en la procesadas de un modo correcto a pesar de fallas en la transacción, en el DDBMS, en la red y en la computadora. transacción, en el DDBMS, en la red y en la computadora.

Frente a una falla, las transacciones deberán ser atómicas, Frente a una falla, las transacciones deberán ser atómicas, esto es, ya sea que se procesen todas las transacciones o esto es, ya sea que se procesen todas las transacciones o ninguna de ellas. Además, una vez comprometidos los ninguna de ellas. Además, una vez comprometidos los resultados de las transacciones, serán permanentes.resultados de las transacciones, serán permanentes.


Recommended