+ All Categories
Home > Documents > Descriptiva y Probabilidad

Descriptiva y Probabilidad

Date post: 06-Jan-2017
Category:
Upload: ngotuong
View: 243 times
Download: 4 times
Share this document with a friend
70
Transcript
Page 1: Descriptiva y Probabilidad

Índice general

I Estadística 3

1 Estadística Descriptiva 51.1 Variables estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Tipos, muestras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3.1 Diagramas (cualitativas: de barras y de sectores; cuantitativas: de tallos y hojase histogramas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.4 Medidas numéricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.4.1 Medidas de centralización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.4.2 Medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4.3 Cuartiles y diagramas de cajas . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.4.4 Diagramas de cajas. Datos atípicos . . . . . . . . . . . . . . . . . . . . . . . . 151.4.5 Comparación de media y mediana: robustez . . . . . . . . . . . . . . . . . . . 16

1.5 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191.6 Dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.6.1 Recta de regresión y correlación . . . . . . . . . . . . . . . . . . . . . . . . . . 211.6.2 Otras dependencias funcionales . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2 Probabilidades 272.1 Denición y propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.1.1 Función de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2 Probabilidad condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.3 Cálculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3 Variables aleatorias 393.1 Denición, tipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.2 Función de masa o de densidad, función de distribución . . . . . . . . . . . . . . . . . 40

3.2.1 Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.3 Esperanza: media y varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.4 Varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.4.1 Densidad conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493.4.2 Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503.4.3 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.4.4 Densidades condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

1

Page 2: Descriptiva y Probabilidad

2 ÍNDICE GENERAL

3.4.5 Vectores aleatorios continuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523.5 Suma de variables independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4 Modelos de probabilidad 614.1 Modelos discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.1.1 Pruebas de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614.1.2 Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 624.1.3 Otros modelos basados en pruebas de Bernoulli . . . . . . . . . . . . . . . . . 624.1.4 Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

4.2 Modelos continuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.2.1 Distribución uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.2.2 Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.2.3 Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Page 3: Descriptiva y Probabilidad

Parte I

Estadística

3

Page 4: Descriptiva y Probabilidad
Page 5: Descriptiva y Probabilidad

Capítulo 1

Estadística Descriptiva

Para el estudio de una o varias características de una población, el primer paso es la recogida dedatos. Se realiza esta sobre una muestra de la población, lo sucientemente signicativa para que lasconclusiones a las que lleguemos, sobre las características objeto de estudio, sean bastante plausibles(tengan una alta abilidad). La ultima parte del curso se dedicará a cómo decidir la bondad dela muestra y las conclusiones. En este capítulo nos ocupamos de la primera, aunque no menosimportante, etapa de la descripción de los datos tomados.

1.1 Variables estadísticas

Los datos numéricos, o serie estadística, de las observaciones realizadas en una población convienepresentarlos ordenados y clasicados, siguiendo un criterio prejado, que dependerá del estudio queestemos realizando. Por lo general, estos se presentan agrupados en una tabla estadística, aunquepara una mejor lectura de los mismos se acompañan de una representación gráca (ver §1.3.1).

1.2 Tipos, muestras

Entre las series estadísticas podemos encontrarnos con series temporales, en las que se toman datosreferidos a una magnitud en diferentes instantes de un periodo de tiempo. Ejemplos de series tem-porales son: las cotizaciones de un valor a lo largo del año; la renta per cápita de una población enun periodo de tiempo; las precipitaciones mensuales de un año; . . . . La tabla estadística de una serietemporal es la de una variable bidimensional, con el tiempo como una de las variables.

Por contra, si las observaciones se han efectuado en un momento jo, nos encontramos ante unaserie atemporal, y estas pueden ser espaciales y de frecuencias. Las primeras tratan de comparar losvalores de una variable en distintos espacios geográcos, como la tasa de natalidad en las distintasprovincias españolas. Las de frecuencias estudian la repetición de un determinado hecho o fenómeno;son las más usuales y a ellas nos dedicaremos.

5

Page 6: Descriptiva y Probabilidad

6 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

1.3 Una variable

1.3.1 Diagramas (cualitativas: de barras y de sectores; cuantitativas: detallos y hojas e histogramas)

Las distribuciones de frecuencias tratan de observar, clasicar y ordenar las repeticiones de ciertosvalores de una variable. Pueden ser cualitativas o cuantitativas, pudiendo ser las últimasde carácter discreto o continuo, según la variable. Los datos se presentan mediante tablas de

frecuencias.En una tabla de frecuencias se llama frecuencia absoluta al número de veces que se repite

un valor de la variable; se representa por ni, y signica que el valor xi aparece ni veces. La suma detodas las frecuencias absolutas debe coincidir, obviamente, con el número total de elementos de lamuestra, y se denomina tamaño muestral, representado por N .

Llamamos frecuencia relativa a la razón entre la frecuencia absoluta y el tamaño muestral,y mide la proporción de cada valor dentro de la muestra. Se representa por fi y, según se ha denido,es:

fi =ni

N.

Es claro que fi ≤ 1, así como que∑i

fi = 1.

Por último, llamamos frecuencias acumuladas, a las sumas de las frecuencias hasta undeterminado valor de la variable. Las denotaremos por Ni o Fi según se reeran a frecuencias absolutaso relativas, respectivamente. Para calcularlas se ordenan previamente los valores observados de lavariable, y se puede hacer de menor a mayor (frecuencias acumuladas crecientes: Ni ↑, Fi ↑ ), o demayor a menor (frecuencias acumuladas decrecientes: Ni ↓, Fi ↓).

Si los datos observados corresponden a una variable continua, o hay poca repetición de datos,es común agrupar estos en intervalos de clase, que no han de solaparse, por ejemplo de la forma:[Li−1, Li) (cerrados por la derecha y abiertos por la izquierda). En estos casos se dene, además, lamarca de clase, xi, como el punto medio de cada intervalo:

xi =Li + Li−1

2.

De este modo, los valores del intervalo [Li−1, Li) pueden tratarse como si fueran todos iguales a sumarca de clase, xi, con la consiguiente pérdida de información o error de agrupamiento.

Ejemplos

Ejemplo 1 Encuestadas cincuenta parejas respecto a su número de hijos, se obtuvieron los siguientesdatos:

2; 4; 2; 3; 1; 2; 4; 2; 3; 0; 2; 2; 2; 3; 2; 6; 2; 3; 2; 2; 3; 2; 3; 3; 4; 1; 3;3; 4; 5; 2; 0; 3; 2; 1; 2; 3 ; 2; 2; 3; 1; 4; 2; 3; 2; 4; 3; 3; 2; 2 .

Constrúyase una tabla estadística que represente dichos datos, indicando frecuencias absolutas,relativas y acumuladas relativas crecientes.

Page 7: Descriptiva y Probabilidad

1.3. UNA VARIABLE 7

Solución:

xi ni fi Fi ↑

0 2 125

125

1 4 225

325

2 21 2150

2750

3 15 310

4250

4 6 325

4850

5 1 150

4950

6 1 150

1

N = 50

Ejemplo 2 Los datos que se dan a continuación corresponden a los pesos en kilogramos de 80personas:

60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 63;69; 80; 59; 66; 70; 67; 78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56; 65; 74;67; 54; 65; 65; 69; 61; 67; 73; 57; 62; 67; 68; 63; 67; 71; 68; 76; 61; 62; 63;76; 61; 67; 67; 64; 72; 64; 73; 79; 58; 67; 71; 68; 59; 69; 70; 66; 62; 63; 66.

(a) Obténgase una distribución de datos en intervalos de amplitud 5, empezando en [50, 55).

(b) Calcúlese el porcentaje de personas de peso menor que 65 Kg.

(c) ¾Cuántas personas tienen peso mayor o igual que 70 Kg pero menor que 85?

Solución:

(a) Como queremos efectuar una distribución de datos agrupados, debemos obtener primero losintervalos correspondientes, quedando la siguiente tabla, donde hemos añadido una columnacorrespondiente a la marca de clase:

[Li−1, Li] xi ni Ni ↑ fi Fi ↑

[50, 55) 52.5 2 2 140

140

[55, 60) 57.5 7 9 780

980

[60, 65) 62.5 17 26 1780

1340

[65, 70) 67.5 30 56 38

710

[70, 75) 72.5 14 70 740

78

[75, 80) 77.5 7 77 780

7780

[80, 85) 82.5 3 80 380

1

N = 80

Page 8: Descriptiva y Probabilidad

8 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

(b) Observando la columna de frecuencias acumuladas (absolutas), se deduce que existen N3 = 26individuos cuyo peso es menor que 65 Kg, que, en términos de porcentajes corresponden a:

F3 · 100 =13

40· 100 = 32.5 % .

(c) El número de individuos con peso comprendido entre 70 y 85 Kg es:

n5 + n6 + n7 = 14 + 7 + 3 = 24 , equivalentemente: N7 − N4 = 80 − 56 = 24 .

Representaciones grácas

Puede resultar laboriosa la lectura de una tabla estadística. Para facilitar esta tarea se suele acom-pañar de una gráca, que proporciona una visión rápida del aspecto que se estudia. Estas repre-sentaciones grácas deben tomarse como una ayuda a la interpretación, y las conclusiones han deobtenerse de la tabla.

Presentamos, mediante ejemplos, las representaciones grácas más usuales.

Ejemplo 3 (Diagrama de barras) Se utiliza para distribuciones con poca variedad de datos. Se colo-can sobre un eje horizontal los valores de la variable y sobre cada uno una barra cuya altura sea iguala su frecuencia absoluta. Las escalas de los ejes horizontal y vertical se pueden tomar distintas, conel objetivo de que el diagrama quede proporcionado.

Las temperaturas medias registradas en el mes de mayo de 2002 en Madrid, en grados centígrados,están dadas por la siguiente tabla:

Temperatura 13 14 15 16 17 18 19 20 21 22Núm. de días 1 1 2 3 6 8 4 3 2 1

La representación gráca es el siguiente diagrama de barras:

xi

ni

13 14 15 16 17 18 19 20 21 22

1

2

3

4

5

6

7

8

Ejemplo 4 (Histograma) Si hemos agrupado los datos en intervalos, utilizamos un histograma

de frecuencias. Se colocan los intervalos que denen las clases sobre un eje horizontal, y sobre cadauno de ellos se coloca un rectángulo cuya área sea igual a la frecuencia absoluta. Así, la altura delrectángulo sobre un intervalo [Li−1, Li), de amplitud ai = Li − Li−1, con frecuencia absoluta ni será:

hi =ni

ai

.

Page 9: Descriptiva y Probabilidad

1.3. UNA VARIABLE 9

Cuando todos los intervalos son de la misma amplitud, es más cómodo colocar como alturas lasfrecuencias absolutas, ni. En este caso las áreas no coincidirán con las frecuencias, pero serán pro-porcionales, y el aspecto de la gráca será el mismo.

El histograma de frecuencias del ejemplo 2 sería:

50 55 60 65 70 75 80 85

5

10

15

20

25

30

Ejemplo 5 (Polígono de frecuencias) Consiste en unir con una línea poligonal:

los extremos superiores consecutivos de las barras en un diagrama de barras

o los puntos medios consecutivos de los lados superiores de los rectángulos de un histograma.

Los polígonos de frecuencias se pueden utilizar también para representar las frecuencias acumuladas,absolutas o relativas, crecientes o decrecientes.

En los casos anteriores quedarían los siguientes polígonos de frecuencias:

xi

ni

13 14 15 16 17 18 19 20 21 22

1

2

3

4

5

6

7

8

50 55 60 65 70 75 80 85

5

10

15

20

25

30

Nota: Se acostumbra a prolongar la poligonal hasta el eje horizontal. Para ello tomamos valoresa ambos lados de los datos observados con frecuencia cero. Para no modicar el aspecto visual, losnuevos puntos del eje horizontal se toman a una distancia igual a la mitad del intervalo adyacente.Haciéndolo, así, en el caso de un histograma, el área bajo la poligonal coincide con la del histograma.

Ejemplo 6 (Diagrama de sectores) Si la variable que estamos considerando es cualitativa, sesuele usar este tipo de diagramas. Se divide un círculo en sectores, uno por cada atributo observado,cuyas áreas respectivas sean proporcionales a las frecuencias.

Page 10: Descriptiva y Probabilidad

10 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Clasicada una muestra de 100 personas según su grupo sanguíneo, obtuvimos los siguientesdatos:

Grupo sanguíneo A B AB ONúm. de personas 42 12 5 41

El siguiente sería un diagrama de sec-tores para los datos de esta muestra:

O A

BAB

Aunque podemos adaptar un diagramade barras para la misma:

0

10

20

30

40

A B AB O

Ejemplo 7 (Diagramas de tallos y hojas) Para variables cuantitativas continuas, los diagramasde tallos y hojas constituyen una sencilla representación. El procedimiento es como sigue:

1. Se redondean los datos a un número conveniente de cifras signicativas.

2. Se colocan en una tabla de dos columnas separadas por una línea vertical, escribiendo:

todas las cifras, salvo la última, a la izquierda (forman el tallo);

la última cifra a la derecha (forma la hoja).

3. Cada tallo dene una clase y se escribe sólo una vez. El número de hojas representa la frecuenciade dicha clase.

Representemos por un diagrama de tallos y hojas, los siguientes datos, expresados en cm.:11.357; 12.542; 11.384; 12.431; 14.212; 15.213; 13.300; 11.300; 17.206; 12.710;13.455; 16.143; 12.162; 12.721; 13.420; 14.698.

Primero los redondeamos a tres cifras signicativas, expresándolos en mm.:

114; 125; 114; 124; 142; 152; 133; 113; 172; 127; 135; 161; 122; 127; 134; 147.

Nos quedaría el siguiente diagrama de tallos y hojas:

11 44312 5472713 35414 2715 216 117 2

y los propios datos nos dan una idea visual de la zona con mayor frecuencia de observaciones. Es fácil,a partir del diagrama de tallos y hojas, construir la tabla de frecuencias:

Page 11: Descriptiva y Probabilidad

1.4. MEDIDAS NUMÉRICAS 11

[Li−1, Li] xi ni Ni ↑ fi Fi ↑

[110, 120) 115 3 3 316

316

[120, 130) 125 5 8 516

12

[130, 140) 135 3 11 316

1116

[140, 150) 145 2 13 18

1316

[150, 160) 155 1 14 116

78

[160, 170) 165 1 15 116

1516

[170, 180) 175 1 16 116

1

N = 16

1.4 Medidas numéricas

El objeto de todo estudio estadístico es obtener información cuantitativa sobre alguna característicade una población, lo que obligaría a manejar una gran cantidad de datos. Para simplicar el estudio seutilizan ciertas medidas que tratan de darnos la información precisa sobre la característica estudiadaa partir de la tabla. Distinguimos entre estas las medidas de centralización y las medidas dedispersión.

1.4.1 Medidas de centralización

Su pretensión es dar una idea del valor central, alrededor del cual se reparten los valores de la muestra.Denimos las más habituales e interesantes.

Denición 1.4.1. La media muestral se dene como:

x =1

N

n∑i=1

nixi =n∑

i=1

fixi .

Denición 1.4.2. La idea de la mediana muestral es la siguiente:

Es el valor de la muestra que deja a izquierda y derecha el mismo número de observaciones (unavez ordenadas).

Para hallar la mediana muestral hemos de jarnos en la columna de frecuencias absolutas acumuladascrecientes, Ni ↑. Si el número de observaciones, N , es impar, digamos N = 2k + 1 = k + 1 + k, lamediana es el valor central, es decir, xi tal que su índice i es el primero que cumple k < Ni ↑. Si elnúmero de observaciones es par, digamos N = 2k, se toma como mediana el punto medio de los dosvalores centrales.

Para variables continuas con los datos agrupados, lo más que se puede hallar es el intervalomediana; es decir la clase que contiene a la mediana.

Denición 1.4.3. La moda de una muestra de una variable estadística discreta es el valor queaparece más veces repetido.

Page 12: Descriptiva y Probabilidad

12 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Esta última medida no tiene mucho interés como medida de centralización, por varios motivos:no tiene sentido para variables continuas al tener que agrupar; puede no ser un valor central; puedehaber más de una moda, incluso estar en los extremos; . . . .

1.4.2 Medidas de dispersión

Para complementar la información de las medidas de centralización se denen las medidas de disper-sión. Es evidente que las primeras son insucientes como muestra el siguiente ejemplo:

• •en el que ambas muestras tienen iguales tanto la media como la mediana muestrales. Las medidasde dispersión diferenciarán estas muestras al medir la separación de los datos.

Denición 1.4.4. La varianza muestral se dene como:

s2x =

1

N

N∑i=1

ni(xi − x)2 .

Se dene la desviación típica (o desviación estándar) de la muestra como la raíz cuadradapositiva de la varianza muestral: sx = +

√s2

x.También se considera la quasivarianza muestral:

S2x =

1

N − 1

N∑i=1

ni(xi − x)2(

= NN−1

s2x

)de mejor comportamiento para realizar análisis más precisos (lo veremos en los últimos capítulos). Sedene la quasidesviación típica (o desviación estándar) de la muestra como la raíz cuadradapositiva de la quasivarianza muestral: Sx = +

√S2

x.

Con la desviación típica se mide la dispersión de la muestra en las unidades originales, ya que lavarianza nos da la media de los cuadrados de las desviaciones a la media muestral.

Es cómodo utilizar la siguiente fórmula en el cálculo de la varianza:

s2x =

1

N

( N∑i=1

nix2i

)− x2 =

N∑i=1

fix2i − x2 .

Ejercicio 1 Demostrar la identidad anterior para la varianza.Solución: : Basta desarrollar el cuadrado y sustituir la media muestral:

s2x =

1

N

N∑i=1

ni(xi − x)2

=1

N

N∑i=1

nix2i −

2x

N

N∑i=1

nixi +x2

N

N∑i=1

ni

=1

N

N∑i=1

nix2i − 2x2 + x2 =

1

N

N∑i=1

nix2i − x2

Page 13: Descriptiva y Probabilidad

1.4. MEDIDAS NUMÉRICAS 13

Ejemplo 8 Apliquemos los conceptos anteriores a la siguiente muestra de estaturas de 24 personas,expresadas en metros:

1.62; 1.75; 1.60; 1.41; 1.93; 2.00; 1.71; 1.68; 1.60; 1.67; 1.85; 1.83; 1.57; 1.54;1.62; 1.93; 1.84; 2.01; 1.70; 1.85; 2.05; 1.66; 1.90; 1.65 .

Redondeando a tres cifras signicativas, expresándolos en cm., nos quedaría el siguiente diagramade tallos y hojas: 14 1

15 74

16 20807265

17 510

18 5345

19 330

20 015

Apuntamos ahora estos datos en una tabla, añadiendo, a las ya vistas, algunas columnas útiles parael cálculo de la media y la varianza:

xi ni Ni ↑ nixi x2i nix

2i

141 1 1 141 19881 19881

154 1 2 154 23716 23716

157 1 3 157 24649 24649

160 2 5 320 25600 51200

162 2 7 324 26244 52488

165 1 8 165 27225 27225

166 1 9 166 27556 27556

167 1 10 167 27889 27889

168 1 11 168 28224 28224

170 1 12 170 28900 28900

171 1 13 171 29241 29241

175 1 14 175 30625 30625

183 1 15 183 33489 33489

184 1 16 184 33856 33856

185 2 18 379 34225 68450

190 1 19 190 36100 36100

193 2 21 386 37249 74498

200 1 22 200 40000 40000

201 1 23 201 40401 40401

205 1 24 205 42025 42025

Así para calcular la media muestral sumaremos las entradas de la cuarta columna (con cabecera nixi)y dividiremos por N = 24:

x =4197

24≈ 175 cm.

La mediana muestral, al haber 24 datos, será el valor medio entre el valor en lugar 12 y el 13:

mediana muestral =170 + 171

2= 170.5 .

Para la varianza, sumamos las entradas de la sexta columna (nix2i ), dividimos por N = 24, y

restamos el cuadrado de la media:s2

x = 74041324

− 1752 ≈ 30851 − 30625 = 226 .La desviación estándar será sx ≈ 15.

Page 14: Descriptiva y Probabilidad

14 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Al haber poca repetición de datos la tabla ha quedado bastante grande, con lo que hemos tenidoque realizar muchos cálculos. Vamos a ver cómo, al agrupar los datos en intervalos, los cálculos sesimplican, pero, a cambio, perdemos en precisión.

Supongamos que los datos los agrupamos en intervalos de amplitud 10, empezando en [140, 150).Obtendríamos la siguiente tabla de frecuencias:

[Li−1, Li] xi ni Ni ↑ nixi x2i nix

2i

[140, 150) 145 1 1 145 21025 21025[150, 160) 155 2 3 310 24025 48050[160, 170) 165 8 11 1320 27225 217800[170, 180) 175 3 14 525 30625 91875[180, 190) 185 4 18 740 34225 136900[190, 200) 195 3 21 585 38025 114075[200, 210) 205 3 24 615 42025 126075

La media muestral sería: x =4240

24=

530

3≈ 176.7.

El intervalo mediana: [170, 180).

La varianza muestral: s2x =

755800

24− 5302

9=

94475

3− 280900

9=

283425 − 280900

9=

2525

9≈ 280.6

La desviación típica: sx =

√2525

9=

√2525

3≈ 50.25

3= 16.75.

Para comparar ambos estudios, mostramos los respectivos diagramas de barras e histograma defrecuencias (absolutas al tener intervalos de igual amplitud):

xi

ni

140 150 160 170 180 190 200 210

1

2

3

x ≈ 175

mediana muestral = 170.5

s2x ≈ 226

sx ≈ 15

xi

ni

140 150 160 170 180 190 200 210

1

2

3

4

5

6

7

8

x ≈ 176.7

intervalo mediana [170, 180)

s2x ≈ 280.6

sx ≈ 16.75

Page 15: Descriptiva y Probabilidad

1.4. MEDIDAS NUMÉRICAS 15

1.4.3 Cuartiles y diagramas de cajas

Una medida elemental de dispersión, una vez ordenados los datos, es el rango o recorrido, R, quees la diferencia entre el mayor y el menor de los datos:

R = xn − x1 .

Siguiendo la idea de la denición de la mediana, introducimos los cuartiles. La mediana separaen dos mitades el conjunto de observaciones. Los 3 cuartiles, Q1, Q2 y Q3, lo hacen en 4 partes conel mismo número de elementos. Así, los cuartiles, Q1, Q2 y Q3 son tales que:

el 25% de los datos están a la izquierda del primer cuartil, Q1, y el 75% a su derecha;

el 50% de los datos están a la izquierda del segundo cuartil, Q2, y el 50% a su derecha (es decirQ2 = mediana );

el 75% de los datos están a la izquierda del tercer cuartil, Q3, y el 25% a su derecha.

Igual que ocurría con la mediana, hemos de considerar distintos casos según el tamaño muestralsea o no divisible por 4: N = 4k, N = 4k + 1, N = 4k + 2 ó N = 4k + 3.

Las únicas novedades son el primer y el tercer cuartiles. A partir de estas dos cantidades se deneel rango intercuartílico, RI, que es una medida de dispersión denida por:

rango intercuartílico RI = Q3 − Q1 .

La misma idea seguida para denir los cuartiles nos llevaría a la denición de los 99 percentiles,P1, . . . , P99. En general el percentil de orden k será el menor valor que supera al k por ciento de losdatos.

1.4.4 Diagramas de cajas. Datos atípicos

El diagrama de caja es un gráco basado en los cuartiles que contiene además información sobrela simetría de la distribución y nos permitirá denir el concepto de dato atípico. El siguiente diagramamuestra la construcción del diagrama de caja de una muestra dada. Se han de calcular los cuartiles,Q1, mediana y Q3, así como el rango intercuartílico RI = Q3 − Q1.

Q1 med. Q3

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

-RI

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.barrera interior barrera interior

- -1.5RI 1.5RI

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

barrera exterior barrera exterior

- -3RI 3 RI

•• • • •

Page 16: Descriptiva y Probabilidad

16 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Los segmentos dibujados a ambos lados de la caja, denominados bigotes , unen cada lado con losdatos más extremos que aparecen dentro de las barreras interiores. Llamamos datos atípicos alas observaciones que están fuera de las barreras interiores, es decir, a más de 1.5 veces el rangointercuartílico del correspondiente cuartil. Si además están a más de 3 veces el rango intercuartílico(fuera de las barreras exteriores), se denominan datos atípicos extremos. En el gráco anteriorhemos representado con el símbolo los datos atípicos extremos, y con • los datos atípicos noextremos.

Este tipo de observaciones atípicas requiere una atención particular: bien porque responden aerrores en la medida o en el tratamiento de datos; bien porque contienen información relevante sobreel comportamiento de la variable.

1.4.5 Comparación de media y mediana: robustez

Un rasgo que diferencia a media y mediana es su comportamiento frente a datos atípicos.Supongamos dada la siguiente muestra de datos:

5.3; 2.8; 3.4; 7.2; 1.7; 6.2; 9.3; 3.2; 5.9 ;

que tiene media 5 y mediana 5.3. Si introducimos un dato más que sea un valor atípico extremo, porejemplo 83, la muestra quedaría con la misma mediana, pero la media cambia drásticamente a 12.8.

La resistencia o estabilidad de la mediana frente a la existencia de datos atípicos es un fenómenoque recibe el nombre de robustez. Todos los estadísticos basados en el orden mediana, cuartiles,percentiles, . . . tienen esta misma propiedad, y se dice que son robustas. Las medidas que se basanen la suma como la media y la desviación típica son más sensibles a los datos atípicos y son, portanto, poco robustas.

Esta sensibilidad de la media a las observaciones atípicas explica la posición relativa de la medianay media en distribuciones asimétricas, como muestran las siguientes guras:

Simétrica Asimétrica a la dcha. Asimétrica a la izqda.

xmed.

med. x x med.

Los datos atípicos a la derecha (izquierda) del diagrama de caja, atraen a la media, desplazándolahacia la derecha (izquierda), creando los distintos tipos de asimetría.

Conclusión: La media y la desviación típica deben utilizarse para resumir distribuciones homogéneas(simétricas y sin datos atípicos). En otros casos, es preferible utilizar la mediana y el rango inter-cuartílico.

Page 17: Descriptiva y Probabilidad

1.4. MEDIDAS NUMÉRICAS 17

Ejemplo 9 Las ventas de zapatos de caballero en una zapatería, distribuidas por tallas, han sido,durante cierto mes, las siguientes:

Talla 37 38 39 40 41 42 43 44 45Núm. de pares 3 4 55 234 366 229 57 6 2

El número total de zapatos vendidos en ese mes es N = 956. Para calcular los cuartiles vemos que:

25 % de 956 = 239

de manera que:

Q1 = 40 , Q2 = 41 , Q3 = 42 , y el rango intercuartílico es: RI = 2 .

Las barreras interiores del diagrama de caja estarían en 37 y 45, de manera que no tenemos datosatípicos, y los bigotes tienen la misma longitud, pues existen los datos 37 y 45 en la muestra. Además,la distribución de datos de la caja es simétrica respecto a la mediana:

Tabla de frecuencias:

xi ni Ni ↑ Ni ↓ ni xi x2i ni x

2i

37 3 3 956 111 1369 410738 4 7 953 152 1444 577639 55 62 949 2145 1521 8365540 234 296 894 9360 1600 37440041 366 662 660 15006 1681 61524642 229 891 294 9618 1764 40395643 57 948 65 2451 1849 10539344 6 954 8 264 1936 1161645 2 956 2 90 2025 4050

Cálculos:

x =39197

956≈ 41

s2x =

1608199

956− x2 ≈ 1.131

sx =√

Vx ≈ 1.06

moda = 41 .

Ejemplo 10 La clasicación de 100 familias por el número de hijos es:

Núm. de hijos 0 1 2 3 4 5 6 7 8Núm. de familias 11 13 20 25 14 10 4 2 1

Page 18: Descriptiva y Probabilidad

18 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Vamos a analizar X =número de hijos por familia. Se tiene:

x =280

100=

14

5= 2.8 , s2

x =1098

100− 196

25=

549 − 392

50=

157

50≈ 3.14 , sx =

√157

50≈ 8.86

5= 1.77 .

De los 100 datos el lugar 50 lo ocupa el 3, y el 51 también; luego la mediana es 3: Q2 = 3. Por su partelos otros dos cuartiles son Q1 = 2 y Q3 = 4 (¾por qué?), con lo que tenemos rango intercuartílico:

RI = 4 − 2 = 2

y el diagrama de caja queda con un dato atípico, 8, que es no extremo pues no supera la barreraexterior derecha (la vertical en Q3 + 3RI = 4 + 6 = 10).

La inuencia de este dato atípico no puede ser muy grande, pues aparece en el 1% de la muestra.De hecho, si lo ignoramos de la muestra quedaría media 2.75. Además la media y la mediana estánmuy próximas: si redondeamos a enteros coinciden.

Bajo estas consideraciones podemos tratar la muestra como casisimétrica .

Ejemplo 11 De una encuesta de la población española en el año 1973 sobre presupuestos familiares,se obtuvieron los siguientes datos para la variable G =gasto mensual por familia (en miles depesetas), sobre una muestra de 75 familias:

[Li−1, Li) ni fi Fi ↑[0, 50) 1 0.01 0.01

[50, 100) 10 0.13 0.15

[100, 150) 9 0.12 0.27

[150, 200) 12 0.16 0.43

[200, 250) 12 0.16 0.59

[250, 300) 10 0.13 0.72

[300, 350) 3 0.04 0.76

[350, 400) 1 0.01 0.77

[400, 450) 6 0.08 0.85

[450, 500) 5 0.07 0.92

[500, 550) 1 0.01 0.93

[550, 600) 0 0.00 0.93

[600, 650) 2 0.03 0.96

[650, 700) 1 0.01 0.97

[700, 750) 1 0.01 0.99

[750, 800) 0 0.00 0.99

[800, 850) 0 0.00 0.99

[850, 900) 1 0.01 1.00

[900, 950) 0 0.00 1.00

El primer intervalo cuartílico es [100, 150), el intervalo mediana, [200, 250), y el tercer cuartil estáen el intervalo [300, 350). Tendríamos así un rango intercuartílico

150 < RI ≤ 350 − 100 = 250 .

El diagrama de caja tendría barreras interiores extremas en −275, a la izquierda, y 725 a laderecha. En concreto, vemos de la tabla que el 76− 15 = 61 % de los datos se encontraría en la caja,

Page 19: Descriptiva y Probabilidad

1.5. TRANSFORMACIONES LINEALES 19

un 15% en el segmento izquierdo, y un 24% en el segmento derecho, del cual el 1% corresponde adatos atípicos, que podrían llegar a ser extremos.

Vemos, en cualquier caso, que la distribución es asimétrica a la derecha.Si tomamos las marcas de clase como representativas de cada intervalo, podemos calcular la media

y la desviación típica de esta muestra, obteniendo:

x ≈ 264 miles de pesetas; sx ≈ 170.8

1.5 Transformaciones lineales

Supongamos que tenemos una muestra de datos x1, x2, . . . , xn con media muestral x y desviacióntípica sx. Puede interesar cambiar la escala en la que nos dieron los datos. ¾Cómo inuirá estecambio de escala en x y sx?

En general, un cambio de escala viene dado por y = kx, que es un caso particular de las trans-formaciones lineales: y = ax + b. Veamos cómo varían los estadísticos media y desviación típica:

Siendo: x =n∑

i=1

fixi tendríamos: y =n∑

i=1

fi(a xi + b) = an∑

i=1

fixi + bn∑

i=1

fi

de donde: y = a x + b ;

Análogamente si: s2x =

n∑i=1

fix2i − x2

entonces: s2y =

n∑i=1

fi(a xi + b)2 − (a x + b)2

= a2

n∑i=1

fix2i + 2ab

n∑i=1

fixi + b2

n∑i=1

fi − a2 x2 − 2abx − b2

= a2

n∑i=1

fix2i + 2abx + b2 − a2 x2 − 2abx − b2

= a2( n∑

i=1

fix2i − x2

)= a2s2

x ;

por tanto: sy = |a| sx .

Ejercicio 2 ¾Cómo inuye una transformación lineal sobre los datos de una muestra en sus cuar-tiles?

Denición 1.5.1. (Tipicación) Si x y sx son la media y desviación típica muestrales de unamuestra, x1, . . . , xN , correspondiente a una variable X, la muestra correspondiente a la variabletipificada

Y =X − x

sx

, yi =xi − x

sx

, i = 1, . . . , N ,

tiene media muestral y = 0 y desviación típica muestral sy = 1.

Page 20: Descriptiva y Probabilidad

20 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

1.6 Dos variables

En ocasiones estudiaremos varias características de una población. Un problema interesante serádeterminar si existe algún tipo de relación entre ellas. Dedicaremos esta sección a este problema.Como en capítulos anteriores, nos bastará con entender el caso de dos variables aleatorias.

Supongamos, pues, que estamos realizando el estudio conjunto de dos variables aleatorias cuan-titativas, X e Y . Dispondremos de una muestra de N pares de observaciones:

(x1, y1), (x2, y2), . . . , (xN , yN) ;

es decir, para el elemento iésimo de la muestra, (xi, yi), se ha observado que X = xi e Y = yi.Utilizaremos una tabla de doble entrada para la distribución conjunta. De ella podemos calcular

las distribuciones marginales y, en particular, calcular los estadísticos de cada variable: x, medx,modax, Sx, S2

x, . . . para la muestra marginal de la variable X; y los respectivos para Y .Las representaciones grácas de la distribución conjunta, se realizan en 3 dimensiones. Como

alternativa a estos grácos se introduce la nube de puntos:

Con ella representamos, por ejemplo, los valores observados de X enel eje horizontal, y los de Y en el vertical. Cada punto es una observacióndel vector (X,Y ). La nube de puntos mostrada a la izquierda se harealizado a partir de la muestra:

(23, 15) ; (43, 16) ; (42, 25) ; (23, 25) ; (28, 17) ; (29, 22) ; (31, 35) ;(32, 28) ; (34, 18) ; (36, 32) ; (40, 38) ; (34, 18) ; (36, 23) ; (38, 28) ;(45, 25) ; (65, 26) ; (64, 35) ; (45, 35) ; (50, 27) ; (51, 32) ; (53, 45) ;(54, 38) ; (56, 28) ; (58, 42) ; (65, 48) ; (56, 28) ; (58, 33) ; (60, 38) .

X

Y

• •••

••

•••

••

••• • •

••••

•••

••

•••

El objetivo marcado en esta sección es encontrar una curva sencilla que exprese (de maneraresumida) una posible relación entre X e Y . Para ello es fundamental dibujar, primero, la nube depuntos, para decidir si puede existir esta relación. Una medida numérica que recoge esta posiblerelación es la covarianza muestral que se dene como:

covx,y =1

N

N∑i=1

(xi − x)(yi − y) .

Para calcularla es más sencillo utilizar la igualdad:

covx,y =1

N

N∑i=1

xiyi − xy

que se demuestra fácilmente (ejercicio).La covarianza aparece de manera natural al intentar ajustar una recta de regresión a una nube

de datos.

Page 21: Descriptiva y Probabilidad

1.6. DOS VARIABLES 21

1.6.1 Recta de regresión y correlación

Si de la nube de puntos decidimos que puede existir una recta, y = ax + b, que se ajuste a la misma,resumiremos toda la nube con ella. Esta recta trataría de formalizar la idea de que existe una relaciónlineal entre los valores de X e Y .

Denición 1.6.1. La recta de regresión de Y sobre X es la recta y = a+bx que minimiza el errorcuadrático medio (en adelante, E.C.M.):

E.C.M. =1

N

N∑i=1

(yi − a − bxi)2 .

Nota: Con la recta de regresión de Y sobre X, se pretende minimizar el E.C.M., en cuya deniciónse promedian las distancias verticales de cada punto de la muestra a la recta. Esta recta se usarápara estimar valores de Y para valores conocidos de X. Podemos, análogamente, calcular la rectade regresión de X sobre Y , que servirá para estimar valores de X para valores conocidos de Y .El desarrollo es el mismo, pero partiendo del error cuadrático medio para las distancias horizontales:

1

N

N∑i=1

(xi − c − dyi)2 ,

con x = c + dy. Puesto que los resultados son análogos, para no alargar innecesariamente la sección,nos centraremos en la primera de las rectas: y = a + bx.

Como viene siendo costumbre, presentamos una identidad para el cálculo de este nuevo número:

E.C.M. =1

N

( N∑i=1

y2i + Na2 + b2

N∑i=1

x2i − 2a

N∑i=1

yi − 2bN∑

i=1

xiyi + 2ab

N∑i=1

xi

)=

(Vy + y2

)+ a2 +

(Vx + x2

)b2 + 2x a b − 2y a − 2

(covx,y + xy

)b ;

aunque en esta ocasión para justicar los cálculos posteriores, que resuelven (calculan) los coecientesde la recta que minimizan esta cantidad. Diremos que y = a + bx es la recta de regresión de Y sobreX si a y b son tales que:

∂(E.C.M.)

∂a= 2 a + 2x b − 2y = 0

∂(E.C.M.)

∂b= 2(s2

x + x2) b + 2x a − 2(covx,y + xy) = 0 .

La solución es inmediata:a = y − covx,y

s2x

x ; b =covx,y

s2x

aportando, además, esta solución un mínimo de la función E.C.M.. Por tanto, la recta de regresiónde Y sobre X es:

y − y =covx,y

s2x

(x − x) .

Obsérvese que la recta de regresión pasa por el punto de medias: (x, y).Justicaremos el uso de la recta de regresión por el valor concreto del E.C.M. cometido:

Page 22: Descriptiva y Probabilidad

22 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Denición 1.6.2. La varianza residual es el E.C.M. cometido con la recta de regresión de Ysobre X, es decir:

Varianza residual =1

N

N∑i=1

(yi − y − covx,y

s2x

(xi − x)

)2

Desarrollando y agrupando esta última igualdad, podemos reescribirla como:

Varianza residual = s2y(1 − r2) , siendo: r =

covx,y

sxsy

.

Al cociente r se le denomina coeficiente de correlación y nos da una medida de la bondad delajuste por la recta de regresión. En concreto, r es un número entre −1 y 1, y cuánto más próximoesté a los valores extremos (|r| ≈ 1), más pequeño será el E.C.M. cometido; en otras palabras, mejorserá el ajuste.

Ejemplo 12 (Frank Anscombe) En la siguiente tabla se presentan tres conjuntos de datos prepara-dos por el estadístico Frank Anscombe para ilustrar los peligros de hacer cálculos sin antes representarlos datos:

Conjunto de datos A:

(10, 8.04); (8, 6.95); (13, 7.58); (9, 8.81); (11, 8.33); (14, 9.96); (6, 7.24); (4, 4.26); (12, 10.84); (7, 4.82); (5, 5.68) .

Conjunto de datos B:

(10, 9.14); (8, 8.14); (13, 8.74); (9, 8.77); (11, 9.26); (14, 8.10); (6, 6.13); (4, 3.10); (12, 9.13); (7, 7.26); (5, 4.74) .

Conjunto de datos C:

(8, 6.58); (8, 5.76); (8, 7.71); (8, 8.84); (8, 8.47); (8, 7.04); (8, 5.25); (8, 5.56); (8, 7.91); (8, 6.89); (19, 12.50) .

Los cálculos correspondientes sobre cada conjunto aportan los siguientes valores, comunes a lostres conjuntos de datos:

x = 9; sx ≈ 3.16; y ≈ 7.50; sy ≈ 1.94;1

11

11∑i=1

xiyi = 72.51;

covx,y ≈ 5;covx,y

s2x

≈ 0.5; r ≈ 0.82; Varianza residual = s2y(1 − r2) ≈ 1.23

y así la recta de regresión de Y sobre X sería, para los tres:

y − 7.50 = 0.5(x − 9) ⇐⇒ y = 3 + 0.5x .

Las nubes de datos de sendos conjuntos son:

Datos A Datos B Datos C

•• •• ••

••

•••• •• • •

••

••

•••••••••••

A la vista de las mismas, tomamos la recta de regresión como buen ajuste sólo para la muestra A.

Page 23: Descriptiva y Probabilidad

1.6. DOS VARIABLES 23

1.6.2 Otras dependencias funcionales

En ocasiones intentar resumir la nube de puntos por una recta puede que no tenga mucho sentido.Podemos pensar en muchos modelos alternativos al modelo lineal. Vamos a dedicar esta sección aindicar cómo aplicar los resultados del modelo de regresión lineal a otros modelos como el logarítmicoy el exponencial.

La idea es podernos restringir al modelo lineal mediante una sencilla transformación, fácil deinvertir.

En general, si disponemos de observaciones (x1, y1), . . . , (xN , yN) de dos características X e Y deuna población, y queremos ajustar un modelo de la forma:

y = a + b g(x)

a estos datos, podemos denir una nueva variable T = g(X) y hallar la recta de regresión de Ysobre T . Esta correspondería a los datos

(t1, y1), . . . , (tN , yN), donde: tj = a + b g(xj), para cada j = 1, . . . , N .

Una vez obtenida la recta de regresión de Y sobre T , deshacemos el cambio y obtenemos la curvapedida.

Ejemplo 13 (Regresión logarítmica) Si la nube de puntos recuerda a la gráca de la funciónlogaritmo, se ajustará por un modelo de la forma:

y = a + b log x (regresión logarítmica) .

Para ello denimos T = log(X), hallamos la recta de regresión de Y sobre T , con la muestra con-veniente modicada. Si obtenemos, por ejemplo, y = 2 + 3t, diremos que y = 2 + 3 log x es nuestromodelo de regresión logarítmica para la muestra original.

Ejemplo 14 (Regresión exponencial) Cuando la nube de puntos recuerde a una gráca expo-nencial (y = ex ó y = e−x), la intentaremos representar mediante un modelo de la forma:

y = a ebx (regresión exponencial) .

Tomando logaritmos en este modelo tendríamos:

log y = log a + bx .

Si denimos la variable T = log(Y ), y hallamos la recta de regresión de T sobre X, al deshacer elcambio obtendríamos los datos de la regresión exponencial. Por ejemplo, si obtenemos t = −2 + 3x,la curva pedida sería:

y = e−2 e3x ≈ 0.135 e3x .

Page 24: Descriptiva y Probabilidad

24 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

Problemas

1. Antes de que los hornos microondas se puedan poner a la venta, el fabricante debe asegurarsede que la radiación emitida a través de la puerta se encuentra por debajo de un límite deseguridad. Las cantidades de radiación emitidas por 25 hornos (en mw/cm2) con la puertacerrada son:

15 9 18 10 512 8 5 8 107 2 1 5 35 15 10 15 98 18 1 2 11

(a) Calcula la media, la varianza y la desviación típica.

(b) Calcula la mediana, los cuartiles y el rango intercuartílico.

(c) Dibuja el diagrama de cajas correspondiente a estos datos.

2. Determina razonadamente si las siguientes armaciones son verdaderas o falsas:

(a) Si añadimos 7 a todos los datos de un conjunto, el primer cuartil aumenta en 7 unidadesy el rango intercuartílico no cambia.

(b) Si todos los datos de un conjunto se multiplican por -2, la desviación típica se dobla.

(c) Si todos los datos de un conjunto se multiplican por 2, la varianza se dobla.

(d) Si cambiamos el signo de todos los datos de un conjunto, el coeciente de asimetría deFisher también cambia de signo.

(e) Al multiplicar por tres todos los datos de un conjunto, el coeciente de asimetría Fisherno varía.

(f) Si el coeciente de correlación entre dos variables vale -0.8, los valores por debajo delpromedio de una variable están asociados con valores por debajo del promedio de la otra.

(g) Si para todo i, se cumple yi < xi, el coeciente de correlación entre x e y es negativo.

(h) Al restar una unidad a cada dato de un conjunto, la desviación típica siempre disminuye.

(i) Si a un conjunto de datos con media x se le añade un nuevo dato que coincide con x, lamedia no cambia y la desviación típica disminuye.

3. Un estudio sobre el efecto de la temperatura en el rendimiento de un proceso químico propor-ciona los siguientes resultados:

Temperatura (x) -5 -4 -3 -2 -1 0 1 2 3 4 5Rendimiento (y) 1 5 4 7 10 8 9 13 14 13 18

(a) Representa el diagrama de dispersión de los datos anteriores y calcula el coeciente decorrelación entre las dos variables. ¾Se puede admitir que existe una relación lineal apro-ximada entre ambas, es decir, yi ≈ a + bxi?

(b) Calcula el término independiente y la pendiente de la recta de mínimos cuadrados.

Page 25: Descriptiva y Probabilidad

1.6. DOS VARIABLES 25

(c) ¾Qué rendimiento predecirías para un nuevo proceso realizado a temperatura x = 3.5?

4. Con el n de hacer un estudio de aceptación sobre dos modelos de automóviles de recientefabricación, se han considerado las ventas efectuadas por un concesionario durante los días nofestivos del último mes de septiembre, que han sido las siguientes:

Mod. A Mod. B Núm. de días0 2 11 3 12 1 32 2 53 1 83 2 44 0 14 1 2

Obténganse las distribuciones marginales, dando sus medias y varianzas respectivas. Hállese lacovarianza de la distribución bidimensional, dibujar la nube de puntos de la misma.

5. Comparadas las edades de cien madres con la de su primer hijo, se obtuvo la siguiente distribu-ción bidimensional:

Edad del hijoEdad de la madre

2030 3040 4050 5060 6070010 11 31015 18 11520 15 62025 122530 10 63040 9 34050 6

Hállense la covarianza de la distribución y las varianzas correspondientes, tomando en cadaclase su marca de clase central. A partir de esta muestra estúdiese la edad de una madre alnacer su primer hijo.

6. Consultando el chero de un departamento de pediatría, se obtuvieron los siguientes datosrespecto a los pesos y edades de los niños atendidos:

Peso (en kg)Edad (en años)

0 1 2 3 405 2510 4 21015 8 9 71520 1 2 8 142025 1

Obténgase la recta de regresión de Y (pesos) sobreX (edades). Con la recta obtenida, decídase cuál esel peso que debe esperarse para un niño de 5 años.

Page 26: Descriptiva y Probabilidad

26 CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

7. Hállense y represéntense las rectas de regresión correspondientes a la distribución estadística:

xi yi ni,i

1 5 22 6 63 6 73 7 64 7 74 8 45 8 56 9 3

8. Una distribución estadística de variables X e Y es tal que x = 3.5, y = 4 x, y s2x = 3 covx,y.

Sabiendo que en una de las observaciones es xi = 5, ¾qué valor debe esperarse para yi en elsupuesto de una dependencia lineal entre las variables?

9. Ajústese una función del tipo y = aebx a la siguiente distribución bidimensional:

xi 1 1.5 2 2.5 3 4yi 2.2 6 16 44.5 121 895

10. Conocidas la media y varianza muestrales de cada una de las variables asociadas a una dis-tribución bidimensional,

x = 3 , s2x = 6 , y = 6 , s2

y = 8 ,

de la que se conoce, además, la recta de regresión de Y sobre X

2x + 3y − 12 = 0

obténgase la recta de regresión de X sobre Y .

11. Dadas dos variables X e Y , la recta de regresión de Y sobre X es y = 1.16x+10.8 mientras quela de X sobre Y es x = 0.13y − 0.6. Calcula las medias de las variables X e Y y el coecientede correlación entre ambas.

12. Calcúlese la recta de regresión, `1, de Y sobre X para la muestra:

(1, 3), (3, 4), (5, 2) .

Añadir a la muestra anterior el punto de la recta `1 con coordenada x = 7. Calcular la rectade regresión, `2, de Y sobre X para la muestra aumentada.

Repetir lo mismo añadiendo a la muestra original el punto de `1 con primera coordenada x = −9(obteniendo una tercera recta `3).

Dibuja las tres rectas con sus muestras en un mismo gráco e interpreta el resultado.

Page 27: Descriptiva y Probabilidad

Capítulo 2

Probabilidades

2.1 Denición y propiedades

Al realizar un experimento aleatorio nuestro interés es obtener información sobre las leyes que rigenel fenómeno sometido a estudio. El punto de partida para el estudio de un experimento aleatorio esconocer el espacio muestral, Ω, o conjunto de todos los resultados posibles.

Ejemplo 15 Consideremos el siguiente experimento aleatorio: se tiran tres dados de colores rojo,azul y blanco. Podemos presentar nuestro espacio muestral de la forma:

Ω = (1, 1, 1), (1, 1, 2), . . . , (3, 2, 6), (4, 1, 1), . . . , (6, 6, 6)

donde (a, b, c) quiere decir que el resultado del dado rojo ha sido a, b el del azul, y c el del blanco.Es directo comprobar que hay un total de 63 = 216 resultados posibles.

El estudio sobre el experimento lo realizaremos midiendo el tamaño relativo de subconjuntos delespacio muestral. La siguiente es una denición poco rigurosa matemáticamente.

Denición 2.1.1. Se llama suceso aleatorio a cualquier subconjunto del espacio muestral.

En particular el vacío y el total son sucesos aleatorios, y los denominaremos suceso imposible ysuceso seguro, respectivamente.

Ejemplo 16 En el experimento aleatorio del ejemplo anterior determinar los siguientes sucesos:

A1 = en el dado azul siempre se obtiene un 5, y en el rojo un 2

A2 = la suma de los dados rojo y azul es siempre 3

A3 = los dados azul y rojo dieren en 2

A4 = la suma de los tres dados es menor que 20

A5 = la suma de los tres dados es exactamente 2

A6 = el resultado del blanco es la suma de los otros dos .

27

Page 28: Descriptiva y Probabilidad

28 CAPÍTULO 2. PROBABILIDADES

La respuesta, con paciencia y buen orden, es inmediata:

A1 = (2, 5, 1), (2, 5, 2), (2, 5, 3), (2, 5, 4), (2, 5, 5), (2, 5, 6) ;

A2 = (1, 2, 1), (1, 2, 2), (1, 2, 3), (1, 2, 4), (1, 2, 5), (1, 2, 6),

(2, 1, 1), (2, 1, 2), (2, 1, 3), (2, 1, 4), (2, 1, 5), (2, 1, 6) ;

A3 = (1, 3, 1), . . . , (1, 3, 6), (2, 4, 1), . . . , (2, 4, 6),

(3, 5, 1), . . . , (3, 5, 6), (3, 1, 1), . . . , (3, 1, 6),

(4, 6, 1), . . . , (4, 6, 6), (4, 2, 1), . . . , (4, 2, 6),

(5, 3, 1), . . . , (5, 3, 6), (6, 4, 1), . . . , (6, 4, 6) ;

A4 = Ω y A5 = ∅ ;

A6 = (1, 1, 2), (1, 2, 3), (2, 1, 3), (1, 3, 4), (2, 2, 4), (3, 1, 4),

(1, 4, 5), . . . , (4, 1, 5), (1, 5, 6), . . . , (5, 1, 6) .

Es directo comprobar, además, que los cardinales de los sucesos son:

|A1| = 6 ; |A2| = 12 ; |A3| = 48 ;

|A4| = 216 ; |A5| = 0 ; |A6| = 1 + 2 + 3 + 4 + 5 = 15 .

¾Por qué se ha medido así el último?

Al ser los sucesos aleatorios subconjuntos del espacio muestral, es natural realizar con ellos lasoperaciones habituales de conjuntos.

Denición 2.1.2. Se llama suceso contrario de un suceso A, y lo denotaremos Ac, al sucesoque ocurre cuando no ocurre A.

Si A y B son dos sucesos de un mismo experimento aleatorio, el suceso unión, A ∪ B, es aquélque ocurre cuando ocurre alguno de los dos, A o B. El suceso intersección, A∩B, ocurre cuandoocurren ambos a la vez, A y B.

Dos sucesos, A y B, se dicen incompatibles si no pueden ocurrir a la vez en una mismarealización del experimento aleatorio, es decir A ∩ B = ∅.

Es claro que ∅ y Ω son sucesos contrarios e incompatibles, y que cualquier suceso es incompatiblecon su contrario.

Ejemplo 17 Calcular los sucesos contrarios de los sucesos del ejemplo anterior. Describir los sucesosA1 ∪ A2, A2 ∩ A6 y A3 ∩ A6. Ignorando los sucesos seguro e imposible, ¾hay parejas de sucesosincompatibles que no sean contrarios?

Sean

B1 = (a, b, c) : a = 2 y B2 = (a, b, c) : b = 5 ,

entonces

A1 = B1 ∩ B2 = (a, b, c) : a = 2 y b = 5 ,

Page 29: Descriptiva y Probabilidad

2.1. DEFINICIÓN Y PROPIEDADES 29

y así:

Ac1 = (B1 ∩ B2)

c = Bc1 ∪ Bc

2 = (a, b, c) : a 6= 2 o bien b 6= 5 .

A2 = (a, b, c) : a + b = 3 y así: Ac2 = (a, b, c) : a + b 6= 3 .

A3 = (a, b, c) : |a − b| = 2 y así: Ac3 = (a, b, c) : |a − b| 6= 2 .

Es evidente que: Ac4 = ∅ y Ac

5 = Ω .

Finalmente: A6 = (a, b, c) : c = a + b de donde: Ac6 = (a, b, c) : a + b − c 6= 0 .

Respecto a las otras operaciones, tenemos:

A1 ∪ A2 = (2, 5, 1), (2, 5, 2), (2, 5, 3), (2, 5, 4), (2, 5, 5), (2, 5, 6),

(1, 2, 1), (1, 2, 2), (1, 2, 3), (1, 2, 4), (1, 2, 5), (1, 2, 6),

(2, 1, 1), (2, 1, 2), (2, 1, 3), (2, 1, 4), (2, 1, 5), (2, 1, 6) ;

A2 ∩ A6 = (1, 2, 3), (2, 1, 3) ;

A3 ∩ A6 = (1, 3, 4), (2, 4, 6), (3, 1, 4), (4, 2, 6) .

La respuesta a la última pregunta es armativa. En efecto:

A1 ∩ A2 = ∅

en otras palabras, son incompatibles, pero Ac1 6= A2, y por tanto no son contrarios. Es claro que si

al tirar los tres dados el rojo ha sido un 2 y el azul un 5, su suma es 7, y por tanto no ocurre elsuceso A2. Recíprocamente, si la suma de los dados rojo y azul ha sido 3, es imposible que suceda A1.

Aprovechamos este momento para indicar que en ocasiones es más fácil contar los elementos deun suceso restando al total el de su contrario. En efecto:

|Ac1| = 216 − 6 = 210 ; |Ac

2| = 216 − 12 = 204 ;

|Ac3| = 216 − 48 = 168 ; |Ac

6| = 216 − 15 = 201 ,

resultados triviales de las meras deniciones. Obsérvese también que, en todos los casos, se puedecomprobar la fórmula para el cardinal de la unión de dos conjuntos nitos, a saber:

|A ∪ B| = |A| + |B| − |A ∩ B| .

Así, por ejemplo:

|A1 ∪ A2| = |A1| + |A2| − |A1 ∩ A2| = 6 + 12 − 0 = 18 ,

|A2 ∪ A6| = |A2| + |A6| − |A2 ∩ A6| = 12 + 15 − 2 = 25 ,

|A3 ∪ A6| = |A3| + |A6| − |A3 ∩ A6| = 48 + 15 − 4 = 59 ,

lo que nos permitirá calcular cardinales de sucesos conociendo otros más sencillos.

Siguiendo esta última idea, introducimos una última denición.

Page 30: Descriptiva y Probabilidad

30 CAPÍTULO 2. PROBABILIDADES

Denición 2.1.3. Una familia de sucesos A1, A2, . . . , de un espacio muestral Ω, se dice mutua-

mente excluyente si son incompatibles dos a dos, es decir si

Ai ∩ Aj = ∅, siempre que i 6= j .

De especial interés son las familias mutuamente excluyentes que a su vez recogen todos los posiblescasos, es decir, tales que:

Ω = A1 ∪ A2 ∪ · · · ∪ Ak ∪ . . . .

Diremos en este caso que tenemos una familia completa de sucesos.

Ejemplo 18 Siguiendo con el mismo experimento aleatorio, obsérvese que si

Ck−1 = (a, b, c) : a + b = k

entonces Ω = C1 ∪ C2 ∪ · · · ∪ C11, siendo además incompatibles dos a dos. Tenemos así hecha unafamilia completa de sucesos, o en otras palabras, una partición (disjunta) del espacio muestral, en 11subconjuntos que hemos denido respecto a la característica: suma de los dados rojo y azul.

Si de un suceso A conociéramos los cardinales de las 11 intersecciones A ∩ Cj, digamos:

aj = |A ∩ Cj|, j = 1, . . . , 11

es claro que |A| =11∑

j=1

aj.

Aunque sea quizá más sencillo de otra manera, tratemos de calcular por este método el cardinaldel suceso A = (a, b, c) : a−b = 1. En las intersecciones A∩Ck−1 aparecerán los resultados (a, b, c)tales que se verique el siguiente sistema lineal:

a − b = 1a + b = k

que equivale al sistema:

2 a = k + 12 b = k − 1

Este sistema tiene soluciones: a = k+12

y b = k−12; que determinarán resultados posibles sólo si k es

impar y estrictamente mayor que 1 (¾por qué?). Así, tenemos los siguientes cardinales:

|A ∩ C2| = |(2, 1, c)| = 6

|A ∩ C4| = |(3, 2, c)| = 6

|A ∩ C6| = |(4, 3, c)| = 6

|A ∩ C8| = |(5, 4, c)| = 6

|A ∩ C10| = |(6, 5, c)| = 6

y |A ∩ Cj| = 0 en cualquier otro caso. En denitiva |A| = 30. Con la misma idea determínese elcardinal del suceso: B = (a, b, c) : 3 a − 2 b = 1.

Se trata ahora de resolver el sistema3 a − 2 b = 1

a + b = ko su equivalente:

5 a = 2k + 15 b = 3k − 1

Page 31: Descriptiva y Probabilidad

2.1. DEFINICIÓN Y PROPIEDADES 31

y en nuestro contexto (k = 2, . . . , 12), las únicas soluciones son (1, 1, c) y (3, 4, c), para k = 2 y 7respectivamente; por lo tanto:

|B| = |(a, b, c) : 3 a − 2 b = 1| = 6 + 6 = 12 .

De hecho, conocemos B:

B = (1, 1, 1), (1, 1, 2), (1, 1, 3), (1, 1, 4), (1, 1, 5), (1, 1, 6),

(3, 4, 1), (3, 4, 2), (3, 4, 3), (3, 4, 4), (3, 4, 5), (3, 4, 6) .

2.1.1 Función de probabilidad

Pasemos a denir buenas maneras de medir el tamaño relativo de cada suceso dentro del espaciomuestral.

Denición 2.1.4. Dado un espacio muestral Ω (no vacío), se dene el álgebra de sucesos Acomo el conjunto formado por todos los sucesos de Ω.

Obsérvese que, en particular, ∅, Ω ∈ A; además, si A ∈ A también Ac ∈ A, y si A, B ∈ A,también lo están A ∪ B y A ∩ B. Si escribimos A ∈ A, leeremos A es un suceso en Ω.

Denición 2.1.5. Un modelo o función de probabilidad en un espacio muestral Ω, es unafunción P : A −→ [0, 1] que a cada suceso A ∈ A le asocia un número entre 0 y 1, y que satisfacelas propiedades:

1. P (Ω) = 1;

2. si A1, A2, . . . , Ak son sucesos incompatibles, entonces

P

( k∪i=1

Ak

)=

k∑i=1

P (Ak) .

Se tienen las siguientes propiedades de las funciones de probabilidad:

1. Para cualquier A ∈ A, P (Ac) = 1 − P (A). En particular P (∅) = 0.

2. Para cualesquiera A, B ∈ A: P (A ∪ B) = P (A) + P (B) − P (A ∩ B).En particular P (A ∪ B) ≤ P (A) + P (B).

3. Para cualesquiera A, B ∈ A: si B ⊂ A entonces P (B) ≤ P (A).

4. Para cualquier colección nita A1, A2, . . . , An ∈ A:

P

( n∪i=1

Ai

)=

n∑i=1

P (Ai) −∑i<j

P (Ai ∩ Aj) +∑

i<j<k

P (Ai ∩ Aj ∩ Ak)

− · · · + (−1)n+1P

( n∩i=1

Ai

).

Page 32: Descriptiva y Probabilidad

32 CAPÍTULO 2. PROBABILIDADES

Ejemplo 19 Sigamos con el experimento aleatorio de tirar tres dados de colores. El modelo deprobabilidad natural es el que a cada suceso elemental, (a, b, c), le asigna la misma probabilidad.Decimos en este caso que son equiprobables. ¾Cuál es la función de probabilidad así determinada?

Es fácil ver que todo suceso A de este experimento es un conjunto nito.Si A = v1, . . . , vk ⊂ Ω, es decir |A| = k, puesto que todos los sucesos elementales son equipro-

bables, y por supuesto son incompatibles, la propiedad 2 que debe vericar la función de probabilidadobliga a que:

P (A) = P (v1 ∪ . . . vk) =k∑

i=1

P (vi) = k · p

donde p es la probabilidad de cada suceso elemental (que es la misma para todos). ¾Cuál es estaprobabilidad p común a todos los sucesos elementales? La propiedad 1 nos da la solución:

P (Ω) = 1 = 216 · p por lo dicho arriba

luego p = 1/216. En otras palabras:

P (A) =|A||Ω|

,

lo que nos da una fórmula general de un modelo de probabilidad en un espacio muestral Ω discreto,cuando suponemos que todos los sucesos elementales son equiprobables. Esta fórmula no es más quela conocida regla de Laplace:

P (A) =casos favorablescasos totales

.

Pero cuidado, podemos construir otros modelos de probabilidad distintos. Basta asignarles dis-tintas probabilidades a los sucesos elementales, aunque claro ciñéndonos a la propiedad 1: P (Ω) = 1.

Supongamos que el dado blanco está trucado y la probabilidad de obtener 6 es el doble que lade obtener cualquier otro resultado. Los otros dados son perfectos, por lo que asignaremos a cadaresultado la misma probabilidad.

Es fácil ver que, en este caso:

P ((a, b, c)) =

λ , si c = 1, 2, 3, 4, 52 λ, si c = 6 .

Para determinar el valor de λ, obsérvese que:

1 = P (Ω) = 5(λ · 36) + 2λ · 36 = 180λ + 72 λ = 252 λ ,

pues cada posible valor jo de c ocurre en 36 elementos de Ω. Así, λ = 1/252.

Calculemos las probabilidades de los sucesos A1, A2, A3 y A6 del Ejemplo 16, utilizando ambosmodelos de probabilidad:

P1((a, b, c)) =1

216

P2((a, b, c)) =

1

252, si c = 1, 2, 3, 4, 5

1126

, si c = 6 .

Page 33: Descriptiva y Probabilidad

2.2. PROBABILIDAD CONDICIONADA 33

A1 = (2, 5, 1), (2, 5, 2), (2, 5, 3), (2, 5, 4), (2, 5, 5), (2, 5, 6)

P1(A1) =6

216=

1

36

P2(A1) = 51

252+

1

126=

7

252=

1

36;

A2 = (1, 2, 1), (1, 2, 2), (1, 2, 3), (1, 2, 4), (1, 2, 5), (1, 2, 6),

(2, 1, 1), (2, 1, 2), (2, 1, 3), (2, 1, 4), (2, 1, 5), (2, 1, 6)

P1(A2) =12

216=

1

18

P2(A2) = 101

252+ 2

1

126=

14

252=

1

18;

A3 = (1, 3, 1), . . . , (1, 3, 6), (2, 4, 1), . . . , (2, 4, 6),

(3, 5, 1), . . . , (3, 5, 6), (3, 1, 1), . . . , (3, 1, 6),

(4, 6, 1), . . . , (4, 6, 6), (4, 2, 1), . . . , (4, 2, 6),

(5, 3, 1), . . . , (5, 3, 6), (6, 4, 1), . . . , (6, 4, 6)

P1(A3) =48

216=

2

9

P2(A3) = 401

252+ 8

1

126=

56

252=

2

9;

A6 = (1, 1, 2), (1, 2, 3), (2, 1, 3), (1, 3, 4), (2, 2, 4), (3, 1, 4),

(1, 4, 5), . . . , (4, 1, 5), (1, 5, 6), . . . , (5, 1, 6)

P1(A6) =15

216=

5

72

P2(A6) = (1 + 2 + 3 + 4)1

252+ 5

1

126=

20

252=

5

63.

¾Sabrías explicar las coincidencias y diferencias que hemos obtenido?

2.2 Probabilidad condicionada

Hay ocasiones en que al realizar un experimento aleatorio nos interesará saber si el hecho de queocurra un suceso A aporta alguna información sobre la ocurrencia de otro suceso B. Esta cuestiónse recoge en el concepto de probabilidad condicionada.

Denición 2.2.1. Dado un espacio muestral Ω, un modelo de probabilidad, P , denido en su ál-gebra de sucesos A, y un suceso A ∈ A con P (A) > 0, llamaremos probabilidad de B ∈ Acondicionada por A, y la denotaremos P (B|A), al cociente:

P (B|A) =P (A ∩ B)

P (A).

Siempre que hablemos de probabilidades condicionadas por un suceso A se entenderá que P (A) > 0.

Denición 2.2.2. Diremos que dos sucesos A y B son independientes si

P (A ∩ B) = P (A) · P (B) .

Page 34: Descriptiva y Probabilidad

34 CAPÍTULO 2. PROBABILIDADES

Ejercicio 1 Demostrar que: A y B son independientes ⇐⇒ P (B|A) = P (B).

Ejemplo 20 Siguiendo con nuestro experimento aleatorio, determinar la independencia de los suce-sos

A = (a, b, c) : a + b = 5B = (a, b, c) : c = 6 ;

considerando las dos funciones de probabilidad del Ejemplo 19:

P1((a, b, c)) =1

216

P2((a, b, c)) =

1

252, si c = 1, 2, 3, 4, 5

1126

, si c = 6 .

Para la primera función de probabilidad tenemos:

P1(A) =24

216=

1

9

P1(B) =36

216=

1

6

P1(A ∩ B) =4

216=

1

54=

1

9

1

6= P1(A) · P1(B)

luego son independientes.Para la segunda función de probabilidad, tenemos:

P2(A) =20

252+

4

126=

1

9

P2(B) =36

126=

2

7

P2(A ∩ B) =4

126=

2

63=

1

9

2

7= P2(A) · P2(B)

luego son independientes.¾Serán siempre independientes estos dos sucesos? No, pues la independencia es un concepto que

depende de la función de probabilidad. Consideremos la función de probabilidad

P3((a, b, c)) =

µ si c 6= a + b2µ si c = a + b .

Al imponer P3(Ω) = 1 resulta que µ = 1231

, puesto que hay 15 sucesos elementales en que c = a + b,y 216 − 15 = 201 en que c 6= a + b. Así este modelo de probabilidad viene determinado por:

P3((a, b, c)) =

1

231si c 6= a + b

2231

si c = a + b .

Page 35: Descriptiva y Probabilidad

2.3. CÁLCULO DE PROBABILIDADES 35

Entonces:

P3(A) = 42

231+ 20

1

231=

28

231

P3(B) = 52

231+ 31

1

231=

41

231

P3(A ∩ B) = 41

231=

4

2316= P3(A) · P3(B) =

41 · 28

231 · 231=

41 · 7231

4

231;

por lo que para esta función de probabilidad A y B no son independientes.Podemos, nalmente, comprobar la equivalencia de la denición de independencia con el concepto

de probabilidad condicionada. En efecto:

P1(B|A) =4

21619

=36

216=

1

9= P1(B) ; P2(B|A) =

421619

=36

216=

1

9= P2(B) ;

P3(B|A) =4

23128231

=1

76= 41

231= P3(B) .

2.3 Cálculo de probabilidades

Vamos a dar, por último, tres reglas útiles para el cálculo de probabilidades.Regla de la multiplicación

P

( n∩i=1

Ai

)= P (A1)P (A2|A1)P (A3|A1 ∩ A2) · · · · · P

(An|

n−1∩i=1

Ai

).

Por supuesto se consideran no nulas todas las probabilidades de los sucesos a los que condicionamos.La comprobación de esta regla es sencilla: basta desarrollar el segundo miembro y ver que se vancancelando todos los términos salvo P

( ∩ni=1 Ai

). Por ejemplo, para 4 sucesos A1, A2, A3 y A4, con

P (A1), P (A1 ∩ A2) y P (A1 ∩ A2 ∩ A3) no nulas:

P (A2|A1) =P (A1 ∩ A2)

P (A1)

=⇒ P (A1)P (A2|A1) = P (A1 ∩ A2)

P (A3|A1 ∩ A2) =P (A1 ∩ A2 ∩ A3)

P (A1 ∩ A2)

=⇒ P (A1)P (A2|A1)P (A3|A1 ∩ A2) = P (A1 ∩ A2 ∩ A3)

P (A4|A1 ∩ A2 ∩ A3) =P (A1 ∩ A2 ∩ A3 ∩ A4)

P (A1 ∩ A2 ∩ A3)

=⇒ P (A1)P (A2|A1)P (A3|A1 ∩ A2)P (A4|A1 ∩ A2 ∩ A3) = P (A1 ∩ A2 ∩ A3 ∩ A4) .

Usaremos esta regla cuando queramos calcular la probabilidad de ocurrencia simultánea de variossucesos y sean más sencillas de determinar las probabilidades condicionadas del segundo miembro.Regla de la probabilidad total

Sea A1, . . . , An una familia completa de sucesos, es decir, tales que:

1.n∪

i=1

Ai = Ω;

Page 36: Descriptiva y Probabilidad

36 CAPÍTULO 2. PROBABILIDADES

2. Ai ∩ Aj = ∅, siempre que i 6= j;

con P (Ai) > 0 para i = 1, . . . , n. Entonces:

P (B) =n∑

i=1

P (Ai)P (B|Ai) .

Ejercicio 2 Comprobar la regla de la probabilidad total.

Regla de Bayes

Sea A1, . . . , An una familia completa de sucesos con P (Ai) > 0 para i = 1, . . . , n. Entonces:

P (Aj|B) =P (Aj) P (B|Aj)∑ni=1 P (Ai)P (B|Ai)

En el uso de las dos últimas reglas, llamaremos probabilidades a priori a las de los sucesos Aj;probabilidades a posteriori a las de los sucesos Aj|B; y verosimilitudes a las de B|Ai. La regla deBayes nos permite, pues, calcular cualquier probabilidad a posteriori, conociendo las verosimilitudesy probabilidades a priori pertinentes.

Obsérvese también que el denominador que aparece en la Regla de Bayes es P (B), por la reglade la Probabilidad total. El uso de ambas reglas será especialmente útil cuando se den las siguientescircunstancias:

a) El experimento aleatorio se puede separar en dos etapas.

b) Es sencillo dar una familia completa nita de sucesos, A1, . . . , An, correspondientes a sucesosde la primera etapa.

c) Son fácilmente calculables las probabilidades a priori: P (A1), . . . , P (An).

d) Es fácil calcular las verosimilitudes P (B|A1), . . . , P (B|An), para un suceso B correspondientea la segunda etapa.

Aplicaremos estas reglas en los ejercicios propuestos al nal del capítulo.

Recogemos por último, las fórmulas clásicas de la Combinatoria:

Variaciones: Vm,n = m(m − 1)(m − 2) · · · · · (m − n + 1) =m!

(m − n)!;

Combinaciones: Cm,n =

(m

n

)=

m!

n!(m − n)!=

Vm,n

n!;

Permutaciones: Pm = m!;

Variaciones con repetición: V Rm,n = mn;

Combinaciones con repetición: CRm,n = Cm+n−1,n−1 =

(m + n − 1

n − 1

);

Permutaciones con repetición: PRh1,h2,...,hkm =

m!

h1!h2! · · · · · hk!.

Recuérdese que n! = n(n − 1)(n − 2) · · · · · 3 · 2 · 1, y que 0! = 1.

Page 37: Descriptiva y Probabilidad

2.3. CÁLCULO DE PROBABILIDADES 37

Problemas

1. Demostrar que si A y B son sucesos independientes, entonces:

(a) sus contrarios, Ac y Bc, también lo son;

(b) A y Bc son independientes.

2. Se tiran n veces dos dados equilibrados. Calcular la probabilidad de que se obtenga al menosun seis doble. Sea p esa probabilidad, ¾cuántas partidas habrán de jugarse para tener p = 1/2?

3. En el ascensor de un edicio con bajo y diez plantas entran en el bajo cuatro personas. Cadapersona se baja con independencia de las demás y con igual probabilidad en cada planta.Calcúlese la probabilidad de que:

(a) las cuatro personas se bajen en la décima planta;

(b) las cuatro se bajen en la misma planta;

(c) las cuatro bajen en plantas distintas.

4. Una urna contiene seis bolas rojas y cuatro negras. Se extraen dos bolas sin reemplazamiento.Si se sabe que la primera es roja, ¾cuál es la probabilidad de que la segunda sea roja? Sabiendoque la segunda bola ha sido negra, ¾cuál es la probabilidad de que la primera haya sido roja?

5. Un aparato eléctrico falla al enchufarlo con probabilidad p. Si falla una vez se repara, pero sifalla en una segunda ocasión se sustituye por uno nuevo. Si se supone que los fallos se producende forma independiente, calcúlese la probabilidad de que el aparato sea sustituido al enchufarlopor nésima vez.

6. Se sabe que, en cierta población, el número de personas que padecen la enfermedad E es del 1 %.Se ha investigado una prueba diagnóstica que ha resultado positiva en el 97 % de las personasque padecen la enfermedad E y en el 2 % de las personas sanas. Calcúlese la probabilidad deque una persona con prueba positiva padezca realmente la enfermedad.

7. Supongamos que se clasica a los individuos de cierta especie animal en tres grupos A, B yC de distintas características biológicas. La probabilidad de que un individuo tomado al azarpertenezca al grupo A, B o C es respectivamente 1/2, 1/3 y 1/6. La probabilidad de que unindividuo del grupo A, B o C contraiga cierta enfermedad S es respectivamente 1/10, 1/15 y1/12. Calcúlese la probabilidad de que:

(a) un individuo contraiga la enfermedad S;

(b) un individuo enfermo sea del grupo A;

(c) un individuo sano sea del grupo A.

8. En una estación de autobuses hay tres ventanillas para venta de billetes. La probabilidad deque un viajero se dirija a la primera, segunda o tercera ventanilla es respectivamente p, q y r.La probabilidad de que no queden billetes cuando el viajero llegue a la ventanilla elegida esP , Q o R respectivamente. Calcúlese la probabilidad de que un viajero con billete no lo hayacomprado en la primera ventanilla.

Page 38: Descriptiva y Probabilidad

38 CAPÍTULO 2. PROBABILIDADES

Page 39: Descriptiva y Probabilidad

Capítulo 3

Variables aleatorias

3.1 Denición, tipos

En ocasiones de un experimento aleatorio sólo nos interesará conocer ciertas características del mismo.En estos casos nos bastará con conocer la distribución o modelo de probabilidad de cada característica.

Ejemplo 21 Si queremos estudiar la suma de dos dados lanzados uno tras otro, de los 36 resultados(a, b), estudiaremos los 11 posibles resultados a + b. Si ninguno de los dados está trucado, nuestromodelo de probabilidad será:

P ( Suma sea ω) =

136

si a + b = 2236

si a + b = 3...136

si a + b = 12

Si quisiéramos estudiar también cuánto distan, es decir |a−b|, tendríamos 6 resultados: 0, 1, 2, 3, 4ó 5, con distribución de probabilidad dada por:

P ( Distancia sea ω) =

636

si |a − b| = 01036

si |a − b| = 1...236

si |a − b| = 5

Para ambas características estamos utilizando el mismo modelo de probabilidad sobre el espacio mues-tral de 36 sucesos elementales: Ω = (1, 1), (1, 2), . . . , (6, 5), (6, 6). Y este modelo de probabilidadnos permite calcular el modelo para ambas características (o cualquier otra asociada al experimento).

Denición 3.1.1. Una variable aleatoria X es una función X : Ω −→ R, que a cada elemento delespacio muestral le hace corresponder un número real.

La idea recogida en esta denición es que para cada suceso elemental, ω ∈ Ω, el valor X(ω)representa la característica que queremos estudiar.

39

Page 40: Descriptiva y Probabilidad

40 CAPÍTULO 3. VARIABLES ALEATORIAS

Ejemplo 22 En el experimento del lanzamiento sucesivo de dos dados, estamos considerando lassiguientes variables aleatorias:

X = suma de los dados ;

Y = diferencia (en valor absoluto) de ambos dados .

A partir de ellas podemos denir distintos sucesos aleatorios. Por ejemplo:

A1 = ω ∈ Ω : X(ω) = 5 ; A2 = ω ∈ Ω : X(ω) > 7 ;

A3 = ω ∈ Ω : Y (ω) ≤ 4 ; A4 = ω ∈ Ω : (X − Y )(ω) = 6 .

Y nos interesará conocer la probabilidad de los diferentes sucesos correspondientes a una variablealeatoria, es decir, su modelo o función de probabilidad.

Denición 3.1.2. Sea X : Ω −→ R una variable aleatoria. Si A es un subconjunto de R, denimos:

P (A) = P (X ∈ A) := P (ω ∈ Ω : X(ω) ∈ A) .

Ejemplo 23 De los tres primeros sucesos del ejemplo anterior, considerando que los dados no estántrucados, tenemos que:

P (A1) =4

36=

1

9; P (A2) =

5 + 4 + 3 + 2 + 1

36=

15

36=

5

12; P (A3) = 1 − 2

36=

17

18; P (A4) =

7

36

que hemos calculado con las siguientes igualdades, evidentes:

P (A2) = P (X > 7)) = P (X = 8) + P (X = 9) + P (X = 10) + P (X = 11) + P (X = 12))

P (A3) = P ((Y ≤ 4)) = 1 − P ((Y = 5)) .

Obsérvese el abuso de notación, P (X > x) en lugar de P (X(ω) > x) por ejemplo, que utilizaremos,para simplicar, siempre que esté claro lo que queremos decir. Por último, los casos ω = (a, b) en quese verica (X − Y )(ω) = 6 son los siete siguientes: (3, 3), (3, 4), (4, 3), (3, 5), (5, 3), (3, 6) y (6, 3).

3.2 Función de masa o de densidad, función de distribución

Denición 3.2.1. La función de distribución de una variable aleatoria se dene como:

F (x) = P ((−∞, x]) = P (ω ∈ Ω : X(ω) ≤ x) para todo x ∈ R .

Propiedades de las funciones de distribución

1. lımx→−∞

F (x) = 0;

2. lımx→∞

F (x) = 1;

3. si x1 < x2, entonces F (x1) ≤ F (x2);

Page 41: Descriptiva y Probabilidad

3.2. FUNCIÓN DE MASA O DE DENSIDAD, FUNCIÓN DE DISTRIBUCIÓN 41

4. F es continua por la derecha, es decir:

lımh→0+

F (x + h) = F (x) .

Es fácil, dada una función de distribución, calcular la probabilidad de diferentes tipos de inter-valos de la recta real. Basta tomar la denición, P ((−∞, x]) = F (x) y las propiedades generales decualquier función de distribución. Denotaremos por

F (x−) = lımh→0+

P ((−∞, x − h]) = P ((−∞, x)) .

Se tienen así las siguientes identidades:

P ((a, b]) = P ((−∞, b]) − P ((−∞, a]) = F (b) − F (a)

P ((a, b)) = P ((−∞, b)) − P ((−∞, a]) = F (b−) − F (a)

P ([a, b]) = P ((−∞, b]) − P ((−∞, a)) = F (b) − F (a−)

P (b) = ((−∞, b]) − P ((−∞, b)) = F (b) − F (b−) = salto de F en el punto b .

La última de ellas nos dice que si la función de distribución, F , tiene un salto en un punto, laprobabilidad de ese punto es positiva.

Ya hemos dicho que al estudiar una variable aleatoria nos interesará conocer su función de proba-bilidad. La función de distribución caracteriza completamente la de probabilidad. Ahora bien, paralos casos más interesantes de variables aleatorias que trataremos, hay herramientas más sencillas quela función de distribución para conocer el reparto de probabilidad. Éstas son: la función de masa,para una variable aleatoria discreta; la función de densidad, si la variable aleatoria es continua.

3.2.1 Variables aleatorias discretas

Denición 3.2.2. Una variable aleatoria, X, se dice discreta cuando sólo puede tomar un númeronito o numerable de valores x1, . . . , xn, . . . .

La función de probabilidad de una variable aleatoria discreta X queda totalmente caracterizadapor su función de masa, que nos da la probabilidad de cada uno de esos posibles valores:

P (X = xi) = P (xi) = P (xi) = P (ω ∈ Ω : X(ω) = xi) i = 1, 2, 3, . . . , n, . . . .

Se sigue de la denición que∑i

P (xi) = 1. La función de distribución de una variable aleatoria

discreta tiene forma de escalera:

••

x1 x2 x3 x

F (x)

Obsérvese que la función de distribución, F (x), es no decreciente (¾por qué?).

Page 42: Descriptiva y Probabilidad

42 CAPÍTULO 3. VARIABLES ALEATORIAS

Ejemplo 24 Calcular la función de masa y la función de distribución de la variable aleatoriaX =suma de los dados, en el experimento de tirar sucesivamente dos dados no trucados.

Solución: El espacio muestral tiene 36 elementos:

Ω = (1, 1), (1, 2), . . . , (6, 5), (6, 6) .

La variable aleatoria X, es una función del espacio muestral Ω en R que sólo toma los 11 valores en-teros: 2, 3, . . . , 12. Puesto que los dados no están trucados, los sucesos elementales son equiprobables,y así:

P ((a, b)) =1

36, para cualquier (a, b) ∈ Ω .

Puesto que podemos contar cuántos elementos de Ω hay en cada uno de los sucesos X = 2, X = 3,. . . , X = 12, conocemos la función de masa de la variable X. La siguiente tabla de valores, determinacompletamente la función de masa de X:

xi 2 3 4 5 6 7 8 9 10 11 12

P (X = xi)1

36

2

36

3

36

4

36

5

36

6

36

5

36

4

36

3

36

2

36

1

36

Obsévese que1 + 2 + 3 + 4 + 5 + 6 + 5 + 4 + 3 + 2 + 1

36= 1 .

Por su parte la función de distribución, F : R −→ [0, 1], viene dada por:

F (x) = 0 si x < 2 , F (x) = 1 si x ≥ 12

y para 2 ≤ x < 12, va subiendo de 0 a 1 paulatinamente creando una gráca con escalones horizontalesentre cada dos enteros consecutivos, con los saltos en cada entero determinados por la función demasa (dibujar la gráca).

3.2.2 Variables aleatorias continuas

Denición 3.2.3. Una variable aleatoria, X, se dice continua cuando puede tomar cualquierade los valores de un intervalo. La función de probabilidad de una variable aleatoria continua quedacaracterizada por su función de densidad, que es una función f : R −→ R vericando:

1. f(x) ≥ 0, para todo x ∈ R;

2.

∫R

f(x) dx = 1.

La probabilidad de un suceso, A, relativo a una variable aleatoria continua, X, con función dedensidad f se calcula mediante la fórmula:

P (A) =

∫A

f(x) dx

Page 43: Descriptiva y Probabilidad

3.2. FUNCIÓN DE MASA O DE DENSIDAD, FUNCIÓN DE DISTRIBUCIÓN 43

Conviene resaltar que para una variable aleatoria continua X, los sucesos unitarios, A = t, tienenprobabilidad 0 pues:

P (t) =

∫t

f(x) dx = 0 .

Este hecho viene a decir que si X es una variable aleatoria continua, la probabilidad de que X tomeun valor particular es nula: P (X = t) = P (t) = 0. Como consecuencia, la función de distribuciónno tiene saltos, es decir, es continua.

La función de distribucion se obtiene a partir de la función de densidad:

F (x) = P ((−∞, x]) =

∫ x

−∞f(t) dt .

Además, en los puntos en que F (x) es derivable:

f(x) = F ′(x) .

Ejemplo 25 Sea un segmento OA de longitud 5. ¾Cuál es la probabilidad de que un punto B,situado al azar en OA, se encuentre en un segmento CD de OA? ¾Cuál es la función de densidad dela distancia OB?Solución: El conjunto Ω de sucesos es no numerable. La probabilidad de que B sea un puntocualquiera del segmento CD, es nula. La probabilidad de que B esté sobre CD se dene mediantela razón de las longitudes: CD/OA. Modelizaremos el experimento tomando OA sobre el intervalo[0, 5] de la recta real:

•O = 0

•A = 5

C

D

B

U q

Podemos denir la función de distribución de la variable aleatoria continua X =distancia OB ,de manera que sea igual a 1 cuando B esté en A:∫ 5

0

f(x) dx = 1 .

Puesto que el punto B se sitúa al azar en el intervalo OA, la distribución es uniforme sobre OA, esdecir, la función de densidad es constante, y así:

f(x) =

0 si x /∈ [0, 5]1

5si x ∈ [0, 5]

=⇒ F (x) =

0 si x < 0∫ x

0

1

5dt =

x

5si x ∈ [0, 5]

1 si x ≥ 5 .

x

f(x)

15

x

F (x)

Page 44: Descriptiva y Probabilidad

44 CAPÍTULO 3. VARIABLES ALEATORIAS

3.3 Esperanza: media y varianza

Con frecuencia de los experimentos aleatorios que estudiemos, podremos realizar un estudio es-

tadístico previo. Para ello, se toma cierta muestra, realizando varias veces el experimento, y serecogen datos sobre distintas características del mismo. El objetivo último es adaptar, para las dis-tintas características del experimento (variables aleatorias), modelos de probabilidad teóricos quenos permitan predecir el comportamiento real (su probabilidad) de estas características. De los datostomados se calcularán ciertas medidas que nos darán idea de la distribución de cada una de lascaracterísticas objeto de estudio.

Destacamos entre estas la media (medida de centralización), la varianza y la desviación

típica (medidas de dispersión). En esta sección deniremos los conceptos análogos a estas medidasde la Estadística.

Denición 3.3.1. Dada una variable aleatoria discreta, X, con función de masa P (xi), i = 1, 2, . . . ,se dene su media o esperanza como:

µ = E[X] =∑

i

xiP (xi) .

De manera análoga, si X es una variable aleatoria continua, con función de densidad f(x), sedene su media o esperanza como:

µ = E[X] =

∫R

xf(x) dx .

Pasemos a las medidas de dispersión (en el capítulo de Estadística vimos la utilidad de estasmedidas).

Denición 3.3.2. La varianza de una variable aleatoria discreta, X, con función de masa P (xi)y media µ se dene como:

σ2 = V [X] = E[(X − µ)2] =∑

i

(xi − µ)2P (xi) .

Análogamente, la varianza de una variable aleatoria continua, X, con función de densidad f(x)media µ se dene como:

σ2 = V [X] = E[(X − µ)2] =

∫R(x − µ)2f(x) dx .

La desviación típica, σ, de una variable aleatoria se dene como la raíz cuadrada positiva desu varianza.

Ejercicio 1 Demostrar, en los casos discreto y continuo, la siguiente identidad para la varianza deuna variable aleatoria:

σ2 = E[X2] − µ2

Page 45: Descriptiva y Probabilidad

3.3. ESPERANZA: MEDIA Y VARIANZA 45

Solución: Si X es una variable aleatoria discreta con función de masa P (xi), desarrollando elcuadrado y simplicando, se obtiene:

σ2 =∑

i

(xi − µ)2P (xi)

=∑

i

(x2i − 2xiµ + µ2)P (xi)

=∑

i

x2i P (xi) − 2µ ·

( ∑i

xiP (xi))

+ µ2 ·( ∑

i

P (xi))

= E[X2] − 2µ2 + µ2 = E[X2] − µ2 .

En el caso continuo, desarrollando el cuadrado y simplicando, se obtiene:

σ2 =

∫R(x − µ)2f(x) dx

=

∫R

x2f(x) dx − 2µ

( ∫R

xf(x) dx

)+ µ2

( ∫R

f(x) dx

)= E[X2] − 2µ2 + µ2 = E[X2] − µ2 .

Ejemplos

Ejemplo 26 Una persona participa en un concurso de televisión con las siguientes reglas:

• Si contesta correctamente a una pregunta con cinco respuestas posibles (sólo una correcta) gana10 000e.

• En caso contrario se le propone una segunda pregunta con tres respuestas posibles (sólo unacorrecta). Si acierta gana 1 000e.

• Si tampoco acierta la segunda respuesta, se le propone una tercera con dos respuestas posibles(sólo una correcta). Si acierta no gana nada, pero si falla debe pagar 500e.

El juego termina cuando la persona acierta o tras fallar la tercera pregunta. Si un concursante contestaal azar, calcúlese:

a) probabilidad de que obtenga una respuesta correcta;

b) la ganancia esperada;

c) E[X] y V [X], siendo X el número de preguntas propuestas al concursante.

Solución: Sea Ai el suceso el concursante responde correctamente la cuestión i-ésima, i = 1, 2, 3.Los sucesos A1, A2 y A3 son independientes.

a) La probabilidad de que una respuesta sea correcta es:

P (A1) + P (A2)P (Ac1) + P (A3)P (Ac

1)P (Ac2) =

1

5+

1

3· 4

5+

1

2· 4

5· 2

3=

11

15.

Page 46: Descriptiva y Probabilidad

46 CAPÍTULO 3. VARIABLES ALEATORIAS

b) Sea Y la variable aleatoria ganancia . Es claro que esta variable toma los valores:

y1 = 10 000 con P (y1) =1

5;

y2 = 1 000 con P (y2) =4

5· 1

3=

4

15;

y3 = 0 con P (y3) =4

5· 2

3· 1

2=

4

15;

y3 = −500 con P (y3) =4

5· 2

3· 1

2=

4

15.

Por tanto, la ganancia esperada es:

E[Y ] = 10 000 · 1

5+ 1 000 · 4

15+ 0 · 4

15− 500 · 4

15= 2 133.33e .

c) La variable aleatoria X puede tomar los valores:

x1 = 1 con P (X = 1) = P (A1) =1

5,

x2 = 2 con P (X = 2) = P (A2)P (Ac1) =

1

3· 4

5=

4

15,

x3 = 3 con P (X = 3) = P (Ac2)P (Ac

1) =2

3· 4

5=

8

15.

Así:

µ = E[X] =3∑

i=1

xiP (xi) = 1 · 1

5+ 2 · 4

15+ 3 · 8

15=

35

15= 2.33 ;

V [X] = E[X2] − µ2 =3∑

i=1

x2i P (xi) − µ2

= 1 · 1

5+ 4 · 4

15+ 9 · 8

15−

(35

15

)2

=91

15− 1225

225=

1365 − 1225

225=

140

225=

28

45= 0.622 .

Ejemplo 27 La longitud de ciertos tornillos en centímetros se distribuye según la función de densi-dad:

f(x) =

3

4(x − 1)(3 − x) si x ∈ [1, 3]

0 si x /∈ [1, 3] .

i) Calcúlese E[X] y σ[X].

ii) Si los tornillos son válidos sólo si su longitud está entre 1.7 y 2.4 cm., calcúlese la probabilidadde que un tornillo sea válido.

Page 47: Descriptiva y Probabilidad

3.4. VARIAS VARIABLES 47

Solución: i) Aplicamos directamente las fórmulas a la variable aleatoria continua X =longitud deltornillo, que tiene función de densidad f(x):

E[X] =∫ 3

1

34

x(x − 1)(3 − x) dx =34

∫ 3

1(−3x + 4x2 − x3) dx

=34

(− 3

2(9 − 1) +

43(27 − 1) − 1

4(81 − 1)

)=

34

(− 12 +

1043

− 20)

=34· 83

= 2 ;

E[X2] =34

∫ 3

1(−3x2 + 4x3 − x4) dx =

34

(− (27 − 1) + (81 − 1) − 1

5(243 − 1)

)=

34

(− 26 + 80 − 242

5

)=

34· 28

5=

215

σ2[X] = E[X2] − µ2 =215

− 4 =15

σ[X] =

√15

=√

55

= 0.447 .

ii) Nos piden calcular P (1.7 < x < 2.4), que, por denición, es:

P (1.7 < x < 2.4) =∫ 2.4

1.7f(x) dx =

34

∫ 2.4

1.7(−3 + 4x − x2) dx

=34·(− 3(2.4 − 1.7) + 2(2.42 − 1.72) − 1

3(2.43 − 1.73)

)=

34·(− 2.1 + 5.74 − 1

38.911

)=

14·(10.92 − 8.911

)=

2.0094

= 0.50225 .

3.4 Varias variables

En un mismo experimento aleatorio podemos considerar distintas variables aleatorias: X1, X2, . . . .En ocasiones interesará considerar sucesos determinados por valores referidos a varias de ellas, en cuyocaso tendremos que mezclar adecuadamente la información de las variables individuales.

En el mejor de los casos la información de cada variable no inuirá en la de las demás. Diremosque estamos ante variables independientes. Cuando esto no sea así, tendremos una relación entreellas más o menos fuerte. La covarianza de dos variables aleatorias es un número que nos mideesta posible relación.

Denición 3.4.1. (Vectores aleatorios) Un vector aleatorio (o variable aleatoria de dimensión n)es una función

(X1, . . . , Xn) : Ω −→ Rn .

que a cada elemento ω del espacio muestral Ω le hace corresponder n números reales X1(ω), . . . , Xn(ω).

Page 48: Descriptiva y Probabilidad

48 CAPÍTULO 3. VARIABLES ALEATORIAS

Ejemplo 28 En el experimento tirar dos dados perfectos sucesivamente, se considera el vectoraleatorio

(X, Y ) : Ω −→ R2

que dado un elemento ω = (a, b) nos devuelve:

(X, Y )(ω) = (a + b, |a − b|) .

En el concurso televisivo del Ejemplo 26, se considera el vector aleatorio

(X, Y ) : Ω −→ R2

que a cada elemento del espacio muestral, ω, le asocia:

(X, Y )(ω) = ( preguntas propuestas al concursante , ganancia del concursante ) .

En la producción de tornillos del Ejemplo 27, consideramos el vector aleatorio

(X,Y, Z) : Ω −→ R3

que al tomar cada tornillo ω ∈ Ω, nos dice:

(X, Y, Z)(ω) = ( su longitud , diámetro de la cabeza , longitud de la rosca ) .

En lo que sigue deniremos los conceptos análogos al caso de una variable aleatoria para vectoresaleatorios de dimensión 2. El caso ndimensional es la generalización natural del de dimensión 2.Además, al considerar vectores aleatorios de la forma:

(X, Y ) : Ω −→ R2

podremos hacer representaciones sobre el plano, ganando en claridad a la hora de asimilar los con-ceptos.

Denición 3.4.2. Si A es un subconjunto de R2 descrito como conjunto de posibles valores del vectoraleatorio (X, Y ) : Ω −→ R2, denimos:

P (A) = P ((X, Y ) ∈ A) = P (ω ∈ Ω : (X(ω), Y (ω)) ∈ A) .

Denición 3.4.3. La función de distribución de un vector aleatorio (X, Y ) se dene como:

F (x, y) = P ((s, t) ∈ R2 : s ≤ x, t ≤ y)= P (ω ∈ Ω : X(ω) ≤ x, Y (ω) ≤ y) para todo (x, y) ∈ R2 .

Las propiedades de las funciones de distribución de un vector aleatorio son, en cierto modo,parecidas al caso de una variable. Sin embargo son menos manejables, de manera que utilizaremoslas funciones de masa conjunta o de densidad conjunta, para el cálculo de probabilidades.

Ejercicio 2 Calcular la función de distribución del vector aleatorio

(X, Y ) : Ω −→ R2

correspondiente al concurso televisivo del Ejemplo 28.

Page 49: Descriptiva y Probabilidad

3.4. VARIAS VARIABLES 49

3.4.1 Densidad conjunta

Denición 3.4.4. Un vector aleatorio (X, Y ) es discreto cuando sólo puede tomar un númeronito o numerable de valores. El modelo de probabilidad conjunta de un vector aleatorio(X, Y ) discreto queda caracterizado por la función de masa conjunta:

P (X = xi, Y = yj) = P (ω ∈ Ω : X(ω) = xi, Y (ω) = yj) i = 1, . . . , m ; j = 1, . . . , n .

Cuando esté claro por el contexto, utilizaremos la siguiente notación: pi,j = P (X = xi, Y = yj).La función de masa conjunta suele presentarse con una tabla de doble entrada:

X

Y

y1 · · · yj · · · yn

x1...

...

xi · · · · · · pi,j · · · · · ·...

...

xm

Ejemplo 29 Para el concurso televisivo descrito en el Ejemplo 26, calcular la función de masa delvector aleatorio determinado por:

(X,Y )(ω) = ( preguntas propuestas al concursante , ganancia del concursante ).Solución: Este vector aleatorio puede tomar 3 × 4 = 12 valores, tomando la primera componente3 posibles valores, y 4 la segunda. La siguiente tabla nos representa la función de masa conjunta:

X

Y

−500 0 1 000 10 000

1 0 0 015

2 0 0415

0

3415

415

0 0

En el caso de vectores aleatorios, aparte de la distribución conjunta, hay otras distribucionestambién muy interesantes: las distribuciones marginales y las condicionadas.

Denición 3.4.5. Las distribuciones marginales de un vector aleatorio (X, Y ) son las que seobtienen al considerar cada característica por separado. Así tenemos:

Distribución marginal de X: es de tipo discreto y su función de masa marginal vienedada por:

P (X = xi) =n∑

j=1

P (X = xi, Y = yj) , i = 1, . . . , m .

Distribución marginal de Y : es de tipo discreto y su función de masa marginal vienedada por:

P (Y = yj) =m∑

i=1

P (X = xi, Y = yj) , j = 1, . . . , n .

Page 50: Descriptiva y Probabilidad

50 CAPÍTULO 3. VARIABLES ALEATORIAS

Obsérvese que, de la denición, es fácil obtener cada distribución marginal si la función de masaconjunta viene representada por una tabla de doble entrada: basta en cada caso sumar por las opor columnas.

Ejemplo 30 Las distribuciones marginales del ejemplo anterior se obtienen a partir de la tabla comose indica:

X

Y

−500 0 1 000 10 00 P (X = xi) FX(xi)

1 0 0 015

15

15

2 0 0415

0415

715

3415

415

0 0815

1

P (Y = yj)415

415

415

15

FY (yj)415

815

45

1

3.4.2 Covarianza

Antes de pasar a las distribuciones condicionadas conviene denir: covarianza e independencia.

Denición 3.4.6. La covarianza entre dos variables aleatorias discretas X e Y se dene como:

Cov(X,Y ) = E[(X − E[X])(Y − E[Y ])

]=

m∑i=1

n∑j=1

(xi − E[X])(yj − E[Y ])P (X = xi, Y = yj) .

Decimos que X e Y están incorreladas, cuando Cov(X, Y ) = 0.

Se dene, también, el coeficiente de correlación lineal de (X,Y ) como:

r =Cov(X, Y )

σ[X]σ[Y ].

Este coeciente verica que −1 ≤ r ≤ 1, y sirve para estudiar la existencia de una posible relaciónlineal entre X e Y : digamos Y = aX + b para ciertos coecientes a, b ∈ R. Si r = 1 ó r = −1, existetal relación lineal. Su utilidad quedará más clara en los capítulos sobre Estadística.

Ejercicio 3 Demostrar la siguiente fórmula:

Cov(X,Y ) = E[XY ] − E[X] · E[Y ] .

Page 51: Descriptiva y Probabilidad

3.4. VARIAS VARIABLES 51

Solución: Desarrollando el sumatorio y usando las propiedades de las funciones de distribuciónconjunta y marginales, tenemos:

Cov(X,Y ) =m∑

i=1

n∑j=1

(xi − E[X])(yj − E[Y ])P (X = xi, Y = yj)

=m∑

i=1

n∑j=1

xiyjP (X = xi, Y = yj) − E[Y ]m∑

i=1

xi

( n∑j=1

P (X = xi, Y = yj))

−E[X]n∑

j=1

yj

( m∑i=1

P (X = xi, Y = yj))

+ E[X]E[Y ]m∑

i=1

n∑j=1

P (X = xi, Y = yj)

= E[XY ] − E[Y ]m∑

i=1

xiP (X = xi) − E[X]n∑

j=1

yjP (Y = yj) + E[X]E[Y ]

= E[XY ] − E[Y ]E[X] − E[X]E[Y ] + E[X]E[Y ] = E[XY ] − E[X]E[Y ] .

3.4.3 Independencia

Denimos a continuación la independencia de variables aleatorias discretas, de manera análoga a ladenición de independencia de sucesos.

Denición 3.4.7. Dos variables aleatorias discretas, X e Y , se dicen independientes cuando:

P (X = xi, Y = yj) = P (X = xi) · P (Y = yj) para i = 1, . . . , m ; j = 1, . . . , n .

Surge, de manera directa, la siguiente propiedad:

Si X e Y son variables aleatorias discretas independientes entonces

E[XY ] = E[X] · E[Y ] .

En particular son incorreladas, es decir: Cov(X,Y ) = 0 .

Ejercicio 4 Demostrar la propiedad anterior.Solución: Supongamos que X e Y son independientes, es decir:

P (X = xi, Y = yj) = P (X = xi) · P (Y = yj) ,

para i = 1, . . . , m ; j = 1, . . . , n. Calculemos la esperanza de la variable producto X · Y :

E[XY ] =m∑

i=1

n∑j=1

xiyjP (X = xi, Y = yj)

=m∑

i=1

n∑j=1

xiyjP (X = xi) · P (Y = yj)

=m∑

i=1

xiP (X = xi)( n∑

j=1

yjP (Y = yj))

= E[Y ]( m∑

i=1

xiP (X = xi))

= E[Y ]E[X] .

Page 52: Descriptiva y Probabilidad

52 CAPÍTULO 3. VARIABLES ALEATORIAS

En particular Cov(X, Y ) = E[XY ] − E[X]E[Y ] = 0, en otras palabras, X e Y son incorreladassiempre que sean independientes.

Ejercicio 5 Calcular la covarianza de las variables aleatorias X = número de preguntas propuestasal concursante e Y = ganancia de un concursante, del Ejemplo 26.Solución: De la tabla de las funciones de masa conjunta y marginales del vector (X, Y ) vemos queno son independientes, pues, por ejemplo:

P (X = 3, Y = 0) =415

mientras que P (X = 3) · P (Y = 0) =815

· 415

6= 415

.

Con los datos de la tabla calculamos:

E[X] = 1 · 15

+ 2 · 415

+ 3 · 815

=3515

=73

E[Y ] = 10 000 · 15

+ 1 000 · 415

+ 0 · 415

− 500 · 415

=32 000

15=

6 4003

E[XY ] = 1 · 10 000 · 15

+ 2 · 1 000 · 415

+ 3 · 0 · 415

+ 3 · (−500) · 415

=32 000

15=

6 4003

de donde: Cov(X, Y ) = E[XY ] − E[X]E[Y ] =6 400

3− 7

3· 6 400

3=

(1 − 7

3

)· 6 400

3=

−25 6009

3.4.4 Densidades condicionadas

Finalizamos esta sección con el concepto de probabilidad condicionada.

Denición 3.4.8. La distribución de la variable aleatoria X, condicionada por un valor jo, yj, dela variable aleatoria Y , viene dada por la función de masa condicionada:

P (X = xi |Y = yj) =P (X = xi, Y = yj)

P (Y = yj), i = 1, . . . ,m .

Es fácil comprobar que si X e Y son independientes, las distribuciones condicionadas coincidencon las distribuciones marginales correspondientes:

P (X = xi |Y = yj) =P (X = xi, Y = yj)

P (Y = yj)

=P (X = xi) · P (Y = yj)

P (Y = yj)= P (X = xi) , i = 1, . . . , m .

Y, análogamente, para Y : P (Y = yj |X = xi) = P (Y = yj), j = 1, . . . , n.

3.4.5 Vectores aleatorios continuos

Denición 3.4.9. Un vector aleatorio (X,Y ) es continuo cuando toma valores en un subconjuntono discreto de R2; por ejemplo: un cuadrado, un rectángulo, un triángulo, un círculo, un sectorcircular, . . . .

El modelo de probabilidad conjunta de un vector aleatorio (X, Y ) continuo queda carac-terizado por la función de densidad conjunta, que es una función f : R2 −→ R, vericando:

1. f(x, y) ≥ 0 para todo (x, y) ∈ R2;

Page 53: Descriptiva y Probabilidad

3.4. VARIAS VARIABLES 53

2.∫∫

R2

f(x, y) dx dy = 1.

La probablidad de cualquier suceso A ⊂ R2 relativo al vector aleatorio continuo (X,Y ), se calculapor la fórmula:

P (A) =

∫∫A

f(x, y) dx dy .

Denición 3.4.10. Las distribuciones marginales de un vector aleatorio (X,Y ) son las quese obtienen al considerar cada característica por separado. Así tenemos:Distribución marginal de X: es de tipo continuo y su función de densidad marginal

viene dada por:

f(x) =

∫R

f(x, y) dy , para todo x ∈ R .

Distribución marginal de Y : es de tipo continuo y su función de densidad marginal

viene dada por:

f(y) =

∫R

f(x, y) dx , para todo y ∈ R .

Denición 3.4.11. La covarianza entre dos variables aleatorias continuas X e Y se dene como:

Cov(X,Y ) = E[(X − E[X])(Y − E[Y ])

]=

∫∫R2

(x − E[X])(y − E[Y ])f(x, y) dx dy .

Decimos que X e Y están incorreladas, cuando Cov(X, Y ) = 0. El coeficiente de corre-

lación lineal de (X, Y ) se dene como:

r =Cov(X, Y )

σ[X]σ[Y ].

Ejercicio 6 Demostrar la igualdad: Cov(X, Y ) = E[XY ] − E[X]E[Y ].

Denición 3.4.12. Dos variables aleatorias continuas, X e Y , se dicen independientes si:

f(x, y) = f(x)f(y) para cualesquiera x ∈ R, y ∈ R .

Se tienen, también, la siguiente propiedad:

Si X e Y son variables aleatorias continuas independientes entonces

E[XY ] = E[X] · E[Y ] .

En particular son incorreladas, es decir: Cov(X,Y ) = 0 .

Denición 3.4.13. La distribución de la variable aleatoria X, condicionada por un valor jo, y, dela variable aleatoria Y , viene dada por la función de densidad condicionada:

f(x | y) = f(x |Y = y) =f(x, y)

f(y), para todo x ∈ R .

Obsérvese que es necesario que f(y) > 0. Intuitivamente, esto quiere decir que estamos condicio-nando por un valor de Y potencialmente observable.

Page 54: Descriptiva y Probabilidad

54 CAPÍTULO 3. VARIABLES ALEATORIAS

Es fácil comprobar que si X e Y son independientes, las distribuciones condicionadas coincidencon las distribuciones marginales correspondientes:

f(x | y) =f(x)f(y)

f(y)= f(x) , para todo x ∈ R ; f(y |x) =

f(x)f(y)

f(x)= f(y), para todo y ∈ R .

Ejercicio 7 La función de densidad conjunta de dos variables aleatorias continuas es:

f(x, y) =

k(x + xy) si x ∈ (0, 1), y ∈ (0, 1)0 en otro caso.

1) ¾Cuál es el valor de k?

2) Calcular la densidad marginal, la esperanza y la varianza de cada variable.

3) ¾Son variables independientes?

4) Calcular la covarianza.

Solución: 1) Puesto que es una función de densidad hemos de tener integral total 1. Integrandotenemos:∫∫

R2

f(x, y) dx dy = k

∫ 1

0

∫ 1

0

(x + xy) dx dy

= k

∫ 1

0

x( ∫ 1

0

(1 + y) dy)

dx = k

∫ 1

0

x((1 − 0) + (

1

2− 0)

)dx

=3k

2

∫ 1

0

x dx =3k

2

(1

2− 0

)=

3k

4=⇒ k =

4

3.

2) Las densidades marginales serán:

f(x) =

∫R

f(x, y) dy

ahora bien:∫ 1

0

4

3x(1 + y) dy =

4x

3

((1 − 0) + (

1

2− 0)

)= 2x

de donde: f(x) =

2x si x ∈ (0, 1)0 en otro caso;

f(y) =

∫R

f(x, y) dx

ahora bien:∫ 1

0

4

3(1 + y)x dx =

4(1 + y)

3

(1

2− 0

)=

2

3(1 + y)

de donde: f(y) =

2

3(1 + y) si y ∈ (0, 1)

0 en otro caso.

Page 55: Descriptiva y Probabilidad

3.5. SUMA DE VARIABLES INDEPENDIENTES 55

Con las densidades marginales calculamos los parámetros pedidos de cada variable:

µX = E[X] =∫ 1

0x · 2xdx = 2

(13− 0

)=

23

E[X2] =∫ 1

0x2 · 2xdx =

12

(1 − 0) =12

σ2X = E[X2] − µ2

X =12− 4

9=

118

µY = E[Y ] =∫ 1

0y · 2

3(1 + y) dy =

23

(12

+13

)=

59

E[Y 2] =23

∫ 1

0y2 (1 + y) dy =

23

(13

+14

)=

718

σ2Y = E[Y 2] − µ2

Y =718

− 2581

=13162

3) La densidad conjunta es el producto de las marginales:

f(x, y) = f(x) · f(y)

y, por tanto, son variables independientes.

4) Al ser variables independientes, directamente son incorreladas, es decir: Cov(X, Y ) = 0.

3.5 Suma de variables independientes

Es especialmente ventajoso considerar variables que se distribuyen de manera independiente puescombinándolas linealmente se obtienen otras variables cuyas distribuciones se conocen a partir de lasprimeras.

En la Estadística Descriptiva que hemos tratado en el Capítulo 1, es interesante que las muestrasrecogidas nos sirvan para inferir la distribución de cierta cualidad en determinada población. Paraello tomamos medidas numéricas de la muestra. Si cada dato muestral es representativo de la cualidad(o variable aleatoria) a inferir, nos gustaría, por ejemplo, que la media muestral fuese representativade la media de dicha cualidad (se dice de la media poblacional); y así con el resto de las medidas:varianza, desviación típica, mediana, . . .

Si consideramos a cada muestra, de tamaño N , como un valor concreto de un vector aleatorio(X1, X2, . . . , XN), con cada componente la misma variable, el requisito de independencia de las Xi

simplica tanto los cálculos como el análisis.

Denición 3.5.1. Dadas n variables aleatorias X1, X2, . . . , Xn decimos que son variables aleatoriasindependientes igualmente distribuidas, en adelante v.a.i.i.d., si todas siguen el mismo modelo deprobabilidad, digamos Xi ∼ X, y son independientes dos a dos.

Ejercicio 8 Probar que si X1, X2, . . . , Xn son v.a.i.i.d. con distribución común Xi ∼ X, µ = E(X)y σ2 = V (X) entonces:

E(X1 + X2 + · · · + Xn) = nµ , V (X1 + X2 + · · · + Xn) = nσ2 .

Es más si X = 1n

(X1 + X2 + · · · + Xn

)entonces µ(X) = µ y V (X) = σ2/n.

Page 56: Descriptiva y Probabilidad

56 CAPÍTULO 3. VARIABLES ALEATORIAS

Podemos, por último, tratar el caso más general de combinaciones lineales de variables aleato-rias independientes. Basta enunciar los resultados para dos variables. Los presentamos en forma deejercicio:

Ejercicio 9 Sean X e Y dos variables aleatorias independientes, y consideremos la nueva variableT = aX + bY (con a, b ∈ R). Entonces:

E(T ) = aE(X) + bE(Y ) , V (T ) = a2V (X) + b2V (Y ) .

Cerramos la sección con la observación de que si no se tiene independencia (ni tan siquieraincorrelación) entre las variables, la covarianza juega un papel importante en la fórmula de la varianzade la combinación (ver el problema 1).

Problemas

1. Demuestra las siguientes propiedades de esperanzas y varianzas de variables aleatorias:

(a) E[kX] = kE[X].

(b) E[X + Y ] = E[X] + E[Y ].

(c) V [kX] = k2V [X].

(d) Si X e Y son incorreladas: E[XY ] = E[X]E[Y ].

(e) V [X1 + · · · + Xn] = V [X1] + · · · + V [Xn] + 2∑i<j

Cov(Xi, Xj).

(f) Si X1, . . . , Xn son variables aleatorias incorreladas:

V [X1 + · · · + Xn] = V [X1] + · · · + V [Xn] .

(g) V [X − Y ] = V [X] + V [Y ] − 2Cov(X,Y ).

(h) Si X e Y son variables aleatorias incorreladas: V [X − Y ] = V [X] + V [Y ].

2. Dadas las variables aleatorias independientes X e Y con funciones de densidad f y g respecti-vamente, dadas por:

f(x) =

2x si 0 ≤ x ≤ 10 en otro caso;

g(y) =

y

2si 0 ≤ y ≤ 2

0 en otro caso;

calcula:

i) E[X + Y ];

ii) E[2X − 3Y + 5];

iii) E[2XY ];

iv) V [4X − 2Y − 3];

v) V [2X + 3Y ].

Page 57: Descriptiva y Probabilidad

3.5. SUMA DE VARIABLES INDEPENDIENTES 57

3. En un experimento aleatorio el suceso A ocurre con probabilidad 0.2. Se realiza el experimentotres veces y se dene la variable aleatoria X = número de veces que ha ocurrido A en las trespruebas que se suponen independientes.

(a) Calcular E[X] y V [X].

(b) Representar grácamente la función de distribución de X.

(c) Calcular P (X > 2) a partir de la función de distribución.

4. La variable aleatoria X está distribuida de tal forma que su función de densidad determina conlos ejes un triángulo rectángulo con ángulo recto en el origen y base sobre el intervalo (0, 1).Calcula sus funciones de densidad y distribución, la esperanza, µ, la desviación típica, σ, y laprobabilidad de que X ∈ (µ − σ, µ + σ).

5. Un semáforo está verde para los coches durante un minuto y medio, y rojo durante 15 segundos.Suponiendo que un automovilista llega al semáforo con igual probabilidad en cualquier instante,calcúlese el tiempo medio de espera.

6. Una diana está formada por tres círculos concéntricos de radios 10, 20 y 30 cm. respectivamente.Si se cae en el círculo central se obtienen 5 puntos, 3 puntos si se cae en la primera coronay 1 punto al caer en la tercera corona. La probabilidad de que un tiro caiga en cada zona esproporcional al área de la misma (y ningún tiro cae fuera de la diana). Si se efectúan cuatrodisparos, calcúlese:

(a) la puntuación esperada;

(b) la probabilidad de la puntuación total se mayor que 17.

7. Un examen consta de 5 temas numerados. Para elegir un tema al azar, se propone lanzar undado; si sale de 1 a 5, el número del tema es el resultado del dado; si sale 6 se vuelve a tirarhasta que sale de 1 a 5. Sabemos que el dado está trucado de tal manera que la probabilidadde que salga el número 2 es 2/7 y la probabilidad de cualquier otro número es 1/7. Sea X lavariable aleatoria que representa el tema seleccionado nalmente. Halla la probabilidad de queX valga 1 (que nos interesa especialmente ya que el tema 1 es el único que hemos estudiado).

8. El vector aleatorio (X,Y ) tiene una distribución de probabilidad dada por:

P (X = 0, Y = 1) = 0.3 ; P (X = 1, Y = 1) = 0.1 ; P (X = 2, Y = 1) = 0.1 ;

P (X = 0, Y = 2) = 0.1 ; P (X = 1, Y = 2) = 0.2 ; P (X = 2, Y = 2) = 0.2 .

Calcúlese:

(a) Las distribuciones marginales y condicionadas;

(b) las esperanzas de cada variable, y la de XY ;

(c) las varianzas de cada variable y Cov(X,Y );

(d) el coeciente de correlación lineal.

Page 58: Descriptiva y Probabilidad

58 CAPÍTULO 3. VARIABLES ALEATORIAS

9. La vida útil de cierto producto perecedero es una variable aleatoria con función de densidad

f(x) =

e−x si x > 00 en otro caso.

Si X1 y X2 representan la vida útil de dos unidades de dicho producto, seleccionadas al azar,calcúlese P (X1 ≤ 2, 1 ≤ X2 ≤ 3).

10. Dado el vector aleatorio (X,Y ) y la función

f(x, y)

k(x + y) si 0 ≤ x ≤ 2 0 ≤ y ≤ 2x − x2

0 en otro caso.

(a) Determínese k para que f(x, y) sea su función de densidad.

(b) Calcular P (0 ≤ X ≤ 1).

11. Las etiquetas de cierta bebida pueden tener un premio de forma que en cada 1000 etiquetashay 500 correspondientes a inténtelo otra vez, 300 con premio de 5 euros, 150 con premios de10 euros, 40 con premios de 50 euros y 10 con premios de 100 euros. Una persona compra unabotella que cuesta 10 euros.(a) Si X es la variable aleatoria correspondiente al benecio obtenido por el comprador, ¾cuáles la distribución de X?(b) ¾Cuál es el benecio esperado del comprador?(c) ¾Cuál es la probabilidad de perder dinero?(d) Si se sabe que el comprador ha ganado dinero, ¾cuál es la probabilidad de que le hayatocado una etiqueta de 100 euros?

12. En una ciudad hay una proporción p de personas que fuman. Se dene una variable aleatoriaX que toma el valor 1 si al preguntar a una persona seleccionada aleatoriamente responde quees fumador, y toma el valor 0 si responde que no lo es.(a) En función de p calcula la esperanza de X e interpreta el valor obtenido.(b) Calcula la varianza de X en función de p. ¾Para qué valor de p es máxima la varianza?(c) Si se pregunta a n personas seleccionadas aleatoriamente con reemplazamiento, y la variablealeatoria Y representa el número de fumadores entre los n seleccionados, calcula la esperanzay la varianza de Y .

13. Sea X una variable aleatoria continua con función de densidad

f(x) =

k(1 + x), si x ∈ (0, 2)0, si x /∈ (0, 2)

(a) Calcula la constante k.(b) Calcula la probabilidad de que X tome valores entre 0 y 1.(c) Sabiendo que X es mayor que 1, ¾cuál es la probabilidad de que sea menor que 1.5?(d) Calcula P|X − E(X)| > 0.2

14. El tiempo de vida activa de un plaguicida (en días) es una variable aleatoria X con función dedensidad

f(x) =

1

500e−

1500

x, si x ≥ 00, si x < 0

Page 59: Descriptiva y Probabilidad

3.5. SUMA DE VARIABLES INDEPENDIENTES 59

(a) Calcula el valor m tal que la probabilidad de que X sea menor o igual que m es 0.5.Interpreta el resultado obtenido.(b) Si al cabo de 800 días el plaguicida ya no estaba activo, ¾cuál es la probabilidad de quetras 600 días todavía lo estuviera?

15. El vector aleatorio (X, Y ) tiene una distribución uniforme en el cuarto de círculo de centro(0, 0) y radio r correspondiente al primer cuadrante. Obténganse las densidades conjunta ymarginales de X e Y , y estudiar si son variables independientes.

16. Una pareja decide encontrarse en un lugar prejado entre las tres y las cuatro de la tarde, deforma que el primero que llegue sólo esperará al otro durante 15 minutos. Suponiendo que losmomentos de llegada de ambos al lugar son independientes y se distribuyen uniformementeentre las tres y las cuatro, calcúlese la probabilidad de que no se encuentren.

17. Una fábrica produce una pieza en dos calidades diferentes: el 60% de la producción es decalidad A. La duración (en años) de una pieza de esta calidad viene dada por la función dedensidad

fA(x) =

e−x si x > 00 en el resto.

El 40% restante es de calidad B. La duración viene dada, en este caso, por la función dedensidad

fB(x) =

2e−2x si x > 00 en el resto.

(a) Calcula la probabilidad de que una pieza de calidad A dure más de 1 año.(b) Si tomamos una pieza al azar de toda la producción, ¾cuál es la probabilidad de que duremás de 1 año?(c) Si tomamos una pieza al azar de toda la producción, y observamos que dura más de 1 año,¾cuál es la probabilidad de que sea de calidad A?

18. Una empresa suministra energía eléctrica a través de dos líneas de alta tensión A y B. En lasiguiente tabla se muestran las probabilidades conjuntas pij = PX = xi, Y = yj, para lasvariables X ≡ número de fallos mensuales en la línea A e Y ≡ número de fallos mensuales enla línea B.

YX 0 1 2 3 40 0.20 0.15 0.05 0.04 0.021 0.20 0.06 0.08 0.03 0.012 0.06 0.02 0.02 0 03 0.04 0.02 0 0 0

(a) Calcula las distribuciones marginales de X e Y .(b) Calcula la distribución del número de fallos que se producen en la línea B en un mes en queno se produce ningún fallo en la línea A. ¾Cuál es el número esperado de fallos en este caso?(c) ¾Son independientes los fallos en las dos líneas?

Page 60: Descriptiva y Probabilidad

60 CAPÍTULO 3. VARIABLES ALEATORIAS

19. Dos características, X e Y , son variables aleatorias con función de densidad conjunta:

f(x, y) =

kye−2xe−y si x > 0, y > 00 en el resto.

(a) Hallar el valor de k. ¾Son independientes X e Y ?

(b) Calcular la esperanza de X.

20. Dos sustancias, A y B, se encuentran en la sangre en cantidades X e Y , respectivamente. Estascantidades varían de un individuo a otro. La densidad conjunta de ambas es:

f(x, y) =

281

xy2 si 0 < x < 3, 0 < y < 30 en el resto.

Calcúlese:

(a) la densidad marginal de Y y la esperanza de Y ;

(b) la probabilidad de que, en un individuo tomado al azar, haya más sustancia A que B.

Page 61: Descriptiva y Probabilidad

Capítulo 4

Modelos de probabilidad

4.1 Modelos discretos

4.1.1 Pruebas de Bernoulli

Denición 4.1.1. Una prueba de Bernoulli es un experimento aleatorio cuyos posibles resul-tados se agrupan en dos conjuntos excluyentes que llamaremos éxito (E) y fracaso (F ), conrespectivas probabilidades: p = P (E) y 1 − p = P (F ).

Ejemplos 31 En el lanzamiento de una moneda podemos tomar E = Cara y F = Cruz .Si la moneda no está trucada, p = 1

2.

En una población se elige al azar una persona y consideramos los sucesos E = altura ≥ 1.80y F = altura < 1.80. La probabilidad de éxito dependerá de la distribución de la variable alturaen la población.

En el lanzamiento de un dado podemos tomar E = 6 y F = 1, 2, 3, 4, 5. Si el dado esperfecto, p = 1

6; si está trucado y, por ejemplo, el 2 tiene probabilidad doble que cualquiera de los

demás resultados, p = 17.

La distribución de Bernoulli es el modelo más sencillo obtenido a partir de pruebas de Bernoulli.

Denición 4.1.2. Realizada una prueba de Bernoulli con P (E) = p se considera la variable aleatoria

X =

1 si obtenemos éxito0 si obtenemos fracaso

La función de masa es: P (X = 0) = 1− p y P (X = 1) = p. Los parámetros esperanza y varianza deuna variable X con distribución de Bernoulli son:

E[X] = p , V [X] = p (1 − p) ;

obtenidos ambos de manera sencilla a partir de la denición. Para abreviar escribiremos X ∼ B(1; p)para indicar que X es una variable aleatoria con distribución de Bernoulli con esperanza p.

61

Page 62: Descriptiva y Probabilidad

62 CAPÍTULO 4. MODELOS DE PROBABILIDAD

4.1.2 Distribución binomial

Denición 4.1.3. Supongamos que realizamos n pruebas de Bernoulli independientes, con P (E)=pen cada prueba. Sea X la variable número de éxitos obtenidos en las n pruebas. Llamamos dis-tribución binomial a la distribución de esta variable X. Denotaremos por B(n; p) la distribuciónbinomial de parámetros n = número de pruebas de Bernoulli y p = P (E) en cada prueba.

Si X sigue una distribución B(n; p), escribiremos X ∼ B(n; p), y su función de masa es:

P (X = i) =

(n

i

)pi(1 − p)n−i , i = 0, 1, 2, . . . , n .

Obsérvese que si tomamos una prueba de Bernoulli con p(E) = p, y consideramos la variable Xcon valores 1 si éxito, 0 si fracaso, entonces X ∼ B(1; p).

También, si tomamos n variables Xi independientes, todas y cada una de ellas siguiendo la mismadistribución B(1; p), entonces la variable

X = X1 + X2 + · · · + Xn

sigue una distribución B(n; p). En particular, la esperanza y la varianza de X ∼ B(n; p) son:

E[X] = n · p , V [X] = n · p · (1 − p) ;

puesto que p = E[Xi] y p · (1 − p) = V [Xi] para cada una de las variables independientes quesumamos.

4.1.3 Otros modelos basados en pruebas de Bernoulli

Denición 4.1.4. Realizamos pruebas de Bernoulli independientes con la misma distribución dadapor P (E) = p. La distribución geométrica de parámetro p es la de la variable aleatoria:

X = número de pruebas hasta el primer éxito.

Su función de masa es:

P (X = j) = (1 − p)j−1 · p , j = 1, 2, 3, . . . .

Se puede probar que:

E[X] =1

p; V [X] =

1 − p

p2.

Ejercicio 1 Demostrar que si X sigue una distribución geométrica de parámetro p, entonces

E[X] =1

p.

Page 63: Descriptiva y Probabilidad

4.1. MODELOS DISCRETOS 63

Solución: Por denición se tiene:

E[X] = 1 · p + 2 · (1 − p) · p + 3 · (1 − p)2 · p + 4 · (1 − p)3 + 5(1 − p)4 + · · ·= p ·

(1 + 2(1 − p) + 3(1 − p)2 + 4 · (1 − p)3 + 5(1 − p)4 + · · ·

)= p ·

(1 + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · ·

+ (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · ·+ (1 − p)2 + (1 − p)3 + (1 − p)4 + · · ·

+ (1 − p)3 + (1 − p)4 + · · ·+ (1 − p)4 + · · ·

)= p

(1

p+

1 − p

p+

(1 − p)2

p+

(1 − p)3

p+

(1 − p)4

p+ · · ·

)= 1 + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · · =

1

p.

Denición 4.1.5. Consideramos pruebas de Bernoulli independientes con la misma distribucióndada por p = P (E). Para cada número jo r, se dene la variable

X = número de pruebas hasta el résimo éxito .

Decimos que la variable X sigue una distribución binomial negativa de parámetros r y p,X ∼ BN(r; p), y su función de masa viene dada por:

P (X = r + j) =

(r + j − 1

j

)pr(1 − p)j , j = 0, 1, 2, . . . .

La distribución BN(r; p) para r = 1 es una geométrica. De hecho, si realizamos pruebas deBernoulli con p = P (E), hasta conseguir r éxitos y se denen las variables:

Xi = número de pruebas entre el (i − 1)ésimo éxito y el iésimo, i = 1, 2, . . . , r

cada Xi es una geométrica de parámetro p. Entonces

X = X1 + X2 · · · + Xr

sigue una distribución BN(r; p). Así vemos que si X ∼ BN(r; p) entonces:

E[X] =r

p; V [X] =

r(1 − p)

p2.

4.1.4 Distribución de Poisson

Supongamos que estamos interesados en estudiar el número de éxitos obtenidos en un número grandede pruebas independientes de Bernoulli, teniendo una probabilidad pequeña de éxito en cada prueba.Es razonable pensar que la distribución venga dada como límite de una distribución B(n; p) conn → ∞, p → 0. De hecho si se tiene cierto control sobre el producto np, digamos np → λ < ∞

Page 64: Descriptiva y Probabilidad

64 CAPÍTULO 4. MODELOS DE PROBABILIDAD

cuando n → ∞ y p → 0, podemos calcular el límite. Surge así la distribución de Poisson de parámetroλ > 0 denida por la función de masa:

P (X = j) =λj · e−λ

j!, j = 0, 1, 2, . . . .

Si X ∼ Poisson(λ), informalmente, se obtiene: E[X] = lım n · p = λ y V [X] = lım np(1 − p) = λ.Usaremos la distribución de Poisson cuando estemos estudiando un modelo binomial, B(n ; p),

con un número grande de pruebas, cada una con probabilidad de éxito pequeña. A título orientativo,sustituiremos la B(n ; p) por una Poisson(λ), con λ = np, cuando n ≥ 30 y p ≤ 0.1.

Es fácil comprobar que la función dada arriba es una función de masa puesto que:

∞∑j=0

P (X = j) =∞∑

j=0

λj · e−λ

j!= e−λ

∞∑j=0

λj

j!= e−λ · eλ = 1 .

Ejercicio 2 Demostrar que el límite cuando n → ∞, p → 0, con np → λ, de la función de masa deuna B(n; p) es la función de masa de una distribución de Poisson con parámetro λ, en otras palabrassi np → λ cuando n → ∞ y p → 0:

lım

(n

j

)pj(1 − p)n−j =

λj · e−λ

j!, cuando n → ∞, p → 0 .

Solución: :

lım

(n

j

)pj(1 − p)n−j = lım

n(n − 1)(n − 2) · · · · · (n − j + 1)

j!· pj · (1 − p)n

(1 − p)j

=1

j!lım nj ·

(1 − 1

n

)(1 − 2

n

)· · · · ·

(1 − j − 1

n

)· pj · (1 − p)n

(1 − p)j

=1

j!lım

(1 − 1

n

)(1 − 2

n

)· · · · ·

(1 − j − 1

n

)· (n · p)j · (1 − p)n

(1 − p)j

=1

j!1 · λj e

−λ

1=

λj · e−λ

j!.

4.2 Modelos continuos

4.2.1 Distribución uniforme

Denición 4.2.1. Decimos que una variable aleatoria X sigue una distribución uniforme enun intervalo (a, b) de la recta real, X ∼ U(a, b), si su función de densidad es:

f(x) =1

b − asi x ∈ (a, b) , f(x) = 0 en otro caso.

Si X ∼ U(a, b) entonces µ = E[X] =a + b

2y σ2 = V [X] =

1

12(b − a)2.

Page 65: Descriptiva y Probabilidad

4.2. MODELOS CONTINUOS 65

4.2.2 Distribución exponencial

Denición 4.2.2. Una variable aleatoria X se dice que sigue una distribución exponencial deparámetro λ > 0, X ∼ Exp(λ), si su función de densidad es

f(x) = λe−λx si x > 0 , f(x) = 0 si x ≤ 0 .

Si X ∼ Exp(λ) entonces:

µ = E[X] =1

λ, σ2 = V [X] =

1

λ2.

4.2.3 Distribución Normal

Denición 4.2.3. De una variable aleatoria X diremos que sigue una distribución normal demedia µ y desviación típica σ, X ∼ N(µ; σ), si su función de densidad es:

f(x) =1

σ√

2πe−

(x−µ)2

2σ2 , para todo x ∈ R .

Si X ∼ N(µ; σ) entonces:E[X] = µ , V [X] = σ2 .

La función de densidad de una distribución N(µ; σ) tiene propiedades muy interesantes:

1. Su gráca es simétrica respecto a la media µ:

µµ − σ µ + σ

de manera que: P (X < µ − a) = P (X > µ + a), para todo a > 0.

2. Si X ∼ N(µ; σ) y Z =X − µ

σentonces Z ∼ N(0; 1). En esta situación, nos referiremos al cambio

de variable Z =X − µ

σ, como tipificación de la variable X ∼ N(µ; σ), y a la correspondiente

Z ∼ N(0; 1) como la distribución normal tipificada.

La tipicación de cualquier normal, X ∼ N(µ; σ), nos permitirá calcular la probabilidad de unsuceso correspondiente a ella a partir de la tabla de la distribución normal tipicada N(0; 1).Así, por ejemplo, si X ∼ N(µ; σ) entonces:

P (a < X < b) = P(a − µ

σ< Z <

b − µ

σ

)= FZ

(b − µ

σ

)− FZ

(a − µ

σ

),

donde Z ∼ N(0; 1) y FZ(z) = P (Z ≤ z) es su función de distribución, cuyos valores vienendados por una tabla.

Page 66: Descriptiva y Probabilidad

66 CAPÍTULO 4. MODELOS DE PROBABILIDAD

3. La distribución B(n; p) tiende a una distribución normal cuando n → ∞ y p es jo. Así siestamos con una distribución binomial con n grande, la podremos aproximar por una normalN(µ; σ) con parámetros:

µ = n · p , σ =√

n p (1 − p) .

A título orientativo es aconsejable realizar esta sustitución cuando n ≥ 30 y 0.1 < p < 0.9.

4. Si X1 ∼ N(µ1; σ1), X2 ∼ N(µ2; σ2), . . . , Xn ∼ N(µn; σn) son variables independientes en-tonces:

X = X1 + X2 + · · · + Xn ∼ N(µ = µ1 + µ2 + · · · + µn ; σ =√

σ21 + σ2

2 + · · · + σ2n)

Y = X1 − X2 ∼ N(µ = µ1 − µ2 ; σ =√

σ21 + σ2

2) .

Problemas

1. En una cadena de producción dos robots funcionan conectados, respectivamente, a cinco y seisordenadores independientes entre sí, de manera que en un tiempo dado t de funcionamientofalla un ordenador del primer robot (resp. segundo) con probabilidad 0.1 (resp. 0.2). Calcúlenselas probabilidades de que en un tiempo t de funcionamiento fallen:

(a) un ordenador del primer robot;

(b) al menos un ordenador del primer robot;

(c) cinco ordenadores del segundo robot;

(d) no más de cinco ordenadores del segundo robot;

(e) exactamente dos ordenadores del primer robot y tres del segundo;

(f) tres ordenadores más del primero que del segundo robot.

2. Un lote de piezas contiene una proporción p de defectuosas. Para realizar un control de calidadse seleccionan n piezas y se denomina X el número de piezas defectuosas encontradas.

(a) Calcúlese P (X = 0).

(b) Si p = 0.1, ¾cuál debe ser el número de piezas, n, examinadas para tener P (X = 0) < 0.05?

(c) Si n = 40, ¾para qué valores de p es P (X = 0) < 0.01?

(d) Si se examinan n = 80 piezas y se encuentran dos defectuosas, ¾cuál es la proporción másverosímil de piezas defectuosas en el lote total: el 1%, el 4% ó el 7%?

3. En una población se sabe que, en promedio, uno de cada 20 habitantes tiene teléfono móvil.¾Cuál es la probabilidad de que al realizar una encuesta, el cuarto encuestado sea el primerocon teléfono móvil?

4. Se extraen una a una con reemplazamiento cartas de una baraja española. Calcúlese la proba-bilidad de obtener 5 cartas que no sean oros antes de obtener el tercer oro.

Page 67: Descriptiva y Probabilidad

4.2. MODELOS CONTINUOS 67

5. El dueño de una ferretería, extrae al azar 50 tornillos de cada lote que recibe. Si en la muestra noencuentra más de 3 defectuosos, se queda el lote, en caso contrario lo rechaza. Un representantele envía un lote que contiene un 10% de tornillos defectuosos, ¾cuál es la probabilidad de queacepte el lote?

6. En cierto tramo de una carretera la probabilidad de que un coche supere la velocidad máximapermitida es 0.0001. Si recorren ese tramo 20000 coches, calcúlese la probabilidad de que

(a) ninguno supere la velocidad máxima permitida;

(b) a lo sumo 5 superen la velocidad máxima permitida.

7. Se ha observado el número de fallos cometidos en un folio por un mecanógrafo en un tiempojado. Estos fallos se han anotado en la siguiente tabla:

número de fallos 0 1 2 3 4 5frecuencia 42 30 16 12 4 1

Ajústese una distribución de Poisson y calcúlese la probabilidad de que en un folio seleccionadoal azar, de entre los escritos por este mecanógrafo, aparezcan más de tres fallos.

8. Se sabe que la demanda de un producto de consumo sigue una distribución normal de media95 y desviación típica 7. Calcúlese:

(a) la probabilidad de que la demanda sea menor que 97;

(b) la probabilidad de que la demanda sea mayor que 99;

(c) la probabilidad de que la demanda esté entre 92 y 96;

(d) la mínima cantidad disponible necesaria para poder atender la demanda con una proba-bilidad no menor que 0.95 .

9. En cierto país, el 20% de la población se muestra preocupada por el incremento de las emisionesde dióxido de carbono. Se hace una encuesta a 15 personas.

(a) ¾Cuál es la probabilidad de que ninguna de ellas esté preocupada por el incremento de lasemisiones de dióxido de carbono?

(b) Halla la probabilidad de que no haya más de tres personas preocupadas.

(c) Calcula la probabilidad de que al menos tres personas entre las 15 estén preocupadas.

(d) ¾Cuál es la esperanza y la desviación típica del número de personas preocupadas entre las15? Si en lugar de al 20%, sólo al 2% de los habitantes del país les preocupa el problema,¾cómo cambian la esperanza y la desviación típica?

10. Consideramos un experimento aleatorio consistente en tirar 400 veces una moneda.

(a) Halla la probabilidad aproximada de que el número de caras obtenido esté comprendidoentre 160 y 190.

(b) Halla el intervalo (a, b) centrado en 200, tal que la probabilidad aproximada de que elnúmero de caras obtenido esté en dicho intervalo sea 0.95.

Page 68: Descriptiva y Probabilidad

68 CAPÍTULO 4. MODELOS DE PROBABILIDAD

11. Un zoólogo estudia cierta especie de ratones de campo. Para ello, captura ejemplares de ratonesen un bosque en el que la proporción de ratones de campo de la especie que le interesa es p.

(a) Si p = 0.3, calcula la probabilidad de que entre 6 ejemplares capturados haya al menos 2de la especie que le interesa.

(b) Si p = 0.05, calcula la probabilidad de que entre 200 ejemplares capturados, haya exacta-mente 3 de la especie que le interesa.

(c) Si p = 0.4, calcula la probabilidad de que entre 200 ejemplares capturados, haya entre 75y 110 de la especie que le interesa.

(d) ¾Cuál es el número medio de ejemplares que tendrá que capturar hasta encontrar uno dela especie que le interesa, si p = 0.2 ?

12. Se supone que el número de bacterias por cm3 de agua en un estanque es una variable aleatoriaX con distribución de Poisson de parámetro λ = 0.5.

(a) ¾Cuál es la probabilidad de que en un cm3 de agua del estanque no haya ninguna bacteria?

(b) En 40 tubos de ensayo se toman muestras de agua del estanque (1 cm3 de agua en cadatubo). ¾Qué distribución sigue la variable Y que representa el número de tubos de ensayo,entre los 40, que no contienen bacterias? Calcula P (Y ≥ 20).

(c) Si sabemos que en un tubo hay bacterias, ¾cuál es la probabilidad de que haya menos detres?

13. En el sur de California se produce, en promedio, un terremoto al año de magnitud 6.1 o mayoren la escala de Richter1. Se supone que el número de terremotos al año en esta zona sigue unproceso de Poisson.

(a) ¾Cuál es la probabilidad de que se produzcan más de dos terremotos en cinco años?

(b) ¾Cuál es la probabilidad de que haya un periodo de 15 meses sin que haya terremotos?

(c) ¾Cuál es la probabilidad de que haya que esperar más de tres años y medio para que seproduzcan dos terremotos?

14. La probabilidad de que una pieza tenga un fallo durante el primer año de funcionamiento es0.001. Halla la probabilidad de que, entre 2000 piezas, presenten un fallo (a) exactamente tres,(b) más de 2.

1

Escala RitcherMagnitud Efectos del terremoto

menos de 3.5 Generalmente no se siente, pero es registrado

3.55.4 A menudo se siente, pero sólo causa daños menores

5.56.0 Ocasiona daños ligeros a edicios

6.16.9 Puede ocasionar daños severos en áreas muy pobladas

7.07.9 Terremoto mayor. Causa graves daños

8 ó mayor Gran terremoto. Destrucción total a comunidades cercanas

Fuente: http://www.angelfire.com/ri/chterymercalli

Page 69: Descriptiva y Probabilidad

4.2. MODELOS CONTINUOS 69

15. La variable X expresa el tiempo en segundos que tarda una depuradora en ltrar 10 mm3 deagua y sigue una distribución exponencial con media 10. Calcula la probabilidad de que tardeentre tres y doce segundos en depurar 10 mm3.

16. Para estudiar la viabilidad económica de una mina de carbón, consideramos la variable aleatoriaX=Kilogramos de carbón obtenidos por tonelada de mineral. Supongamos que, en cierta mina,X sigue una N(µ = 150; σ = 25).(a) Calcula la probabilidad de que, en una tonelada de mineral, el contenido de carbón sea

superior a 130 kg.

(b) Calcula la probabilidad de que, en 2 toneladas de mineral extraídas independientemente,la diferencia en el contenido de carbón sea inferior a 30 kg.

(c) Extraemos independientemente 100 toneladas de mineral. Calcula la probabilidad de queen más de 80 de ellas el contenido de carbón sea superior a 130 kg.

17. En una fábrica, se están produciendo cuerdas con cierta bra sintética. La resistencia a latensión de estas cuerdas sigue una distribución N(µ = 30; σ = 2).

(a) ¾Cuál es el porcentaje de cuerdas cuya resistencia a la tensión está entre 28 y 32?

(b) En un pedido de 200 cuerdas, ¾cuál es la probabilidad de que más de 140 presenten unaresistencia a la tensión entre 28 y 32?

(c) En un pedido de 250 cuerdas, ¾cuál es la probabilidad de que alguna presente una re-sistencia inferior a 25?

18. Un fabricante produce varillas y recipientes para insertar las varillas. Ambos tienen seccionescirculares. Los diámetros de las varillas siguen una distribución N(µ = 1; σ = 0.2); los diámetrosde los recipientes siguen una distribución N(µ = 1.05; σ = 0.15). Un ingeniero selecciona alazar una varilla y un recipiente. ¾Cuál es la probabilidad de que la varilla pueda insertarse enel recipiente?

19. Para analizar si las aguas próximas a la costa están contaminadas cuando se produce una mareanegra por el hundimiento de un petrolero, se analizan varias muestras con un test que se divideen tres pruebas independientes. Los resultados varían aleatoriamente de unas muestras a otrasy se sabe que siguen distribuciones normales dadas por:

X = resultados de la primera prueba del test, X ∼ N(7; 1)Y = resultados de la segunda prueba del test, Y ∼ N(5; σ = 2)Z = resultados de la tercera prueba del test, Z ∼ N(6; 1)

Se elige una muestra al azar. Contesta a las siguientes preguntas:(a) Si el resultado nal del test es el promedio de los valores que se obtienen en las tres

pruebas, ¾cuál es la probabilidad de que el resultado del test sea superior a 5?

(b) ¾Cuál es la probabilidad de que el resultado de las tres pruebas sea superior a 5?

20. Una compañía de petróleo tiene un contrato para vender grasa en envases de 500 gramos. Lacantidad de grasa que la máquina de llenado pone en los envases sigue una Normal con la mediaque el encargado elija y σ = 25. ¾Qué valor medio deberá elegir el encargado si la compañía nodesea que le rechacen más del 2% de los envases por tener un peso por debajo de lo especicado?

Page 70: Descriptiva y Probabilidad

70 CAPÍTULO 4. MODELOS DE PROBABILIDAD

21. Una máquina de envasado llena sacos de fertilizante de aproximadamente 30 kg. La cantidadde fertilizante por saco sigue una distribución N(µ = 30; σ = 1).

(a) Se desea que la cantidad de fertilizante por saco esté entre 29 y 31 kg. Calcula la proba-bilidad de que la cantidad esté dentro de esos límites.

(b) Una empresa realiza un pedido de 80 de estos sacos de fertilizante. Calcular la probabilidadde que más de 50 estén dentro de los límites indicados.

22. La permeabilidad intrínseca del hormigón producido en una fábrica química sigue una distribu-ción N(µ = 40; σ = 5). Se reciben 60 remesas de hormigón.

(a) ¾Cuál es la probabilidad de que alguna remesa tenga una permeabilidad intrínseca inferiora 30?

(b) El 30% de las remesas de hormigón enviadas a un almacén tiene una permeabilidad quesigue una N(µ = 40; σ = 5). El 70% de las remesas restantes tiene una permeabilidadque sigue una N(µ = 45; σ = 10). ¾Cuál es el porcentaje total de remesas que tienen unapermeabilidad inferior a 35?


Recommended