1
CURSO VIRTUAL: ESTADÍSTICA DESCRIPTIVA
INEC - 2011
2
Capítulo 1¿Qué es la Estadística? Objetivos: Al terminar este capítulo podrá:
n Comprender qué es y por qué se estudia la estadística.
n Explicar lo que significan estadística descriptiva y estadística inferencial.
n Diferenciar entre una variable cualitativa y una variable cuantitativa.
n Distinguir entre una variable discreta y una variable continua.
n Diferenciar entre los niveles de medición nominal, ordinal, de intervalo y de razón.
n Definir los términos mutuamente excluyente y exhaustivo.
3
¿Qué se entiende por Estadística?
Estadística: Es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva.
4
¿Quién usa la Estadística?
Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc…
5
Tipos de Estadística
Estadística Descriptiva: Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.
Ejemplo 1: La agencia Gallup encontró que el 49% de las personas entrevistadas en una encuesta supo el nombre del primer libro de la Biblia. El estadístico 49 describe el número de personas que de cada 100 conoce el nombre del primer libro de la Biblia.
Ejemplo 2: De acuerdo al reporte de consumidores, los dueños de lavadoras General Electric reportaron 9 problemas de cada 100 lavadoras durante 2005. El estadístico 9 describe el número de problemas de cada 100 lavadoras.
6
Tipos de Estadística
Estadística Inferencial: Conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra.
Población: Conjunto de todos los posibles individuos, objetos, o medidas de interés.
Muestra: Una porción, o parte, de la población de interés.
7
Tipos de Estadística(Ejemplos de Estadística Inferencial)
Ejemplo 1: Las empresas de televisión constantemente monitorean la popularidad de sus programas contratando a la empresa Nielsen y a otras organizaciones para conocer las preferencias de los telespectadores.
Ejemplo 2: Un despacho de contadores selecciona una muestra aleatoria de 100 facturas y verifica que sean correctas . En 5 de las mismas se encontraron errores, por tanto el despacho estima que el 5% de toda la población de facturas contiene algún error.
Ejemplo 3: Los catadores de vino toman unas copas de vino como muestra para tomar una decisión con respecto a todo el vino almacenado para su venta.
8
Tipos de variables
Cuando la característica o variable en estudio es no numérica, se le denomina variable cualitativa o de atributo.
Ejemplos: Género sexual, religión, tipo de automóvil, lugar de nacimiento, color de los ojos de la persona, etc…
9
Tipos de variables
En una variable cuantitativa la información es reportada numéricamente.
Ejemplos: El saldo en tu cuenta de cheques, los minutos que le restan a la clase, o el número de niños de una familia.
10
Tipos de variables
Las variables cuantitativas pueden ser discretas o continuas.
Las variables discretas pueden asumir sólo ciertos valores, y generalmente existen “brechas” o “huecos” entre ellos.
Ejemplo: el número de recámaras en una casa, el número de estudiantes en el curso de estadística (1,2,3,…).
11
Tipos de variables
Las observaciones de una variable continua pueden tomar cualquier valor dentro de un intervalo determinado.
La presión del aire en un neumático de automóvil, el peso de un cargamento de granos (15.0,15.01, 15.013,…toneladas).
12
Resumen de tipos de variables
Variables
Cualitativa Numérica
Discreta Continua
13
Niveles de medición
Existen cuatro niveles de medición: Nivel nominal: Las observaciones
solamente se pueden clasificar o contar. No existe algún orden específico entre las clases.
Ejemplos: color de ojos, género, religión.
14
Niveles de medición
Mutuamente excluyente. Propiedad de un conjunto de categorías que implica que una persona, objeto o medición se ha de incluir en sólo una categoría.
Exhaustivo. Propiedad de un conjunto de categorías que implica que cada individuo, objeto o medición debe aparecer en sólo una categoría.
15
Niveles de medición
Nivel ordinal: involucra datos arreglados con algún orden, pero las diferencias entre los valores de los mismos no pueden ser determinadas o bien no tienen algún significado.
Ejemplo: en la evaluación de profesores, se asigna el 4 a excelente, 3 a bueno, 2 a regular y 1 a malo.
16
Niveles de medición
Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que la diferencia entre los valores de los datos sí pueden ser determinados. Es importante señalar que 0 es solamente un punto de la escala, y no representa la ausencia de la condición.
Ejemplo: temperatura en grados Fahrenheit.
17
Niveles de medición
Nivel de razón: esta medida tiene todas las características del nivel de intervalo, pero además el punto 0 sí tiene significado, y la razón (cociente) entre dos números también es significativa.
Ejemplo: unidades de producción, salarios, distancia entre un conjunto de oficinas, la estatura.
18
Capítulo 2 Descripción de los datos, distribuciones de frecuencias y representaciones gráficas Objetivos: Al terminar este capítulo podrá:
3. Organizar los datos en una distribución de frecuencias.
5. Presentar una distribución de frecuencias en un histograma, un polígono de frecuencias y un polígono de frecuencias acumuladas.
7. Elaborar e interpretar una representación de tallo y hoja.
9. Presentar datos utilizando técnicas de graficación como gráficas de líneas, gráficas de barras y gráficas circulares.
19
Distribución de frecuencias
Distribución de frecuencias: Agrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría.
20
Construcción de una distribución de frecuencias
Determinar la información que
interesaRecolectar datos Organizar datos
Sacarconclusiones
Presentar datos(gráfica)
Distribución de frecuencias
21
Distribución de frecuencias
Punto medio de clase: Un punto que divide el intervalo en dos partes iguales. Es el promedio entre el límite inferior y superior del intervalo de clase.
Frecuencia de clase: El número de observaciones en cada clase.
Intervalo de clase: El intervalo de clase es obtenido restando el límite inferior de una clase del límite inferior de la siguiente clase.
22
Ejemplo 1
El Dr. Yáñez es director de una Escuela de Negocios en la Universidad de Calvillo. Él desea preparar un resumen mostrando el número de horas por semana que los estudiantes emplean en el estudio. Selecciona una muestra de 30 estudiantes y determina el número de horas que cada alumno estudió en la última semana.
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6
Organice los datos en una distribución de frecuencias.
23
Ejemplo 1 (Continuación)
Hay 30 observaciones. Dos elevado a la quinta potencia es 32. Sin embargo, debemos tener al menos 5 clases.
Eventualmente utilizaríamos 6. El rango es 23.5 horas, restando 10.3 de 33.8
horas. Escogemos un intervalo de 5 horas. El límite inferior de la primera clase es 7.5
horas.
24
Ejemplo 1 (Continuación)
•Horas en estudio •Frecuencia, f
•De 7.5 a menos de 12.5 • 1
•De 12.5 a menos de 17.5 • 12
•De 17.5 a menos de 22.5 • 10
•De 22.5 a menos de 27.5 • 5
•De 27.5 a menos de 32.5 • 1
•De 32.5 a menos de 37.5 • 1
25
Sugerencias en la construcción de la distribución de frecuencias
El intervalo o amplitud de las clases debe ser el mismo para todas ellas.
Determine el intervalo o amplitud usando la siguiente fórmula:
clasesdenúmerobajo)másvaloraltomás(valor −=i
26
Sugerencias en la construcción de la distribución de frecuencias
Use el cálculo obtenido como sugerencia del ancho del intervalo en la construcción de la distribución de frecuencias.
Nota: Esto es un ancho del intervalo de clase sugerido; si el cálculo obtenido es 97, puede ser mejor usar 100.
Cuente el número de valores en cada clase.
27
Ejemplo 1 (Continuación)
Una distribución de frecuencias relativas muestra el porcentaje de observaciones en cada clase.
28
Distribución de frecuencias relativas
Horas en estudio Frecuencia, f Frecuencia relativa
• De 7.5 a menos de 12.5 • 1 • 1/30 = .0333
• De 12.5 a menos de 17.5 • 12 • 12/30 = .4000
• De 17.5 a menos de 22.5 • 10 • 10/30 = .3333
• De 22.5 a menos de 27.5 • 5 • 5/30 = .1667
• De 27.5 a menos de 32.5 • 1 • 1/30 = .0333
• De 32.0 a menos de 37.5 • 1 • 1/30 = .0333
Total 30 30/30 = 1.0000
29
Representación de tallo y hoja
Representación de tallo y hoja: Es una técnica estadística que muestra un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales se toman como el tallo, y el dígito siguiente es la hoja. Los tallos se ubican a lo largo del eje vertical principal, y las hojas de cada observación, a lo largo del eje horizontal.
Nota: Una ventaja de esta representación sobre la distribución de frecuencias es que no se pierde la identidad de cada observación.
30
Ejemplo 2
86, 79, 92, 84, 69, 88, 91, 83, 96, 78,
82, 85.
Construya un diagrama de árbol y hojas.
Colín obtuvo las siguientes calificaciones en doce pruebas de este semestre:
31
Ejemplo 2 (Continuación)
Árbol Hojas
6 9
7 8 9
8 2 3 4 5 6 8
9 1 2 6
32
Presentación de una distribución de frecuencias en gráficas
Las tres gráficas más comunes son: histograma, polígono de frecuencias y distribución de frecuencias acumuladas.
Un histograma es una gráfica en la cual los intervalos de clase se señalan en el eje horizontal, y las frecuencias de clase en el eje vertical.
Las frecuencias de clase son representadas por barras de diferente altura y éstas se colocan una junto a otra.
33
Presentación de una distribución de frecuencias en gráficas
Un polígono de frecuencias consiste en segmentos de línea conectados a través de los puntos medios (marcas de clase) de clase en cada intervalo de clase.
Una distribución de frecuencias acumulada (ojiva) es utilizada para determinar cuántos o qué proporción de los datos están por arriba o por debajo de cierto valor.
34
Histograma para horas empleadas en estudiar
Histograma
0
2
4
6
8
10
12
14
intervalos de clase
frecu
en
cia
35
Polígono de frecuencias para horas empleadas en estudiar
polígono de frecuencias
0
2
4
6
8
10
12
14
1 2 3 4 5 6
intervalos de confianza
frec
uen
cia
frecuencia
36
Distribución de frecuencias acumuladas (ojiva) para horas en estudio
frecuencia acumulada(ojiva)
0
5
10
15
20
25
30
35
1 2 3 4 5 6 7
intervalos de clase
frecu
en
cia
acu
mu
lad
a
ojiva
37
Gráfica de barras
Una gráfica de barras es especialmente útil para mostrar cualquiera de los niveles de medición: nominal, ordinal, de intervalo o de razón.
38
Ejemplo 3 Construya un diagrama de barras para el número de
desempleados de una población de 100,000 para ciudades seleccionadas durante 2001.
Ciudad Número de desempleados por cada
100,000
Atlanta 7300
Boston 5400
Chicago 6700
Los Ángeles 8900
Nueva York 8200
Washington 8900
39
Diagrama de barras para desempleados
Diagrama de barras
0
2000
4000
6000
8000
10000
Atlanta
Bosto
n
Chicago
Los A
ngeles
Nueva Y
ork
Wash
ingto
n
Ciudades
Des
emp
lead
os/
100,
000
40
Diagrama tipo pastel
Un diagrama tipo pastel es útil para mostrar la distribución de frecuencias relativas. Un círculo es dividido proporcionalmente a las frecuencias relativas y las porciones del círculo están ubicadas para los diferentes grupos.
41
Ejemplo 4
A una muestra de 200 corredores se le preguntó su tipo de zapato tenis favorito.
Elabore un diagrama tipo pastel en base a la siguiente información.
Tipo de zapato No. de corredores
Nike
Adidas
Reebok
Asics
Otros
92
49
37
13
9
42
Diagrama tipo pastel para zapato tenis
Diagrama tipo pastel
Nike
Adidas
Reebok
Asics
Otros
Nike
Adidas
Reebok
Asics
Otros
43
Capítulo 3Descripción de datos, medidas de tendencia central
Objetivos: Al terminar este capítulo podrá:
3. Calcular la media aritmética, la media ponderada, la mediana, la moda y la media geométrica.
5. Explicar las características, uso, ventajas y desventajas de cada medida de tendencia central.
7. Identificar la posición de la media aritmética, la mediana y la moda, tanto en distribuciones simétricas como asimétricas.
44
Características de la media
La media aritmética es, con mucho, la medida de localización más usada.
Es calculada sumando los valores y dividiendo entre el número de valores.
Las principales características de la media son:- Requiere de una escala de intervalo.
- Todos los valores son utilizados. - Es única. - La suma de las desviaciones con respecto a la media
es cero.
45
Media poblacional
Para datos no agrupados, la media poblacional es la suma de todos los valores de la población divididos entre el número total de valores de la población: donde µ es la media poblacional, N es el total de observaciones de la población y X un valor particular.
N
X∑=µ
46
Ejemplo 1
Un parámetro es una medida característica de la población.
Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los siguientes datos corresponden al kilometraje de cada uno de ellos:56,000 23,000 42,000 73,000Encuentre la media aritmética del kilometraje de los autos:
µ = (56,000 + … + 73,000)/4 = 48,500
47
Media muestral
Para datos no agrupados, la media muestral es la suma de todos los valores de la muestra dividida por el número de valores de la muestra. Donde n es el número total de valores en la muestra.
n
XX
Σ=
48
Ejemplo 2
Un estadístico es una medida característica de una muestra.
Ejemplo 2: Una muestra de cinco ejecutivos recibió los siguientes bonos el último año ($000):
14.0, 15.0, 17.0, 16.0, 15.0
4.155
77
5
0.15...0.14 ==++=Σ=n
XX
49
Propiedades de la media aritmética
Todos los datos de nivel de intervalo y de nivel de razón tienen una media.
Para evaluar la media se consideran todos los valores. Un conjunto de datos sólo tiene una media la cual es un
valor único. La media es afectada por valores inusualmente grandes
o pequeños. La media aritmética es la única medida de tendencia
central donde la suma de las desviaciones de cada valor, respecto de la media, siempre es igual a cero.
50
Ejemplo 3
Considere el siguiente conjunto de valores: 3, 8, y 4. La media es 5. Ilustrando la quinta propiedad:
[ ] 0)54()58()53()( =−+−+−=−Σ XX
51
Media ponderada
La media ponderada de un conjunto de números X1, X2, …,Xn con pesos correspondientes w1, w2, …,wn es calculada con la siguiente fórmula:
)21
)2211
...(
...(
n
nnw
www
XwXwXwX
+++++
=
52
Ejemplo 6
Durante el periodo de una hora, en una tarde calurosa de sábado, Cristina sirvió 50 refrescos. Ella vendió 5 bebidas de $0.50, 15 de $0.75, 15 de $0.90, y 15 de $1.15. Calcule la media ponderada para el precio de estas bebidas.
89.0$50
50.44$1515155
)15.1($15)90.0($15)75.0($15)50.0($5
==
++++++=wX
53
La mediana
La mediana es el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor.
Cincuenta por ciento de las observaciones son mayores que la mediana, y 50% son menores que ella.
Para un conjunto par de valores, la mediana será el promedio aritmético de los dos valores centrales.
54
Ejemplo 4
Las edades de una muestra de 5 estudiantes del colegio son:
21, 25, 19, 20, 22 Ordenando los datos en forma ascendente, tenemos: 19, 20, 21, 22, 25. Entonces la mediana es 21. Las estaturas de 4 jugadores de basquetbol, en
pulgadas, son: 76, 73, 80, 75 Entonces la mediana es 75.5
55
Propiedades de la mediana
Es única; esto es, a semejanza de la media, sólo existe una mediana para un conjunto de datos.
No se ve afectada por valores extremadamente grandes o muy pequeños, y por tanto es una medida valiosa de tendencia central cuando se presenta esta clase de valores.
Puede calcularse para datos de nivel de razón, de intervalo y ordinal.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en tal clase.
56
La moda
La moda es el valor de la observación que aparece con más frecuencia.
Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87
Dado que 81 es el dato que aparece con más frecuencia, éste es la moda.
57
La media geométrica
La media geométrica (GM) de un conjunto de n números se define como la raíz enésima del producto de n números.
La media geométrica es útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento.
La fórmula es:
n nXXXXGM ))...()()(( 321=
58
Ejemplo 7
La tasa de interés de tres bonos son: 5, 21 y 4 por ciento.
La media aritmética es (5+21+4)/3 =10.0 La GM da una utilidad más conservadora porque no
está demasiado influenciada por la tasa del 21 por ciento.
La media geométrica es:
49.7)4)(21)(5(3 ==GM
59
Media geométrica (Continuación)
Otro uso de la media geométrica es determinar el aumento porcentual en ventas, producción o series económicas de un periodo de tiempo a otro.
(Valor al principio del periodo)
Valor al final del periodo)(−1= nGM
60
Ejemplo 8
El número total de mujeres contratadas en Colegios Americanos se incrementó de 755,000 en 1992 a 835,000 en 2000. Esto es, la media geométrica o tasa de incremento es 1.27%.
0127.1000,755
000,8358 =−=GM
61
La media para datos agrupados
La media de una muestra de datos organizados en una distribución de frecuencias es calculada por la siguiente fórmula:
n
XfX
Σ=
62
Ejemplo 9
Una muestra de 10 cines en una gran área metropolitana contó el número total de películas en exhibición la última semana. Calcule el número medio de películas en exhibición.
6.610
66 ==Σ=n
XX
63
Ejemplo 9 (Continuación)
Películas en cartelera
Frecuencia
f
Punto medio de clase (X)
(f)(X)
1 hasta 3 1 2 2
3 hasta 5 2 4 8
5 hasta 7 3 6 18
7 hasta 9 1 8 8
9 hasta 11 3 10 30
Total 10 66
64
La mediana para datos agrupados
La mediana de una muestra de datos agrupados en una distribución de frecuencias se calcula con:
donde L es el límite inferior de la clase que contiene a la mediana, n es el número total de frecuencias, CF es la frecuencia acumulada precedente a la clase mediana, f es la frecuencia de la clase que contiene a la mediana, e i es la amplitud de la clase en que se encuentra la mediana.
)(2 if
CFn
LMediana−
+=
65
Encontrar la clase que contiene a la mediana
Para determinar la clase que contiene a la mediana para datos agrupados:
Construya una distribución de frecuencias acumuladas.
Divida el número total de datos entre 2. Determine cuál clase contiene este valor. Por ejemplo, si n = 50, 50/2 =25, entonces
determine cuál clase contiene el valor en la posición 25.
66
Ejemplo 10
Películas en cartelera
Frecuencia Frecuencia acumulada
1 hasta 3 1 1
3 hasta 5 2 3
5 hasta 7 3 6
7 hasta 9 1 7
9 hasta 11 3 10
67
Ejemplo 10 (Continuación)
De la tabla, tenemos: L = 5, n = 10, f = 3, i = 2, CF = 3
33.6)2(3
32
10
5)(2 =−
+=−
+= if
CFn
LMediana
68
La moda en datos agrupados
Para datos agrupados en una distribución de frecuencias, es posible aproximar la moda usando el punto medio de la clase que contiene el mayor número de frecuencias de clase.
Las modas en el ejemplo 10 son 8 y 10. Cuando dos valores ocurren un gran número de veces, la distribución es llamada bimodal, como en el ejemplo 10.
69
Distribución simétrica
Cero asimetría moda = mediana = media
70
Distribución con sesgo positivo
Asimetría positiva: media y mediana están a la derecha de la moda.
Moda<Mediana<Media
71
Distribución con sesgo negativo
Asimetría negativa: media y mediana están a la izquierda de la moda.
Media<Mediana<Moda
72
Capítulo 4Otras medidas descriptivas Objetivos: Al terminar este capítulo podrá:
3. Calcular e interpretar la amplitud, la desviación media, la varianza y la desviación estándar de datos no agrupados.
5. Calcular e interpretar la amplitud de variación, la varianza y la desviación estándar de datos agrupados.
7. Explicar las características, usos, ventajas y desventajas de cada medida.
73
Capítulo 4 (Continuación)
1. Entender el teorema de Chebyshev y la regla normal o empírica, con relación a un conjunto de observaciones.
3. Calcular e interpretar los cuartiles y la amplitud cuartílica o intercuartílica.
5. Elaborar e interpretar los diagramas de caja.
7. Calcular y entender el coeficiente de asimetría y el coeficiente de variación.
74
Amplitud de variación
La amplitud de variación es la diferencia entre el valor más grande y el valor más pequeño.
Sólo dos valores son utilizados en su cálculo. Está influido por un valor extremo. Es fácil calcularlo y entenderlo.
75
Desviación media La desviación media (MD) es el promedio aritmético de
los valores absolutos de las desviaciones con respecto a la media aritmética.
Todos los valores son utilizados en el cálculo. No está influido excesivamente por valores muy grandes
o valores muy pequeños. Los valores absolutos son difíciles de manipular.
76
Desviación media
La fórmula para la desviación media es:
n
XXMD
−Σ=
77
Ejemplo 1
Los pesos de una muestra de canastas conteniendo libros para una librería (en libras) son:
103, 97, 101, 106, 103
Encuentre la amplitud y la desviación media.
Amplitud = 106 – 97 = 9
78
Ejemplo 1 (Continuación)
El primer paso es encontrar la media:
La desviación media es:
1025
510 ==Σ=n
XX
4.25
541515
102103...102103
=++++=
−++−=
−Σ=
n
XXMD
79
Varianza de la población
La varianza de la población es la media aritmética de las desviaciones al cuadrado de la media poblacional.
Todos los valores son utilizados en el cálculo. No está influido por valores extremos. Las unidades están desproporcionadas, son los
cuadrados de la unidad original.
80
Varianza
La fórmula para la varianza poblacional es:
La fórmula para la varianza muestral es:
NX 2
2 )( µσ −Σ=
1)( 2
2
−−Σ=nXX
s
81
Ejemplo 2
Las edades de la familia González son:
2, 18, 34, 42
¿Cuál es la varianza poblacional?
244
96 ==Σ=n
Xµ
( ) ( )
2364
9444
2442...242)( 2222
==
−++−=−Σ=N
X µσ
82
La desviación estándar poblacional
La desviación estándar poblacional ( ) es la raíz cuadrada de la varianza poblacional.
Para el Ejemplo 2, la desviación estándar es 15.36, calculada así:
σ
36.152362 === σσ
83
Ejemplo 3
Los ingresos ganados por hora en una muestra de cinco estudiantes son:
$7, $5, $11, $8, $6.
Encuentre la varianza.
40.75
37 ==Σ=n
XX
( ) ( ) ( )
30.515
2.2115
4.76...4.77
1
2222
=−
=
−−++−=
−−Σ=n
XXs
84
Desviación estándar muestral
La desviación estándar muestral es la raíz cuadrada de la varianza muestral.
En el Ejemplo 3, la desviación estándar muestral es 2.30
30.229.52 === ss
85
Varianza muestral para datos agrupados
La fórmula para la varianza muestral para datos agrupados es:
donde f es la frecuencia de clase y X es la marca de clase.
1
)( 22
2
−
Σ−Σ=
nn
fXfX
s
86
Interpretación y usos de la desviación estándar
Teorema de Chebyshev: Para un conjunto cualquiera de observaciones, la proporción mínima de los valores que se encuentran dentro de k desviaciones estándar desde la media es por lo menos.
2
11k
−
donde k2 es una constante mayor que 1.
87
Interpretación y usos de la desviación estándar
Regla empírica: En una distribución de frecuencias simétrica, con forma de campana:
Aproximadamente 68% de las observaciones estarán entre más una y menos una s desde la media;
Aproximadamente 95% de las observaciones se encontrarán entre más dos y menos dos s desde la media;
Prácticamente todas las observaciones se hallarán entre más tres y menos tres s a partir del valor medio.
88
µ µ +1s µ+2s µ+3sµ-1sµ-2sµ-3s
89
Dispersión relativa
El coeficiente de variación es la razón (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje.
CVs
X= (100%)
90
Coeficiente de asimetría
La asimetría es la medida de la carencia de simetría en una distribución.
El coeficiente de asimetría puede variar desde
-3 hasta 3. Un valor cero indica una distribución
simétrica. Es calculado como sigue: CA = 3(Media – Mediana)/s
91
Rango intercuartílico
El rango intercuartílico es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.
Esta distancia incluirá la mitad de las observaciones.
Rango intercuartílico = Q3 – Q1
92
Ejemplo 5
Para un conjunto de observaciones el tercer cuartil es 24 y el primer cuartil es 10.
¿Cuál es la desviación intercuartílica?
El rango intercuartílico es 24 – 10 = 14. 50% de las observaciones ocurrirán entre 10 y 24.
93
Diagrama de caja y bigotes
Una gráfica de caja y bigotes es una gráfica basada en cuartiles, que ayudan a retratar un conjunto de datos.
Cinco tipos de datos son necesarios para construir una gráfica de caja y bigotes: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo.
94
Ejemplo 6
Basado en una muestra de 20 pedidos entregados, Pizza Hot registró la siguiente información. El tiempo mínimo de entrega fue 13 minutos, y el máximo, 30 minutos. El primer cuartil fue 15 minutos, la mediana 18 minutos, y el tercer cuartil 22 minutos. Elabore un diagrama de caja y bigotes para los tiempos de entrega.
95
Ejemplo 6 (Continuación)
mín
Q1 Q2 Q3
máx
12 14 16 18 3020 22 24 26 28