+ All Categories
Home > Education > Estadistica descriptiva

Estadistica descriptiva

Date post: 03-Jul-2015
Category:
Upload: maggisita
View: 8,623 times
Download: 5 times
Share this document with a friend
Description:
La estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. Se considera como su fundador a Godofredo Achenwall, profesor alemán (1719-1772), él y sus seguidores estructuraron métodos estadísticos para estudiar las riquezas de las naciones. La estadística es una de las ramas de la matemática con más aplicaciones, ya que casi en cualquier rama del conocimiento humano tiene aplicación. Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc.
95
1 CURSO VIRTUAL: ESTADÍSTICA DESCRIPTIVA INEC - 2011
Transcript
Page 1: Estadistica descriptiva

1

CURSO VIRTUAL: ESTADÍSTICA DESCRIPTIVA

INEC - 2011

Page 2: Estadistica descriptiva

2

Capítulo 1¿Qué es la Estadística? Objetivos: Al terminar este capítulo podrá:

n Comprender qué es y por qué se estudia la estadística.

n Explicar lo que significan estadística descriptiva y estadística inferencial.

n Diferenciar entre una variable cualitativa y una variable cuantitativa.

n Distinguir entre una variable discreta y una variable continua.

n Diferenciar entre los niveles de medición nominal, ordinal, de intervalo y de razón.

n Definir los términos mutuamente excluyente y exhaustivo.

Page 3: Estadistica descriptiva

3

¿Qué se entiende por Estadística?

Estadística: Es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva.

Page 4: Estadistica descriptiva

4

¿Quién usa la Estadística?

Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc…

Page 5: Estadistica descriptiva

5

Tipos de Estadística

Estadística Descriptiva: Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa.

Ejemplo 1: La agencia Gallup encontró que el 49% de las personas entrevistadas en una encuesta supo el nombre del primer libro de la Biblia. El estadístico 49 describe el número de personas que de cada 100 conoce el nombre del primer libro de la Biblia.

Ejemplo 2: De acuerdo al reporte de consumidores, los dueños de lavadoras General Electric reportaron 9 problemas de cada 100 lavadoras durante 2005. El estadístico 9 describe el número de problemas de cada 100 lavadoras.

Page 6: Estadistica descriptiva

6

Tipos de Estadística

Estadística Inferencial: Conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra.

Población: Conjunto de todos los posibles individuos, objetos, o medidas de interés.

Muestra: Una porción, o parte, de la población de interés.

Page 7: Estadistica descriptiva

7

Tipos de Estadística(Ejemplos de Estadística Inferencial)

Ejemplo 1: Las empresas de televisión constantemente monitorean la popularidad de sus programas contratando a la empresa Nielsen y a otras organizaciones para conocer las preferencias de los telespectadores.

Ejemplo 2: Un despacho de contadores selecciona una muestra aleatoria de 100 facturas y verifica que sean correctas . En 5 de las mismas se encontraron errores, por tanto el despacho estima que el 5% de toda la población de facturas contiene algún error.

Ejemplo 3: Los catadores de vino toman unas copas de vino como muestra para tomar una decisión con respecto a todo el vino almacenado para su venta.

Page 8: Estadistica descriptiva

8

Tipos de variables

Cuando la característica o variable en estudio es no numérica, se le denomina variable cualitativa o de atributo.

Ejemplos: Género sexual, religión, tipo de automóvil, lugar de nacimiento, color de los ojos de la persona, etc…

Page 9: Estadistica descriptiva

9

Tipos de variables

En una variable cuantitativa la información es reportada numéricamente.

Ejemplos: El saldo en tu cuenta de cheques, los minutos que le restan a la clase, o el número de niños de una familia.

Page 10: Estadistica descriptiva

10

Tipos de variables

Las variables cuantitativas pueden ser discretas o continuas.

Las variables discretas pueden asumir sólo ciertos valores, y generalmente existen “brechas” o “huecos” entre ellos.

Ejemplo: el número de recámaras en una casa, el número de estudiantes en el curso de estadística (1,2,3,…).

Page 11: Estadistica descriptiva

11

Tipos de variables

Las observaciones de una variable continua pueden tomar cualquier valor dentro de un intervalo determinado.

La presión del aire en un neumático de automóvil, el peso de un cargamento de granos (15.0,15.01, 15.013,…toneladas).

Page 12: Estadistica descriptiva

12

Resumen de tipos de variables

Variables

Cualitativa Numérica

Discreta Continua

Page 13: Estadistica descriptiva

13

Niveles de medición

Existen cuatro niveles de medición: Nivel nominal: Las observaciones

solamente se pueden clasificar o contar. No existe algún orden específico entre las clases.

Ejemplos: color de ojos, género, religión.

Page 14: Estadistica descriptiva

14

Niveles de medición

Mutuamente excluyente. Propiedad de un conjunto de categorías que implica que una persona, objeto o medición se ha de incluir en sólo una categoría.

Exhaustivo. Propiedad de un conjunto de categorías que implica que cada individuo, objeto o medición debe aparecer en sólo una categoría.

Page 15: Estadistica descriptiva

15

Niveles de medición

Nivel ordinal: involucra datos arreglados con algún orden, pero las diferencias entre los valores de los mismos no pueden ser determinadas o bien no tienen algún significado.

Ejemplo: en la evaluación de profesores, se asigna el 4 a excelente, 3 a bueno, 2 a regular y 1 a malo.

Page 16: Estadistica descriptiva

16

Niveles de medición

Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que la diferencia entre los valores de los datos sí pueden ser determinados. Es importante señalar que 0 es solamente un punto de la escala, y no representa la ausencia de la condición.

Ejemplo: temperatura en grados Fahrenheit.

Page 17: Estadistica descriptiva

17

Niveles de medición

Nivel de razón: esta medida tiene todas las características del nivel de intervalo, pero además el punto 0 sí tiene significado, y la razón (cociente) entre dos números también es significativa.

Ejemplo: unidades de producción, salarios, distancia entre un conjunto de oficinas, la estatura.

Page 18: Estadistica descriptiva

18

Capítulo 2 Descripción de los datos, distribuciones de frecuencias y representaciones gráficas Objetivos: Al terminar este capítulo podrá:

3. Organizar los datos en una distribución de frecuencias.

5. Presentar una distribución de frecuencias en un histograma, un polígono de frecuencias y un polígono de frecuencias acumuladas.

7. Elaborar e interpretar una representación de tallo y hoja.

9. Presentar datos utilizando técnicas de graficación como gráficas de líneas, gráficas de barras y gráficas circulares.

Page 19: Estadistica descriptiva

19

Distribución de frecuencias

Distribución de frecuencias: Agrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría.

Page 20: Estadistica descriptiva

20

Construcción de una distribución de frecuencias

Determinar la información que

interesaRecolectar datos Organizar datos

Sacarconclusiones

Presentar datos(gráfica)

Distribución de frecuencias

Page 21: Estadistica descriptiva

21

Distribución de frecuencias

Punto medio de clase: Un punto que divide el intervalo en dos partes iguales. Es el promedio entre el límite inferior y superior del intervalo de clase.

Frecuencia de clase: El número de observaciones en cada clase.

Intervalo de clase: El intervalo de clase es obtenido restando el límite inferior de una clase del límite inferior de la siguiente clase.

Page 22: Estadistica descriptiva

22

Ejemplo 1

El Dr. Yáñez es director de una Escuela de Negocios en la Universidad de Calvillo. Él desea preparar un resumen mostrando el número de horas por semana que los estudiantes emplean en el estudio. Selecciona una muestra de 30 estudiantes y determina el número de horas que cada alumno estudió en la última semana.

15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6

Organice los datos en una distribución de frecuencias.

Page 23: Estadistica descriptiva

23

Ejemplo 1 (Continuación)

Hay 30 observaciones. Dos elevado a la quinta potencia es 32. Sin embargo, debemos tener al menos 5 clases.

Eventualmente utilizaríamos 6. El rango es 23.5 horas, restando 10.3 de 33.8

horas. Escogemos un intervalo de 5 horas. El límite inferior de la primera clase es 7.5

horas.

Page 24: Estadistica descriptiva

24

Ejemplo 1 (Continuación)

•Horas en estudio •Frecuencia, f

•De 7.5 a menos de 12.5 • 1

•De 12.5 a menos de 17.5 • 12

•De 17.5 a menos de 22.5 • 10

•De 22.5 a menos de 27.5 • 5

•De 27.5 a menos de 32.5 • 1

•De 32.5 a menos de 37.5 • 1

Page 25: Estadistica descriptiva

25

Sugerencias en la construcción de la distribución de frecuencias

El intervalo o amplitud de las clases debe ser el mismo para todas ellas.

Determine el intervalo o amplitud usando la siguiente fórmula:

clasesdenúmerobajo)másvaloraltomás(valor −=i

Page 26: Estadistica descriptiva

26

Sugerencias en la construcción de la distribución de frecuencias

Use el cálculo obtenido como sugerencia del ancho del intervalo en la construcción de la distribución de frecuencias.

Nota: Esto es un ancho del intervalo de clase sugerido; si el cálculo obtenido es 97, puede ser mejor usar 100.

Cuente el número de valores en cada clase.

Page 27: Estadistica descriptiva

27

Ejemplo 1 (Continuación)

Una distribución de frecuencias relativas muestra el porcentaje de observaciones en cada clase.

Page 28: Estadistica descriptiva

28

Distribución de frecuencias relativas

Horas en estudio Frecuencia, f Frecuencia relativa

• De 7.5 a menos de 12.5 • 1 • 1/30 = .0333

• De 12.5 a menos de 17.5 • 12 • 12/30 = .4000

• De 17.5 a menos de 22.5 • 10 • 10/30 = .3333

• De 22.5 a menos de 27.5 • 5 • 5/30 = .1667

• De 27.5 a menos de 32.5 • 1 • 1/30 = .0333

• De 32.0 a menos de 37.5 • 1 • 1/30 = .0333

Total 30 30/30 = 1.0000

Page 29: Estadistica descriptiva

29

Representación de tallo y hoja

Representación de tallo y hoja: Es una técnica estadística que muestra un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales se toman como el tallo, y el dígito siguiente es la hoja. Los tallos se ubican a lo largo del eje vertical principal, y las hojas de cada observación, a lo largo del eje horizontal.

Nota: Una ventaja de esta representación sobre la distribución de frecuencias es que no se pierde la identidad de cada observación.

Page 30: Estadistica descriptiva

30

Ejemplo 2

86, 79, 92, 84, 69, 88, 91, 83, 96, 78,

82, 85.

Construya un diagrama de árbol y hojas.

Colín obtuvo las siguientes calificaciones en doce pruebas de este semestre:

Page 31: Estadistica descriptiva

31

Ejemplo 2 (Continuación)

Árbol Hojas

6 9

7 8 9

8 2 3 4 5 6 8

9 1 2 6

Page 32: Estadistica descriptiva

32

Presentación de una distribución de frecuencias en gráficas

Las tres gráficas más comunes son: histograma, polígono de frecuencias y distribución de frecuencias acumuladas.

Un histograma es una gráfica en la cual los intervalos de clase se señalan en el eje horizontal, y las frecuencias de clase en el eje vertical.

Las frecuencias de clase son representadas por barras de diferente altura y éstas se colocan una junto a otra.

Page 33: Estadistica descriptiva

33

Presentación de una distribución de frecuencias en gráficas

Un polígono de frecuencias consiste en segmentos de línea conectados a través de los puntos medios (marcas de clase) de clase en cada intervalo de clase.

Una distribución de frecuencias acumulada (ojiva) es utilizada para determinar cuántos o qué proporción de los datos están por arriba o por debajo de cierto valor.

Page 34: Estadistica descriptiva

34

Histograma para horas empleadas en estudiar

Histograma

0

2

4

6

8

10

12

14

intervalos de clase

frecu

en

cia

Page 35: Estadistica descriptiva

35

Polígono de frecuencias para horas empleadas en estudiar

polígono de frecuencias

0

2

4

6

8

10

12

14

1 2 3 4 5 6

intervalos de confianza

frec

uen

cia

frecuencia

Page 36: Estadistica descriptiva

36

Distribución de frecuencias acumuladas (ojiva) para horas en estudio

frecuencia acumulada(ojiva)

0

5

10

15

20

25

30

35

1 2 3 4 5 6 7

intervalos de clase

frecu

en

cia

acu

mu

lad

a

ojiva

Page 37: Estadistica descriptiva

37

Gráfica de barras

Una gráfica de barras es especialmente útil para mostrar cualquiera de los niveles de medición: nominal, ordinal, de intervalo o de razón.

Page 38: Estadistica descriptiva

38

Ejemplo 3 Construya un diagrama de barras para el número de

desempleados de una población de 100,000 para ciudades seleccionadas durante 2001.

Ciudad Número de desempleados por cada

100,000

Atlanta 7300

Boston 5400

Chicago 6700

Los Ángeles 8900

Nueva York 8200

Washington 8900

Page 39: Estadistica descriptiva

39

Diagrama de barras para desempleados

Diagrama de barras

0

2000

4000

6000

8000

10000

Atlanta

Bosto

n

Chicago

Los A

ngeles

Nueva Y

ork

Wash

ingto

n

Ciudades

Des

emp

lead

os/

100,

000

Page 40: Estadistica descriptiva

40

Diagrama tipo pastel

Un diagrama tipo pastel es útil para mostrar la distribución de frecuencias relativas. Un círculo es dividido proporcionalmente a las frecuencias relativas y las porciones del círculo están ubicadas para los diferentes grupos.

Page 41: Estadistica descriptiva

41

Ejemplo 4

A una muestra de 200 corredores se le preguntó su tipo de zapato tenis favorito.

Elabore un diagrama tipo pastel en base a la siguiente información.

Tipo de zapato No. de corredores

Nike

Adidas

Reebok

Asics

Otros

92

49

37

13

9

Page 42: Estadistica descriptiva

42

Diagrama tipo pastel para zapato tenis

Diagrama tipo pastel

Nike

Adidas

Reebok

Asics

Otros

Nike

Adidas

Reebok

Asics

Otros

Page 43: Estadistica descriptiva

43

Capítulo 3Descripción de datos, medidas de tendencia central

Objetivos: Al terminar este capítulo podrá:

3. Calcular la media aritmética, la media ponderada, la mediana, la moda y la media geométrica.

5. Explicar las características, uso, ventajas y desventajas de cada medida de tendencia central.

7. Identificar la posición de la media aritmética, la mediana y la moda, tanto en distribuciones simétricas como asimétricas.

Page 44: Estadistica descriptiva

44

Características de la media

La media aritmética es, con mucho, la medida de localización más usada.

Es calculada sumando los valores y dividiendo entre el número de valores.

Las principales características de la media son:- Requiere de una escala de intervalo.

- Todos los valores son utilizados. - Es única. - La suma de las desviaciones con respecto a la media

es cero.

Page 45: Estadistica descriptiva

45

Media poblacional

Para datos no agrupados, la media poblacional es la suma de todos los valores de la población divididos entre el número total de valores de la población: donde µ es la media poblacional, N es el total de observaciones de la población y X un valor particular.

N

X∑=µ

Page 46: Estadistica descriptiva

46

Ejemplo 1

Un parámetro es una medida característica de la población.

Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los siguientes datos corresponden al kilometraje de cada uno de ellos:56,000 23,000 42,000 73,000Encuentre la media aritmética del kilometraje de los autos:

µ = (56,000 + … + 73,000)/4 = 48,500

Page 47: Estadistica descriptiva

47

Media muestral

Para datos no agrupados, la media muestral es la suma de todos los valores de la muestra dividida por el número de valores de la muestra. Donde n es el número total de valores en la muestra.

n

XX

Σ=

Page 48: Estadistica descriptiva

48

Ejemplo 2

Un estadístico es una medida característica de una muestra.

Ejemplo 2: Una muestra de cinco ejecutivos recibió los siguientes bonos el último año ($000):

14.0, 15.0, 17.0, 16.0, 15.0

4.155

77

5

0.15...0.14 ==++=Σ=n

XX

Page 49: Estadistica descriptiva

49

Propiedades de la media aritmética

Todos los datos de nivel de intervalo y de nivel de razón tienen una media.

Para evaluar la media se consideran todos los valores. Un conjunto de datos sólo tiene una media la cual es un

valor único. La media es afectada por valores inusualmente grandes

o pequeños. La media aritmética es la única medida de tendencia

central donde la suma de las desviaciones de cada valor, respecto de la media, siempre es igual a cero.

Page 50: Estadistica descriptiva

50

Ejemplo 3

Considere el siguiente conjunto de valores: 3, 8, y 4. La media es 5. Ilustrando la quinta propiedad:

[ ] 0)54()58()53()( =−+−+−=−Σ XX

Page 51: Estadistica descriptiva

51

Media ponderada

La media ponderada de un conjunto de números X1, X2, …,Xn con pesos correspondientes w1, w2, …,wn es calculada con la siguiente fórmula:

)21

)2211

...(

...(

n

nnw

www

XwXwXwX

+++++

=

Page 52: Estadistica descriptiva

52

Ejemplo 6

Durante el periodo de una hora, en una tarde calurosa de sábado, Cristina sirvió 50 refrescos. Ella vendió 5 bebidas de $0.50, 15 de $0.75, 15 de $0.90, y 15 de $1.15. Calcule la media ponderada para el precio de estas bebidas.

89.0$50

50.44$1515155

)15.1($15)90.0($15)75.0($15)50.0($5

==

++++++=wX

Page 53: Estadistica descriptiva

53

La mediana

La mediana es el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor.

Cincuenta por ciento de las observaciones son mayores que la mediana, y 50% son menores que ella.

Para un conjunto par de valores, la mediana será el promedio aritmético de los dos valores centrales.

Page 54: Estadistica descriptiva

54

Ejemplo 4

Las edades de una muestra de 5 estudiantes del colegio son:

21, 25, 19, 20, 22 Ordenando los datos en forma ascendente, tenemos: 19, 20, 21, 22, 25. Entonces la mediana es 21. Las estaturas de 4 jugadores de basquetbol, en

pulgadas, son: 76, 73, 80, 75 Entonces la mediana es 75.5

Page 55: Estadistica descriptiva

55

Propiedades de la mediana

Es única; esto es, a semejanza de la media, sólo existe una mediana para un conjunto de datos.

No se ve afectada por valores extremadamente grandes o muy pequeños, y por tanto es una medida valiosa de tendencia central cuando se presenta esta clase de valores.

Puede calcularse para datos de nivel de razón, de intervalo y ordinal.

Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en tal clase.

Page 56: Estadistica descriptiva

56

La moda

La moda es el valor de la observación que aparece con más frecuencia.

Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87

Dado que 81 es el dato que aparece con más frecuencia, éste es la moda.

Page 57: Estadistica descriptiva

57

La media geométrica

La media geométrica (GM) de un conjunto de n números se define como la raíz enésima del producto de n números.

La media geométrica es útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento.

La fórmula es:

n nXXXXGM ))...()()(( 321=

Page 58: Estadistica descriptiva

58

Ejemplo 7

La tasa de interés de tres bonos son: 5, 21 y 4 por ciento.

La media aritmética es (5+21+4)/3 =10.0 La GM da una utilidad más conservadora porque no

está demasiado influenciada por la tasa del 21 por ciento.

La media geométrica es:

49.7)4)(21)(5(3 ==GM

Page 59: Estadistica descriptiva

59

Media geométrica (Continuación)

Otro uso de la media geométrica es determinar el aumento porcentual en ventas, producción o series económicas de un periodo de tiempo a otro.

(Valor al principio del periodo)

Valor al final del periodo)(−1= nGM

Page 60: Estadistica descriptiva

60

Ejemplo 8

El número total de mujeres contratadas en Colegios Americanos se incrementó de 755,000 en 1992 a 835,000 en 2000. Esto es, la media geométrica o tasa de incremento es 1.27%.

0127.1000,755

000,8358 =−=GM

Page 61: Estadistica descriptiva

61

La media para datos agrupados

La media de una muestra de datos organizados en una distribución de frecuencias es calculada por la siguiente fórmula:

n

XfX

Σ=

Page 62: Estadistica descriptiva

62

Ejemplo 9

Una muestra de 10 cines en una gran área metropolitana contó el número total de películas en exhibición la última semana. Calcule el número medio de películas en exhibición.

6.610

66 ==Σ=n

XX

Page 63: Estadistica descriptiva

63

Ejemplo 9 (Continuación)

Películas en cartelera

Frecuencia

f

Punto medio de clase (X)

(f)(X)

1 hasta 3 1 2 2

3 hasta 5 2 4 8

5 hasta 7 3 6 18

7 hasta 9 1 8 8

9 hasta 11 3 10 30

Total 10 66

Page 64: Estadistica descriptiva

64

La mediana para datos agrupados

La mediana de una muestra de datos agrupados en una distribución de frecuencias se calcula con:

donde L es el límite inferior de la clase que contiene a la mediana, n es el número total de frecuencias, CF es la frecuencia acumulada precedente a la clase mediana, f es la frecuencia de la clase que contiene a la mediana, e i es la amplitud de la clase en que se encuentra la mediana.

)(2 if

CFn

LMediana−

+=

Page 65: Estadistica descriptiva

65

Encontrar la clase que contiene a la mediana

Para determinar la clase que contiene a la mediana para datos agrupados:

Construya una distribución de frecuencias acumuladas.

Divida el número total de datos entre 2. Determine cuál clase contiene este valor. Por ejemplo, si n = 50, 50/2 =25, entonces

determine cuál clase contiene el valor en la posición 25.

Page 66: Estadistica descriptiva

66

Ejemplo 10

Películas en cartelera

Frecuencia Frecuencia acumulada

1 hasta 3 1 1

3 hasta 5 2 3

5 hasta 7 3 6

7 hasta 9 1 7

9 hasta 11 3 10

Page 67: Estadistica descriptiva

67

Ejemplo 10 (Continuación)

De la tabla, tenemos: L = 5, n = 10, f = 3, i = 2, CF = 3

33.6)2(3

32

10

5)(2 =−

+=−

+= if

CFn

LMediana

Page 68: Estadistica descriptiva

68

La moda en datos agrupados

Para datos agrupados en una distribución de frecuencias, es posible aproximar la moda usando el punto medio de la clase que contiene el mayor número de frecuencias de clase.

Las modas en el ejemplo 10 son 8 y 10. Cuando dos valores ocurren un gran número de veces, la distribución es llamada bimodal, como en el ejemplo 10.

Page 69: Estadistica descriptiva

69

Distribución simétrica

Cero asimetría moda = mediana = media

Page 70: Estadistica descriptiva

70

Distribución con sesgo positivo

Asimetría positiva: media y mediana están a la derecha de la moda.

Moda<Mediana<Media

Page 71: Estadistica descriptiva

71

Distribución con sesgo negativo

Asimetría negativa: media y mediana están a la izquierda de la moda.

Media<Mediana<Moda

Page 72: Estadistica descriptiva

72

Capítulo 4Otras medidas descriptivas Objetivos: Al terminar este capítulo podrá:

3. Calcular e interpretar la amplitud, la desviación media, la varianza y la desviación estándar de datos no agrupados.

5. Calcular e interpretar la amplitud de variación, la varianza y la desviación estándar de datos agrupados.

7. Explicar las características, usos, ventajas y desventajas de cada medida.

Page 73: Estadistica descriptiva

73

Capítulo 4 (Continuación)

1. Entender el teorema de Chebyshev y la regla normal o empírica, con relación a un conjunto de observaciones.

3. Calcular e interpretar los cuartiles y la amplitud cuartílica o intercuartílica.

5. Elaborar e interpretar los diagramas de caja.

7. Calcular y entender el coeficiente de asimetría y el coeficiente de variación.

Page 74: Estadistica descriptiva

74

Amplitud de variación

La amplitud de variación es la diferencia entre el valor más grande y el valor más pequeño.

Sólo dos valores son utilizados en su cálculo. Está influido por un valor extremo. Es fácil calcularlo y entenderlo.

Page 75: Estadistica descriptiva

75

Desviación media La desviación media (MD) es el promedio aritmético de

los valores absolutos de las desviaciones con respecto a la media aritmética.

Todos los valores son utilizados en el cálculo. No está influido excesivamente por valores muy grandes

o valores muy pequeños. Los valores absolutos son difíciles de manipular.

Page 76: Estadistica descriptiva

76

Desviación media

La fórmula para la desviación media es:

n

XXMD

−Σ=

Page 77: Estadistica descriptiva

77

Ejemplo 1

Los pesos de una muestra de canastas conteniendo libros para una librería (en libras) son:

103, 97, 101, 106, 103

Encuentre la amplitud y la desviación media.

Amplitud = 106 – 97 = 9

Page 78: Estadistica descriptiva

78

Ejemplo 1 (Continuación)

El primer paso es encontrar la media:

La desviación media es:

1025

510 ==Σ=n

XX

4.25

541515

102103...102103

=++++=

−++−=

−Σ=

n

XXMD

Page 79: Estadistica descriptiva

79

Varianza de la población

La varianza de la población es la media aritmética de las desviaciones al cuadrado de la media poblacional.

Todos los valores son utilizados en el cálculo. No está influido por valores extremos. Las unidades están desproporcionadas, son los

cuadrados de la unidad original.

Page 80: Estadistica descriptiva

80

Varianza

La fórmula para la varianza poblacional es:

La fórmula para la varianza muestral es:

NX 2

2 )( µσ −Σ=

1)( 2

2

−−Σ=nXX

s

Page 81: Estadistica descriptiva

81

Ejemplo 2

Las edades de la familia González son:

2, 18, 34, 42

¿Cuál es la varianza poblacional?

244

96 ==Σ=n

( ) ( )

2364

9444

2442...242)( 2222

==

−++−=−Σ=N

X µσ

Page 82: Estadistica descriptiva

82

La desviación estándar poblacional

La desviación estándar poblacional ( ) es la raíz cuadrada de la varianza poblacional.

Para el Ejemplo 2, la desviación estándar es 15.36, calculada así:

σ

36.152362 === σσ

Page 83: Estadistica descriptiva

83

Ejemplo 3

Los ingresos ganados por hora en una muestra de cinco estudiantes son:

$7, $5, $11, $8, $6.

Encuentre la varianza.

40.75

37 ==Σ=n

XX

( ) ( ) ( )

30.515

2.2115

4.76...4.77

1

2222

=−

=

−−++−=

−−Σ=n

XXs

Page 84: Estadistica descriptiva

84

Desviación estándar muestral

La desviación estándar muestral es la raíz cuadrada de la varianza muestral.

En el Ejemplo 3, la desviación estándar muestral es 2.30

30.229.52 === ss

Page 85: Estadistica descriptiva

85

Varianza muestral para datos agrupados

La fórmula para la varianza muestral para datos agrupados es:

donde f es la frecuencia de clase y X es la marca de clase.

1

)( 22

2

Σ−Σ=

nn

fXfX

s

Page 86: Estadistica descriptiva

86

Interpretación y usos de la desviación estándar

Teorema de Chebyshev: Para un conjunto cualquiera de observaciones, la proporción mínima de los valores que se encuentran dentro de k desviaciones estándar desde la media es por lo menos.

2

11k

donde k2 es una constante mayor que 1.

Page 87: Estadistica descriptiva

87

Interpretación y usos de la desviación estándar

Regla empírica: En una distribución de frecuencias simétrica, con forma de campana:

Aproximadamente 68% de las observaciones estarán entre más una y menos una s desde la media;

Aproximadamente 95% de las observaciones se encontrarán entre más dos y menos dos s desde la media;

Prácticamente todas las observaciones se hallarán entre más tres y menos tres s a partir del valor medio.

Page 88: Estadistica descriptiva

88

µ µ +1s µ+2s µ+3sµ-1sµ-2sµ-3s

Page 89: Estadistica descriptiva

89

Dispersión relativa

El coeficiente de variación es la razón (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje.

CVs

X= (100%)

Page 90: Estadistica descriptiva

90

Coeficiente de asimetría

La asimetría es la medida de la carencia de simetría en una distribución.

El coeficiente de asimetría puede variar desde

-3 hasta 3. Un valor cero indica una distribución

simétrica. Es calculado como sigue: CA = 3(Media – Mediana)/s

Page 91: Estadistica descriptiva

91

Rango intercuartílico

El rango intercuartílico es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.

Esta distancia incluirá la mitad de las observaciones.

Rango intercuartílico = Q3 – Q1

Page 92: Estadistica descriptiva

92

Ejemplo 5

Para un conjunto de observaciones el tercer cuartil es 24 y el primer cuartil es 10.

¿Cuál es la desviación intercuartílica?

El rango intercuartílico es 24 – 10 = 14. 50% de las observaciones ocurrirán entre 10 y 24.

Page 93: Estadistica descriptiva

93

Diagrama de caja y bigotes

Una gráfica de caja y bigotes es una gráfica basada en cuartiles, que ayudan a retratar un conjunto de datos.

Cinco tipos de datos son necesarios para construir una gráfica de caja y bigotes: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo.

Page 94: Estadistica descriptiva

94

Ejemplo 6

Basado en una muestra de 20 pedidos entregados, Pizza Hot registró la siguiente información. El tiempo mínimo de entrega fue 13 minutos, y el máximo, 30 minutos. El primer cuartil fue 15 minutos, la mediana 18 minutos, y el tercer cuartil 22 minutos. Elabore un diagrama de caja y bigotes para los tiempos de entrega.

Page 95: Estadistica descriptiva

95

Ejemplo 6 (Continuación)

mín

Q1 Q2 Q3

máx

12 14 16 18 3020 22 24 26 28


Recommended