Post on 27-Jan-2016
description
transcript
1-1
DESCRIPCIÓN DE LOS DATOS
DISTRIBUCIONES DE
FRECUENCIAS,
REPRESENTACIONES GRÁFICAS,
MEDIDAS DE UBICACIÓN Y
MEDIDAS DE DISPERSIÓN
PATRICIO ORTEGA
1-1
OBJETIVOS
Organizar los datos en una distribución de frecuencias. Presentar datos mediante gráficos de líneas, de barras y circulares. Calcular e interpretar la amplitud de variación, la desviación
media, la variancia, y la desviación estándar de los datos originales.
Calcular y entender el coeficiente de variación.
Distribución de frecuencias
Distribución de frecuencias: agrupamiento de datos en categorías que muestran el número de observaciones en cada categoría mutuamente excluyente.
2-2
31302928272625
4
3
2
1
0
NOTAS /50
Frec
uenc
ia
Histograma de NOTAS /50
Distribución de frecuencias Marca de clase (punto medio): punto que divide a la
clase en dos partes iguales. Es el promedio entre los límites superior e inferior de la clase.
Intervalo de clase: para una distribución de frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene restando el límite inferior de una clase del límite inferior de la siguiente.
2-4
EJEMPLO
Dr. Tillman es el director de la escuela de administración y desea determinar cuánto estudian los alumnos en ella.
Selecciona una muestra aleatoria de 30 estudiantes y determina el número de horas por semana que estudia cada uno:
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
2-5
EJEMPLO
Horas de estudio Frecuencia, f 8-12 1 13-17 12 18-22 10 23-27 5 28-32 1 33-37 1
2-6
Organice los datos en una distribución de frecuencias.
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15.
El intervalo de clase es 5 (13 - 8).
Sugerencias para elaborar una distribución de frecuencias
Los intervalos de clase usados en la distribución de frecuencias deben ser iguales.
Determine un intervalo de clase sugerido con la fórmula:
i = (valor más alto - valor más bajo)/número de clases.
2-7
Sugerencias para elaboraruna distribución de frecuencias Use el intervalo de clase calculado sugerido para
construir la distribución de frecuencias.
Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97, puede ser mejor usar 100.
Cuente el número de valores en cada clase.
2-8
Distribución de frecuencia relativa
La frecuencia relativa de una clase se obtiene dividiendo la frecuencia de clase entre la frecuencia total.
2-9
Frecuencia,f
Frecuenciarelativa
8-12 1 1/30=.0333
13-17 12 12/30=.400
18-22 10 10/30=.333
23-27 5 5/30=.1667
28-32 1 1/30=.0333
33-37 1 1/30=.0333
TOTAL 30 30/30=1
T
Horas
Presentación gráfica de una distribución de frecuencias
Las tres formas de gráficas más usadas son histogramas, polígonos de frecuencia y distribuciones de frecuencias acumuladas (ojiva).
Histograma: gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se trazan adyacentes entre sí.
2-12
Presentación gráfica de una distribución de frecuencias Un polígono de frecuencias consiste en segmentos
de línea que conectan los puntos formados por el punto medio de la clase y la frecuencia de clase.
Una distribución de frecuencias acumulada (ojiva) se usa para determinar cuántos o qué proporción de los valores de los datos es menor o mayor que cierto valor.
2-13
Histograma para las horas de estudio
0
2
4
6
8
10
12
14
10 15 20 25 30 35
Horas de estudio
Fre
cu
en
cia
2-14
Polígono de frecuencias para las horas de estudio
0
2
4
6
8
10
12
14
10 15 20 25 30 35
Horas de estudio
Fre
cu
en
cia
2-15
Distribución de frecuencias acumuladas menor que para las horas de estudio
0
5
10
15
20
25
30
35
10 15 20 25 30 35
Horas de estudio
Fre
cuen
cia
2-16
Gráfica de barras para los datos de desempleados
7300
5400
6700
89008200
8900
0
2000
4000
6000
8000
10000
1 2 3 4 5 6
Ciudades
# d
esem
ple
ado
s/10
0 00
0AtlantaBostonChicagoLos AngelesNew YorkWashington
2-19
Gráfica cicular para tipos de zapatos
Nike
Adidas
ReebokAsics
Otros
Nike
Adidas
ReebokAsics
Otros
2-22
Media de la población Para datos no agrupados, la media de la población es
la suma de todos los valores en ella dividida entre el total de valores en la población:
donde µ representa la media de la población. N es el número total de elementos en la población. X representa cualquier valor en particular. indica la operación de sumar.
X N/
3-2
EJEMPLO
Parámetro: una característica de una población.
La familia Kiers posee cuatro carros. Los datos son las millas recorridas por cada uno:56 000, 23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros.
Esto es (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500
3-3
Media de una muestra
Para datos no agrupados, la media de una muestra es la suma de todos los valores divididos entre el número total de los mismos:
donde X denota la media muestral. n es el número total de valores en la muestra.
X X n /
3-4
EJEMPLO
Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado: $14 000, $15 000, $17 000, $16 000 y $15 000.
Encuentre el promedio en bonos para los cinco ejecutivos.
Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es:
(14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.
3-5
Propiedades de la media aritmética Todo conjunto de datos de nivel de intervalo y de
nivel de razón tiene un valor medio. Al evaluar la media se incluyen todos los valores. Un conjunto de valores sólo tiene una media. La cantidad de datos a evaluar rara vez afecta la
media. La media es la única medida de ubicación donde la
suma de las desviaciones de cada valor con respecto a la media, siempre es cero.
3-6
Media ponderada
La media ponderada de un conjunto de números X1, X2, ..., Xn, con las ponderaciones correspondientes w1, w2, ...,wn, se calcula con la fórmula:
wXwXw
wwwXwXwXwXw nnn
/)*(
).../()...( 212211
3-8
EJEMPLO
Durante un periodo de una hora en una tarde calurosa de un sábado, el cantinero Chris sirvió cincuenta bebidas.
Calcule la media ponderada de los precios de las bebidas. (Precio ($), cantidad vendida):
($0.50, 5), ($0.75, 15), ($0.90, 15), ($1.10, 15).
La media ponderada es: $(.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = $0.875
3-9
Mediana
Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.
Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.
3-10
EJEMPLO
Calcule la mediana para los siguientes datos. La edad de una muestra de cinco estudiantes es: 21,
25, 19, 20 y 22.
Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25.
La mediana es 21. La altura, en pulgadas, de cuatro jugadores de
basquetbol es 76, 73, 80 y 75.
Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80.
La mediana es 75.5.
3-11
Propiedades de la mediana
La mediana es única para cada conjunto de datos. No se ve afectada por valores muy grandes o muy
pequeños, y por lo tanto es una medida valiosa de tendencia central cuando ocurren.
Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.
Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.
3-12
Moda
La moda es el valor de la observación que aparece con más frecuencia.
EJEMPLO: las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificación 81 es la que más ocurre, la calificación modal es 81.
EJEMPLO: Talla de calzado
EJEMPLO: Color de ojos
3-13
Desviación media
Desviación media: media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética.
MDX X
n
4-3
EJEMPLO
Los pesos de una muestra de cajas con libros en una librería son (en lb) 103, 97, 101, 106 y 103.
X = 510/5 = 102 lb
= 1 + 5 + 1 + 4 + 1 = 12
MD = 12/5 = 2.4
Por lo común los pesos de las cajas están a 2.4 lb del peso medio de 102 lb.
4-4
Variancia de la población
La varianza de la población para datos no agrupados es la media aritmética de las desviaciones cuadráticas respecto a la media de la población.
2
2
( )X
N
4-5
EJEMPLO
Las edades de la familia Dunn son 2, 18, 34, y 42 años. ¿Cuál es la variancia de la población?
X N/ /96 4 24
2 2 944 4 236 ( ) / /X N
4-6
Variancia poblacional
Una fórmula alternativa para la variancia poblacional es:
22
2 X
N
X
N( )
4-7
Desviación estándar poblacional
La desviación estándar poblacional () es la raíz cuadrada de la variancia de la población.
Para el EJEMPLO 2, la desviación estándar poblacional es 15.19 (raíz cuadrada de 230.81).
4-8
Variancia muestral
4-9
La variancia muestral estima la variancia de la población.
1
)Σ(Σ
= = operativa Fórmula
1)(Σ
== conceptual Fórmula
22
2
22
nnX
XS
nXX
S
Interpretación y usos de la deviación estándar Regla empírica: para una distribución de frecuencias
simétrica de campana:
Cerca de 68% de las observaciones estará dentro de ±1 de la media ().
Cerca de 95% de las observaciones estará dentro de ±2 de la media ().
Alrededor de 99.7% estará dentro de ±3 de la media ().
4-15
3 m
Curva en forma de campana que muestra la relación entre y
2 1 +1 +2 +3
Dispersión relativa
El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:
CVs
X (100%)
4-17