Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc. Chap 2-1
Capítulo 2
Presentación de Datos en Tablas y Gráficos
Estadística I
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-2
Los datos categóricos son presentados en tablas y gráficos
Datos
Categóricos
Graficando los datos
Gráfico de pastel
Diagrama de Pareto
Gráfico de barras
Tabulando los datos
Tabla de resumen
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-3
Organizando los datos categóricos: Tabla de Resumen
§ La tabla de resumen indica la frecuencia, cantidad o porcentaje de objetos en un conjunto de categorías para observar las diferencias que hay entre ellas.
§ Una tabla de resumen lista las categorías en una columna y la frecuencia, cantidad o porcentaje en una columna o columnas independientes.
Preferencia Bancaria? Percent ATM 16% Llamada Telefónica 2% Autobanco 17% Sucursal 41% Internet 24%
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-4
Organizando los datos categóricos: Gráfico de Barras
§ En una gráfica de barras, cada barra muestra una categoría, su longitud representa la cantidad, frecuencia o porcentaje de los valores que caen en cada categoría.
0% 10% 20% 30% 40% 50%
ATM
Llamada Telefónica
Autobanco
Sucursal
Internet
Preferencia Bancaria
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-5
Organizando datos categóricos: Gráfico de Pastel
§ La gráfica de pastel es un círculo que se divide en partes para representar las categorías. El tamaño de cada rebanada varía de acuerdo con el porcentaje de cada categoría.
16% 2%
17%
41%
24%
Preferencia Bancaria
ATM
Llamada Telefónica
Autobanco
Sucursal
Internet
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-6
Organizando datos categóricos: Diagrama de Pareto
n Las respuestas categorizadas se trazan en orden descendente de acuerdo con sus frecuencias.
n Se combinan con la línea de porcentaje acumulado en la misma gráfica.
n El diagrama de Pareto permite separar a lo “poco vital” de lo “mucho trivial”, lo que nos permite enfocarnos en las categorías importantes.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-7
Organizando datos categóricos: Diagrama de Pareto
Pareto Chart For Banking Preference
0%
20%
40%
60%
80%
100%
In personat branch
Internet Drive-through
service atbranch
ATM Automatedor live
telephone
% in
eac
h ca
tego
ry(b
ar g
raph
)
0%
20%
40%
60%
80%
100%
Cum
ulat
ive
%(li
ne g
raph
)
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-8
Tablas y Gráficos para datos numéricos
Datos Numéricos
Arreglo Ordenado
Diagrama de Tallo y Hojas Histograma Polígono Ojiva
Distribuciones de Frecuencia y
Distribuciones Acumulativas
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-9
Arreglo Ordenado
§ Un arreglo ordenado es una secuencia de datos ordenados del menor al mayor valor.
§ Muestra el rango (del valor min al valor max) § Ayuda a identificar valores atípicos (observaciones poco comunes)
Edad de los estudiantes encuestados en la universidad
Asisten por la mañana
16 17 17 18 18 18 19 19 20 20 21 22 22 25 27 32 38 42 Asisten por la noche
18 18 19 19 20 21 23 28 32 33 41 45
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-10
Diagrama de Tallo y Hojas
n Permite ver cómo se distribuyen y dónde están las concentraciones de datos. METODO:
Separa los datos en dígitos principales o primarios (los tallos) y en dígitos secundarios (las hojas).
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-11
Diagrama de Tallo y Hojas
§ Organiza los datos en grupos (llamados tallos), para que los valores dentro de cada grupo (hojas) ramifiquen hacia la derecha de cada fila.
Tallo Hojas
1 67788899
2 0012257
3 28
4 2
Edad de los estudiantes
Mañana Noche
Tallo Hojas
1 8899
2 0138
3 23
4 15
Edad de los estudiantes encuestados en la universidad
Asisten por la mañana
16 17 17 18 18 18
19 19 20 20 21 22
22 25 27 32 38 42
Asisten por la noche
18 18 19 19 20 21
23 28 32 33 41 45
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-12
Distribución de Frecuencia
§ Una distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos numéricamente ordenados.
§ Se debe prestar atención al seleccionar el número apropiado de
agrupaciones o clases para la tabla, determinando una amplitud conveniente de las clases y estableciendo los límites de cada una para evitar el traslape.
§ El número de clases usadas depende del número de valores. Un mayor número de valores permite un mayor número de clases.
§ En general, la distribución de frecuencias debería tener por lo menos 5 clases, pero no más de 15.
§ Para determinar la amplitud de un intervalo de clase, se divide el rango (el valor mayor menos el valor menor) de los datos entre el número de clases que se desea.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-13
Distribución de Frecuencia
Un fabricante de insuladores aleatoriamente selecciona 20 días de invierno y registra la temperatura diaria mas alta.
24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-14
Distribución de Frecuencia
§ Ordenar los datos en orden ascendente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
§ Determine el rango: 58 - 12 = 46 § Seleccione el número de clases: 5 (5-15) § Calcule el intervalo de clase (amplitud): 10 (46/5 redondear al
entero mayor) § Determine los límites de clase:
§ Clase 1: 10 a menos de 20 § Clase 2: 20 a menos de 30 § Clase 3: 30 a menos de 40 § Clase 4: 40 a menos de 50 § Clase 5: 50 a menos de 60
§ Calcule los puntos medios de cada clase: 15, 25, 35, 45, 55 § Contar las observaciones y asignarlas a las clases
correspondientes.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-15
Distribución de Frecuencia
Clase Frecuencia
10 a menos de 20 3 .15 15 20 a menos de 30 6 .30 30 30 a menos de 40 5 .25 25 40 a menos de 50 4 .20 20 50 a menos de 60 2 .10 10 Total 20 1.00 100
Frecuencia Relativa Porcentaje
Datos en orden ascendente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-16
Frecuencia Acumulada
Clase
10 a menos de 20 3 15 3 15 20 a menos de 30 6 30 9 45 30 a menos de 40 5 25 14 70 40 a menos de 50 4 20 18 90 50 a menos de 60 2 10 20 100
Total 20 100
Porcentaje Porcentaje Acumulado
Datos en orden ascendente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Frecuencia Frecuencia Acumulada
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-17
Por qué utilizar una Distribución de Frecuencia?
n Resume la información de una manera mas útil.
n Permite una rápida interpretación visual de los datos.
n Permite determinar las características mas importantes de un conjunto de datos, donde estan concentrados y como están agrupados.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-18
Distribuciones de Frecuencia
n Si el conjunto de datos no contiene muchos valores, un conjunto de límites de clase refleja una imagen diferente de la que da otro conjunto de límites.
n Usted obtendrá cambios en la concentración de los datos al elegir límites de clase inferiores y superiores diferentes.
n Conforme aumenta el tamaño de la muestra, las alteraciones en la selección de los límites de clase afectan cada vez menos la concentración de los datos.
n Cuando comparamos dos o más grupos que difieren en el tamaño de su muestra, se debe usar una distribución de frecuencias relativa o una distribución de porcentaje.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-19
El Histograma
§ Un gráfico de barras verticales de los datos de una distribución de frecuencias se llama histograma.
§ En un histograma no existen espacios entre las barras adyacentes.
§ Los límites de clase (o puntos medios de clase) se muestran
en el eje horizontal.
§ El eje vertical representa la frecuencia o porcentaje de los valores por intervalo de clase.
§ La altura de las barras representa la frecuencia, frecuencia relativa o porcentaje.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-20
El Histograma
Clase Frecuencia
10 but less than 20 3 .15 15 20 but less than 30 6 .30 30 30 but less than 40 5 .25 25 40 but less than 50 4 .20 20 50 but less than 60 2 .10 10 Total 20 1.00 100
Frecuencia Relativa Porcentaje
0 1 2 3 4 5 6 7
5 15 25 35 45 55 More
Frec
uenc
ia
Histograma: Temperatura Diaria
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-21
Polígono
§ El polígono de porcentaje se crea al hacer que el punto medio de cada clase represente los datos de esa clase y después se conecta la secuencia de puntos medios con sus respectivos porcentajes de clase.
§ El polígono de porcentaje acumulado, u ojiva, muestra la
variable de interés a lo largo del eje X, y los porcentajes acumulados a lo largo del eje Y.
§ Es difícil y confuso realizar múltiples histogramas en la misma gráfica cuando comparamos dos o más conjuntos de datos. Cuando hay dos o más grupos, es conveniente utilizar un polígono de porcentaje.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-22
Frequency Polygon: Daily High Temperature
01234567
5 15 25 35 45 55 65
Frequency
Polígono de Frecuencias
Class Midpoints
Clase
10 but less than 20 15 3 20 but less than 30 25 6 30 but less than 40 35 5 40 but less than 50 45 4 50 but less than 60 55 2
Frecuencia Punto
Medio
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-23
Ojiva (Polígono de % Acumulado)
Clase
10 but less than 20 10 15 20 but less than 30 20 45 30 but less than 40 30 70 40 but less than 50 40 90 50 but less than 60 50 100
% menor que límite
inferior
Límite inferior
Ogive: Daily High Temperature
0
20
40
60
80
100
10 20 30 40 50 60Cu
mu
lati
ve P
erce
nta
ge
Lower Class Boundary
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-24
Tablas de Clasificación
n Se utilizan para estudiar características que pueden existir entre dos o mas variables categóricas.
n Pueden presentarse en: n Forma Tabular -- Tablas de contingencia n Forma Gráfica -- Gráfico de barras agrupadas
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-25
Tablas de Contingencia
§ Una tabla de clasificación (o contingencia) cruzada presenta los resultados de dos variables cate- góricas. Las respuestas en conjunto se clasifican de tal manera que las categorías de una variable se localizan en las filas, y las categorías de la otra variable se localizan en las columnas.
§ Los valores localizados en las intersecciones de las filas y las
columnas se llaman celdas. § Una forma útil de mostrar los resultados de datos de
clasificación cruzada es realizar una gráfica de barras agrupadas.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-26
Tabla de Contingencia
Importancia de la marca
Hombre Mujer Total
Mucha 450 300 750
Igual o poca 3300 3450 6750
Total 3750 3750 7500
Se realizó una encuesta para estudiar la importancia de la marca en los consumidores. Los resultados se clasificaron por género:
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-27
Gráfico de Barras Agrupadas
0 500 1000 1500 2000 2500 3000 3500 4000
Mucha
Poca o igual
Número de Respuestas
Res
pues
ta
Importancia de la Marca
Mujer
Hombre
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-28
Diagramas de Dispersión
§ Se utilizan para analizar datos en forma de pares ordenados que corresponden a dos variables numéricas.
§ Coloque una variable en el eje horizontal X y la otra variable
en el eje vertical Y. § Sirve para examinar las posibles relaciones entre dos
variables numéricas.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-29
Diagrama de Dispersión
Volumen por día
Costo por día
23 125
26 140
29 146
33 160
38 167
42 170
50 188
55 195
60 200
0
50
100
150
200
250
20 25 30 35 40 45 50 55 60 65
Cos
to p
or D
ía
Volumen por Día
Costo por Día vs. Volumen de Producción
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-30
n El diagrama de series de tiempo se usa para estudiar patrones en las variables a través del tiempo.
n Cada valor se traza como un punto de dos dimensiones.
n Un diagrama de series de tiempo muestra el periodo de tiempo en el eje horizontal X y la variable de interés en el eje vertical Y.
Series de Tiempo
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-31
Series de Tiempo
Number of Franchises, 1996-2004
0204060
80100120
1994 1996 1998 2000 2002 2004 2006
Year
Num
ber o
f Fr
anch
ises
Año #
Franquicias
1996 43 1997 54 1998 60 1999 73 2000 82 2001 95 2002 107 2003 99 2004 95
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-32
Principios para Gráficos Excelentes
§ No debe distorsionar la información. § No debe contener adornos innecesarios. § La escala del eje vertical debe comenzar en cero. § Todos los ejes deben tener el nombre de la variable que
representan. § El gráfico debe tener un título. § Se debe utilizar el gráfico mas simple para representar un
conjunto de datos.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-33
Gráficos Inadecuados
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80
Salario Mínimo
Mala Presentación
Salario Mínimo
0
2
4
1960 1970 1980 1990
$
ü Buena Presentación
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-34
Gráficos Inadecuados
Estudiantes que obtuvieron A
Estudiantes que obtuvieron A
Mala Presentación
0
200
300
9no 10mo 11mo 12mo
Frec.
10%
30%
9no 10mo 11mo 12mo
ü
100
20%
0%
%
Buena Presentación
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-35
Gráficos Inadecuados
Buena Presentación
Ventas Trimestrales
Ventas Trimestrales
Mala Presentación
0
25
50
Q1 Q2 Q3 Q4
$
0
100
200
Q1 Q2 Q3 Q4
$
ü
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-36
Gráficos Inadecuados
Ventas Mensuales
36
39
42
45
E F M A M J
$
Gráfico de la ventas en los primeros 6 meses
Ventas Mensuales
0
39 42 45
E F M A M J
$
36
ü Buena Presentación Mala Presentación