PRACTICAS SPSS
Profesor:
DAGOBERTO SALGADO HORTA
UNIVERSIDAD DEL TOLIMA
CIENCIAS ECONOMICAS Y ADMINISTRATIVAS
ECONOMIA
ESTADISTICA APLICADA
IBAGUE
2010
PRACTICAS SPSS
Profesor:
DAGOBERTO SALGADO HORTA
Estudiantes:
DIEGO FERNANDO ALZATE GALEANO
NATALIA CORRALES DUCUARA
DIEGO FERNANDO PATIÑO GONGORA
UNIVERSIDAD DEL TOLIMA
CIENCIAS ECONOMICAS Y ADMINISTRATIVAS
ECONOMIA
ESTADISTICA APLICADA
IBAGUE
2010
Ibagué 18 de junio de 2010
Docente:
Dagoberto Salgado Horta
Matemático y Físico - Especialista en Estadística - Especialista en Docencia Universitaria - Magister en Educación con Mención en Docencia e Investigación Universitaria
Referencia: Petición
Reciba un cordial saludo de parte nuestra, la presente es para manifestarle nuestro agradecimiento, por su ampliación del plazo, para la entrega del trabajo “practicas spss”. Sabemos que usted nos manifestó que la nota máxima de calificación era de 3.0; pero en este caso le pedimos encarecidamente que reconsidere una nota mayor, ya que nuestro presente en la materia demanda una calificación mayor para poder aprobarla.
Agradecemos su atención prestada y esperamos una respuesta positiva.
Cordialmente:
Diego Fernando Patiño
Diego Fernando Alzate
Lizeth Natalia Corrales
Estudiantes de Pregrado Economía
EJERCICIO 1 SPSS
2. 1. Estudiar media, varianza, moda, mediana, máximo y mínimo de ambas zonas.
Estadísticos
ZONA UNO
ZONA DOS
N Válidos 14 14
Perdidos
0 0
Media 203,07 162,36
Mediana 200,50 157,00
Moda 194a 156
Varianza 115,918 679,632
Mínimo 191 116
Máximo 230 220
a. Existen varias modas. Se mostrará el menor de los valores.
2. Representar gráficamente los datos con un histograma para cada variable.
Estadísticos
ZONA UNO ZONA DOS
N Válidos 14 14
Perdidos 0 0
Moda 194a 156
a. Existen varias modas. Se mostrará el menor de
los valores.
ZONA UNO
Frecuencia Porcentaje Porcentaje válido
Porcentaje
acumulado
Válidos 191 1 7.1 7.1 7.1
193 1 7.1 7.1 14.3
194 2 14.3 14.3 28.6
197 1 7.1 7.1 35.7
199 2 14.3 14.3 50.0
202 2 14.3 14.3 64.3
204 1 7.1 7.1 71.4
209 1 7.1 7.1 78.6
214 1 7.1 7.1 85.7
215 1 7.1 7.1 92.9
230 1 7.1 7.1 100.0
Total 14 100.0 100.0
ZONA DOS
Frecuencia Porcentaje Porcentaje válido
Porcentaje
acumulado
Válidos 116 1 7.1 7.1 7.1
139 1 7.1 7.1 14.3
143 1 7.1 7.1 21.4
147 1 7.1 7.1 28.6
156 3 21.4 21.4 50.0
158 1 7.1 7.1 57.1
161 2 14.3 14.3 71.4
174 1 7.1 7.1 78.6
188 1 7.1 7.1 85.7
198 1 7.1 7.1 92.9
220 1 7.1 7.1 100.0
Total 14 100.0 100.0
3. Representar gráficamente los datos con un diagrama de caja simple (donde los datos del gráfico son resúmenes para distintas variables).
Resumen del procesamiento de los casos
ZONA
DOS
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
ZONA UNO 116 1 100.0% 0 .0% 1 100.0%
139 1 100.0% 0 .0% 1 100.0%
143 1 100.0% 0 .0% 1 100.0%
147 1 100.0% 0 .0% 1 100.0%
156 3 100.0% 0 .0% 3 100.0%
158 1 100.0% 0 .0% 1 100.0%
161 2 100.0% 0 .0% 2 100.0%
174 1 100.0% 0 .0% 1 100.0%
188 1 100.0% 0 .0% 1 100.0%
198 1 100.0% 0 .0% 1 100.0%
220 1 100.0% 0 .0% 1 100.0%
Advertencia
dimension0 1 Se ha producido un error al aplicar una plantilla de gráfico.
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
ZONA UNO 14 100.0% 0 .0% 14 100.0%
Advertencia
dimension0 1 Se ha producido un error al aplicar una plantilla de gráfico.
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
ZONA DOS 14 100.0% 0 .0% 14 100.0%
EJERCICIO 2
JUVENTUD. SAV
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
edad * ocio = 3 (FILTER)
109 100.0% 0 .0% 109 100.0%
Informe
edad
ocio = 3 (FILTER) Media N
Desv. típ.
Selected 23.17 109 3.081
Total 23.17 109 3.081
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
ocio * ingreso total
182 93.3% 13 6.7% 195 100.0%
a. ocio = Beber, ir de copas
Informea
ocio
ingreso total Media N
Desv. típ.
0 1.00 126 .000
4 1.00 1 .
5 1.00 1 .
10 1.00 3 .000
13 1.00 1 .
15 1.00 2 .000
20 1.00 6 .000
25 1.00 5 .000
30 1.00 3 .000
32 1.00 1 .
36 1.00 1 .
40 1.00 3 .000
45 1.00 1 .
48 1.00 2 .000
50 1.00 1 .
51 1.00 1 .
60 1.00 2 .000
74 1.00 1 .
75 1.00 1 .
80 1.00 2 .000
90 1.00 3 .000
100 1.00 2 .000
115 1.00 2 .000
120 1.00 2 .000
125 1.00 1 .
130 1.00 2 .000
140 1.00 1 .
150 1.00 2 .000
160 1.00 1 .
190 1.00 1 .
200 1.00 1 .
Total 1.00 182 .000
a. ocio = Beber, ir de copas
Ocio = Bailar
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
ocio * ingreso total
147 88.6% 19 11.4% 166 100.0%
a. ocio = Bailar
Informe
ocio
ingreso total Media N
Desv. típ.
0 2.00 90 .000
4 2.00 1 .
5 2.00 1 .
6 2.00 2 .000
8 2.00 3 .000
10 2.00 3 .000
15 2.00 4 .000
20 2.00 3 .000
25 2.00 5 .000
30 2.00 5 .000
40 2.00 5 .000
50 2.00 2 .000
55 2.00 1 .
60 2.00 3 .000
70 2.00 3 .000
75 2.00 2 .000
80 2.00 2 .000
90 2.00 1 .
100 2.00 1 .
130 2.00 1 .
140 2.00 1 .
150 2.00 2 .000
175 2.00 1 .
200 2.00 1 .
210 2.00 1 .
275 2.00 1 .
300 2.00 1 .
325 2.00 1 .
Total 2.00 147 .000
a. ocio = Bailar
Ocio = Hacer deporte
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
ocio * ingreso total
94 86.2% 15 13.8% 109 100.0%
a. ocio = Hacer deporte
Informe
ocio
ingreso total Media N
Desv. típ.
0 3.00 39 .000
2 3.00 1 .
8 3.00 1 .
10 3.00 3 .000
12 3.00 1 .
15 3.00 1 .
17 3.00 2 .000
20 3.00 4 .000
25 3.00 1 .
30 3.00 4 .000
40 3.00 6 .000
50 3.00 2 .000
60 3.00 2 .000
65 3.00 2 .000
70 3.00 1 .
80 3.00 2 .000
90 3.00 1 .
100 3.00 1 .
109 3.00 1 .
120 3.00 1 .
125 3.00 2 .000
130 3.00 1 .
140 3.00 1 .
160 3.00 1 .
180 3.00 2 .000
200 3.00 1 .
223 3.00 1 .
230 3.00 1 .
280 3.00 1 .
300 3.00 1 .
320 3.00 1 .
370 3.00 1 .
372 3.00 1 .
380 3.00 1 .
400 3.00 1 .
550 3.00 1 .
Total 3.00 94 .000
a. ocio = Hacer deporte
Ocio = Ir de excursión
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
ocio * ingreso total
153 90.5% 16 9.5% 169 100.0%
a. ocio = Ir de excursión
Informe
ocio
ingreso total Media N
Desv. típ.
0 4.00 87 .000
5 4.00 4 .000
10 4.00 5 .000
15 4.00 3 .000
20 4.00 3 .000
25 4.00 1 .
30 4.00 2 .000
35 4.00 1 .
40 4.00 1 .
45 4.00 2 .000
47 4.00 1 .
50 4.00 9 .000
55 4.00 1 .
60 4.00 6 .000
63 4.00 1 .
70 4.00 2 .000
80 4.00 1 .
90 4.00 2 .000
100 4.00 3 .000
110 4.00 1 .
120 4.00 1 .
125 4.00 2 .000
142 4.00 1 .
150 4.00 3 .000
170 4.00 1 .
175 4.00 1 .
190 4.00 1 .
220 4.00 1 .
230 4.00 2 .000
245 4.00 1 .
290 4.00 1 .
400 4.00 1 .
600 4.00 1 .
Total 4.00 153 .000
a. ocio = Ir de excursión
Ocio = Viajar
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
ocio * ingreso total
32 100.0% 0 .0% 32 100.0%
a. ocio = Viajar
Informe
ocio
ingreso total Media N
Desv. típ.
0 5.00 14 .000
10 5.00 5 .000
20 5.00 2 .000
30 5.00 1 .
35 5.00 1 .
40 5.00 2 .000
50 5.00 3 .000
60 5.00 2 .000
180 5.00 1 .
250 5.00 1 .
Total 5.00 32 .000
a. ocio = Viajar
Ocio = Ir al cine
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
ocio * ingreso total
17 94.4% 1 5.6% 18 100.0%
a. ocio = Ir al cine
Informe
ingreso total Media N Desv. típ.
0 6.00 8 .000
30 6.00 1 .
60 6.00 1 .
94 6.00 1 .
130 6.00 1 .
160 6.00 1 .
200 6.00 2 .000
355 6.00 1 .
420 6.00 1 .
Total 6.00 17 .000
a. ocio = Ir al cine
PRACTICA CINCO
EJEMPLO 3
Realiza un diagrama de dispersión en el que puedas observar el tipo de dependencia entre la variable que indica el nº de años de escolarización del padre y laque indica los de la madre.
PRACTICA CINCO EJEMPLO 4
Calcula el histograma de las variables que indican el nº de años de escolarización y el nº de hermanos y hermanas.
PRACTICA CINCO EJEMPLO 5
a) Tipifica las variables que indican el nº de hermanos y hermanas, el nº de añosde escolarización del encuestado. Calcula, asimismo, su media, el valormínimo y máximo.
Estadísticos descriptivos
N Mínimo Máximo Media
Número de años de escolarización
1510 0 20 12,88
Número de hermanos y hermanas
1505 0 26 3,93
N válido (según lista) 1501
b) ¿Cuál es el la edad media del encuestado? Determina la desviación típica, varianza y recorrido de dicha variable. ¿Qué puedes decir de su forma?Interpreta todos los resultados.
Estadísticos descriptivos
N Rango MediaDesv.
típ.Varianz
a
Edad del encuestado
1514 71 45,63 17,808 317,140
N válido (según lista)
1514
Rango, 71, par una muestra de 1517 de los Cuales 3 no son validaos, existe un
recorrido de 71 lo que significa que existen 71 diferentes edades entre os
encuestados, lo que indica que la muestra no tiene una edad promedio.
Media: 45.63, es la edad promedio para los encuestados que poseen edades desde los18 hasta los 89 años de edad.
Desviación típica y varianza, es el promedio de la distancia entre los datos y su media aritmética, en este caso podemos observar que por la misma dispersión la
desviación típica es alta es decir los datos en promedio están alejados de la media.
Estadísticos descriptivos
N Curtosis
Estadístico
Estadístico
Error típico
Edad del encuestado
1514 -,786 ,126
N válido (según lista)
1514
Como podemos observar en el grafico los datos se presentan de una forma leptocurtica (curtosis): -786, es decir existe alta concentración en los datos. esto
significa que para cada caso de edad existe un número significativo de encuestados para cada una de ellas.
PRACTICA CINCO EJEMPLO 6
a) ¿Cuál es el número medio de hijos por encuestado de raza blanca? ¿Cuál es el número de hijos más frecuente en esa raza? ¿Cuál es el número de hijos mediano de esa raza? Determina los tres cuartales de la variable nº de hijos para la raza blanca. Interpreta todos los resultados.
Para la variable número de hijos en la raza blanca podemos observa que la media es de 1.83 el promedio entre las respuestas 1,2 y 3 hijos, la mediana y el segundo cuartil es 2, y el tercer cuartil también el máximo es tres; al ser la raza blanca la predominante podemos también observar que los resultados son casi iguales a diferencia de la media, no existe mucha dispersión y alta concentración en los datos.
b) ¿Cuáles son los límites inferior y superior de un intervalo que deja a su
Estadísticos
Número de hijos
N Válidos 1259
Perdidos
5
Media 1,83
Mediana 2,00
Moda 0
Percentiles
25 ,00
50 2,00
75 3,00
Izquierda el 35% de los encuestados con menor edad y a su derecha el 15% de los encuestados con mayor edad ?
Dejando de lado un 35 % de los encuestados con menor edad
LIMITE INFERIOR 35
LIMITE SUPERIOR 69
530.95 25% encuestados por encima
227.55 15% encuestados por debajo
PRACTICA 6
TABLAS PERSONALIZADAS
Sexo
Mujer Hombre
Recuento Recuento
Título obtenido Diplomado/Turismo 198 282
Diplomado/Empresariales 116 147
Licenciado/Derecho 50 69
Licenciado/Ingeniero 54 84
Sexo
Mujer Hombre
Recuento Recuento
Título obtenido Diplomado/Turismo 198 282
Diplomado/Empresariales 116 147
Licenciado/Derecho 50 69
Licenciado/Ingeniero 54 84
Sexo
Mujer Hombre
Recuento Recuento
Título obtenido Diplomado/Turismo 198 282
Diplomado/Empresariales 116 147
Licenciado/Derecho 50 69
Licenciado/Ingeniero 54 84
TABLAS PERSONALIZADAS
Sexo Mujer
Recuento
418
Sexo Mujer
Sexo
Mujer Hombre
Recuento Recuento
Título obtenido Diplomado/Turismo 198 0
Diplomado/Empresariales 116 0
Licenciado/Derecho 50 0
Licenciado/Ingeniero 54 0
Sexo Mujer
Sexo
Mujer Hombre
Recuento Recuento
Título obtenido Diplomado/Turismo 198 0
Diplomado/Empresariales 116 0
Licenciado/Derecho 50 0
Licenciado/Ingeniero 54 0
PRACTICA 7
EJERCICIO.
Abra el archivo de datos de SPSS denominado “encuesta USA” y resuelva las siguientes cuestiones:
a) Numero medio de hijos en función del nivel de felicidad.
b) Numero de años de escolarización del encuestado en función de la raza y el sexo.
c) Numero mediano de hermanos en función del nivel de felicidad.
d) Calcule el máximo y mínimo de la variable número de años de escolarización de la madre de encuestado en función de la raza.
e) ¿Qué grupo ocupacional tiene la media mayor de número de hijos? ¿Qué grupo tiene la media más representativa?
MEDIDAS
a) Medias
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
Número de hijos * Nivel de felicidad
1497 98.7% 20 1.3% 1517 100.0%
Informe
Número de hijos
Nivel de felicidadMedia N
Desv. típ.
Muy feliz 1.97 467 1.753
Bastante feliz 1.80 866 1.744
No demasiado feliz
2.23 164 1.851
Total 1.90 1497 1.763
b) Medias
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
Número de años de escolarización * Sexo del encuestado
1510 99.5% 7 .5% 1517 100.0%
Número de años de escolarización * Raza del encuestado
1510 99.5% 7 .5% 1517 100.0%
Número de años de escolarización * Sexo del encuestado
Número de años de escolarización
Sexo del encuestado Media N
Desv. típ.
Hombre 13.23 633 3.143
Mujer 12.63 877 2.839
Total 12.88 1510 2.984
Número de años de escolarización * Raza del encuestado
Número de años de escolarización
Raza del encuestado Media N
Desv. típ.
Blanca 13.06 1262 2.955
Negra 11.89 199 2.677
Otra 12.47 49 4.001
Total 12.88 1510 2.984
c) Medias
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
Nivel de felicidad * Número de hermanos y hermanas
1492 98.4% 25 1.6% 1517 100.0%
Informe
Mediana
Número de hermanos y hermanas Nivel de felicidad
0 2.00
1 2.00
2 2.00
3 2.00
4 2.00
5 2.00
6 2.00
7 2.00
8 2.00
9 2.00
10 2.00
11 2.00
12 2.00
13 1.50
14 1.00
15 2.00
16 1.00
17 1.50
21 2.00
26 1.00
Total 2.00
d) Medias
Resumen del procesamiento de los casos
Casos
Incluidos Excluidos Total
NPorcentaj
e NPorcentaj
e NPorcentaj
e
Raza del encuestado * Número de años de escolarización de la madre
1233 81.3% 284 18.7% 1517 100.0%
Informe
Raza del encuestado
Número de años de escolarización de la madre Máximo Mínimo
0 Otra Blanca
1 Blanca Blanca
2 Otra Blanca
3 Otra Blanca
4 Negra Blanca
5 Otra Blanca
6 Otra Blanca
7 Otra Blanca
8 Otra Blanca
9 Otra Blanca
10 Otra Blanca
11 Negra Blanca
12 Otra Blanca
13 Otra Blanca
14 Otra Blanca
15 Negra Blanca
16 Otra Blanca
17 Negra Blanca
18 Negra Blanca
20 Blanca Blanca
Total Otra Blanca
FRECUENCIAS
a) FRECUENCIAS
Estadísticos
Número de hijos
N Válidos 1509
Perdidos 8
Media 1.90
Número de hijos
Frecuencia
Porcentaje
Porcentaje válido
Porcentaje acumulado
Válidos 0 419 27.6 27.8 27.8
1 255 16.8 16.9 44.7
2 375 24.7 24.9 69.5
3 215 14.2 14.2 83.8
4 127 8.4 8.4 92.2
5 54 3.6 3.6 95.8
6 24 1.6 1.6 97.3
7 23 1.5 1.5 98.9
Ocho o más
17 1.1 1.1 100.0
Total 1509 99.5 100.0
Perdidos No contesta
8 .5
Total 1517 100.0
b) FRECUENCIAS
Estadísticos
Número de hijos
N Válidos 1509
Perdidos 8
Media 1.90
Mínimo 0
Máximo 8
Número de hijos
Frecuencia
Porcentaje
Porcentaje válido
Porcentaje acumulado
Válidos 0 419 27.6 27.8 27.8
1 255 16.8 16.9 44.7
2 375 24.7 24.9 69.5
3 215 14.2 14.2 83.8
4 127 8.4 8.4 92.2
5 54 3.6 3.6 95.8
6 24 1.6 1.6 97.3
7 23 1.5 1.5 98.9
Ocho o más
17 1.1 1.1 100.0
Total 1509 99.5 100.0
Perdidos No contesta
8 .5
Total 1517 100.0
PRACTICA 8 TERRENO
EJERCICIO 3.
La siguiente tabla muestra los resúmenes descriptivos que proporciona la opción Explorar del SPSS para los datos sobre la cantidad de lluvia registrada por n estaciones de medición en Madrid:
Indica cuál de estos diagramas de caja (box-plot) puede representar a este conjunto de datos y da razones de por qué los otros no pueden representar a los datos reunidos en la tabla:
SOLUCION:
El diagrama de caja (box-plot) el cual representa a este conjunto de datos es el “B”, puesto que representa claramente que la mediana es de 20,00, su valor máximo es 34,00 y su valor mínimo es 9,00, a diferencia de los demás diagramas pues no concuerdan con estas descripciones de datos. A demás presenta una asimetría muy leve hacia la derecha o negativa.
PRACTICA 9
Es una correlación significativa
Correlaciones
Potencia (CV)
Velocidad máxima
Potencia (CV) Correlación de Pearson
1 ,856**
Sig. (unilateral) ,000
N 125 122
Velocidad máxima
Correlación de Pearson
,856** 1
Sig. (unilateral) ,000
N 122 122
**. La correlación es significante al nivel 0,01 (unilateral).
Continuando con los datos del archivo terreno.sav, selecciona los vehículos de gran cilindrada (aquéllos con una cilindrada superior a 2500 cc) y responde a la siguiente cuestión: ¿existe relación lineal entre el consumo urbano y la potencia de estos vehículos?¿Qué signo tiene? Justifica tu respuesta?
Correlaciones
Potencia (CV)
Consumo urbano
Potencia (CV) Correlación de Pearson
1 ,824**
Sig. (bilateral) ,000
N 54 49
Consumo urbano
Correlación de Pearson
,824** 1
Sig. (bilateral) ,000
N 49 49
**. La correlación es significativa al nivel 0,01 (bilateral).
Si existe relación
El signo es positivo
PRACTICA 10Ejercicio 1
a) ¿Qué decisión debe adoptar la empresa con un nivel de confianza del 99%?
Prueba para una muestra
Valor de prueba = 0
t glSig.
(bilateral)Diferencia de medias
99% Intervalo de confianza para la
diferencia
Inferior Superior
TIEMPO DE REALIZACION
18,254 9 ,000 61.1900 50.296 72.084
Con un intervalo de confianza del 99% podemos decir , en el intervalo no se encuentra dentro del cero , no es recomendable comprar las maquinas ya que no la media no está por debajo de 70 segundos.
b) ¿Y si el nivel de confianza es del 95%?
Prueba para una muestra
Valor de prueba = 0
t glSig.
(bilateral)Diferencia de medias
95% Intervalo de confianza para la
diferencia
Inferior Superior
TIEMPO DE REALIZACION
18,254 9 ,000 61.1900 53.607 68.773
Con un intervalo de confianza podemos 95% decir, en el intervalo no se encuentra dentro del cero, no es recomendable comprar las maquinas ya que no la media no está por debajo de 70 segundos.
EJERCICIO 2.
La misma empresa decide hacer una puesta a punto de su vieja maquinaria con el objetivo de igualar el tiempo medio de producción de la maquinaria recién adquirida. Para ello, pone a trabajar a sus mecánicos, que después de varias jornadas de duro trabajo afirman haber alcanzado el objetivo. Para comprobarlo se toman al azar los tiempos de realización de 10 prendas de una máquina revisada:
a) ¿están los mecánicos en lo cierto? Compruébelo suponiendo que los tiempos se distribuyen normalmente y para un nivel de confianza del 95%.
Prueba de muestras independientes
Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias
F Sig. t glSig.
(bilateral)Diferencia de medias
Error típ. de la diferencia
TIEMPOS DE REALIZACION
Se han asumido varianzas iguales
8,161 ,010 1,841 18 ,082 6.75900 3.67152
No se han asumido varianzas iguales
1,841 12,737 ,089 6.75900 3.67152
Como el valor 0 se encuentra dentro del intervalo de confianza construido, con un 99% de confianza, puede admitirse que igualaron las maquinas nuevas con las viejas.
b) ¿se llega la misma conclusión con un nivel de confianza del 90%?
Prueba de muestras independientes
Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias
F Sig. t glSig.
(bilateral)Diferencia de medias
Error típ. de la diferencia
TIEMPOS DE REALIZACION
Se han asumido varianzas iguales
8,161 ,010 1,841 18 ,082 6.75900 3.67152 .39235
No se han asumido varianzas iguales
1,841 12,737 ,089 6.75900 3.67152 .24671
Como el valor 0 se encuentra dentro del intervalo de confianza construido, con un 90% de confianza, puede admitirse que igualaron las maquinas nuevas con las viejas.
PRACTICA 10EJERCICIO 3.
Con los datos del archivo encuestausa.sav, responde a las siguientes cuestiones:
a) construye un intervalo de confianza para la media del número de hijos, considerando un nivel de confianza del 99%: [1.78-2.02.]
Prueba para una muestra
Valor de prueba = 0
t glSig.
(bilateral)Diferencia de medias
99% Intervalo de confianza para la
diferencia
Inferior Superior
Número de hijos
41,851 1508 ,000 1,901 1,78 2,02
b) según los datos del intervalo, podrías considerar, con un 99% de confianza, que la media de la citada variable es de 2?
Si, la media según el intervalo de confianza del 99% es de 1.90 y el 2 se encuesta dentro del intervalo de confianza.
PRACTICA 11. EJERCICIO 1
1. Con el fin de determinar la velocidad de descarga de dos conexiones a Internet contratadas por vecinos del mismo inmueble, decidimos descargar un fichero de 2 Mb y anotar el tiempo necesario para la descarga. Los resultados (en segundos) obtenidos se presentan la siguiente tabla:
a) ¿Se inclinaría usted a la hora de contratar sus servicios de Internet por alguna de las dos conexiones? Considere un nivel de confianza del 95% para tomar la decisión.
Con un intervalo de confianza del 95% podemos inclinarlos por la conexión numero dos ya que su media esta en 4.5283 segundos por debajo de la media de la conexión numero uno que es de 5.4378 segundos
b) En el caso de la Conexión 2, calcule un intervalo de confianza para el tiempo medio de descarga al 90%.
Prueba para una muestra
Valor de prueba = 0
t glSig.
(bilateral)Diferencia de medias
90% Intervalo de confianza para la
diferencia
Inferior Superior
CONEXION2
22,556 11 ,000 4.52833 4.1678 4.8889
Estadísticos para una muestra
N MediaDesviación
típ.Error típ. de
la media
CONEXION1
9 5.4378 .98623 .32874
CONEXION2
12 4.5283 .69546 .20076
EJERCICIO 2
2. Los ingenieros de una multinacional del automóvil están dispuestos a probar si la nueva generación de gasóleos de una conocida marca reduce el consumo medio a los 100 Km/h. Para ello, seleccionan al azar de su cadena de montaje 20 vehículos nuevos del mismo modelo a los que suministra gasoil convencional y de última generación, midiendo su consumo sobre un circuito cerrado
a) Responda a la cuestión que se plantean los ingenieros mediante un intervalo de confianza de la diferencias de medias de consumos al 90%. Suponga que el consumo a los 100 Km/h se distribuye según una normal.
Con un nivel de confianza del 95% se reduce la generación de gasóleo en 1.3633
b) ¿Qué sucede si bajamos el nivel de confianza al 95%?
Prueba de muestras independientesPrueba de
Levene para la
igualdad de varianzas Prueba T para la igualdad de medias
F Sig. t gl
Sig. (bilateral)
Diferencia
de medi
as
Error típ.
de la diferencia
90% Intervalo de confianza
para la diferencia
Inferior
Superior
NUEVO
Se han asumido varianzas iguales
15,958
,001 -1,612
16 ,127 -1.363
33
.84580
-2.840
00
.11334
No se han asumido varianzas iguales
-1,612
10,19
0
,137 -1.363
33
.84580
-2.893
42
.16675
Prueba de muestras independientesPrueba
de Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
FSig
. t gl
Sig. (bilateral)
Diferencia de
medias
Error típ. de la diferencia
95% Intervalo de confianza
para la diferencia
Inferior
Superior
NUEVO
Se han asumido varianzas iguales
15,958
,001
-1,61
2
16 ,127 -1.363
33
.84580 -3.1563
5
.42969
No se han asumido varianzas iguales
-1,61
2
10,19
0
,137 -1.363
33
.84580 -3.2431
5
.51648
Con un nivel de confianza de 90% podemos afirmar que el gasóleo Se reduce en 1.3633 utilizando el nuevo.
PRACTICA 11EJERCICIO 3
3. Un estudio demostró que el tiempo de vida de las baterías de los móviles se distribuye normalmente. Para estudiar su duración, se consideró una muestra formada por 10 baterías, obteniéndose las siguientes duraciones medias (en días): 1456, 1478, 1467, 1350, 1460, 1376, 1410, 1330, 1421, 1423
c) Obtenga una estimación puntual de la media de la población y una medida del error que conlleva dicha estimación.
d) Obtenga un intervalo de confianza para la media de la población al 99%.
Estadísticos para una muestra
N MediaDesviación
típ.Error típ. de
la media
DURACION
10 1397.10 79.632 25.182
Prueba para una muestra
Valor de prueba = 0
t glSig.
(bilateral)Diferencia de medias
95% Intervalo de confianza para la
diferencia
Inferior Superior
DURACION
55.481 9 .000 1397.100 1340.13 1454.07
Estadísticos para una muestra
N MediaDesviación
típ.Error típ. de
la media
DURACION
10 1397.10 79.632 25.182
Prueba para una muestra
Valor de prueba = 0
t glSig.
(bilateral)Diferencia de medias
99% Intervalo de confianza para la
diferencia
Inferior Superior
DURACION
55.481 9 .000 1397.100 1315.26 1478.94
PRACTICA 12
HUELVA S.A
2. Representa los datos mediante un gráfico de barras agrupado. A la vista del gráfico,
¿Consideras que puede existir alguna relación entre las averías y el tipo de climatizador? ¿Por qué?
Gráfico
A simple vista podemos ver que si existe relación con el tipo y la falla.
3. Contrasta, mediante una tabla de contingencia, la independencia de las dos variables observadas. ¿Cuánto vale el p-valor (significación) del contraste?
TABLAS DE CONTINGENCIA
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
TIPO DE CLIMATIZADORES
* FRECUENCIA
137 100.0% 0 .0% 137 100.0%
TIPO DE CLIMATIZADORES
* TIPO DE FALLLAS
137a 100.0% 0 .0% 137 100.0%
a. El número de casos válidos es diferente del recuento total de la tabla de contingencia porque se han
redondeado las frecuencias de casilla.
TIPO DE CLIMATIZADORES * FRECUENCIA
Tabla de contingencia
Recuento
FRECUENCIA
2 6 8 10 11
TIPO DE CLIMATIZADORES TIPO A 0 0 8 10 0
TIPO B 0 0 0 10 0
TIPO C 0 6 0 10 11
TIPO D 2 0 8 0 0
Total 2 6 16 30 11
Tabla de contingencia
Recuento
FRECUENCIA
Total12 15 20 25
TIPO DE CLIMATIZADORES TIPO A 0 0 20 0 38
TIPO B 0 15 0 25 50
TIPO C 0 0 0 0 27
TIPO D 12 0 0 0 22
Total 12 15 20 25 137
Pruebas de chi-cuadrado
Valor gl
Sig. asintótica
(bilateral)
Chi-cuadrado de Pearson 295.541a 24 .000
Razón de verosimilitudes 278.337 24 .000
Asociación lineal por lineal 21.762 1 .000
N de casos válidos 137
a. 27 casillas (75,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es ,32.
TIPO DE CLIMATIZADORES * TIPO DE FALLLAS
Tabla de contingencia
Recuento
TIPO DE FALLLAS
Total
FALLO
INTERRUPTOR
FALLO
MULTIPLICADO
R
FALLO
CONDENSADO
RES
TIPO DE CLIMATIZADORES TIPO A 8 10 20 38
TIPO B 15 10 25 50
TIPO C 10 11 6 27
TIPO D 12 8 2 22
Total 45 39 53 137
Pruebas de chi-cuadrado
Valor gl
Sig. asintótica
(bilateral)
Chi-cuadrado de Pearson 18.700a 6 .005
Razón de verosimilitudes 20.603 6 .002
Asociación lineal por lineal 13.828 1 .000
N de casos válidos 137
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es 6,26.
Tablas de contingencia
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
TIPO DE CLIMATIZADORES
* FRECUENCIA
137 100.0% 0 .0% 137 100.0%
TIPO DE CLIMATIZADORES
* TIPO DE FALLLAS
137a 100.0% 0 .0% 137 100.0%
a. El número de casos válidos es diferente del recuento total de la tabla de contingencia porque se han
redondeado las frecuencias de casilla.
TIPO DE CLIMATIZADORES * FRECUENCIA
Tabla de contingencia
Recuento
FRECUENCIA
2 6 8 10 11
TIPO DE CLIMATIZADORES TIPO A 0 0 8 10 0
TIPO B 0 0 0 10 0
TIPO C 0 6 0 10 11
TIPO D 2 0 8 0 0
Total 2 6 16 30 11
Tabla de contingencia
Recuento
FRECUENCIA
Total12 15 20 25
TIPO DE CLIMATIZADORES TIPO A 0 0 20 0 38
TIPO B 0 15 0 25 50
TIPO C 0 0 0 0 27
TIPO D 12 0 0 0 22
Total 12 15 20 25 137
Pruebas de chi-cuadrado
Valor gl
Sig. asintótica
(bilateral)
Sig. de Monte
Carlo (bilateral)
Sig.
Chi-cuadrado de Pearson 295.541a 24 .000 .000b
Razón de verosimilitudes 278.337 24 .000 .000b
Estadístico exacto de Fisher 223.475 .000b
Asociación lineal por lineal 21.762c 1 .000 .000b
N de casos válidos 137
a. 27 casillas (75,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima
esperada es ,32.
b. Basada en 137 tablas muestreadas con la semilla de inicio 2000000.
c. El estadístico tipificado es -4,665.
Pruebas de chi-cuadrado
Sig. de Monte Carlo (bilateral)
Sig. de Monte
Carlo (unilateral)
Intervalo de confianza al 95%
Sig.Límite inferior Límite superior
Chi-cuadrado de Pearson .000 .022
Razón de verosimilitudes .000 .022
Estadístico exacto de Fisher .000 .022
Asociación lineal por lineal .000 .022 .000b
N de casos válidos
b. Basada en 137 tablas muestreadas con la semilla de inicio 2000000.
Pruebas de chi-cuadrado
Sig. de Monte Carlo (unilateral)
Intervalo de confianza al 95%
Límite inferior Límite superior
Chi-cuadrado de Pearson
Razón de verosimilitudes
Estadístico exacto de
Fisher
Asociación lineal por lineal .000 .022
N de casos válidos
TIPO DE CLIMATIZADORES * TIPO DE FALLLAS
Tabla de contingencia
Recuento
TIPO DE FALLLAS
Total
FALLO
INTERRUPTOR
FALLO
MULTIPLICADO
R
FALLO
CONDENSADO
RES
TIPO DE CLIMATIZADORES TIPO A 8 10 20 38
TIPO B 15 10 25 50
TIPO C 10 11 6 27
TIPO D 12 8 2 22
Total 45 39 53 137
Pruebas de chi-cuadrado
Valor gl
Sig. asintótica
(bilateral)
Sig. de Monte
Carlo (bilateral)
Sig.
Chi-cuadrado de Pearson 18.700a 6 .005 .000b
Razón de verosimilitudes 20.603 6 .002 .000b
Estadístico exacto de Fisher 19.655 .000b
Asociación lineal por lineal 13.828c 1 .000 .000b
N de casos válidos 137
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima
esperada es 6,26.
b. Basada en 137 tablas muestreadas con la semilla de inicio 2000000.
c. El estadístico tipificado es -3,719.
Pruebas de chi-cuadrado
Sig. de Monte Carlo (bilateral)
Sig. de Monte
Carlo (unilateral)
Intervalo de confianza al 95%
Sig.Límite inferior Límite superior
Chi-cuadrado de Pearson .000 .022
Razón de verosimilitudes .000 .022
Estadístico exacto de Fisher .000 .022
Asociación lineal por lineal .000 .022 .000b
N de casos válidos
b. Basada en 137 tablas muestreadas con la semilla de inicio 2000000.
Pruebas de chi-cuadrado
Sig. de Monte Carlo (unilateral)
Intervalo de confianza al 95%
Límite inferior Límite superior
Chi-cuadrado de Pearson
Razón de verosimilitudes
Estadístico exacto de Fisher
Asociación lineal por lineal .000 .022
N de casos válidos
PRACTICA 13
Ejercicio 1.
C.L. es propietaria de una cadena de tiendas de helados en San Pedro, Texas. Está tratando de encontrar alguna variable que tenga una relación positiva con las ventas diarias y decide investigar la temperatura ambiental promedio. Para ello recoge datos para una muestra aleatoria de 10 días:
• Calcule el coeficiente de correlación.
• Calcule la ecuación de regresión muestral.
• Interprete la pendiente o coeficiente de regresión.
• Calcule el error estándar de la estimación y el coeficiente de determinación.
• Pruebe el coeficiente de regresión con un nivel de significación del 5%.
• Calcule la tabla ANOVA y realice la prueba F (α=5%).
Respuestas
Variables introducidas/eliminadas
Modelo Variables
introducidas
Variables
eliminadas Método
di
m
e
n
si
o
n
0
1 Temperatura . Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: VENTASDIARIAS
Resumen del modelo
Modelo
R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
di
m
e
n
si
o
n
0
1 .984a .969 .965 6.940
a. Variables predictoras: (Constante), TEMPERATURA
ANOVA
Modelo Suma de
cuadrados gl Media cuadrática F Sig.
1 Regresión 11980.741 1 11980.741 248.783 .000a
Residual 385.259 8 48.157
Total 12366.000 9
a. Variables predictoras: (Constante), TEMPERATURA
b. Variable dependiente: VENTASDIARIAS
Coeficientes
Modelo Coeficientes no
estandarizados
Coeficientes
tipificados
t Sig.
Correlaciones
B Error típ. Beta
Orden
cero Parcial
Semiparcia
l
1 (Constante) -130.171 17.898 -7.273 .000
TEMPERATU
RA
3.265 .207 .984 15.773 .000 .984 .984 .984
a. Variable dependiente: VENTASDIARIAS
PRACTICA 13
Ejercicio 2.
Se ha pedido a la contable del servicio de mensajería City Parcel, J.F., que calcule una nueva tasa de horarios para los repartos locales. Ella tiene datos sobre el costo promedio de operación del vehículo por milla de reparto, pero necesita determinar el tiempo promedio por milla para hacer dicho reparto. Ella recoge los datos de los siguientes 13 recorridos:
• Bosqueje los datos en un diagrama de dispersión.
• Calcule el coeficiente de correlación y el de determinación.
• Determine la ecuación de regresión muestral.
• ¿Cuál es el tiempo promedio necesario por milla para hacer el reparto? Obtenga un intervalo de confianza para dicho parámetro con un nivel de confianza del 98%.
• Construya la tabla de regresión ANOVA y realice una prueba para determinar si la ecuación de regresión explica un porcentaje significativo de la varianza de la variable dependiente. Utilice un nivel de significación del 1%.
Respuestas
Gráfico G
Regresión
Variables introducidas/eliminadas
Modelo Variables introducidas Variables eliminadas Método
dimens
ion0
1 Millas . Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: MINUTOS
Resumen del modelo
Modelo
R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
di
m
en
si
on
0
1 .956a .914 .907 3.161
a. Variables predictoras: (Constante), MILLAS
ANOVA
Modelo Suma de
cuadrados gl Media cuadrática F Sig.
1 Regresión 1172.982 1 1172.982 117.361 .000a
Residual 109.941 11 9.995
Total 1282.923 12
a. Variables predictoras: (Constante), MILLAS
b. Variable dependiente: MINUTOS
coeficientes
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados
t Sig.B Error típ. Beta
1 (Constante) 3.909 1.880 2.080 .062
MILLAS 2.274 .210 .956 10.833 .000
a. Variable dependiente: MINUTOS
Coeficientes
Modelo Intervalo de confianza de 95,0%
para B
Límite inferior Límite superior
1 (Constante) -.228 8.047
MILLAS 1.812 2.735
a. Variable dependiente: MINUTOS
EJERCICIO EN CLASE
1. El archivo universitarios.sav recoge entre otros datos el salario semanal inicial en pesetas percibido por universitarios de distintas facultades. Construye la variable salario-euro que recoge el salario semanal inicial en euros y contesta a las siguientes preguntas:
a) ¿Cuál es el salario en euros más frecuente de los universitarios de la facultad de Ing. Agrónomos?
El salario en euros con mayor frecuencia es 120,0 (frecuencia de 36)
Frecuencias
Facultad = I. Agrónomos
Estadísticos
salario semanal inicial en euros
N Válidos 366
Perdidos 0
a. Facultad = I. Agrónomos
salario semanal inicial en eurosa
Frecuencia Porcentaje
Porcentaje válido
Porcentaje acumulado
Válidos 43,2 1 ,3 ,3 ,3
48,0 1 ,3 ,3 ,5
50,4 1 ,3 ,3 ,8
54,0 2 ,5 ,5 1,4
60,0 3 ,8 ,8 2,2
62,4 1 ,3 ,3 2,5
64,8 1 ,3 ,3 2,7
66,0 1 ,3 ,3 3,0
67,2 1 ,3 ,3 3,3
69,0 1 ,3 ,3 3,6
72,0 6 1,6 1,6 5,2
73,2 1 ,3 ,3 5,5
75,0 1 ,3 ,3 5,7
75,6 1 ,3 ,3 6,0
78,0 1 ,3 ,3 6,3
81,0 2 ,5 ,5 6,8
82,8 1 ,3 ,3 7,1
86,4 1 ,3 ,3 7,4
87,6 1 ,3 ,3 7,7
90,0 11 3,0 3,0 10,7
93,6 2 ,5 ,5 11,2
96,0 6 1,6 1,6 12,8
97,8 1 ,3 ,3 13,1
99,0 3 ,8 ,8 13,9
99,6 2 ,5 ,5 14,5
102,0 15 4,1 4,1 18,6
103,2 1 ,3 ,3 18,9
104,4 2 ,5 ,5 19,4
105,0 2 ,5 ,5 19,9
107,4 1 ,3 ,3 20,2
108,0 15 4,1 4,1 24,3
109,8 1 ,3 ,3 24,6
111,0 2 ,5 ,5 25,1
112,2 1 ,3 ,3 25,4
114,0 5 1,4 1,4 26,8
115,2 2 ,5 ,5 27,3
117,0 3 ,8 ,8 28,1
120,0 36 9,8 9,8 38,0
120,6 1 ,3 ,3 38,3
121,2 1 ,3 ,3 38,5
123,0 1 ,3 ,3 38,8
126,0 15 4,1 4,1 42,9
126,6 2 ,5 ,5 43,4
129,0 3 ,8 ,8 44,3
129,6 1 ,3 ,3 44,5
130,2 1 ,3 ,3 44,8
132,0 13 3,6 3,6 48,4
132,6 2 ,5 ,5 48,9
133,8 2 ,5 ,5 49,5
135,0 2 ,5 ,5 50,0
136,2 1 ,3 ,3 50,3
138,0 7 1,9 1,9 52,2
142,2 1 ,3 ,3 52,5
142,8 1 ,3 ,3 52,7
144,0 17 4,6 4,6 57,4
144,6 1 ,3 ,3 57,7
145,2 3 ,8 ,8 58,5
147,6 1 ,3 ,3 58,7
148,2 2 ,5 ,5 59,3
150,0 20 5,5 5,5 64,8
151,2 1 ,3 ,3 65,0
153,0 1 ,3 ,3 65,3
154,2 1 ,3 ,3 65,6
156,0 9 2,5 2,5 68,0
157,2 1 ,3 ,3 68,3
157,8 1 ,3 ,3 68,6
158,4 1 ,3 ,3 68,9
159,0 4 1,1 1,1 69,9
162,0 9 2,5 2,5 72,4
163,8 1 ,3 ,3 72,7
165,0 7 1,9 1,9 74,6
165,6 1 ,3 ,3 74,9
167,4 2 ,5 ,5 75,4
168,0 7 1,9 1,9 77,3
172,2 1 ,3 ,3 77,6
174,0 6 1,6 1,6 79,2
174,6 1 ,3 ,3 79,5
175,2 1 ,3 ,3 79,8
177,0 1 ,3 ,3 80,1
179,4 1 ,3 ,3 80,3
180,0 16 4,4 4,4 84,7
180,6 1 ,3 ,3 85,0
181,2 1 ,3 ,3 85,2
181,8 1 ,3 ,3 85,5
182,4 2 ,5 ,5 86,1
183,6 1 ,3 ,3 86,3
184,8 1 ,3 ,3 86,6
185,4 1 ,3 ,3 86,9
186,0 6 1,6 1,6 88,5
187,2 2 ,5 ,5 89,1
189,6 3 ,8 ,8 89,9
192,0 7 1,9 1,9 91,8
198,0 3 ,8 ,8 92,6
200,4 1 ,3 ,3 92,9
202,8 1 ,3 ,3 93,2
204,0 1 ,3 ,3 93,4
210,0 2 ,5 ,5 94,0
211,8 2 ,5 ,5 94,5
216,0 1 ,3 ,3 94,8
225,0 1 ,3 ,3 95,1
228,0 2 ,5 ,5 95,6
234,0 1 ,3 ,3 95,9
237,0 1 ,3 ,3 96,2
240,0 4 1,1 1,1 97,3
258,0 1 ,3 ,3 97,5
264,0 1 ,3 ,3 97,8
270,0 1 ,3 ,3 98,1
276,0 1 ,3 ,3 98,4
282,0 1 ,3 ,3 98,6
288,0 1 ,3 ,3 98,9
294,0 1 ,3 ,3 99,2
309,0 1 ,3 ,3 99,5
312,0 2 ,5 ,5 100,0
Total 366 100,0 100,0
a. Facultad = I. Agrónomos
b) ¿Cuál es el promedio del salario en euros para los universitarios de la facultad de empresariales?
Facultad = Empresariales
Estadísticos descriptivos
N Media
salario semanal inicial en euros
293 148,477
N válido (según lista)
293
a. Facultad = Empresariales
b) ¿Cuál es el salario en euros máximo de los universitarios de la facultad de Ing. Industriales?
c)
Facultad = I. Industriales
Estadísticos descriptivos
N Máximo Media
salario semanal inicial en euros
262 264,0 184,447
N válido (según lista)
262
a. Facultad = I. Industriales
2. Construye un diagrama de caja para la variable salario semanal inicial, de forma que aparezcan en un mismo gráfico, pero de forma separada, para ambos sexos (archivo universitarios.sav).
Sexo
Resumen del procesamiento de los casos
Sexo Casos
Total
N Porcentaje
Salario semanal inicial (en pesetas)
Mujer 418 100,0%
Hombre 582 100,0%
Descriptivos
Sexo Estadístico
Salario semanal inicial (en pesetas)
Mujer Media 24652,87
Intervalo de confianza para la media al 95%
Límite inferior 24002,78
Límite superior 25302,96
Media recortada al 5% 24541,31
Mediana 24200,00
Varianza 4,572E7
Desv. típ. 6761,611
Mínimo 7200
Máximo 52000
Rango 44800
Amplitud intercuartil 9000
Asimetría ,401
Curtosis 1,088
Hombre Media 26976,85
Intervalo de confianza para la media al 95%
Límite inferior 26420,04
Límite superior 27533,66
Media recortada al 5% 26830,50
Mediana 27000,00
Varianza 4,678E7
Desv. típ. 6839,364
Mínimo 8000
Máximo 65500
Rango 57500
Amplitud intercuartil 9500
Asimetría ,609
Curtosis 2,650
Responda a las siguientes preguntas:
a) ¿Es simétrica esta variable para el caso de los hombres? Justifica tu respuesta.
*La variable salario semanal inicial (en pesetas) para el caso de los hombres presenta una distribución simétrica ya que el valor de la mediana coincide con el punto medio de la caja, es decir, la media y la mediana son iguales.
¿Y para el caso de las mujeres?
*La variable salario semanal inicial (en pesetas) para el caso de las mujeres presenta una distribución también es simétrica ya que el valor de la mediana coincide con el punto medio de la caja.
c) Calcula todos los valores extremos para el caso de los hombres.
Valores extremos
Hombre Mayores 1 589 65500
2 647 60000
3 153 52000
4 324 51500
5 606 50000
Menores 1 178 8000
2 854 8400
3 909 8600
4 95 10000
5 343 10400