Post on 18-Dec-2015
description
transcript
AUTORES Msc. JORGE ACOSTA PISCOYA. Licenciado En Estadstica Msc. DEBORA MEJIA PACHECO. Licenciado En Estadstica
DOCENTES ASCRITOS AL DEPARTAMENTO DE ESTADISTICA DE LA UNPRG LAMBAYEQUE
2010
ACARGO DE LA ASIGNATURA DE:
ESTADSTICA
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
2
BASE DE DATOS
N
SEXO ESC.PROF MARCA DE CELULAR
EDAD TALLA PESO INGR
MENSUAL EGR.
MENSUAL N DE HIJOS
1 F MATEMAT LG 40 1,52 58 450 420 5
2 M COMPUT NOKIA 25 1,75 59 630 600 3
3 F ELECTRON NOKIA 38 1,55 59 500 500 2
4 M ESTADSTI SONY 28 1,69 68 750 720 1
5 F FISICA LG 31 1,56 60 750 720 5 6 F FISICA NOKIA 30 1,61 57 600 580 4 7 F MATEMAT MOTOROLA 24 1,52 56 650 600 4
8 M COMPUT MOTOROLA 32 1,72 67 800 750 7 9 M ESTADISTI LG 34 1,75 70 1000 850 3
10 M FISICA NOKIA 36 1,82 69 850 800 2 11 M MATEMAT SANSUNG 40 1,69 72 750 750 1 12 F COMPUT ALCATEL 28 1,56 60 750 700 2
13 M ELECTRON SANSUNG 35 1,68 70 950 750 4 14 M ESTADSTI LG 36 1,80 68 1000 800 5 15 F FISICA NOKIA 30 1,62 72 600 600 3
16 M FISICA MOTOROLA 48 1,78 55 1200 1000 4
17 F MATEMAT LG 40 1,58 54 850 800 6
18 F COMPUT NOKIA 32 1,54 67 700 680 3
19 M ESTADISTI NOKIA 35 1,75 69 950 920 3 20 M FISICA SONY 36 1,71 52 1250 1050 2 21 F MATEMAT LG 42 1,57 54 550 540 1
22 F COMPUT NOKIA 48 1,58 69 700 700 2
23 M ELECTRON MOTOROLA 39 1,69 68 850 830 3 24 M ESTADSTI MOTOROLA 40 1,73 73 950 900 3 25 M FISICA LG 38 1,77 75 850 800 2 26 M FISICA NOKIA 32 1,54 45 1250 1000 2 27 F MATEMAT SANSUNG 34 1,65 66 800 600 4
28 M COMPUT ALCATEL 32 1,64 56 785 700 5 29 M ESTADISTI SANSUNG 45 1,68 66 828 800 5 30 M FISICA LG 44 1,65 54 560 500 4 31 M MATEMAT NOKIA 32 1,67 58 1220 1200 6 32 F COMPUT NOKIA 42 1,68 75 1380 1000 5
33 M ELECTRON SONY 38 1,72 72 490 450 2
34 F ESTADSTI LG 36 1,78 78 660 600 3
35 F FISICA NOKIA 44 1,85 79 920 800 4
36 F FISICA MOTOROLA 58 1,66 45 660 600 1
37 F MATEMAT MOTOROLA 55 1,78 65 890 800 2
38 F COMPUT LG 48 1,45 48 1200 1000 3
39 M ESTADISTI NOKIA 36 1,66 46 1300 1000 3 40 M FISICA SANSUNG 28 1,69 48 1325 1200 2 41 F MATEMAT ALCATEL 31 1,56 60 750 720 5
42 F COMPUT SANSUNG 30 1,61 57 600 580 4
43 F ELECTRON LG 24 1,52 56 650 600 4
44 M ESTADSTI NOKIA 32 1,72 67 800 750 7 45 M FISICA MOTOROLA 34 1,75 70 1000 850 3 46 M FISICA LG 36 1,82 69 850 800 2 47 M MATEMAT NOKIA 40 1,69 72 750 750 1 48 F COMPUT NOKIA 28 1,56 60 750 700 2
49 M ESTADISTI SONY 35 1,68 70 950 750 4 50 M FISICA LG 36 1,80 68 1000 800 5
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
3
Primero creamos la base de datos que se presenta en spss ver.17
Cada columna contendr una variable y cada fila los datos de cada unidad de anlisis
observada la hoja de clculo del spss, presenta dos ventanas.
La primera corresponde a la de vista de variables, es donde se declaran todas las variables que se van ingresar en la base de datos, como se muestra :
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
4
Si estamos ingresando una variable cualitativa, podemos etiquetar las categoras de la variable, como se muestra
Para recodificar una variable, se selecciona transformar y hacemos clic en recodificar en distinta variable, aparece la siguiente pantalla:
Para nuestro caso hemos seleccionada la variable ESC.PROF y le vamos a cambiar por
CARRERA, y le damos clic en cambiar, luego le damos clic en valores antiguos y nuevos, y
aparece la siguiente pantalla:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
5
Podemos los valores antiguos y valores nuevos como se muestra, luego le hacemos clic en
continuar y luego clic en aceptar
Por defecto aparece en la ltima columna la variable recodificada, para comparar si coincide
los valores antiguos con los nuevos, con el botn izquierdo del mouse arrastramos la variable
CARRERA, para ponerla a lado de la variable ESC.PROF
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
6
Luego procedemos a etiquetar
La Segunda ventana es una de vista de datos donde se ingresa cada uno de los valores de la variable en estudio
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
7
Con la base de datos concluida se procede hacer el anlisis descriptivo, seleccionamos el men analizar, seleccionamos Estadsticos Descriptivos y seleccionamos la opcin
frecuencias
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
8
Aparece la siguiente ventana:
Seleccionamos la variable que queremos trabajar, por ejemplo ESC.PROF, como se trata de
una variable cualitativa en escala nominal, no podemos seleccionar la opcin Estadsticos,
pero si la opcin Grficos:
Clic en continuar y luego clic en aceptar y aparece los resultados:
La primera tabla nos esta indicando que son 50 datos que se tienen y no hay ningn valor perdido, esto se presenta cuando por error dejamos de ingresar algn valor o la persona
encuestada no lleno toda la informacin que se le pidi en la encuesta.
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
9
Estadsticos
ESC.PROF
N Vlidos 50
Perdidos 1
La segunda tabla nos muestra la tabla de distribucin de frecuencias, la cual puede ser editada para darle una mejor presentacin
ESC.PROF
Frecuencia Porcentaje Porcentaje vlido
Porcentaje
acumulado
Vlidos MATEMATICA 10 19,6 20,0 20,0
COMPUTACION 10 19,6 20,0 40,0
ELECTRONICA 5 9,8 10,0 50,0
ESTADSTICA 10 19,6 20,0 70,0
FISICA 15 29,4 30,0 100,0
Total 50 98,0 100,0
Perdidos Sistema 1 2,0
Total 51 100,0
El grfico que hemos seleccionado es el grfico de sectores que puede ser editada para darle una mejor presentacin
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
10
Seleccionamos el men analizar y luego clic en frecuencias para trabajar una variable cuantitativa, por defecto aparece
Clic en restablecer y seleccionamos una variable cuantitativa, por ejemplo la variable talla:
Esta variable si nos permite trabajar la opcin estadsticos, seleccionamos todos los estadgrafos que deseamos calcular:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
11
Seleccionamos continuar y luego clic en aceptar y aparece todas las medidas descriptivas pedidas:
Estadsticos
TALLA
N Vlidos 50
Perdidos 1
Media 1,6670
Mediana 1,6800
Moda 1,69
Desv. tp. ,09562
Varianza ,009
Asimetra -,159
Error tp. de asimetra ,337
Curtosis -,776
Error tp. de curtosis ,662
Rango ,40
Mnimo 1,45
Mximo 1,85
Suma 83,35
Percentiles 10 1,5400
20 1,5600
25 1,5775
30 1,6100
40 1,6540
50 1,6800
60 1,6900
70 1,7200
75 1,7500
80 1,7500
82 1,7664
90 1,7980
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
12
La tabla dce distribucin de frecuencias de la variable seleccionada:
TALLA
Frecuencia Porcentaje Porcentaje vlido
Porcentaje
acumulado
Vlidos 1,45 1 2,0 2,0 2,0
1,52 3 5,9 6,0 8,0
1,54 2 3,9 4,0 12,0
1,55 1 2,0 2,0 14,0
1,56 4 7,8 8,0 22,0
1,57 1 2,0 2,0 24,0
1,58 2 3,9 4,0 28,0
1,61 2 3,9 4,0 32,0
1,62 1 2,0 2,0 34,0
1,64 1 2,0 2,0 36,0
1,65 2 3,9 4,0 40,0
1,66 2 3,9 4,0 44,0
1,67 1 2,0 2,0 46,0
1,68 4 7,8 8,0 54,0
1,69 5 9,8 10,0 64,0
1,71 1 2,0 2,0 66,0
1,72 3 5,9 6,0 72,0
1,73 1 2,0 2,0 74,0
1,75 4 7,8 8,0 82,0
1,77 1 2,0 2,0 84,0
1,78 3 5,9 6,0 90,0
1,80 2 3,9 4,0 94,0
1,82 2 3,9 4,0 98,0
1,85 1 2,0 2,0 100,0
Total 50 98,0 100,0
Perdidos Sistema 1 2,0
Total 51 100,0
Seleccionamos el grfico adecuado:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
13
Clic en continuar y luego clic en aceptar:
Como podemos observar la informacin que nos presenta la tabla de distribucin de
frecuencia no estn agrupados en intervalos, si queremos agrupar en intervalos tenemos
que hacer una recodificacin
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
14
Seleccionamos la variable TALLA y le vamos a llamar ESTATURA, y luego clic en cambiar
clic en valores antiguos y nuevos, seleccionamos la opcin rangos dado que se trata de una variable cuantitativa y hacemos los cambios respectivos
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
15
Como se puede apreciar lo hemos agrupado en 7 intervalos, si utilizamos la regla de Sturges
para determinar el nmero de intervalos nos da 6.61, dado a que el nmero de intervalos es una
variable discreta procedemos a redondearlo a 7.
Clic en continuar y luego clic en aceptar
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
16
Luego editamos la variable Estatura, nos vamos a la ventana vista de variables y seleccionamos etiquetas enla variable estatura:
Clic en aceptar y nos vamos a la vista de datos:
Seleccionamos analizar y luego clic en frecuencias, seleccionamos la variable estatura y le pedimos que nos construya la tabla de distribucin de frecuencias
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
17
ESTATURA
Frecuencia Porcentaje Porcentaje vlido
Porcentaje
acumulado
Vlidos 1,44 - 1,49 1 2,0 2,0 2,0
1,50 - 1,55 6 12,0 12,0 14,0
1,56 - 1,61 9 18,0 18,0 32,0
1,62 -1,67 7 14,0 14,0 46,0
1,68 - 1,73 14 28,0 28,0 74,0
1,74 - 179 8 16,0 16,0 90,0
1,80 - 1,85 5 10,0 10,0 100,0
Total 50 100,0 100,0
Para este caso no pidamos las medidas descriptivas por que el software les va calcular pero de
los cdigos de la etiqueta, esto solo nos permite darle una mejor presentacin de la tabla, mas
no puede ser utilizado para hacer clculos.
Seleccionamos Analizar, estadsticos descriptivos, clic en Descriptivo y aparece la siguiente pantalla.
Seleccionamos una variable que sea cuantitativa, clic en opciones y aparece la siguiente ventana:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
18
Donde seleccionamos las estadsticas descriptivas que deseemos calcular y luego clic en
continuar en la pantalla de resultado se visualiza:
Estadsticos descriptivos
N Rango Mnimo Mximo Media Desv. tp. Varianza Asimetra Curtosis
Estad
stico
Estadst
ico
Estads
tico
Estadst
ico
Estadst
ico
Error
tpico
Estadsti
co
Estadsti
co
Estad
stico
Error
tpico
Estadsti
co
Error
tpico
PESO 50 34 45 79 63,02 1,254 8,870 78,673 -,357 ,337 -,740 ,662
N vlido
(segn lista)
50
Seleccionamos Analizar, estadsticos descriptivos, clic en Explore y aparece la siguiente pantalla.
Seleccionamos la variable que deseemos analizar, en este caso en la Lista de dependiente
hemos seleccionado la variable ingreso y en la lista de factores Genero, en la opcin visualizar
si seleccionamos ambos nos da las Estadsticas descriptivas y grficos, si solo queremos una
sola opcin seleccionamos la que se dese analizar y luego clic en aceptar.
La primera pantalla que nos presenta l avista de resultados es el resumen:
Resumen del procesamiento de los casos
GENERO
Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
INBRESO FEMENINO 22 100,0% 0 ,0% 22 100,0%
MASCULINO 28 100,0% 0 ,0% 28 100,0%
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
19
La segunda Pantalla es las estadsticas Descriptivas.
Descriptivos
GENERO Estadstico Error tp.
INBRESO FEMENINO Media 743,64 45,601
Intervalo de confianza para la
media al 95%
Lmite inferior 648,80
Lmite superior 838,47
Media recortada al 5% 725,25
Mediana 700,00
Varianza 45748,052
Desv. tp. 213,888
Mnimo 450
Mximo 1380
Rango 930
Amplitud intercuartil 213
Asimetra 1,627 ,491
Curtosis 3,270 ,953
MASCULINO Media 924,57 41,206
Intervalo de confianza para la
media al 95%
Lmite inferior 840,02
Lmite superior 1009,12
Media recortada al 5% 925,75
Mediana 900,00
Varianza 47541,810
Desv. tp. 218,041
Mnimo 490
Mximo 1325
Rango 835
Amplitud intercuartil 211
Asimetra ,205 ,441
Curtosis -,371 ,858
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
20
Luego nos presenta el grafico de tallos y hoja
INBRESO Stem-and-Leaf Plot for
GENERO= FEMENINO
Frequency Stem & Leaf
1,00 4 . 5
2,00 5 . 05
7,00 6 . 0005566
6,00 7 . 005555
3,00 8 . 059
1,00 9 . 2
2,00 Extremes (>=1200)
Stem width: 100
Each leaf: 1 case(s)
Luego tenemos el diagrama de cajas:
Si seleccionamos analizar, Estadsticos Descriptivos y selecionamos una variable en la lista de dependiente:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
21
Clic en aceptar y aparece un resumen de los datos procesados:
Resumen del procesamiento de los casos
Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
INBRESO 50 100,0% 0 ,0% 50 100,0%
Descriptivos
Estadstico Error tp.
INBRESO Media 844,96 32,874
Intervalo de confianza para la
media al 95%
Lmite inferior 778,90
Lmite superior 911,02
Media recortada al 5% 837,84
Mediana 800,00
Varianza 54033,958
Desv. tp. 232,452
Mnimo 450
Mximo 1380
Rango 930
Amplitud intercuartil 303
Asimetra ,614 ,337
Curtosis -,235 ,662
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
22
INBRESO Stem-and-Leaf Plot
Frequency Stem & Leaf
2,00 4 . 59
3,00 5 . 056
8,00 6 . 00035566
10,00 7 . 0055555558
10,00 8 . 0002555559
5,00 9 . 25555
4,00 10 . 0000
,00 11 .
5,00 12 . 00255
3,00 13 . 028
Stem width: 100
Each leaf: 1 case(s)
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
23
Para construir tablas de contingencia seleccionamos: Analizar, Estadsticas Descriptivas y tablas de contingencia
Si seleccionamos la opcin Estadsticos, seleccionamos la opcin chi-cuadrado:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
24
Clic en continuar, luego seleccionamos la opcin casillas, que nos permite seleccionar el
valor observado, el porcentaje total
clic en continuar y clic en aceptar :
Tabla de contingencia MARCA DE CELULAR * GENERO
GENERO
Total FEMENINO MASCULINO
MARCA DE CELULAR ALCATEL Recuento 2 1 3
% del total 4,0% 2,0% 6,0%
LG Recuento 7 6 13
% del total 14,0% 12,0% 26,0%
MOTOROLA Recuento 3 5 8
% del total 6,0% 10,0% 16,0%
NOKIA Recuento 8 8 16
% del total 16,0% 16,0% 32,0%
SANSUNG Recuento 2 4 6
% del total 4,0% 8,0% 12,0%
SONY Recuento 0 4 4
% del total ,0% 8,0% 8,0%
Total Recuento 22 28 50
% del total 44,0% 56,0% 100,0%
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
25
Pruebas de chi-cuadrado
Valor gl
Sig. asinttica
(bilateral)
Chi-cuadrado de Pearson 4,928a 5 ,425
Razn de verosimilitudes 6,425 5 ,267
N de casos vlidos 50
a. 8 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La
frecuencia mnima esperada es 1,32.
Esto nos indica que con las variables seleccionadas no podemos realizar la prueba chi
cuadrado dado a que se tiene que tener un 75% de frecuencias esperadas mayores o
iguales a 5.
Si queremos trabajar solo los estudiantes que siguen la carreta profesional de Estadstica, seleccionamos en el men Datos:
Clic en seleccin de casos y aparece la siguiente pantalla:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
26
Seleccionamos la variable Esc.Prof, si no nos acordamos con que valor hemos etiquetada la carrera profesional de estadstica: hacemos clic con el botn derecho del mouse
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
27
Hacemos clic en informacin de la variable y aparece la siguiente pantalla que nos permite identificar la etiqueta de valor de la variable:
Seleccionamos la opcin 4
Clic en aceptar y luego aparece la siguiente pantalla donde se selecciona la variable ESC.PROF, y realizamos una operacin lgica como se muestra:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
28
Clic en aceptar y se seleciona la categora seleccionada como se muestra :
Luego realizamos el anlisis estadstico:
Los resultados de las variables seleccionadas nos indican :
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
29
Estadsticos descriptivos
N Mnimo Mximo Media Desv. tp. Varianza
TALLA 10 1,66 1,80 1,7240 ,04648 ,002
EDAD 10 28 45 35,70 4,498 20,233
N vlido (segn lista) 10
Solo 10 estudiantes encuestados pertenecen a la Escuela Profesional de Estadstica, los
cuales tienen una estatura mnima de 1,66 mt. Y una estatura mxima de 1,80; siendo su
estatura promedio de 1,72 mt. Los cuales se dispersan en 0,04648 mt. Con respecto a la
estatura promedio.
Luego para dejarla base de datos a su estado original seleccionamos el men datos, clic en seleccionar casos y luego clic en restablecer.
Para hacer un alisis de Regresin Lineal, nos vamos al men anlisis, seleccionamos la opcin regresin Lineal como se muestra:
Seleccionamos la variable dependiente y la variable independiente como se muestra:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
30
Seleccionamos la opcin Estadstico;
Clic en continuar y aceptar, luego aparece el siguiente reporte en la vista de resultados:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
31
Variables introducidas/eliminadasb
Modelo
Variables
introducidas
Variables
eliminadas Mtodo
1 INBRESOa . Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: EGRESO
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error tp. de la
estimacin
1 ,945a ,893 ,891 57,828
a. Variables predictoras: (Constante), INBRESO
El cual nos da un coeficiente de correlacin de 0.945 es decir existe una alta correlacin entre
el ingreso y egreso de los encuestados, el coeficiente de determacin es 0.891, el cual nos
indica que el 89.1% de los egresos estn explicados por los ingresos que tiene las personas
encuestadas.
Coeficientesa
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados
t Sig. B Error tp. Beta
1 (Constante) 156,005 31,123 5,013 ,000
INBRESO ,713 ,036 ,945 20,054 ,000
a. Variable dependiente: EGRESO
El modelo de Regresin Lineal que sale es:
iXY 713,0005,156
Para construir el diagrama de dispersin, nos vamos al men grficos, seleccionamos cuadro de dilogos antiguos, dispersin de Puntos:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
32
Seleccionamos dispersin simple, clic en definir, sale la siguiente ventana donde ingresamos la variable Y y la variable X, como se muestra:
Para ponerle titulo seleccionamos la opcin y ponemos el titulo que corresponde:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
33
Clic en continuar y clic en aceptar y en la vista de resultados aparece el grafico pedido
Otra forma de construir el diagrama de dispersin con la recta estimada se, selecciona el men analizar, regresin y estimacin curvilnea:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
34
Aparece la siguiente ventana donde hay que ingresar las variables correspondientes, como se muestra:
Clic en aceptar y en la ventana de resultados se visualiza, una tabla de Resumen y el diagrama de dispersin con la recta estimada:
Autor: Jorge Acosta Piscoya & Dbora Meja Pacheco
35
Resumen del modelo y estimaciones de los parmetros
Variable dependiente:EGRESO
Ecuacin
Resumen del modelo Estimaciones de los parmetros
R cuadrado F gl1 gl2 Sig. Constante b1
Lineal ,893 402,155 1 48 ,000 156,005 ,713
La variable independiente esINBRESO.