Date post: | 18-Feb-2016 |
Category: |
Documents |
Upload: | karem-katherine-fl |
View: | 217 times |
Download: | 1 times |
• CONCEPTOS BASICOS• ORGANIZACIÓN DE DATOS
Profesor del curso: Ing. Celso Gonzales
• INTRODUCCIÓN
ESTADISTICA GENERAL
•••
INTRODUCCIÓNCONCEPTOS BASICOS ORGANIZACIÓN DE DATOS
Profesor del curso: Ing. Edy Arpasi
INTRODUCCION
OBJETIVOS▪
▪
▪
Comprender
Comprender
qué es y porqué se estudia la estadística.
los conceptos básicos de la estadística.
Explicar lo que significan estadística descriptiva yestadística inferencial.
Diferenciar entre una variable cualitativa y cuantitativa.
▪
¿Qué es estadística?
▪
▪
▪
▪
▪
Recolecta
Organiza
Presenta
Analiza
interpreta
¿Para qué sirve la estadística?
La Estadística se utiliza como tecnología al servicio delas ciencias.......
• Estadística Descriptiva
• Estadística Inferencial
TIPOS DE ESTADISTICA
• Estadística Descriptiva
• Estadística Inferencial
RAMAS DE LA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA INFERENCIAL
SE OCUPA DE LOS PROCESOSSE OCUPA DE LA COLECCIÓN
Y CLASIFICACIÓN DE INFORMACIÓN, DE SU
RESUMENEN CUADROS Y GRÁFICOS
ADECUADOS QUE RESUMAN EN FORMA APROPIADA
LA INFORMACIÓN CAPTADA.
DE ESTIMACIÓN, ANÁLISIS YPRUEBA DE HIPÓTESIS, CON ELPROPÓSITO DE LLEGAR A
CONCLUSIONES QUE BRINDEN
UNA ADECUADA BASE CIENTÍFICA PARA LA TOMADE DECISIONES TOMANDO
COMO BASE LA INFORMACIÓN CAPTADA POR LA MUESTRA.
Pasos en un estudio estadístico
• Plantear hipótesis sobre una población
• Decidir qué datos recoger (diseño de experimentos)••
Qué individuos pertenecerán al estudio (muestras)Qué datos recoger de los mismos (variables)
• Recoger los datos (muestreo)• ¿Estratificado? ¿Sistemáticamente?
• Describir (resumir) los datos obtenidos
• Realizar una inferencia sobre la población
• Cuantificar la confianza en la inferencia••
Nivel de confianzaMargen de error:
CONCEPTOS BÁSICOS
•Población•Muestra•Individuo o unidad elemental•Observación•Variable•Parámetro•Estadístico
POBLACIÓN Y MUESTRA
Poblaciónobtenidos
Conjunto de observaciones o datosde una medición, conteo o cualidad de
ciertos caracteres de los mismos.
Muestra• Deber ser “representativo”
Unidad elemental
• Todo elemento que está afectado por lacaracterística o factor que se desea estudiar.
• Ejemplo: Se desea hacer un estudio sobre elingreso familiar de Lima MetropolitanaIdentifique: Población, una posible muestra, lacaracterística en estudio y la unidad elemental.
Observación
• Dato o registro realizado, producto de laapreciaciónelemental.
de una característica en una unidad
• De una observación para el ejemplo anterior.
EJEMPLO1
Se ha hecho un estudio para determinar la preferenciade una marca especial de detergente por parte de lasamas de casa. Entre las 50 amas de casaentrevistadas, 30 dijeron que preferían esta marca.¿Qué constituye la muestra?.¿Qué constituye la población?.¿Cuál es la proporción, dentro de lamuestra, de las amas de casa que prefieren la marca del detergente?
a.b.c.
Variables
Son las características que seelementos de la población.
desea apreciar de los
CLASIFICACIÓNDE VARIABLES
CUALITATIVAS CUANTITATIVAS
NuméricoAtributos
Nominal Ordinal Discreto Continuo
TIPOS DE VARIABLES
• Cualitativas
• Nominales: Si sus valores no se pueden ordenar• Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
• Ordinales: Si sus valores se pueden ordenar• Grado de satisfacción, Intensidad del
color• Cuantitativas o Numéricas
• Discretas: Si toma valores enteros• Número de hijos, Número de desempleados
• Continuas: Si entre dos valores,son posibles intermedios.
• Altura, ingreso mensual,
infinitos valores
EJEMPLO2
Clasificar cada una de las siguientes variables:a. Distancia diaria recorrida por cada estudiante para ir de
casa a la universidad.Tiempo que requiere un estudiante
para responder a examen.Llamadas que llegan a la central telefónica de la USB en día.Preferencia por cierta marca de refresco.
su
b. un
c. un
d.e. Sexo de las estudiantes que toman el curso de estadística
en el semestre.Número de acciones vendidas enun día en la Bolsa de Valores.
f.
Parámetro
Es una función de( θ)
todas las observaciones de unapoblaciónMEDIDA USADA PARA DESCRIBIR UNA VARIABLE DEUNA POBLACION
El parámetro resume la información contenida en lasque tato
observaciones que comprenden a una población, por losu valor es único y generalmente desconocido y por debe ser ESTIMADO.
Parámetro
μ• La media
x1 +x2 +...+ xNμ =N
σ2
p•
•
La varianza
Proporción
Estadístico o estimador
Es una función de los valoresmuestrales yparámetro caracterizan
que no depende de
ˆalguno.porque
Sepueden θ =f (x1,x2,...,xn)
tomar valores diferentes demuestra a muestra.
Por ejemplo, la media muestral x1 + x2 +...+
xnX =
n
ORGANIZACIÓN DE DATOS
OBJETIVOS▪
▪
Organizar los datos en una distribución de frecuencias
Presentar una distribución de frecuencias en un histograma, un polígono de frecuencias y una ojiva.
Elaborar e interpretar una representación de tallo y hoja.▪
ORGANIZACIÓN DE DATOS
VARIABLE CUALITATIVA
• Para representar gráficamente la distribución defrecuencias de una variable cualitativa sebarras y los sectores circulares.NotaSi trabajamos con variables nominales las pueden ser colocadas en cualquier orden.
utilizan las
•categoríasEn el caso
de escala ordinal las categorías deberán sercolocadas en orden
EJEMPLO:
En54 del
una planta embotelladora se registraronaccidentes y de acuerdo con
(D),la parte
cuerpo lesionada, dedos ojos (O),brazo (B), y piernas (P); se registraron losdatos (cuadrodatos.
1). Se pide organizar los
D D B P B B
D D D P D OD P D O D P
O B B O B D
D B B D O B
P B P D D P
D P D D P B
D D D B O P
B P B O D D
CUADRO 1:
PARTE LESIONADA
NÚMERO DE ACCIDENTES
BRAZOS 14
DEDOS 22
OJO 7
PIERNA 11
Total 54
Accidentes ocurridos en lalesionadaplanta según la parte
20
10
0
Brazo Dedos Ojos Pierna
Parte LesionadaFuente: Elaborado por el Departamento de Personal.Julio del 2005
Núm
ero
de
acci
dent
es
ACCIDENTES OCURRIDOS EN LAPLANTA SEGÚN LA PARTE LESIONADA
BRAZO (14, 25.9%)
DEDO (22, 40.7%)
PIERNA (11, 20.4%)
OJO ( 7, 13.0%)
Si además de registrar la parte lesionada seregistra el sexo de los trabajadores se podríatener un gráfico de este tipo.
Registro de accidentes segúnel tipo de lesión y sexo
15
H om bre
Mujer10
5
0
B D O PLESION
F uente: D epartam ento MédicoJulio del 2005
Núm
ero
de t
raba
jado
res
ORGANIZACIÓN DE DATOS
VARIABLE CUANTITATIVADISCRETA
Variable Frecuencia Porcentaje
X1 f1 (f1/n)x100
X2 f2 (f2/n)x100
… … …
Xn fn (fn/n)x100
n 1
Variable Cuantitativa Discreta(Pocos valores diferentes de la variable)
2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4
• Ejemplo
Construir la distribución de frecuencias del número detrabajadores que se ausentaron en 20 días laborales:
Ausencias deTrabajadores
N° de días Porcentajes
0 1 0.05x100=5%
1 4 0.20x100=20%
2 7 0.35x100=35%
3 6 0.30x100=30%
4 2 0.10x100=10%
20 100%
Distribución de Frecuencia del número detrabajadores que
sea ausentaron por día.
7
6
5
4
3
2
1
0
0 1 2 3 4
Número de Ausencias por día
Núm
ero
de tr
ajad
ores
0123456
419255
27,816,924,9
8,43,61,6
69,5
Tablas de frecuencias: Ejemplo
• ¿Cuántos individuos tienen menos de 2 hijos?
Número de hijos
Porcent.(válido)
Porcent.acum.
• 674 individuosFrec.
27,844,7
• ¿Qué porcentaje de individuostiene 6 hijos o menos?• 97,3% 375
215127
54242317
1509
≥50%
14,2 83,892,295,8
• ¿Qué cantidad de hijos es tal queal menos el 50% de la poblacióntiene una cantidad inferior o igual?• 2 hijos 97,3
7Ocho+ Total
1,51,1
100,0
98,9100,0
MEDIDAS DE VARIABILIDAD
•Rango•Rango intercuartil•Variancia•Desviación estándar•Coeficiente de variabilidad
ORGANIZACIÓN DE DATOS
VARIABLE CUANTITATIVA CONTINUA
20,8 22,8 21,9 22,0 20,7 20,9 25,0 22,2 22,8 20,125,3 20,7 22,5 21,2 23,8 23,3 20,9 22,9 23,5 19,5
23,7 20,3 23,6 19,0 25,1 25,0 19,5 24,1 24,2 21,8
21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9
19,7 24,2 23,8 20,7 23,8 24,3 21,1 20,9 21,6 22,7
En la oficina de un diario, el tiempo que se tardan enimprimir la primera plana fue registrado durante 50 días. Acontinuación se transcriben los datos, aproximados adécimas de minuto:
a. Construya con los datos una tabla de distribuciónde
frecuencia, usando la regla de sturges.b. Construya un polígono de frecuencias.c. Construya una ojiva.d. Por medio de la ojiva estime que porcentaje de las vecesla primera plana del periódico puede imprimirse en
menos de 24 minutos.
PROCEDIMIENTO• Calcular el rango (R) o recorrido, el cual
la siguiente manera:R = Obs. máxima – Obs. Mínima R = 25.3 - 19.0 = 6.3Determine el número de intervalos (k)
se define de
•K = 1 + 3.3K = 1 + 3.3 (Redondeo
log (n) (Fórmula de Sturges)log (50) = 6.607 = 7 (entero) simple)
Determinar del tamaño del intervalo TIC(Redondeado por exceso)Se redondea sugún el número de decimales que se tiene en la muestra
RTIC =K6.37
= = 0.9TIC
• Elaboredonde:
la tabla de frecuencia según la información anterior
fi= Frecuencia absolutaFi= Frecuencia acumulada absoluta fri= Frecuencia relativa=fi/nFri= Frecuencia acumulada relativa
k k ii
∑i=1
∑i=1
∑j =1
∑j =1
f i =n fri =1 Fi = f j Fri = fr j = Fi / n
LI i + LS iX ′ =Marca de clase i 2
Tiempo (minutos) fi fri Fi Fri X’i
[19.0-19.9> 5 0.10 5 0.10 19.45
[19.9-20.8> 6 0.12 11 0.22 20.35
[20.8-21.7> 9 0.18 20 0.40 21.25
[21.7-22.6> 5 0.10 25 0.50 22.15
[22.6-23.5> 7 0.14 32 0.64 23.05
[23.5-24.4> 14 0.28 46 0.92 23.95
[24.4-25.3] 4 0.08 50 1.00 24.85
50 1
Distribución de frecuencias del tiempo que tardan enimprimir la primera plana de un diario
• Gráficos para datos cuantitativos Agrupados enintervalos de clase•••
HISTOGRAMA DE FRECUENCIAPOLIGONO DE FRECUENCIA OJIVA
••
Gráfico de Tallos y hojasGráfico para datos cuantitativos
seriados en el tiempo
HISTOGRAMA DE FRECUENCIA
Distribución del tiempo que se tardan en imprimir la primera plana del diario
14
12
10
8
6
4
2
019.0 19.9 20.8 21.7 22.6 23.5 24.4 25.3
Tiempo
Núm
ero
de
días
POLIGONO DE FRECUENCIAS
Distribución del tiempo que se tardan en imprimir la primera plana del diario
14
POLIGONO12
10
8
6
4
2
019.45
20.35
21.25
22.15Tiempo
23.05
23.95
24.85
Núm
ero
de
días
OJIVA
OJIVA
60
50
40
30
20
10
019 19.9 20.8 21.7 22.6 23.5 24.4 25.3
Tiempo(en minutos)
N° A
cum
ula
do d
e di
as
Composición (mg/cm3)
8.2 12.9 15.3 18.8 20.8
9.2 12.9 15.8 19.7 21
9.4 14 15.9 20.3 21.410.8 14.3 16.9 20.3 22.2
10.8 14.4 18.2 20.3 22.5
11.1 15.1 18.4 20.4 23.211.9 15.1 18.6 20.7 25.8
EJERCICIO
Para evaluar la viabilidad de un proyecto dereforestación de una zona sometidas a estrés turístico,para el que se ha solicitado una subvención publica, seanalizó la composición en mg/cm3 de desechos
fueron:orgánicos del territorio. Los datos obtenidos
A. Construir la tabla de frecuencias y representar lainformación gráficamente.A partir de la tabla de frecuencias interprete: f3 y 1-Fr2B.
C. Entre qué niveles de composición se encuentraaproximadamente el 51,4% de las observaciones conmenores niveles registrados?.
ComposiciónNúmero de
observaciones Fi fri Fri[8.2 - 11.2> 6 6 0.17142857 0.17142857
[11.2 - 14.2> 4 10 0.11428571 0.28571429
[14.2 - 17.2> 8 18 0.22857143 0.51428571
[17.2 - 20.2> 5 23 0.14285714 0.65714286
[20.2 - 23.2> 10 33 0.28571429 0.94285714
[23.6 - 26.2> 2 35 0.05714286 1
CANTIDAD DE ARTICULOS
PUNTOS MEDIOS AGOSTO SETIEMBRE61 0 3
64 1 467 2 6
70 4 473 6 2
76 4 179 3 0
EJERCICIO
Para los artículos anteriores se tienen las siguientesdistribuciones de los precios (en dólares) en la primerasemana de agosto y en la primera semana de setiembre del 2005.
a) Grafique las dos distribuciones anteriores en un sólográfico donde se aprecien el comportamiento de lasmismas y calcule el promedio y la desviación estándarde la distribución de agosto
b) Realice un comentario según lo observado en elgráfico anterior
DIAGRAMA DE
TALLOS Y HOJASStem-and-Leaf Display: Tiempo
Stem-and-leaf of Tiempo N = 50Leaf Unit = 0.10
Losdatos tienen un
decimal hojasTerminación de dígitos del 0 al 4
tallo 1
6815182224 (6)
20181044
19192020212122222323242425
0557891377789991235689025788891356788899112223
Terminación de dígitos del 5 al 9
15 datos menores eiguales que 20.9
6 datos entre 22.5 y22.9 y uno de ellos es la mediana10 datos mayores eiguales que 24.1
0013