+ All Categories
Home > Documents > 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Date post: 28-Jan-2016
Category:
Upload: diego-bristan-yana-mendoza
View: 16 times
Download: 0 times
Share this document with a friend
Popular Tags:
28
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO FACULTAD DE INGENIERIA GEOLOGICA Y METALURGICA ESCUELA PROFESIONAL DE INGENIERIA GEOLOGICA CURSO DE GEOESTADISTICA I TEMA 4: VARIABLES Y DISTRIBUCION DE FRECUENCIAS Por: Ing. MSc. Roger Gonzales Aliaga Puno, Marzo del 2012
Transcript
Page 1: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNOFACULTAD DE INGENIERIA GEOLOGICA Y METALURGICA

ESCUELA PROFESIONAL DE INGENIERIA GEOLOGICA

CURSO DE GEOESTADISTICA I

TEMA 4: VARIABLES Y DISTRIBUCION DE FRECUENCIAS

Por: Ing. MSc. Roger Gonzales Aliaga Puno, Marzo del 2012

Page 2: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

VARIABLES Y DISTRIBUCION DE FRECUENCIA

1. Variables.2. Elementos básicos de la geoestadística3. Resumen de información muestral 4. Tablas estadísticas y distribución de frecuencias5. Gráficos estadísticos

Page 3: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Las observaciones o mediciones sobre los elementos de una población constituyen la materiaprima con la cual se trabaja en Geoestadística. La variable estadística se representan con unsímbolo o letra mayúscula tal como X, Y, Z, A, etc. Ahora los valores que puede tomar unavariable se representan mediante letras minúsculas x1 , x2 , x3 …. Xn.

Si la variable toma un solo valor se denomina constante; se acostumbra clasificar las variables endos grandes grupos.

Es necesario distinguir los diversos tipos de variables que puedan encontrar en diversos tipos deestudios e investigaciones, de acuerdo a esto las se dividen en:

1.1. Según su naturaleza las variables pueden ser de dos tipos:

a) Variables cualitativas o estadísticas de atributos: expresan una cualidad característica oatributo tienen carácter cualitativo, no se pueden medir numéricamente (por ejemplo: tipo dealteración en un afloramiento, estado de alteración de una roca, nacionalidad, color de la piel,sexo, etc.).

b) Variables cuantitativas: tienen valor numérico (edad, ley de mineral, contenido de arsénicoen una muestra de agua, contenido de mercurio en la piel de una trucha, contenido de oro enuna veta (ley), el pH, la temperatura del agua de un rio, precio del platino o de la plata, ingresosanuales por canon minero, etc.).

1. VARIABLES

Page 4: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

variables discretasUna variable discreta es aquella que puede asumir valores enteros o mejor dicho que varíen deun en uno. Por ejemplo el numero de personas que habitan en una casa el numero de dientes enuna rueda dentada.

variables continuasUna variable continua es cuando puede tomar cualquier valor, dependiendo principalmente dela precisión con que se trabaje. Así por ejemplo los resultados de leyes o contenidos de unagente contaminante en un rio , que puede ser: 100.27 ppm de Hg, la velocidad de un vehículopuede ser 80,3 km/h, ley de mineral (g/tn), área, volumen...etc.

1.2. Según la relación entre variables:

a) Variables dependientes, son aquellas que se explican por otras variables, son los efectos olos resultados respecto a los cuales hay que buscar su motivo, causa o razón de ser. Es lavariable que traduce la consecuencia del efecto de una o varias razones o causas de otrasvariables.

b) Variables independientes, son las variables explicativas o predictivas, cuyas asociación,relación o influencia en la variable dependiente se pretende describir en la investigación.

1. VARIABLES

Page 5: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Variables categorizadasEn contraposición a las variables cuantitativas, aquí hacemos referencia a aquellasvariables cuya escala de medida es un conjunto de categorías. Entre ellas podemosdistinguir al menos:

• Categorizadas nominales, como la orientación de un conjunto de vetas que sepodría considerar como “Norte”, “Sur”, “Este”, “Oeste” o la combinación de estas.Normalmente estas variables se utilizan en Geología Estructural con un diagrama deroseta.

• Categorizadas ordinales, como el grado de alteración de una roca que puede ser"severo", "moderado" o "leve“.

Es importante señalar que las variables continuas se pueden “discretizar” (por ejemplotomando intervalos) y así ser tratadas como discretas o que cuando una variable discretaasume una gran variedad de valores.

1. VARIABLES

Page 6: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Después de la conceptualización geoestadística y la precisión de sus objetivos, es fáciladvertir que en el trabajo estadístico existes tres elementos básicos como son: lapoblación o muestra (unidad de análisis), las variables o características y los datos.

a. Los elementos o unidades de análisis (población) pueden ser de manera mascomún personas, instituciones, lotes de muestreo de diferentes tipos de materiales.Estas unidades tienen una característica común, en cuanto constituyen el objeto deestudio de una investigación. Toda población tiene “N” elementos y una muestra“n” elementos.

a. Las variables dimensiones o características que se quieren conocer en relación alas unidades de análisis, como el consumo de minerales de los países en desarrollo.

a. Los datos o valores que alcanzan las unidades en las variables estudiadas, las cualesson las respuestas o resultados que se obtienen luego de un análisis geoquímico deuna muestra de roca.

2. ELEMENTOS BASICOS DE LA GEOESTADISTICA

Page 7: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Al registrar los resultados de un estudio observacional o experimental, se obtieneun número de observaciones que puede ser muy grande y su simple listado es depoca relevancia en el sentido interpretativo. Aunque a partir de dichos registros sepuede encontrar la respuesta buscada, estos datos no están ordenados de maneratal que adquieran significado para el investigador. Es por esto deseable presentar lasobservaciones en forma resumida.

Para los fines de ordenar, resumir y presentar la información, se utilizan tablas ygráficos apropiados para cada tipo de variable (variables numéricas, continuas odiscretas, o bien, variables no numéricas o de naturaleza categórica), por lo quetrataremos las distintas situaciones por separado.

Las tablas estadísticas presentan ordenadamente los datos estadísticos en filas ycolumnas, clasificados y agrupados de acuerdo a un criterios especifico. En lastablas conviene distinguir las tablas de frecuencias o de distribución y los cuadrosestadísticos o de análisis.

Los datos presentados en las tablas o cuadros estadísticos constituyen lainformación estadística. Esta información no solo es un valor numérico si no queademás merece una interpretación de tipo cualitativo según el contexto que loorigino.

3. RESUMEN DE INFORMACION MUESTRAL

Page 8: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Las partes de una tabla estadística son:

a. Titulo, es la descripción clara y precisa del contenido de la tabla, en el titulose indica el lugar o área geográfica y la institución en donde se hizo eltrabajo estadístico. También se indica la naturaleza de los datos, lasvariables y el periodo o época que abarca la información muestral.

b. Encabezamiento, es la primera fila del cuerpo de la tabla en la que seindica las categorías o variables precedidas por la palabra “por”.

c. Columna matriz, es la primera columna de la tabla y en ella se especificalas categorías o variables precedidas por la palabra “según”.

d. Cuerpo, vienen a ser las celdas formadas por las filas y las columnas y endonde se encuentra la información estadística.

e. Fuente, es donde se consigna o indica de donde se obtuvo la informaciónque se muestra en la tabla.

f. Nota de pie, es la aclaración que se hace en referencia a los datos de latabla si es que fuera necesario.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Page 9: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Año de muestreo

Prospecto 2009 2010 2011 Total

Rio Blanco 120 200 521 841

Rio Azul 135 125 112 372

Rio Rojo 140 129 30 299

Rio Negro 110 122 32 264

Total 505 576 695 1776

Fuente : DIRECCION REGIONAL DE ENERGIA Y MINAS Nota : datos hipotéticos

Pie

Piura : EMPRESA DE EXPLORACIONES MAJAS S.A.Numero de muestras de roca extraídas para análisis geoquímicoPor años de exploración según prospectos trabajados

Cuerpo

Titulo

Encabezamiento

Columna matriz

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Page 10: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Las tablas de frecuencias o de distribución son aquellas que muestran trabajoestadístico, resultado de la operación de tabulación, que presenta la distribución de unconjunto de elementos de acuerdo a las categorías de las variables. En ellas se observa lafrecuencia o repetición de cada uno de los valores de la variable, que se obtienedespués de realizar la operación de tabulación.

Las tablas de frecuencias se suelen clasificar en dos tipos:

- Tabla de distribución de frecuencias para datos no agrupados- Tabla de distribución de frecuencias para datos agrupados

Las tablas de datos no agrupados son aquellos que presentan un solo individuo en cadaclase o expresada en otra forma cuando la frecuencia es cada un de las clases es uno.

En las tablas de datos agrupados, la frecuencia en cada clase es por lo general mayorque uno, pudiéndose dar que en alguna clase la frecuencia sea un cero. A las tablas dedatos agrupados se les clasifica en tablas de variable discreta y variable continua.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Page 11: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Para describir la distribución de frecuencia correspondiente a una variable continua, esindispensable agrupar los valores registrados mediante un conjunto de intervalos. Aquíindicamos los pasos a seguir para la construcción de la tabla de frecuencias.

El intervalo de frecuencia se obtiene calculando primero el rango (R)que esta dado por:

R=Xmax – Xmin

luego se calcula el número de intervalos de clase por la ley de Sturges (K), con laformula siguiente. Este valor nunca siempre es un entero positivo.

K=1+3.32 log (n)

culminando esta operación se calcula el ancho o amplitud de cada clase (C) que estadado por la formula:

C=R/K

Luego de esta operación C se suma al valor mínimo (Xmin) y se completa el número deintervalos obtenidos de acuerdo a K.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Page 12: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

La marca de clase se utiliza para graficar los polígonos de frecuencia y se calcula de lasiguiente manera:

Yi=Yi-1 – Yi+1

Ahora se denomina frecuencia absoluta al número de veces que el valor de la variablese repite en el conjunto de datos y se representa por (fi). La frecuencia absolutaacumulada es la suma de los valores de la columna de fi, por lo tato el ultimo valor debeser igual a n; a la frecuencia absoluta acumulada se le representa por (Fi).

Otra columna importante dentro de la tabla de frecuencias, es la frecuencia relativa (hi)que asociada con un valor dado, puede ser considerada como una estimación de laprobabilidad de ocurrencia de dicho valor. Una propiedad que cumplen las frecuenciasrelativas es que su suma es igual a 1. La sumatoria de la frecuencia relativa debe serigual a 1.

En la sexta columna se calculan las frecuencias relativas acumuladas (Hi), sumando lasfrecuencias relativas de la misma manera que se sumaron las frecuencias absolutas paraobtener las absolutas acumuladas. Ahora el ultimo valor de Hi debe ser igual a 1 comodice la propiedad antes mencionada.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Page 13: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Tabla de distribución de frecuencias para datos agrupados con variable continua, paraun conjunto de muestras obtenidas en una prospección de Au.

Intervalo de frecuencia

Marca de claseFrecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuecnia relativa acumulada

Yi-1 - Yi+1 Yi fi Fi hi Hi

0.07 - 1.49 0.78 50 50 0.71 0.71

1.49 - 2.91 2.20 7 57 0.10 0.81

2.91 - 4.33 3.62 8 65 0.11 0.93

4.33 - 5.75 5.04 1 66 0.01 0.94

5.75 - 7.17 6.46 2 68 0.03 0.97

7.17 - 8.59 7.88 1 69 0.01 0.99

8.59 - 10.01 9.30 1 70 0.01 1.00

TOTAL 70

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Page 14: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Tabla de distribución de frecuencias para datos no agrupados.

Como ejemplo presentamos un cuadro de notas obtenidas por un alumno que estudiaen la Escuela de Ingeniería Geológica de la UNA-PUNO, sus notas están en una escala de0 a 20.

Curso Nota

Xi

Geofísica 13.52

Geoestadística 14.20

Mineralogía 13.80

Hidrogeología 17.12

Petrología 11.30

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS

Nótese que en este tipo de cuadro no aparece lafrecuencia “f” por que en cada clase esta uno.Asimismo por simplicidad se ha suprimido loscasilleros correspondientes a Xi, quedandosobreentendido que:

X1=13.52, X2=14.20, X3=13.80;…….

NOTA: En trabajos de investigación normalmentelos datos trabajados estadísticamente y que sepresentan en “cuadros” se le denomina tabla y,cuadro cuando solo se menciona cifras sin trabajoestadístico.

Page 15: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

5. GRAFICOS ESTADISTICOS

Para la representación de una distribución los gráficos son las formas usuales depresentar las distribuciones teniendo la ventaja de que las hacen mas intelegibles.Los gráficos son las representaciones visuales de los datos en donde se evidencianfundamentalmente 3 características:

a. Formab. Acumulación o tendenciac. Dispersión o variabilidad

Los gráficos no deben considerarse como sustitutos de un análisis estadísticos,sino más bien como una ayuda visual del comportamiento de los datos. Estospueden ser univariados, bivariados y multivariados, según el número de variablesinvolucradas.

Page 16: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Las partes de un grafico estadístico son:

a. Código o número de gráfico, es elemento numérico que permite identificar al gráficoestadístico. Si se presenta más de un gráfico en un capítulo, cada uno debe incluir elnúmero del capítulo seguido de un punto y el número de gráfico correspondiente.

b. Título, es la inscripción que se coloca después del número de gráfico, con el propósito dedar a conocer las variables y sus características contenidas en él. El título expresará elcontenido del gráfico en forma ordenada, clara y breve, evitando la descripción excesivao la brevedad extrema en la descripción del contenido de la información. Deberádescribir el contenido conceptual del gráfico, indicar la fecha o período de referencia dela información y especificar (cuando sea necesario) la unidad de medida en que secuantifican las cifras o la ubicación geográfica a la que corresponde la información.

Se recomienda que en el diseño y determinación de un gráfico se tenga en cuenta 4preguntas básicas: donde?, que?, como? y cuando?.

PERÚ: PRODUCCIÓN DE GAS NATURAL SEGÚN ZONAS GEOGRÁFICAS, 2001-08(Miles de barriles)

¿Dónde? : Perú¿Qué? : Producción de gas natural¿Cómo? : Según zonas geográficas

¿Cuándo? : Del 2001 al 2008

5. GRAFICOS ESTADISTICOS

Page 17: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

c. Cuerpo del gráfico, es la ilustración de los valores asociados a los datos presentadosmediante los siguientes elementos:Figura Conjunto de puntos, líneas, barras, polígonos o figuras utilizados en larepresentación de los datos estadísticos.Escala o eje de valores Es la línea recta segmentada que representa la escala de medicióna la que corresponden los datos estadísticos del gráfico. Si se visualizan los rótulos dedatos, es optativo mostrar u ocultar el eje de valores.Leyenda Es la descripción de la simbología utilizada, sea ésta mediante colores,densidades de color, sombreados o tipos de línea usados para diferenciar conceptos a losque se refieren los datos estadísticos. Contiene una muestra de la simbología y el rótulodel concepto con que se asocia. Corresponde a las características que en el título,generalmente, vienen precedidas de la preposición "por".

d. Pie del gráfico, constituye la parte inferior del gráfico y comprende las notas, llamadas yfuente. Se destina para anotar aquellas aclaraciones o señalamientos particulares ygenerales sobre la información, necesarios para una mejor interpretación de ésta porparte del usuario. Si los gráficos están acompañados de cuadros, el uso del pie de gráficoes optativo.

5. GRAFICOS ESTADISTICOS

Page 18: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

5. GRAFICOS ESTADISTICOS

0

100

200

300

400

500

600

Rio Blanco Rio Azul Rio Rojo Rio Negro

Año 2009

Año 2010

Año 2011

Piura : EMPRESA DE EXPLORACIONES MAJAS S.A.Numero de muestras de roca extraídas para análisis geoquímicoPor años de exploración según prospectos trabajados

Fuente : DIRECCION REGIONAL DE ENERGIA Y MINAS Nota : datos hipotéticos

Cuerpo

Titulo

Pie

Eje de valores

Figura

Leyenda

Eje de conceptos

Page 19: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Principales clases o tipos de gráficos:

a. Histogramas y polígonosb. Polígono de frecuenciac. Ojivad. Gráficos linealese. Diagrama de frecuenciasf. Crono diagramasg. Línea de regresiónh. Grafico tela de arañai. Grafico de barrasj. Gráficos circularesk. Grafico de pirámidel. Estereogramas (3D)m. Pictogramasn. Cartogramas (mapas)

5. GRAFICOS ESTADISTICOS

Page 20: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Gráficos lineales, son aquellas que representan la información a través delíneas, rectas o curvas. Como ejemplo graficaremos las notas de 10 semestres deun alumno de geología.

5. GRAFICOS ESTADISTICOS

Semestre Promedio

I 11

II 14

III 12

IV 13

V 15

VI 12

VII 13

VIII 11

IX 15

X 160

2

4

6

8

10

12

14

16

18

I II III IV V VI VII VIII IX X

Notas por semestre

Promedio

Page 21: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Crono diagramas, son diagramas lineales, se utilizan cuando se trabajan conseries de tiempo en el eje X pueden ir los años meses, días, horas, etc. Comoejemplo graficaremos la producción de cobre en sud América de Perú y Chile.

5. GRAFICOS ESTADISTICOS

AñosProducción de cobre ™

Perú Chile

1980 269000 197000

1981 297000 250000

1982 310000 295000

1983 245000 360000

1984 210000 420000

0

50000

100000

150000

200000

250000

300000

350000

400000

450000

1980 1981 1982 1983 1984

Peru

Chile

Page 22: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Gráfico de barras, se construye sobre el sistema de ejes cartesianos. Para cadacategoría se traza una barra vertical en que la altura es la frecuencia absoluta dela categoría; el ancho de la barra es arbitrario pero tiene la misma dimensión.Graficaremos la desnutrición crónica en el año 1999.

5. GRAFICOS ESTADISTICOS

SexoNiños

censadosNormales

Desnutridos crónicos

Masculino 333183 161494 171689

Femenino 320671 176353 144318

Total 653854 337847 316007

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

200000

Masculino Femenino

Niños normales

Desnutridos cronicos"

Page 23: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Gráfico circular o torta, esta es otra forma de representar los datos, en especial cuando setrata de cualidades. Es un gráfico dibujado desde dentro de un círculo; para esto esnecesario calcular el porcentaje de cada categoría respecto del total y luego repartirproporcionalmente estos porcentajes en los 360° del círculo.

Para transformar la frecuencia relativa a grados sexagesimales se aplica el siguientemétodo.

Como ejemplo pondremos al numero de clientes que trabajan en el sector minero en loscuatro bancos principales de nuestro país.

5. GRAFICOS ESTADISTICOS

Banco de Credito

Banco Continental

Banco Scotiabank

Banco de la Nacion

BancosNro. de clientes

% Grados

Banco de Crédito 10000 48.8 175.6Banco Continental 5000 24.4 87.8Banco Scotiabank 3500 17.1 61.5

Banco de la Nacion 2000 9.8 35.1Total 20500 100 360

Page 24: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Histogramas y polígonos de frecuencia, se construyen sobre el sistema decoordenadas cartesianas. Se utiliza cuando la variable en estudio es continua o estaagrupada en una tabla de frecuencia con intervalos en cada categoría.

En el eje X se identifica la variable en estudio y en el eje Y sé gráfica la frecuenciaabsoluta o la frecuencia relativa. Consiste en una serie de rectángulos en donde sualtura depende del valor de cada frecuencia.

Cada categoría de la variable se representa por una barra. El ancho de cada barradepende de la amplitud del intervalo.

El polígono se gráfica uniendo la punta superior de cada barra por segmento derecta. Para que el polígono quede cerrado se considera un punto en la rectahorizontal, antes y después de las anotadas.

El polígono se dibuja midiendo los puntos medios de cada barra, que corresponde ala marca de clase.

5. GRAFICOS ESTADISTICOS

Page 25: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

El polígono se dibuja midiendo los puntos medios de cada barra, que corresponde ala marca de clase.

5. GRAFICOS ESTADISTICOS

Page 26: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Histogramas y ojivas, también se gráfica la columna de frecuencia absolutaacumulada. El gráfico siempre será en forma ascendente. La ojiva se dibuja midiendosegmentos de recta en la parte superior de cada barra, y no se cierra.

5. GRAFICOS ESTADISTICOS

Page 27: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

Barras subliminales, es un gráfico de barras muy apropiado para comprobarsubdivisiones en la variable. Por ejemplo: % de estudiantes en diferentes carreras,separadas por sexo. Cada barra es un 100%.

Pictogramas, un pictograma es la representación de datos estadísticos por medio desímbolos que por su forma sugieren la naturaleza del dato. Por ejemplo: producción de bicicletas (en miles.)

5. GRAFICOS ESTADISTICOS

Page 28: 4. Variables y distribucion de frecuencias (estadistica descriptiva).pdf

EJEMPLO en el aso de una variable discreta; en unaunidad minera ubicada al sur del Perú, laasistenta social hizo una encuesta para unpresupuesto familiar, a 21 trabajadores respectoa n° de hijos en cada familia.

Variable x = n° de hijosLos datos son los siguientes:

3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3x1 x2 x21

5. GRAFICOS ESTADISTICOS


Recommended