+ All Categories
Home > Documents > analisis estadistico descriptivo

analisis estadistico descriptivo

Date post: 07-Jul-2016
Category:
Upload: lore-llerena
View: 233 times
Download: 6 times
Share this document with a friend
Description:
analisis estadistico descriptivo
112
HERRAMIENTAS DE DESCRIPCIÓN ESTADÍSTICA Dr. Roberto Carrillo Mg. DOCENTE MATEMÁTICA F.C.A
Transcript
Page 1: analisis estadistico descriptivo

HERRAMIENTAS DE DESCRIPCIÓN ESTADÍSTICA

Dr. Roberto Carrillo Mg.DOCENTE MATEMÁTICA F.C.A

Page 2: analisis estadistico descriptivo

ETAPA DE ANALISIS E INTERPRETACIÓN

ETAPA DE ANÁLISIS E INTERPRETACIÓN DE DATOS

MEDIDAS DE RESUMEN

2recc

Page 3: analisis estadistico descriptivo

ETAPA DE RECOLECCIÓN DE DATOS

En esta etapa empieza la ejecución de la investigación, es decir; el investigador pone en marcha la etapa de Planeamiento.A través de la recolección, se obtienen los datos que se requieren para alcanzar los objetivos y demostrar las hipótesis de la investigación. La obtención de datos se realiza teniendo en cuenta lo siguiente:

3recc

Page 4: analisis estadistico descriptivo

Fuentes de información

Cuando se recoge información es posible que los datos ya hayan sido obtenidos de las unidades de observación y publicados o registrados por otros, o que los datos se tengan que obtener directamente de las unidades de observación en forma personal. Las fuentes de información son de dos clases.

Fuente primaria: Si la información se obtiene directamente de la misma persona o entidad, utilizando ciertas técnicas (entrevista, cuestionario, etc.).Ej..:- Aplicar un test a un grupo de estudiantes para determinar el nivel intelectual.

4recc

Page 5: analisis estadistico descriptivo

FUENTES:

- Llevar a cabo una encuesta para conocer la situación socio-económica de los pobladores de la comunidad “x”.

- Observar la reacción de un grupo de personas con determinada adicción.

- Fuente secundaria:Si la información a obtener, ya ha sido recopilada por otras personas o instituciones.

Este tipo de información la encontramos en los informes estadísticos de las instituciones públicas o privadas. Ej.. INEC

5recc

Page 6: analisis estadistico descriptivo

Sistemas de recolección:

Los datos pueden ser recogidos a través de:Registros:Mediante los registros se anotan los datos en forma regular, permanente y obligatoria, obteniendo la información total y sistemática de los hechos ocurridos:Ej.:Registro de contribuyentes.Registro electoralRegistro civil, etc.

6recc

Page 7: analisis estadistico descriptivo

Sistemas de recolección:

Encuestas:Es la recolección de datos en forma temporal y pueden ser:- Censal: Cuando abarca a toda la población en estudio.Ej..Censo de población y vivienda de una ciudad o país.- Muestral: Cuando abarca una parte de la población en

estudio.Ej.:- Encuesta de nutrición.- Encuesta de preferencia de consumo, etc.

7recc

Page 8: analisis estadistico descriptivo

Técnicas de recolección:

Existen muchos métodos para recoger la información, entre los cuales el investigador debe elegir los que se adapten a las circunstancias o al tipo de investigación, Entre las técnicas más usadas tenemos:- Cuestionario.- Observación.- Entrevista- Test.- Análisis de contenido, etc.

8recc

Page 9: analisis estadistico descriptivo

ETAPA DE ELABORACIÓN DE DATOS

En la etapa de recolección se obtiene gran cantidad de datos, los mismos que se encuentran en formularios, cuestionarios, etc., y totalmente desordenados. En esta etapa se trata de organizar dichos datos y para ello es necesario cumplir dos actividades: Revisión o crítica y clasificación de datos.Revisión o critica de datos.“La revisión tiene por objeto: a) determinar si se han recibido todos los formularios o al menos una proporción que sea suficiente para no invalidar las conclusiones que se podrían hacer; b) verificar que estén registradas todas las respuestas recogidas y c) localizar posibles incongruencias en la información proporcionada. La revisión de datos constituye lo se ha dado en llamar control de calidad de la información”.

9recc

Page 10: analisis estadistico descriptivo

ETAPA DE ELABORACIÓN DE DATOS

Entre las posibles causas del envió incompleto de formularios tenemos:- Formularios o cuestionarios muy extensos.- Ausencia de instrucciones claras.- Bajo nivel educativo del informante.- Dotación insuficiente o inoportuna de los formularios o cuestionarios.Si no se han registrado todas las respuestas requeridas, puede deberse a:- Formularios o cuestionarios mal diseñados.- Negligencia del entrevistador ya que no recibió adiestramiento.- Informante se niega a contestar la pregunta.Las incongruencias provienen de respuestas, cuyos valores quedan fuera de lo considerado como posible o probable. Por ejemplo, si se indica que una persona tiene 5 años de edad y luego aparece su grado de instrucción como secundaria, es evidente que existe incongruencia.

10recc

Page 11: analisis estadistico descriptivo

Las causas de incongruencias pueden ser: “ Personal poco calificado e irresponsable, preguntas confusas en el

formulario que por su extensión provoca fatiga, informante poco motivado que da como respuesta lo primero que se le ocurre para salir del paso o demasiado complaciente, pues piensa que negar o afirmar determinada cosa va a ser recibido con beneplácito por el encuestador”

Clasificación de datos.La clasificación tiene por objeto organizar los datos en categorías, pero teniendo en cuenta la escala de medición de las variables:Clasificación de los datos medidos a nivel nominal u ordinal.

11recc

Page 12: analisis estadistico descriptivo

Importancia del estudio estadístico

Lo más importante no está en lo que la muestra nos dice sobre sus miembros específicos, sino en cómo hacer inferencias sobre los miembros de la población que no fueron incluidos en la muestra.

12recc

Page 13: analisis estadistico descriptivo

Importancia del estudio estadístico

Un estadístico primero diseña la muestra y el experimento para minimizar los costos de obtener la información.

Después busca el mejor método para realizar la inferencia según el muestreo dado.

Finalmente mide la bondad de la inferencia.

13recc

Page 14: analisis estadistico descriptivo

Variables Aleatorias

A los diferentes fenómenos o características que se miden en un estudio estadístico se les denomina variables aleatorias.

La diferencia entre variables aleatorias y variables algebraicas es que nos interesa saber la probabilidad de ocurrencia de sus posibles valores antes de que estos valores sean observados.

14recc

Page 15: analisis estadistico descriptivo

Tipos de Datos

Cualitativos: Arrojan respuesta categóricas. Miden cualidades Se les puede asignar después un valor

numérico (codificarlas) Cuantitativos:

Producen respuestas numéricas. Miden cantidades Podemos tratar un dato cuantitativo como

cualitativo (categorizando)15recc

Page 16: analisis estadistico descriptivo

Tipos de Datos Cuantitativos

Discretos: Si el número de posibles valores que puede tomar es

contable (número naturales). Generalmente resultan de un proceso de conteo.Ej.Número de facturasNúmero de estudiantes.Número de niños nacidos vivos.Número de ahorristas, etc.

16recc

Page 17: analisis estadistico descriptivo

Tipos de Datos Cuantitativos

Continuos: Si sus posibles valores son susceptibles de ser

medidos, pueden asumir valores decimales. Generalmente resultan de un proceso de medición.Ej.PesoTemperaturaEdad en años, meses y días, etc.

17recc

Page 18: analisis estadistico descriptivo

Escalas de Medición

Los datos que se asocian con las variables aleatorias pueden medirse con diferentes escalas dependiendo del tipo de dato que se trate. Las distintas medidas son:

18recc

Page 19: analisis estadistico descriptivo

Escalas de Medición

a) Medidas por Escala Nominal: Los datos de tipo cualitativo se agrupan en varias categorías sin

orden, En este nivel de medición, las categorías sólo se nombran o se enumeran pero no se comparan. En este nivel los datos, pueden ser:

Dicotómicas.- Si tienen dos categorías o clases, ej. SEXO: Masculino – femeninoTricotómicas: Si tienen tres categorías o clases, ej.RAZA: Blanca – Negra – AmarillaPolitómicas o multitómicas.- Si tienen más de tres categorías, ej.ESTADO CIVIL: Soltero – Casado – Viudo – Divorciado.

19recc

Page 20: analisis estadistico descriptivo

Escalas de Medición

b) Medidas por Escala Ordinal: Los datos de tipo cualitativo guardan un orden natural. Son datos que pueden medirse con una escala nominal, en donde

además existe un orden natural entre las categorías. Se pueden realizar operaciones aritméticas con los números

asignados a las categorías. El resultado no indica nada.Ej.NIVEL SOCIO ECONÓMICO: Alto – Medio – Bajo.

20recc

Page 21: analisis estadistico descriptivo

Escalas de Medición

c) Medidas por Escala de Intervalo: Los datos que se utilizan son cuantitativos y guardan las características

descritas en las medidas ordinales. No existe un cero natural, es decir, el cero no implica necesariamente la

ausencia del atributo en estudio. Implican la asignación de números de modo que a iguales diferencias

entre los grados del atributo, correspondan iguales diferencias entre los valores numéricos. Ej.:

- Temperatura: Un paciente puede llegar a tener 39° C de fiebre, pero ello no significa que su grado de temperatura haya tenido que partir de 0° C.

- Rendimiento escolar: Un estudiante puede obtener 7.5 en algebra; pero ello no nos lleca a pensar que necesariamente para llegar a esa calificación haya tenido que obtener primero nota cero.

- Coeficiente de inteligencia.- Presión arterial.

21recc

Page 22: analisis estadistico descriptivo

Escalas de Medición

d) Medidas por Escala de Razón o proporción: Datos que cumplen con las características necesarias para medirse con

una escala de intervalo, y que además posee un cero natural. Tener un cero natural implica que el punto cero no es arbitrario y

corresponde a una total ausencia del atributo en estudio. Ej.- Edad: Un estudiante puede tener 28 años de edad, pero para llegar a

esa edad necesariamente ha tenido que partir de cero años.- Estatura.- Peso.- Tiempo de reacción mental.- Los datos que según su naturaleza son cualitativos, por su medición

pertenecen a la escala nominal y las ordinales a escala ordinal. Los datos que por su naturaleza son cuantitativos, pertenecen a la escala de intervalo o razón.

22recc

Page 23: analisis estadistico descriptivo

TABLAS DE FRECUENCIA

Page 24: analisis estadistico descriptivo

Tablas de Frecuencia

Los datos recopilados en la muestra se pueden organizar en Tablas de Frecuencias.

Estas tablas muestran: las clases o categorías de respuesta de

donde se obtuvieron los datos (o los intervalos de clase si los datos son cuantitativos)

El número o proporción de veces que la clase se encontró en los datos recopilados.

24recc

Page 25: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cualitativos

Estado Civil(clase)

Número de ocurrencias

(frecuencia)

Porcentaje(frecuencia

relativa)Soltero 22 22 %

Casado 45 45 %

Divorciado 20 20 %

Viudo 8 8 %

Otro 5 5 %

Total 100 personas 100 %

25recc

Page 26: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cualitativos

Frecuencia (f): Resulta de contar el número de observaciones que "entran" en una clase

Frecuencia Relativa (fr): Es la proporción de observaciones que "entran" en una clase:

fr fni

i

26recc

Page 27: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cuantitativos

Se construyen intervalos de clase: Rango: Es la diferencia que existe entre el

valor mas grande y el mas pequeño.

minmaxrango

27recc

Page 28: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cuantitativos

Número de Intervalos: Se aconsejan no menos de 6 ni mas de 15 Para aproximarlo se puede utilizar de manera

alternativa: Raíz de n: el resultado se redondea al siguiente

entero. Regla de Sturges:

num.de intervalos o de clases = 1 + 3.3 (log n)

28recc

Page 29: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cuantitativos

Amplitud de Intervalos: Se calcula aplicando la fórmula:

La “unidad” toma valores de acuerdo a los valores de la variable:

Si la variable toma valores enteros, unidad=1 Si la variable toma valores con decimales, unidad=0.1 Si la variable toma valores con centésimas,

unidad=0.01 Si la variable toma valores con milésimas, unidad=0.001 Si la variable toma valores con diezmilésimas,

unidad=0.0001 etc.

c rango unidadnum.intervalos

29recc

Page 30: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cuantitativos

Límites de Clase o Establecidos: Límite inferior: es el valor inicial del intervalo

de clase.

Límite superior: es el valor final del intervalo de clase.

LI minLI LI c

1

i i 1

unidadLIcLSLSunidadLILS

1i1ii

21

30recc

Page 31: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cuantitativos

Marca de Clase: Es el punto medio del intervalo de clase. Se usa en los métodos estadísticos como valor estimado de las observaciones que cayeron dentro de ese intervalo

2LSLIX ii

i

31recc

Page 32: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cualitativos y Cuantitativos

Frecuencia Acumulada (fa): Es el número de observaciones acumuladas hasta la clase de referencia:

fa fi jj 1

i

32recc

Page 33: analisis estadistico descriptivo

Tablas de FrecuenciaDatos Cualitativos y Cuantitativos

Frecuencia Relativa Acumulada (fra): es la proporción de observaciones acumuladas hasta la clase de referencia:

fra fani

i

33recc

Page 34: analisis estadistico descriptivo

Tablas de Frecuencia en Excel

1. Cargar el módulo de Análisis de Datos: Herramientas Complementos Palomeo “Herramientas para Análisis”

34recc

Page 35: analisis estadistico descriptivo

Tablas de Frecuencia en Excel

2. Acceso la subrutina Histograma de módulo de Análisis de Datos:

Herramientas Análisis de Datos Histograma:

Selecciono a los datos de la muestra como “rango de entrada”

OPCIONAL: Selecciono a los límites superiores como “rango de clases”

35recc

Page 36: analisis estadistico descriptivo

EjemploUn investigador social desea determinar en la

comunidad “X”, el número de horas semanales que dedican los niños de 6 años de edad, a ver televisión. Una muestra de 25 niños, arrojó los siguientes resultados (en número de horas semanales).

10 19 25 19 2616 19 27 27 25

23 22 17 12 20

15 21 23 26 14

18 25 23 24 21

36recc

Page 37: analisis estadistico descriptivo

Se pide: a) ordenar la información en una tabla de

distribución de frecuencias. b) interpretar algunos valores de

frecuencias halladas.

Solución: a) Para ordenar la información, utilizaremos

la regla de Sturges.

37recc

Page 38: analisis estadistico descriptivo

Cálculo del Rango:

Número de clases:

Necesariamente se debe redondear al entero

K=6

mínmáx XXR

171027 R

LogNK 33.312533.31 LogK

)40.1( 33.31K62.562.41 K

38recc

Page 39: analisis estadistico descriptivo

Amplitud del intervalo:

Redondearemos al entero porque la información horas semanales está en números enteros.

Formación de intervalos y frecuencias

2.83617

KRW

3WI Ii fi Fi hi Hi hi(%) Hi(%)

1 10-12 2 2 0.08 0.08 08 08

2 13-15 2 4 0.08 0.16 08 16

3 16-18 3 7 0.12 0.28 12 28

4 19-21 6 13 0.24 0.52 24 52

5 22-24 5 18 0.20 0.72 20 72

6 25-27 7 25 0.28 1.00 28 100

25 if 00.1 ih 100 ih 39recc

Page 40: analisis estadistico descriptivo

CONCLUSIONES:

b) 7 de los 25 niños, ven televisión entre 16 y 18 horas/semanales, o sea, el 28% de los niños está la mayor cantidad de tiempo viendo televisión.

2 niños, que equivale al 8%, ven televisión entre 10 y 12 horas/semanales.

El 52% de los niños en esa comunidad ve televisión entre 10 y 21 horas/semanales.

: 7f6

: 2f1

: 52%H4

40recc

Page 41: analisis estadistico descriptivo

L Los siguientes datos se refieren al número de libros de Estadística consultado por 50 estudiantes para rendir el examen parcial de la asignatura:

2 0 4 4 1 4 0 3 2 0

0 1 1 1 0 1 2 4 0 1

1 5 2 2 5 3 4 0 4 0

0 0 3 0 1 4 2 1 2 0

3 1 3 1 2 0 5 6 3 2

41recc

Page 42: analisis estadistico descriptivo

Se pide: a) Ordenar los datos en un cuadro de frecuencias. b) ¿Qué porcentaje de alumnos no consultó ningún examen

para el examen parcial? c) ¿Qué porcentaje de alumnos consultó entre 5 y 6 libros?

Solución: Para ordenar la información utilizaremos la regla de Sturges. Cálculo del Rango:

mínmáx XXR

606 R

42recc

Page 43: analisis estadistico descriptivo

Cálculo del número de clases: LogNK 33.31

5033.31 LogK )70.1(33.31K

7K entero alredondear enteNecesariam 61.661.51

K

43recc

Page 44: analisis estadistico descriptivo

Amplitud del intervalo: Redondear al entero, porque la información

está en números enteros. Formación de los intervalos y frecuencias

86.076

W

i Ii fi Fi Hi Hi hi(%) Hi(%)1 0 13 13 0.26 0.26 26 26

2 1 11 24 0.22 0.48 22 48

3 2 9 33 0.18 0.66 18 66

4 3 6 39 0.12 0.78 12 78

5 4 7 46 0.14 0.92 14 92

6 5 3 49 0.06 0.98 06 98

7 6 1 50 0.02 1.00 02 100

50if 00.1ih 100ih

44recc

Page 45: analisis estadistico descriptivo

b) El 26 de los estudiantes no consultó ningún libro de Estadística ( )

c) El 8% de los estudiantes consultó entre 5 y 6 libros de Estadística ( ).

261 h

876 hh

45recc

Page 46: analisis estadistico descriptivo

Tablas de Frecuencia Bivariadas

Se tabulan dos variables en una sola tabla. También se llaman tablas de cruce o de

contingencia.Estado Civil Hombre Mujer Total por Estado Civil

Soltero 10 12 22Casado 22 23 45

Divorciado 7 13 20Viudo 2 6 8

Otro 4 1 5Total por Sexo 45 55 100 personas

46recc

Page 47: analisis estadistico descriptivo

TÉCNICAS GRÁFICAS

Page 48: analisis estadistico descriptivo

Técnicas Gráficas

Graficamos el contenido de la tabla de frecuencia.

Las más importantes gráficas: Pie Barras Histograma Polígono

48recc

Page 49: analisis estadistico descriptivo

Gráficas de Pie o de Sectores

Se usa con datos cualitativos o cuantitativos. A través de una regla de tres , un círculo se

divide en sectores.

Cada “rebanada” representa la proporción de datos contenidos en una clase de la tabla de frecuencia.

grados fr 360i i

49recc

Page 50: analisis estadistico descriptivo

Gráficas de Pie o de Sectores

2% 8%

25%

39%

17%

2%5%

2%

clase 1clase 2clase 3clase 4clase 5clase 6clase 7clase 8

50recc

Page 51: analisis estadistico descriptivo

Gráficas de Pie o de Sectoresen Excel:

Selecciono la frecuencia de la tabla Llamo al asistente para gráficas

Selecciono una gráfica circular Coloco los rótulos de categoría:

categorías marcas de clase

Coloco los rótulos de datos en “porcentaje”

51recc

Page 52: analisis estadistico descriptivo

Gráficas de Columnas o Barras

Se usa con datos cualitativos o cuantitativos. Se puede hacer con la frecuencia o con la

frecuencia relativa. Se grafican rectángulos sobre un eje

cartesiano en donde cada rectángulo representa a cada clase en la tabla de frecuencia.

52recc

Page 53: analisis estadistico descriptivo

Gráficas de Columnas o Barras

1

5

15

23

10

1

3

1

0

5

10

15

20

25

clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8

53recc

Page 54: analisis estadistico descriptivo

Gráficas de Columnas o BarrasEn Excel:

Selecciono la frecuencia o frecuencia relativa de la tabla

Llamo al asistente para gráficas Selecciono una gráfica de columnas o de

barras Coloco los rótulos de categoría:

categorías marcas de clase

Coloco los rótulos de datos

54recc

Page 55: analisis estadistico descriptivo

Histograma

Es exclusiva para datos cuantitativos. Se puede hacer con la frecuencia o con la

frecuencia relativa. Se grafican rectángulos sobre un eje

cartesiano en donde el área de cada rectángulo representa a cada intervalo de clase en la tabla de frecuencia.

Sirve para comparar las magnitudes representadas en cada intervalo de clase.

55recc

Page 56: analisis estadistico descriptivo

Histograma

1

5

15

23

10

1

3

1

0

5

10

15

20

25

clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8

56recc

Page 57: analisis estadistico descriptivo

HistogramaEn Excel (Opción 1)

Selecciono la frecuencia de la tabla Llamo al asistente para gráficas

Selecciono una gráfica de columnas Coloco los rótulos de categoría: marcas de

clase Coloco los rótulos de datos Reduzco el “ancho del rango” a cero.

NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier intervalo de clase.

57recc

Page 58: analisis estadistico descriptivo

HistogramaEn Excel (Opción 2)

Acceso la subrutina Histograma de módulo de Análisis de Datos:

Herramientas Análisis de Datos Histograma:

Selecciono a los datos de la muestra como “rango de entrada”

OPCIONAL: Selecciono a los límites superiores como “rango de clases”

Selecciono la opción “Crear Gráfico” Ya en la gráfica, reduzco la distancia entre barras a

cero.NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para

cualquier intervalo de clase.

58recc

Page 59: analisis estadistico descriptivo

Polígono

Es exclusiva para datos cuantitativos. Se puede hacer con la frecuencia o con la

frecuencia relativa. Es una gráfica de punto y línea sobre el eje

cartesiano. Sirve para observar la forma de la

distribución de frecuencias.

59recc

Page 60: analisis estadistico descriptivo

Polígono

Lo importante en el polígono es mantener el área bajo la curva igual al área acumulada en el histograma.

Añado una marca de clase anterior a la primera (restándole la amplitud)

Añado una marca de clase posterior a la última (sumándole la amplitud)

Les adjudico frecuencia igual a cero a estas marcas de clase adicionales

Grafico utilizando estas marcas de clase adicionales.

60recc

Page 61: analisis estadistico descriptivo

Polígono

01

5

15

23

10

1

3

100

5

10

15

20

25

0 2 4 6 8 10 12

61recc

Page 62: analisis estadistico descriptivo

PolígonoEn Excel (Opción 1)

Selecciono la frecuencia o frecuencia relativa de la tabla (ampliada)

Llamo al asistente para gráficas Selecciono una gráfica de dispersión XY, que

muestre los puntos unidos por líneas. Coloco las marcas de clase como “rótulos de

categoría” Coloco los rótulos de datos

NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier intervalo de clase.

62recc

Page 63: analisis estadistico descriptivo

PolígonoEn Excel (Opción 2)

Realizo el histograma de frecuencias a través de la subrutina de Análisis de Datos con la tabla ampliada.

Ya en la gráfica, cambio el tipo de gráfica a: Dispersión XY.

NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier intervalo de clase.

63recc

Page 64: analisis estadistico descriptivo

TÉCNICAS NUMÉRICAS

Page 65: analisis estadistico descriptivo

Técnicas Numéricas

Estos son los estadísticos muestrales. Calculamos valores que “resumen” las

características de los datos en la muestra: Tendencia Central Dispersión Forma Medidas de Posición

65recc

Page 66: analisis estadistico descriptivo

Técnicas NuméricasEn Excel Opción 1

Acceso la subrutina Estadística Descriptiva del módulo de Análisis de Datos:

Herramientas Análisis de Datos Estadística Descriptiva:

Selecciono a los datos de la muestra como “rango de entrada”

Selecciono la opción “Resumen de Estadísticas”

66recc

Page 67: analisis estadistico descriptivo

Tendencia Central

Las principales medidas son: Media Aritmética Mediana Moda Media Geométrica Media aritmética ponderada

67recc

Page 68: analisis estadistico descriptivo

Tendencia Central Media Aritmética

La media aritmética poblacional se denota como μ o La media aritmética muestral es el promedio de los datos. No agrupados Agrupados

X =X

n

ii 1

n

En Excel Opción 2: función PROMEDIO

n

*X=X

n

1ii if

clase de marca if

x

68recc

Page 69: analisis estadistico descriptivo

EJEMPLO: El consumo semanal de carne vacuno en una muestra de 80 familias en la comunidad “x”, es como sigue

Entonces:

Ii fi Xi Xifi

0 – 1.92 – 3.94 – 5.96 – 7.98 – 9.9

152620136

0.952.954.956.958.95

15* 0.95 = 14.2576.709990.3553.70

2.480334.

x

ffx

xi

ii

Interpretación: La muestra de familias de la comunidad, consume en promedio semanal 4.2 kg. Semanal de carne vacuno.

69recc

Page 70: analisis estadistico descriptivo

Ventajas:

- Es útil cuando los datos siguen aproximadamente una progresión

aritmética o están distribuidos en forma normal o simétrica. Es un estadígrafo de gran utilidad, porque toma en cuenta todos los

datos. Nos permite estimar y probar parámetros en estadística inferencial.

Desventajas:• Como incluye todos los datos, puede ser afectado por valores extremos.• Cuando los datos agrupados tienen clases abiertas en los extremos, no

es recomendable calcular la media aritmética.

70recc

Page 71: analisis estadistico descriptivo

Tendencia Central Mediana

Se define como el valor central. El valor que delimita al 50% de los datos .Para datos no agrupados:- Se halla la frecuencia acumulada - Se divide la frecuencia total para 2- Se busca dentro de la frecuencia acumulada, el primer valor

que contiene a n/2Ej..Se obtiene la siguiente información de estudiantes repetidores de año.

Año de estudio

Primero segundo Tercero Cuarto Quinto

No 25 14 6 9 2

71recc

Page 72: analisis estadistico descriptivo

Solución:- Se halla la frecuencia acumulada.- 56/2 = 28- El valor que contiene a 28 es 39- Entonces la Me = Segundo de secundaria. Interpretación:La mitad de estudiantes repetidores lo hacen en segundo de secundaria.La otra mitad lo hacen como máximo hasta segundo desecundaria.

En Excel Opción 2: función MEDIANA

72recc

Page 73: analisis estadistico descriptivo

Me para datos agrupados.

w

f

ff

LMeme

ii

i

2

73recc

Page 74: analisis estadistico descriptivo

De donde:

Me = mediana. Límite inferior del intervalo de la clase mediana = Semisuma de las frecuencias absolutas simples

= Suma de todas las frecuencias absolutas anteriores a la clasemediana. Frecuencia de la clase mediana

iL 2/f

1 if

mef

74recc

Page 75: analisis estadistico descriptivo

Ejemplo:

Se halla la frecuencia acumulada. Se halla la clase en la cual está incluido el valor n/2: 80/2 = 40. Este indicará

la clase mediana. Otros datos Aplicamos la fórmula. Respuesta.- 3.9 kg. Interpretación: El 50 % de las familias consumen

máximo 3.9 kg/semana de carne vacuno el otro 50 % de familias consumen más de 3.9 kg/semana.

Ii fi Xi Xifi

0 – 1.92 – 3.94 – 5.96 – 7.98 – 9.9

152620136

0.952.954.956.958.95

15* 0.95 = 14.2576.709990.3553.70

2;26;151

wff mei

75recc

Page 76: analisis estadistico descriptivo

Ventajas

No está afectada por valores extremos y por lo tanto es más representativa que la media aritmética cuando alguno de los valores de la variable se aleja mucho de los demás o cuando las series son poco simétricas.

Es útil cuando los datos agrupados tienen clases abiertas en los extremos

Se aplica también a variables que pertenecen a la escala ordinal.

76recc

Page 77: analisis estadistico descriptivo

Tendencia Central Moda

Es el valor más frecuente, el que se observa mayor número de veces

Pueden existir varios o ningún valor de moda para un solo conjunto de datos, la distribución puede ser:

Amodal cuando ningún valor se repite Unimodal cuando un solo valor es el más frecuente Bimodal cuando dos valores son los más

frecuentes trimodal,...., polimodal

En Excel Opción 2: función MODA

77recc

Page 78: analisis estadistico descriptivo

FÓRMULAPara datos agrupados:

De donde: Li = Límite inferior de la clase modal. d´ = diferencia de la frecuencia de la clase modal y la frecuencia de la

clase anterior a ella. d´´ = diferencia de la frecuencia de la clase modal y la frecuencia

anterior a ella.

´´

´

´*ddwdLMo i

Ii fi Xi Xifi

0 – 1.92 – 3.94 – 5.96 – 7.98 – 9.9

152620136

0.952.954.956.958.95

15* 0.95 = 14.2576.709990.3553.70

78recc

Page 79: analisis estadistico descriptivo

Desarrollo

La clase modal se ubica en aquella clase que tiene la mayor frecuencia (26). d´= 26 – 15 = 11 d´´ = 26 – 20 = 6. Otros datos Li = 2 ; w = 2 Se aplica la fórmula Respuesta Mo = 3.3 Interpretación: Las familias en estudio consumen con

mayor frecuencia 3.3 kg/semana de carne vacuno.

VENTAJAS:- Al igual que la mediana, no está afectada por valores extremos.- Puede usarse cuando los datos agrupados tienen clases abierta en los

extremos- Se usa también para variables que pertenecen a la escala nominal.

79recc

Page 80: analisis estadistico descriptivo

DESVENTAJAS

No es representativa a menos que la distribución contenga un gran número de datos y exista significativa repetición de alguno de ellos.

Muchas veces la serie no tiene moda porque ningún valor se repite.

Cuando la serie tiene dos, tres, o más modas, se hace difícil su interpretación y comparación.

80recc

Page 81: analisis estadistico descriptivo

Ejemplo Se muestra a continuación la estatura en cm, de un grupo de niños y

niñas normales de 0 a 12 años, residentes en las zonas rurales de la ciudad de Ambato.

Encontrar la media aritmética, mediana y la moda en datos agrupados y no agrupados. Elaborar la tabla de distribución de frecuencias respectiva.

45 48 115 112 95 98 145 115 96 9051 38 52 132 96 89 112 51 63 104

66 36 98 134 87 63 109 91 109 103

60 45 120 105 78 54 53 61 46 56

62 48 125 108 69 49 57 71 63 139

81recc

Page 82: analisis estadistico descriptivo

Relación entre Tendencia Central y la Simetría de la distribución

Simetría RelaciónSimétrica o insesgada Moda = Mediana = Media

sesgo positivo o a la derecha

Moda > Mediana > Media

sesgo negativo o a la izquierda

Moda < Mediana < Media

82recc

Page 83: analisis estadistico descriptivo

Relación entre Tendencia Central y la Simetría de la distribución

Moda=Mediana=Media

Insesgada

83recc

Page 84: analisis estadistico descriptivo

Relación entre Tendencia Central y la Simetría de la distribución

Moda Mediana Media

Sesgo Positivo (a la derecha)

84recc

Page 85: analisis estadistico descriptivo

Relación entre Tendencia Central y la Simetría de la distribución

ModaMedianaMedia

Sesgo Negativo (a la izquierda)

85recc

Page 86: analisis estadistico descriptivo

Tendencia Central Media Geométrica

Es el crecimiento promedio. Se obtiene a través de la fórmula

De donde: i if fi

ffg xxx ....x 21

21

simplesabsolutassFrecuenciafff

clasedemarcasxxx

i

i

...,

...,

21

,21

86recc

Page 87: analisis estadistico descriptivo

Ejemplo

La siguiente información corresponde a los casos de tifoidea (en %), según el reporte de los centros médicos donde fueron atendidos:

Hallar el promedio de casos de tifoidea atendidos en los centros médicos

Los centros atendieron un promedio de 36.3 % de los casos de tifoidea.

i Casos de tifoidea (%) Número de centros12345

0 – 1920 – 3940 – 5960 – 7980 – 99

10141786

TOTAL 55

%3.36

5.895.695.495.29)5.9(55 68171410

g

g

x

x

87recc

Page 88: analisis estadistico descriptivo

Tendencia Central Media Geométrica

La media aritmética siempre es mayor que la geométrica.

88recc

Page 89: analisis estadistico descriptivo

Tendencia Central Media Aritmética Ponderada

Se calcula la media aritmética muestral, adjudicando diferente “importancia” a cada uno de los datos.

n

1ii

n

1iii

p

w

Xw=X

89recc

Page 90: analisis estadistico descriptivo

Medidas de dispersión

Las principales medidas son: Rango Desviación Media Varianza Desviación Estándar Coeficiente de Variación

90recc

Page 91: analisis estadistico descriptivo

Dispersión Rango

Es la diferencia que existe entre el valor mas grande y el mas pequeño.

minmaxrango

91recc

Page 92: analisis estadistico descriptivo

Dispersión Desviación Media Absoluta

Es el promedio de las distancias absolutas de los datos a su media aritmética.

En Excel: función DESVPROM

n

XX=M

n

1ii

D

92recc

Page 93: analisis estadistico descriptivo

Dispersión Varianza poblacional

La varianza poblacional se denota como σ² Es el promedio de los cuadrados de las

distancias de los datos a su media aritmética.

Es un estimador sesgado. Funciona solo para muestras “grandes”.

En Excel Opción 2: función VARP

n

XX=

n

1i

2i

2

93recc

Page 94: analisis estadistico descriptivo

Dispersión Varianza muestral

La varianza muestral se denota como S² Se calcula igual que la varianza poblacional,

dividiendo entre n-1.

Es un estimador insesgado. Funciona para cualquier tamaño de muestra.

En Excel Opción 2: función VAR

1-n

XX=

n

1i

2i

2

S

94recc

Page 95: analisis estadistico descriptivo

Dispersión Desviación Estándar

Mide la variación de los datos en términos absolutos.

Se interpreta como la distancia promedio de los datos a su media aritmética.

Se expresa en las mismas unidades que las empleadas en los datos.

Se calcula tomando la raíz cuadrada positiva de la varianza.

95recc

Page 96: analisis estadistico descriptivo

Dispersión Desviación Estándar

Desviación Estándar Poblacional:

2

2S=S

En Excel: función DESVESTP

Desviación Estándar Muestral:

En Excel: función DESVEST

96recc

Page 97: analisis estadistico descriptivo

Dispersión Desviación Estándar

Para interpretar la dispersión absoluta, se construyen intervalos alrededor del promedio. Con esto se determina en dónde se sitúan los valores de una distribución de frecuencia en relación con la media aritmética. Esto se puede lograr utilizando:

Teorema de Chebyshev Regla Empírica

97recc

Page 98: analisis estadistico descriptivo

EJEMPLO

Con los siguientes datos, encontrar La media geométrica, desviación estándar o típica, la varianza y el coeficiente de variación.

.45 48 115 112 95 98 145 115 96 9051 38 52 132 96 89 112 51 63 104

66 36 98 134 87 63 109 91 109 103

60 45 120 105 78 54 53 61 46 56

62 48 125 108 69 49 57 71 63 139

98recc

Page 99: analisis estadistico descriptivo

Dispersión: Desviación Estándar Teorema de Chebyshev

Cualquiera que sea la forma de la distribución de los datos:

al menos el 75% de los valores (población) caerán dentro de 2 desviaciones estándar respecto de la media de la distribución:

2SX

X 3S

al menos el 89% de los valores (población) caerán dentro de 3 desviaciones estándar respecto de la media de la distribución:

99recc

Page 100: analisis estadistico descriptivo

Dispersión: Desviación Estándar Regla Empírica

Solo cuando la forma de la distribución de los datos es simétrica (insesgada):

aproximadamente el 68% de los datos (población) se encuentran a una desviación estándar alrededor de la media de la distribución :

SX

100recc

Page 101: analisis estadistico descriptivo

Dispersión: Desviación Estándar Regla Empírica

aproximadamente el 95% de los datos (población) se encuentran a 2 desviaciones estándar alrededor de la media de la distribución :

2SX

X 3S

aproximadamente el 99% de los datos (población) se encuentran a 3 desviaciones estándar alrededor de la media de la distribución :

101recc

Page 102: analisis estadistico descriptivo

Dispersión Coeficiente de Variación

Mide la variación relativa de la variable con respecto a su promedio.

Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud de la desviación estándar en relación con la magnitud de la media

Expresa a la variación de los datos como porcentaje de su promedio.

100X

=CV x

102recc

Page 103: analisis estadistico descriptivo

Forma

Las medidas de forma son: Sesgo Curtosis

103recc

Page 104: analisis estadistico descriptivo

FormaSesgo

Es el grado de asimetría que tiene la distribución

Una curva insesgada tiene sesgo cero Medimos en cuánto se aleja la distribución

de una insesgada: Si el polígono de frecuencias tiene la mayor

acumulación a la izquierda, tiene sesgo positivo o a la derecha.

Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo negativo o a la izquierda

104recc

Page 105: analisis estadistico descriptivo

FormaSesgo

En Excel Opción 2: función COEFICIENTE.ASIMETRIA

Coeficiente de Asimetría

Sesgo

= 0 No hay sesgo. La distribución es insesgada

> 0 La distribución tiene sesgo positivo o a la derecha.

< 0 La distribución tiene sesgo negativo o a la izquierda.

105recc

Page 106: analisis estadistico descriptivo

FormaCurtosis

Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal.

La distribución Normal se considera mesocúrtica, es el término medio.

Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas

Las distribuciones menos puntiagudas que la Normal se conocen como platocúrticas

106recc

Page 107: analisis estadistico descriptivo

FormaCurtosis

Leptocúrtica

Mesocúrtica

Platocúrtica

107recc

Page 108: analisis estadistico descriptivo

FormaCurtosis

En Excel Opción 2: función CURTOSIS

Función Curtosis Curtosis

= 3 Mesocúrtica

> 3 Leptocúrtica

< 3 Platocúrtica

108recc

Page 109: analisis estadistico descriptivo

Medidas de Posición

Las medidas de posición son: Cuartiles: Son tres y delimitan al 25%, 50% y

75% de los datos acumulados. Deciles: Son nueve y delimitan al 10%,

20%, ... , 90% de los datos acumulados. Percentiles: Son noventa y nueve y delimitan

al 1%, 2%, ... , 99% de los datos acumulados. Siempre acumulamos de izquierda a

derecha. En Excel: función PERCENTIL

109recc

Page 110: analisis estadistico descriptivo

w

f

ffi

LQiQ

ii

i

1

41

FÓRMULAS:

La misma formula se utiliza en deciles y percentiles. Cambia Q por D o P y 4 por 10 o 100

110recc

Page 111: analisis estadistico descriptivo

EJEMPLO:

Hallar 2 cuartiles, 3 deciles y 5 percentiles.

45 48 115 112 95 98 145 115 96 9051 38 52 132 96 89 112 51 63 104

66 36 98 134 87 63 109 91 109 103

60 45 120 105 78 54 53 61 46 56

62 48 125 108 69 49 57 71 63 139

111recc

Page 112: analisis estadistico descriptivo

GRACIAS

112recc


Recommended