+ All Categories
Home > Documents > Estadística Fundamental -...

Estadística Fundamental -...

Date post: 19-Sep-2018
Category:
Upload: vukhanh
View: 222 times
Download: 0 times
Share this document with a friend
208
1 Estadística Fundamental Conceptos y Definiciones Prof. (Ing.) Andrés Scott Velásquez Según Syllabus del I.U.G.T.
Transcript

1

Estadística

Fundamental Conceptos y Definiciones

Prof. (Ing.) Andrés Scott Velásquez

Según Syllabus del I.U.G.T.

2

ÍNDICE

TÍTULOS CAPÍTULO TEMA PÁGINA

I 01 Resumen de Conceptos y definiciones 03

02 Distribución de Frecuencias 09

II 03 Medidas de Tendencia Central 21

04 Medidas de Posición 26

05 Medidas de Dispersión o Desviación 32

06 Estudio de la curva originada por un Polígono de Frec. 36

III 07 Estudio de las Probabilidades 51

08 Distribución de Probabilidades 84

09 Distribuciones Especiales de Variables Discretas 88

10 Distribución de Variables Continua (Dist. Normal o Z) 93

IV 11 Teoría del Muestreo y Teorema del Límite Central 106

12 Estimación 113

13 Prueba de Hipótesis 121

V 14 Análisis de Varianza (ANOVA) 140

15 Prueba No Paramétrica del Chi-Cuadrado 145

VI 16 Correlación Lineal y Recta de Regresión Lineal 159

17 Series Temporales, Cronológicas o de Tiempo 168

18 Número Índices 182

Apéndices Tabla y Cuadros 199

3

TÍTULO I Capítulo 01

ESTADISTICA

RESUMEN DE CONCEPTOS Y DEFINICIONES

1. Historia, fines e importancia de la Estadística

1.1.-Datos Históricos.

Si hacemos una revisión del concepto elemental de Estadística podemos intuir que

este conocimiento parte desde el momento cuando se realiza el primer censo de propiedades con fines de cobrar impuestos para mantener la estructura de estado que ya se comenzaba a organizar. Fueron los babilonios, los persas, los egipcios, los griegos y los chinos quienes comenzaron con este tipo prácticas. Nos refleja la biblia dos hechos que tienen que ver con el nacimiento de la recolección de datos base de la estadística; en primer lugar el censo que realizó Moisés para conocer el número de personas que constituía su pueblo, y en segundo lugar, cuando nace Jesús sus padres iban a empadronarse en el censo que periódicamente llevaba a cabo el imperio romano para conocer los detalles de estado que tenía que ver con sus dominios. Se tiene escasas noticias de que en América tanto los Aztecas como los Incas realizaban censos para darle forma económica y socialmente a sus pueblos. Hacia el Siglo XVI, cuando se tiene conocimiento de los primeros estudios de Probabilidades, la Estadística toma un gran impulso. En el siglo XVII la Estadística aplicada a las Matemáticas toma un gran impulso, continuando su desarrollo en Siglo XVIII cuando se profundiza los estudios de la Estadística Inductiva o Inferencial, los estudios demográficos, se da la base para la iniciación de los negocios con los seguro de vida cuando se realiza el primer inventario sobre la mortalidad. En ese mismo siglo nace la Sociometría y en el Siglo XVIII la Biometría. Es tal la importancia a la que ha llegado la estadística hoy en día, que no existe ciencias tanto naturales como sociales, ni disciplina que no se apoye en los métodos estadísticos para darle sentido a sus investigaciones. Se puede señalar que personalidades como: Girolano Gargano, Gottfriend Achenwall, Juan Pedro Sussmilch, Antonio Deparcioux, Jacques Bernoulli, Pedro Simón Laplace, Carl Friedrich Gauss, Lambert Jacques Quetelet, Pafnuti Lvovich Chevyshev, Grégor Johann Méndel, Francis Gaston, Karl Pearson, Ronald Fisher, John van Neumann y William Féller, son los padres de la Estadística tal como la conocemos en la actualidad. Sus aportes han sido de una gran valía, porque ello ha contribuido en gran parte a los avances en el mundo de lo científico, lo social, lo económico, lo político y lo cultural.

4

1.2.- Fines e Importancia de la Estadística Para conocer los fines e importancia de la Estadística debemos conocer de dónde viene este vocablo. La voz latina STATUS es el origen de la palabra estadística, referida fundamentalmente a la recolección de datos requeridos por su utilidad al Estado como Nación o al Estado como tal. Cualquier estudio sobre datos tomados de las realidades para escrutar información sobre ellos, que permitan llegar a análisis lógicos y concluyentes sobre fenómenos naturales o sociales, que nos permita tomar decisiones acertadas señalan de por si la importancia de la estadísticas. Los cuadros y gráficos estadísticos por sí solo no nos señalan un camino a seguir. Se requiere profundizar ese primer conocimiento con una serie de definiciones metodológicas que afinen una conclusión final que oriente con acierto la toma de decisiones efectivas. La política, la sociología, la psicología, la medicina, la economía y la ingeniería por decir algunas actividades de la vida diaria se les hace indispensable recurrir a la Estadística para la toma de decisiones, es por eso que muchos académicos la consideran como una ciencia auxiliar de las ciencias madres.

2. Estadística Estadística es una ciencia auxiliar que establece los métodos para recopilar, organizar, presentar, analizar e interpretar información para orientar en la toma de decisiones más efectivas. 2.1.- Tipos de estadísticas.

2.1.1. – Estadística Descriptiva o Deductiva: La cual define el conjunto de métodos para recopilar, organizar, resumir y presentar los datos de manera informativa. También podemos definirla como el conjunto de métodos tantos numéricos como gráficos que luego de recolectada la información de los datos de la población o muestra sometida al estudio se utiliza para resumirla y procesarla para transformarla y presentarla para analizarla. 2.1.2.- Estadística Inferencial o Inductiva: La cual define el conjunto de métodos para determinar algún atributo medible acerca de una población en base a una muestra representativa de la misma. Podemos agregar que la Estadística Inferencial constituye la base para formular predicciones, previsiones y estimaciones que se utilizan para transformar la información en

conocimiento. Este tipo de estadística toma como basamentos los fundamentos de la Teoría de las Probabilidades y de la Teoría del Muestreo.

2.1.2.1 Población: Es el conjunto de todos los individuos, objetos o medidas de interés o a estudiar.

2.1.2.2 Elemento: Son las unidades simples (individuos, objetos o medidas) que integran una población.

2.1.2.3 Población Finita: Cuando el número de elementos que forman una población es limitado.

5

2.1.2.4 Población No Finita: Son poblaciones formadas por una cantidad infinita o muy grande de elementos, cuyo comportamiento puede asumirse como el de una población de infinitos elementos.

2.1.2.5 Característica: Son los rasgos, cualidades o propiedades que poseen los elementos o las unidades que constituyen la población o la muestra.

2.1.2.6 Parámetro: Característica asociada a una población. 2.1.2.7 Muestra: Es una porción o parte representativa de la población de

interés sometida a estudio. 2.1.2.8 Marco: Conocido también como Marco Muestral o Marco de

Referencia, lo constituye la lista, el mapa o cualquier otro material aceptable, que contenga todas las unidades o elementos perfectamente identificadas y actualizadas, de la cual se selecciona la muestra.

2.1.2.9 Estadístico: Característica asociada a una muestra 2.1.2.10 Estadígrafo o Estimador: Es la descripción numérica de una

característica correspondiente a cualquier elemento de una muestra. 2.1.2.11 Atributo: Característica no mensurable, pero si cuantificable de

una población o muestra. Son atributos: profesión, cargo, marcas, calidad, etc.; como se observa son características no mensurables pero que si se pueden cuantificar.

2.1.2.12 Censo: Es una colección e datos de cada un de los miembros de

una población. 2.1.2.13 Dato: Valores que han sido recopilados como resultado de

observaciones y que se refieren a alguna variable en particular. 2.1.2.14 Observación: Es cualquier registro de información ya sea

numérico o categórico 2.1.2.15 Muestra Probabilística: Son muestras donde sus elementos o

unidades se toman al azar o de manera aleatoria, es decir todos los elementos de la población a estudiar tienen la misma posibilidad de ser seleccionados.

2.1.2.16 Muestras No Probabilística: Conocidas también como muestras erráticas o circunstanciales, son aquellas muestras donde los elementos de la población son seleccionados de manera conveniente o caprichosa del investigador.

3. Variable o Unidad Estadística Es una de las tantas particularidades o característica que conforman un fenómeno estadístico de la población o muestra que se está estudiando o analizando.

3.1 Variable Cualitativa: Variable que presenta observaciones no numéricas. Ejemplos: Gentilicios, Religiones, Profesiones, Colores, etc.

3.2 Variable Cuantitativa: Variable que presenta observaciones numéricas. Ejemplos: Las Notas, Edades, Pesos, Longitudes, Áreas, Volúmenes, Compras, Ventas, etc. 2.2.1 Variable Cuantitativa Discreta: Variable numérica que representa valores claramente contables, generalmente números enteros (individuos y objetos). Ejemplo: Personas, Animales, Números de Visas Concedidas, Numero de Carros, etc. 2.2.2 Variable Cuantitativa Continua: Variable numérica que toma cualquier valor dentro de los infinitos valores de un rango determinado (todo número real

6

para señalarla). Ejemplo: Estaturas, Monto de Gastos, Sueldos, Monto de Inversiones, etc.

4. Escala de Medidas o Niveles de Medición Rige los cálculos que se llevan a cabo con el fin de resumir y presentar los datos. Es la manera de clasificar los datos para su presentación. 3.1 Medidas en Escala Nominal: Escala no numérica de nombres o clasificaciones que se utilizan para presentar datos en categorías distintas y separadas. Ejemplo:

Fuente Millones de Barriles Diarios

Porcentajes

OPEP

OCDE (Inc. a USA) Rusia China Otra

32,91

22,76 11,33 3,62 12,35 82,97

39,7

27,4 13,7 4,4 14,8

100,0 TABLA.- Suministro mundial de petróleo para 2004

Se observa en la tabla presentada un nivel de medición que no responde a un orden en particular en las categorías. Propiedades: a) Las categorías de datos la representan los nombres clasificados y b) Aun cuando los nombres se codifiquen con valores, las categorías de datos no siguen un orden lógico. 3.2.- Medidas en Escala Ordinal: Escala no numérica de nombres o clasificaciones que se utilizan para presentar los datos en categorías distintas y separadas pero siguiendo un orden significativo. Ejemplo:

Orden Fuente Millones de Barriles Diarios

Porcentajes

Primero Segundo Tercero Cuarto Quinto

OPEP OCDE (Inc. a USA) Otra Rusia China

32,91 22,76 12,35 11,33 3,62 82,97

39,7 27,4 14,8 13,7 4,4

100,0

TABLA.- Suministro mundial de petróleo para 2004

En esta tabla ya se observa un orden de acuerdo a los volúmenes de barriles de petróleo suministrado por países o grupo de países.

Propiedades: a) Las clasificaciones de los datos se encuentran representados por conjuntos de nombres (Sobresaliente, Bueno, Regular, Malo), las cuales representan valores relativos y b) Estos valores relativos permiten la clasificación atendiendo a un orden lógico. Para definir las medidas en escalas de intervalo debe conocerse las propiedades siguientes: a) de la MUTUA EXCLUSION: propiedad de un grupo o conjunto de categorías por la cual un individuo, objeto o medición se incluye en una sola categoría y b) del EXHAUSTIVO COLECTIVO: propiedad de un grupo o conjunto de categorías

7

según la cual cada uno de los individuos, objetos o mediciones deben integrarse por lo menos a una de las categorías. 4.1 Medidas en Escala de Intervalo: Son escalas numéricas donde el valor cero se

toma de manera arbitraria, siendo significativa la diferencia entre sus valores. Asume todas las características del nivel ordinal. Ejemplo: Las escalas de temperaturas, en las cuales el cero no significa que no haya calor o frío, la mejor manera de observar este hecho es que ninguna de las escalas de temperaturas existentes coinciden en el cero. La escala de Tiempo entre las diferente eras y edades de nuestro momentos históricos, el cero de la era actual no significa que en ese momento no haya habido hechos históricos. Propiedades: a) Las clasificaciones de datos se ordenan en correspondencia con el grado que posea de la característica en estudio y b) Diferencias iguales en la característica representa diferencias iguales en las mediciones.

4.2 Medidas en Escala de Razón: Son escalas numéricas, que a diferencia de la escala de intervalo el valor cero será fijo y tiene significado. Asume todas las características del nivel de intervalo. Ejemplo: El dinero, si tiene tantos bolívares, tienes dinero; si tiene cero bolívares entonces no tienes dinero. Si se compra cero gramos de un producto entonces no se tiene el producto Propiedades: a) Las clasificaciones de datos se ordenan de acuerdo de acuerdo a la cantidad de característica que posee, b) Diferencia iguales en la característica representa diferencias iguales a los números asignados en las clasificaciones y c) El punto cero representa la ausencia de características y la razón entre dos números es significativa. Ejercicios Resueltos

Ejercicio 01.- Tomando una información hipotética de las cinco ciudades de las más importantes de Venezuela sobre las condiciones y estilo de vidas, cuyos hipotéticos datos se presentan a continuación:

Ciudad Población

(En

Millones)

Ingreso Medio

por Familia

(Miles de

bolívares)

Mejor negocio

hotelero

Atracción más

visitada

Tasa de

criminalidad

por cada

100.000

Caracas 3,8 9,2 Hotel Tamanaco Galipán 492,67

Maracaibo 1,8 8,9 Hotel Ciruma Sinamaíca 152,32

Valencia 1,3 10,2 Hotel Intercontinental El Acuario 90,10

Barquisimeto 0,9 5,4 Hotel La hostería Quíbor-Titorero 85,6

Maracay 0,8 7,7 Hotel Pipo Bahía de Cata 81,4

Responder: a) Identificar las variables cualitativas y cuantitativas, b) ¿Cuáles son las Discretas y cuáles las continuas?, c) Identificar cada variable como nominal, ordinal, o de razón y d) ¿Cuáles son descriptivas y cuales son inferenciales? Respuestas: a) Cualitativas: ciudad, mejor negocio hotelero y atracción más visitada; y Cuantitativas: Población, Ingreso Medio por Familia y tasa de criminalidad; b) Discretas: Población; y Continuas: Ingreso Medio por Familia y Tasa de Criminalidad; c) Nominal: ciudad; Ordinal: Mejor Negocio Hotelero y Atracción más Visitada; o De Razón: Población, Ingreso Medio por Familia y Tasa de Criminalidad; y d) Descriptivas: Ciudad, Población, Mejor Negocio Hotelero y Atracción más Visitada; e Inferenciales: Ingreso medio por Familia y Tasa de Criminalidad.

8

Ejercicio 02.- El Director Gerente de una institución benéfica desea tomar una muestra de las opiniones de 86 de sus miembros respecto a las actividades a realizar en las próximas fechas navideñas. Responder: a) ¿Cuál es la población? Y b) ¿Cuál es la mejor forma como debe tomarse la muestra? Respuestas: a) La población la constituye todos los integrantes de la institución benéfica y b) La mejor forma de tomarla muestra es a través de una selección aleatoria, usando cualquiera de los métodos establecidos para la investigación. Ejercicio 03.- Una comisión tripartita integradas por miembros del sector público, del sector privado y del sector sindical, le encomendó a una empresa que realiza estudios de opinión, para que tomara una muestra de 1.000 de trabajadores para consultarle si estaban de acuerdo con las últimas mejoras salariales. De la muestra 718 se mostraron de acuerdo,

196 mostraron su desacuerdo y el resto 86 manifestaron que le daba lo mismo. Se pregunta: a) ¿Qué podría informar la empresa que realiza estudios de opinión a la comisión tripartita? y b) ¿Es un ejemplo de Estadística Descriptiva o Estadística Inferencial? Explicar. Respuestas: a) La información sería que: el 71,8% están de acuerdo; el 19,6% están en desacuerdo y al 8,6% le era indiferente y b) Es un ejemplo de Estadística Inferencial porque partiendo de una muestra se llegó a una conclusión. Ejercicio 04.- ¿Cuál es el Nivel de Medición o Escala que reflejan los siguientes datos? a) Los pesos en kilogramos de 20 bultos de libros que llegaron a los depósitos de un puerto del país son;

102 116 123 104 102 110 110 115 110 102 104 116 110 102 110 112 122 118 110 102

y b) En una encuesta realizada a 120 trabajadores que transitaban por el Boulevard de Sabana Grande sobre el lugar donde trabajaban, 48 manifestaron que trabajaban en Sabana Grande, 32 en Chacaíto, 26 en Chacao, 11 en Altamira y 3 en Los Cortijos de Lourdes. Respuestas: a) El peso de los bultos es una variable de razón, ya que si el bulto pesa cero kilogramos es porque no ha libro, y si comparamos un bulto que pesa 116 kilogramos contra uno que pesa 104 kilogramos, observamos que le lleva 12 kilogramos, b) Es una escala nominal porque se es indiferente la ordenación de los lugares. Ejercicio 05.- En la lista de variables de variables que se dan a anexa, decir a qué tipo de variables corresponden: a) Salario, b) Género c) Volúmenes de ventas de textos de estudio, d) Preferencia por los tipos de cervezas, e) Temperatura, f) Lugar que ocupa un estudiante en

clase, g) Cantidad de computadoras domésticas, h) Calificaciones de un profesor de Estadística e i) Resultados de un cuestionario. Respuestas: a.- Salario (Cuantitativa, Continua y Ordinal). b.- Género (Cualitativa y Discreta), c.- Volúmenes de Ventas de Textos (Cuantitativa, Continua, Ordinal y de Razón), d.- Preferencia por los tipos de cervezas (Cualitativa y Ordinal), e.- Temperatura (Continua y de Intervalo), f.- Lugar que ocupa un estudiante en la clase (Cuantitativa, Ordinal y Discreta), g.-

Cantidad de Computadoras Domésticas (Cuantitativa, Discreta y Ordinal), h.- Calificaciones de un profesor de Estadística (Cuantitativa, Discreta y ordinal) e i.- Resultados de un cuestionario (Cuantitativa, Discreta y de Razón)

9

Capítulo 02

DISTRIBUCION DE FRECUENCIA TABLAS Y GRAFICAS ESTADISTICAS

1. Distribución de Frecuencia: Son tablas estadísticas donde se presentan los datos organizado en categorías mutuamente excluyente (clases o los datos como tal) mostrando el número de observaciones de cada una de las categorías. Las categorías son las clasificaciones ordenadas en orden creciente o decreciente

mediante la cual presentamos los datos en una Tabla Estadística. Las categorías pueden ser presentadas mediante los datos como tal o datos sueltos en datos no agrupados y mediante clases o intervalo de clases en datos agrupados. Cuando estudiamos una distribución de frecuencia de datos no agrupados o sueltos (Máximo 10 datos; convenio) haremos su graficación a través de barras o representación dentro de un circulo o diagrama de torta o pastel. Cuando la distribución de frecuencia sea de datos agrupados (más de 10 datos, se agrupan; convenio) haremos su graficación a través de histograma, polígonos de frecuencia y ojiva.

2. Pasos a seguir para desarrollar o crear una distribución de frecuencia (se ordenan los datos en orden creciente o decreciente según sea el caso, por lo general en orden creciente) 2.1. Datos no agrupados o sueltos

PRIMERO: Determinar la frecuencia absoluta (fi) de cada dato, siendo ésta el número de veces que se repite un dato, o es el número de observaciones que de él se tiene. SEGUNDO: Determinar la frecuencia absoluta acumulada (Fi) de cada dato. Esta frecuencia se obtiene partiendo de la primera frecuencia absoluta y luego acumulando de manera sucesiva el resto de las frecuencias una a una. TERCERO: Determinar la frecuencia relativa (hi) de cada dato. Se obtiene dividiendo la frecuencia absoluta de cada dato entre el número total de las observaciones de la serie de datos o la suma de las frecuencias absolutas.

CUARTO: Determinar la frecuencia relativa acumulada (Hi) de cada dato. Esta frecuencia se obtiene partiendo de la primera frecuencia relativa y luego acumulando de manera sucesiva el resto de las frecuencias relativas una a una.

2.2. Datos agrupados

PRIMERO: Determinar el rango (R) de la serie de datos R= DM – Dm + 1 DM=Dato mayor; Dm: Dato menor

10

SEGUNDO: Determinar el número de intervalos de clases o clase (NIC) 1) Método Empírico: Lo determina la experiencia del profesional que

realiza el estudio.

2) Método del Exponencial 2

;

3) Método de Sturges

N= Tamaño de la población n= Tamaño de la muestra

Si al obtener el resultado en el método exponencial dos le sumamos la unidad estamos coincidiendo plenamente con el Método de Sturges.

TERCERO: Determinar la amplitud del intervalo de clase (IC)

; IC es un valor constante

CUARTO: Definir los intervalos de clase o clase.

Cada intervalo de clase tendrá límites inferiores y superiores siendo estos aparentes y reales. Aparentes cuando el límite superior de un intervalo no es igual al límite inferior del intervalo siguiente y así sucesivamente. Reales cuando el límite superior de un intervalo es igual al límite inferior del intervalo siguiente y así sucesivamente. Con el método empírico se pueden establecer directamente los límites reales, mientras que con los restantes métodos (Exponencial 2 y Sturges) obtenemos límites aparentes (convenimiento). Cuando desarrollamos el Método de Sturges o el Método Exponencial 2, lo más importante es lograr el primer intervalo de clase o primera clase. Algunos estudiosos de la estadística lo logran haciendo coincidir el primer dato de la serie con el límite aparente inferior del primer intervalo y luego define el resto de los mismos. A veces no todos los datos quedan contenidos en la Distribución de Frecuencias que se elabora. Una manera de evitar este inconveniente se logra tomando la amplitud del intervalo de clase y dividiéndolo en dos partes de valores enteros, si es par en dos partes iguales y se le resta al primer dato y ese será el límite aparente inferior del primer intervalo. Si es impar se hace lo mismo pero habrá un

entero menor que el otro, se toma el menor y se le resta al primer dato, sino resulta se le resta el mayor. De no resultar la utilización de valores medios mediante esta metodología se asumen valores pero que no pasen del tamaño o amplitud del intervalo de clase o clase. VER DESARROLLO DE UN EJERCICIO EN LA SOLUCIÓN DE ALGUN PROBLEMA.

QUINTO: Determinar la marca de clase (Xmi) de cada intervalo de clase o clase.

11

La marca de clase se obtiene a través de la semi suma de cualquiera de los tipos de los límites reales o aparentes de un intervalo de clase.

Xs= Límite aparente superior XI = Límite aparente inferior Ls = Límite real superior LI = Límite real inferior

SEXTO: Determinar la frecuencia absoluta de cada intervalo de clase o clase. Se obtiene para cada intervalo de clase o clase sumando las frecuencias absolutas de los datos contenidos en cada intervalo de clase o clase definida.

SEPTIMO: El resto de las frecuencias (Fi, hi, Hi) se obtienen siguiendo el patrón observado para los datos no agrupados.

3. Propiedades de las frecuencias: 3.1. Las frecuencias absolutas siempre son valores enteros. 3.2. La suma de las frecuencias absolutas son igual a N (tamaño de la población) o n

(tamaño de la muestra) 3.3. Las frecuencia relativas son siempre valores fraccionarios o decimales es decir

0 <hi < 1 3.4. La suma de las frecuencias relativas es igual a 1. 3.5. La última frecuencia absolutas acumuladas de una serie de datos previamente

ordenados, es igual a N (tamaño de la población) n (tamaño de la muestra). 3.6. La última frecuencia relativa acumulada de una serie de datos previamente

ordenados, es igual a 1.

4. Tablas o cuadros estadísticos Las tablas o cuadros estadísticos corresponden a arreglos sistematizados de los datos en órdenes crecientes o decrecientes mediante filas y columnas. El desarrollo o la creación de una distribución cualquiera, se presentan a través de cuadros o tablas.

5. Graficas estadísticas: Son figuras que se pueden originar de los cuadros o tablas estadísticas y que sirven para visualizar mejor la información.

5.1. Diagrama de Barras: Gráfica en las cuales las marcas de clases se llevan al eje

horizontal y las frecuencias de cada clase (Preferentemente las frecuencias absolutas) al eje vertical, las cuales serán las alturas de las barras las que se dibujaran cada una separadas de las otras.

5.2. Histograma: Gráfica en las cuales las marcas de clases se llevan al eje horizontal y las frecuencias de cada clase al eje vertical, las cuales serán las alturas de rectángulos los cuales se graficarán cada uno colindante al otro. Los puntos colindantes son los límites reales de la distribución de datos agrupados, el ancho del rectángulo corresponde a la dimensión de cada Intervalo de Clase o Clase, y cuando el tamaño de estas dimensiones son constante el ancho de los rectángulos son iguales.

12

5.3. Polígono de Frecuencia: Es una gráfica formada por segmentos de líneas que partiendo del límite real inferior del primer intervalo de clase o clase va conectando los puntos formados por las intersecciones de las líneas verticales apoyadas en cada marca de clase (eje horizontal) con las líneas horizontales salidas de las frecuencias absolutas de cada intervalo de clase o clase (eje vertical), concluyendo en el límite real superior del último intervalo de clase o clase.

5.4. Polígono de Frecuencia Acumulada u Ojiva: Es una gráfica formada por segmentos de línea que conectan los puntos formados por las intersecciones de las líneas verticales apoyadas en cada marca de clase y las líneas horizontales salidas de las frecuencias acumuladas de cada intervalo de clase o clase.

5.5. Diagrama de Torta o Pastel: Es una gráfica circular donde el círculo queda repartido en parte cuyo tamaño lo define la magnitud de la frecuencia relativa expresada en tanto por ciento.

Para establecer cada parte se realiza: =360 hi; y ese valor se lleva a la parte interna

del círculo usando un transportador si la gráfica se va a realizar de manera manual. Estos son los tipos de gráficos estadísticos más usado, pero hay otros que de acuerdo al estudio realizado son recomendables tales como los: Gráficos Logarítmicos, los Gráficos Semi-logarítmicos, los Pictogramas, los Cartogramas, los Cuadrados, los Triángulos, los de Cajas, los de Sectores Circulares, los Polares, los Estereogramas, etc.

Problemas Resueltos Ejercicio Nº 01.- De manera aleatoria se toman la edad de 30 estudiantes del I. U. G. T., las cuales fueron:

21 26 18 20 20 25 26 24 28 21 21 20 23 25 25 20 20 21 21 26 20 23 21 21 18 28 23 24 20 21

Se pide: a) ¿Será muestra o población?, b) la característica asociada a esta distribución, ¿Será un parámetro o un estadístico?, c) Al ordenar estos datos en el orden que sea y construir la respectiva distribución de frecuencias, ¿Qué nivel de medición o escala de medida estamos utilizando?, d) ¿Qué tipo de variable cuantitativa se está utilizando?, e) ¿Cuántos datos y cuántas observaciones presenta esta distribución de frecuencias?, f) Elaborar la respectiva distribución de frecuencias, y determinar; número de categorías, frecuencia absoluta de la segunda categoría, frecuencia absoluta acumulada de la cuarta categoría, frecuencia relativa de la sexta categoría, frecuencia relativa acumulada de la tercera categoría y el rango de la distribución, g) Porcentajes de estudiantes que tienen una edad de 21 años o menos a 21 y porcentajes de estudiantes que tiene una edad mayor a 23

años, y h)Elaborar las gráficas de esta distribución.

Solución a) Es una muestra ya que los 30 estudiantes se están tomando de manera aleatoria de

una población que corresponde a todos los estudiantes inscritos en el I. U. G. T. b) Por ser la característica asociada a esta muestra entonces es un estadístico. c) Se utilizaría una escala de medición Ordinal y de Razón. d) Se podría considerar una Variable Cuantitativa Continua, porque las edades se podría

expresar en partes fraccionales, años, meses y días.

13

e)

Edades Xi

Cantidad fi

X1=18 X2=20 X3=21 X4=23 X5=24 X6=25 X7=26 X8=28

2 7 8 3 2 3 3 2

∑ 30

Presenta 8 datos y 30 observaciones f) Distribución de Frecuencias

Xi fi Fi hi Hi

18 2 2 0,067 0,067

20 7 9 0,233 0,300

21 8 17 0,267 0,567

23 3 20 0,100 0,667

24 2 22 0,067 0,733

25 3 25 0,100 0,833

26 3 28 0,100 0,933

28 2 30 0,067 1,000

∑ 30 1,000

Categorías= 8 f2 = 7

F4 = 20 h6 = 0,100 H3 = 0,567

R = 28-18 +1 = 11 g) Porcentajes

21 17, 30

100 21% 21

100 17% 2

30

%

1

Total de Estudiantes Edades Años Total Estudiantes

x Total de Estudiantes Edades Añosde Estudiantes con Edades Años

Total Estudiantes

xde Est

de Estudiantes con Edades

udiantes de Edades Años

21 56,67%Años

14

23 10, 30

100 21% 23

100 10% 2

30

%

3

Total de Estudiantes Edades Años Total Estudiantes

x Total de Estudiantes Edades Añosde Estudiantes con Edades Años

Total Estudiantes

xde Es

de Estudiantes con Edad

tudiantes con Edades ñ

s

s

e

A o

23 33,33%Años

h) Gráficas

Diagrama de Barras

6,67%

0%

23,33%

26,67%

0%

10,00%

6,67%

10,00%

10,00%

0%

6,67%

1 2 3 4 5 6 7 8 9 10 11

Series1 6,67% 0% 23,33 26,67 0% 10,00 6,67% 10,00 10,00 0% 6,67%

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%1

2

3

4

5

6

7

8

9

10

Gráfica de Torta o Pastel

10,00%

6,67%

10,00%

10,00%

6,67%

7%

23%

26%10%

7%

10%

10%

7%

15

Ejercicio 02.- Los siguientes datos corresponden a las ventas (En miles de bolívares) realizados por una comercial que vende materiales de oficinas en un lapso de 30 días.

30 45 19 38 18 27 45 30 31 39 15 28 20 13 22 25 48 32 15 14 33 28 49 45 17 16 42 19 47 19

Con estos datos se pide: a) Elaborar una Distribución de Frecuencias de Datos Agrupados aplicando el Método de Sturges y de ella responder: Rango, Número de Intervalos de Clases o Clases, la Amplitud de cada Clase, Límite Aparente Inferior de la Segunda Clase y Límite Aparente Superior de la Tercera Clase, Límite Real Inferior de la Quinta Clase y Límite Real Superior de la Segunda Clase, y Marca de Clase de la Cuarta Clase y b) Elaborar gráficas.

Solución

a) Distribución de Frecuencias de Datos Agrupados. Ordenación de los datos en orden creciente y estableciendo sus Frecuencias Absolutas

Datos fi Datos fi 13 14 15 16 17 18 19 20 22 25 27 28

1 1 2 1 1 1 3 1 1 1 1 2

30 31 32 33 38 39 42 45 47 48 49

2 1 1 1 1 1 1 3 1 1 1

∑ 16 ∑ 14

Aplicando el Método de Sturges.

: 1 49 13 1

( º ) 1 3,322log 1 3,322log30 5,

37

6

7

907

37( ) 6,264

5,907

M m R

NI

Rango R D D

NIC N de Intervalos deClases n

RIC Amplitud del Intervalo deCla

C

sesNIC

IC

Para inicial el Primer Intervalo se toma el IC=7 y se divide en dos partes enteras 3 y 4,

primero se toma el menor de estos dos valores y se le resta al dato menor entonces sería 13-3=10.

16

NIC XI XS LI LS Xmi fi Fi hi Hi

1 10 16 09,5 16,5 13 5 5 0,167 0,167

2 17 23 16,5 23,5 20 7 12 0,233 0,400

3 24 30 23,5 30,5 27 6 18 0,200 0,600

4 31 37 30,5 37,5 34 3 21 0,100 0,700

5 38 44 37,5 44,5 41 3 24 0,100 0,800

6 45 51 44,5 51,5 48 6 30 0,200 1,000

∑ 30 1,000 Rango: R = 37; NIC = 6; IC = 7; XI2 = 17, XS3 = 30; LI5 = 30,5; LS2 = 23,5; Xm4 = 34

b) Gráficas

Histograma

0 5

0 7

0 6

0 3

0 3

0 6

0

1

2

3

4

5

6

7

8

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

1 2 3 4 5 6

Series1

Series2

Polígono de Frecuencias

17

0

5

7

6

3

3

6

0

(9,5; 0)

(13; 5)

(20; 7)

(27; 6)

(34; 3) (41; 3)

(48; 6)

(51,5; 0)

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Ojiva

0 5

0 12

0 18

0 21

0 24

0 30

(13;5)

(20;12)

(27;18)

(34;21)

(41;24)

(48;30)

0

5

10

15

20

25

30

35

1 2 3 4 5 6

Problemas Propuesto del Título I Problema 01.- Se toma dentro de un colegio un grupo de 25 alumnos cuya edad esté comprendida entre

los 7 y 12 años para darle un juguete como regalo de navidad. La selección se hizo por un sorteo quedando los siguientes alumnos según sus edades: 9-7-12-10-9-8-7-7-11-10-9-8-9-7-8-10-12-11-11-8-7-9-10-11-12.

Se pide: a) ¿Será muestra o población?, b) la característica asociada a esta distribución, ¿Será un parámetro

o un estadístico?, c) Al ordenar estos datos en el orden que sea y construir la respectiva distribución de

frecuencias, ¿Qué nivel de medición o escala de medida estamos utilizando?, d) ¿Qué tipo de variable

cuantitativa se está utilizando?, e) ¿Cuántos datos y cuántas observaciones presenta esta distribución de

frecuencias?, f) Elaborar la respectiva distribución de frecuencias, y determinar; número de categorías, frecuencia absoluta de la segunda categoría, frecuencia absoluta acumulada de la cuarta categoría,

frecuencia relativa de la sexta categoría, frecuencia relativa acumulada de la tercera categoría y el rango de

la distribución y g) Elaborar las gráficas de esta distribución.

Problema 02.- En cada enunciado que se presenta a continuación, determinar, tipo de variable

cuantitativa: a) El sueldo de un presidente de la república está por el orden de Bs. 12.000,00, _________________;b) Un estudiante de estadística hace un estudio sobre el promedio general de las notas de

18

los estudiantes del I.U.G.T. y con siguió que éste fue de 12,8 puntos,_______________; c) En una encuesta

realizada entre 500 personas adultas se encontró que el 42% de ellos tienen armas de fuego,_______________

y d) Se probaron 50 aparatos de televisión y 4 de ellos presentaron defectos,_______________. Problema 03.- Determinar si el valor dado es un parámetro o un estadístico: a) La Asamblea Nacional

consta de 165 diputados, ________; b) Se selecciona un grupo de estudiantes y el número promedio de textos

comprados por ellos este período es de 3,8; c) El número de miembros promedio de una familia venezolana

es de 5 y d) En un estudio realizado se constató que de los 2223 pasajeros del Titanic solamente

sobrevivieron 706.

Problema 04.- Al final se presentan cinco (5) Distribuciones; señalar los tipos de variables contenida en cada una, bien sea Cuantitativa o Cualitativa: a) Distribución de alumnos por mes de nacimiento,__________;

b) Distribución de profesionales por estatura y peso,__________; c) Distribución de comerciantes por

nacionalidad,__________ d) Distribución de obreros por salarios,__________ y e) Distribución de accidentes

por causa___________.

Problema 05.- Al final se presentan cinco (5) Distribuciones, señalar que tipo de variable cuantitativa representan: a) Distribución de empleados por sueldos,__________; b) Distribución de fallecimientos por

edades,__________; c) Distribución de alumnos por número de hermanos,__________; d) Distribución de

alumnos por estatura,__________ y e) Distribución de gallinas por posturas de huevos__________.

Problema 06.- Los directivos de una fábrica de refresco están pensando lanzar al mercado un nuevo

producto. Realizada una encuesta a objeto de medir la aceptación del producto, en una muestra de 30 niños

y utilizando una escala de 0 a 10 puntos para medir el grado de aceptación; este fue el resultado obtenido:2-6-8-7-4-5-10-6-6-7-6-7-3-8-7-6-8-6-5-4-7-8-5-7-6-7-2-7-2-7. La muestra tomó 15 niñas y 15 niños, con

edades comprendidas entre los 5 y 12 años de edad, residentes en un barrio de la ciudad de Caracas. Se

pide: a) Estructurar una tabla de Distribución de Frecuencias, b) Definir, ¿Cuál es la población y cuál es la

muestra?, c) ¿Qué variables se utilizaron?, d) ¿Cuál es la variable?, e) ¿De qué tipo es la variable?, f) ¿Qué

tipo de escala se ha utilizado en la medición de la variable?, g) ¿Cuál es la Frecuencia Absoluta de la cuarta clase o categoría?, h) ¿Cuál es la Frecuencia Relativa de la segunda clase o categoría?, i) ¿Cuál es la

Frecuencia Absoluta Acumulada de la sexta clase o categoría?, j) ¿Cuál es la Frecuencia Relativa Acumulada

de la quinta clase o categoría? Y k) Elaborar la respectiva gráfica de barras y de torta o pastel.

Problema 07.- Leer el siguiente texto: “Una vez recolectados los datos en forma ordenada, es

necesario en forma tal que se facilite su comprensión y su posterior análisis y utilizaciones. Para

ello se ordenan en cuadro numéricos y luego se representan en gráficos, para variable discreta mediante diagramas de frecuencias tanto para absolutas ó relativas”. Se pide: a) Considerando a rr y

ll como letra única, formar una tabla de Distribución de Frecuencias de Datos Agrupados en Clases ó

Intervalos de Clases, tomando como base el número el número de letras que forma cada palabra, b)

Elaborar; Histograma y Polígono de Frecuencias y Ojiva.

Problema 08.- (Modelo para datos sueltos).- Un grupo de productores de maíz del Estado Guárico entrega su producción en toneladas, a una planta receptora del producto, y 20 de ellos entregaron el siguiente

tonelaje: 29 24 35 42 25 24 29 27 27 38 44 25 40 42 42 32 35 32 44 32. Se pide: a) Elaborar una tabla de distribución de frecuencias señalando; frecuencia absoluta de la quinta

categoría, frecuencia absoluta acumulada de la octava categoría , la frecuencia relativa de novena categoría

y la frecuencia relativa acumulada para la cuarta categoría. b) Calcular el porcentaje de productores que

entregaron menos de 29 toneladas, el porcentaje de los productores que entregaron 32 o más toneladas y el porcentaje de los productores que entregaron entre 27 y 35 toneladas y c) Elaborar gráficas (Barras y Torta).

Problema 09.- (Modelo para datos agrupados).-Dentro de los televidentes del país se seleccionaron 50 que

ven R.C.T.V. entre personas mayores de 18 años, a las cuales se le consultaron sus edades;

49 26 33 25 19 48 19 52 48 38

38 34 25 21 38 40 40 46 38 20 36 22 38 25 42 19 38 20 23 33

41 20 24 38 41 36 28 34 40 51

21 33 25 24 20 23 20 38 28 31.

Se pide: a) Elaborar la tabla estadística para La Distribución de Frecuencias, b) Señalar; Número de

Intervalos de Clase o Clases, amplitud o tamaño de cada Clase, Frecuencia Absoluta de la tercera Clase,

Frecuencia Absoluta Acumulada de la cuarta clase, Frecuencia Relativa de la segunda Clase, Frecuencia Relativa Acumulada de la quinta Clase, Límite Aparente Inferior de la sexta Clase, Límite Aparente Superior

de la tercera Clase, Límite Real Inferior de la segunda Clase, Límite Real Superior de cuarta Clase y la Marca

19

de Clase de la tercera Clase, c) Calcular un aproximado del número de personas que tienen menos de 28

años y el porcentaje de personas que tienen 36 o más años y d) Elaborar gráficas (Histograma, Polígono de

Frecuencias y Ojiva). Problema 10.- Se seleccionaron 30 estudiantes del I.U.G.T. de acuerdo a sus edades y luego de realizados

los cálculos, se presentaron las Marcas de Clases con sus respectivas Frecuencias Absolutas:

Xmi 18 22 26 30 34

fi 6 7 10 5 2

Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de

los Intervalos de Clases, Límite Aparente Inferior de la cuarta Clase, Límite Real Superior de la tercera Clase, Frecuencia Absoluta Acumulada de la segunda Clase y Frecuencia Relativa de la quinta Clase, b)

Elaborar gráficas, Histograma, Polígono de Frecuencias y Ojiva.

Problema 11.- El cuadro anexo al finalizar nos presenta la clasificación de un grupo de niños por estatura.

Se pide: a) Elaborar el cuadro completo de la distribución de frecuencias y determinar de ella; frecuencia

absoluta de la tercera clase, frecuencia absoluta acumulada de la cuarta clase, frecuencia relativa de la segunda clase, frecuencia relativa acumulada de la quinta clase, límite real inferior de la segunda, límite

real superior de la quinta clase y la marca de clase de la sexta clase y b) Elaborar las respectivas gráficas.

Problema 12.- Un profesor de Estadística General para instruir a sus alumnos sobre todo lo referente a la

Distribución de Frecuencias en cuanto a Datos Sueltos o No Agrupado en Intervalos de Clase, tomó las

notas de un trabajo previo al primer examen parcial las cuales fueron: 16 08 14 10 07 11 11 14 10 11

14 13 12 11 10 08 13 12 07 12. Se pide: a) Tabla de Distribución de Frecuencias y b) Elaborar gráficas de Barras y Pastel o Torta.

Problema 13.- Se da una clasificación (extraídas del último censo) de mujeres de 50 a 54 años de edad

según el número de hijos vivos:

Se pide: a) El estudio será sobre una población o una muestra, sobre qué sector se realiza el estudio sobre la

s mujeres o los niños, b) Completar la tabla de distribución de frecuencias y c) Elaborar las gráficas

respectivas.

Problema 14.- Tomadas las edades de los estudiantes del curso diurno del I.U.G.T. de Estadística

Instrumental de las carreras Recursos Humanos y Mercadeo y Publicidad, con las cuales se elaboró una distribución de frecuencias, la cual se muestra a continuación definida por sus frecuencias absolutas y

marcas de clases:

fi 5 7 10 16 10 7 5

Xmi 13 18 23 28 33 38 43

Problema 15.- A continuación se presenta número de obreros que laboran en 40 empresas de

construcción que contratan con el sector público:

53 58 63 56 53 62 95 98 83 97

56 59 64 71 84 96 102 57 76 69 57 85 93 83 68 72 79 81 80 56

Estatura

(centímetros)

Número de

niños

De 85 a 90

De 90 a 95 De 95 a100

De 100 a 105

De 105 a 110

De 110 a115

3

15 22

18

12

5

Número de hijos 0 1 2 3 4

Número de mujeres (%) 19 25 23 14 9

20

61 80 70 77 80 63 60 59 78 74

Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de

los Intervalos de Clases, Límite Aparente Inferior de la cuarta Clase, Límite Real Superior de la tercera Clase, Frecuencia Absoluta Acumulada de la segunda Clase y Frecuencia Relativa de la sexta Clase y b)

Elaborar gráficas (Histograma, Polígono de Frecuencias y Ojiva.

Problema 16.- Un productor de cítricos hizo 60 entregas de sacos de naranjas californias en el Mercado al

por Mayor de Coche, relación de entregas que se presenta a continuación, sacos entregados:

67 56 52 56 73 79 64 72 72 58 73 69 54 67 51

59 58 59 76 66 79 57 69 64 69 60 68 63 74 67 63 61 74 67 70 63 71 64 75 71 67 59 76 67 71

64 72 67 57 58 58 68 73 58 74 72 60 59 69 60

Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de

los Intervalos de Clases, Límite Aparente Inferior de la tercera Clase, Límite Real Superior de la sexta Clase,

Frecuencia Absoluta Acumulada de la cuarta Clase y Frecuencia Relativa de la segunda Clase y b) Elaborar gráficas (Histograma, Polígono de Frecuencias y Ojiva.

Problema 17.- Un matadero industrial estableció una clasificación de los frigoríficos a los cuales les

suministra sus productos, tomando como referencia el pesaje de los pedidos por mes. Luego de hacer un

estudio estadístico estableció sus Marcas de Clase con sus respectivas Frecuencias Absolutas:

Kilogramos despachados (Xmi): 216,5 256,5 296,5 336,5 376,5 416,5

Frigoríficos receptores del producto (fi) 10 15 30 25 15 05 Se pide: a) Desarrollar la Distribución de Frecuencias y señalar; Número de Intervalos de Clase, amplitud de

los Intervalos de Clases, Límite Aparente Inferior de la cuarta Clase, Límite Real Superior de la tercera

Clase, Frecuencia Absoluta Acumulada de la segunda Clase y Frecuencia Relativa de la quinta Clase y b)

Elaborar gráficas (Histograma, Polígono de Frecuencias y Ojiva.

21

TÍTULO II Capítulo 03

MEDIDAS ESTADISTICAS

Medidas de Tendencia Central Medidas Estadísticas.- Son valores obtenidos mediante metodologías de cálculos según sea el caso, que nos permite describir el comportamiento de un hecho o de un conjunto de observaciones. Las Medidas de Tendencia Central.- Son medidas estadísticas cuyos valores son promedios que se ubican hacia el centro del rango de una serie de datos previamente ordenados.

Medidas de tendencia central

1. Media Aritmética: Es una medida de tendencia central que resulta de promediar los

valores de los datos de una distribución o serie de datos; y se obtiene dividendo la suma total de los valores de los datos entre el número de observaciones que se tienen de los mismos. Es el promedio más usual, el más conocido, y el de uno de los manejos más fáciles para su cálculo.

Conjunto Tipo de Datos

POBLACION

MUESTRA

Datos No Agrupados, Sueltos o Sencillos

Datos Agrupados, Por Intervalos de Clases o Clases

Media Ponderada

Desvíos o desviaciones: Son diferencias que se presentan entre los valores de los datos y un valor fijo establecido, generalmente la media aritmética o en todo caso un valor de origen del trabajo.

1.1.1 Propiedades de la media aritmética

22

a) Todos los valores de una serie de datos participan en el cálculo de la media aritmética, la cual es única.

b) La suma de las desviaciones del valor de la cada dato respecto de la media aritmética, siempre será cero (0).

c) Si realizamos una partición en dos o más sub-muestras de una serie de datos, el valor de la media aritmética de la serie de datos será igual a la suma de las medias aritméticas ponderadas de todas las sub-muestras de la partición efectuada.

d) Si a todos los valores de los datos de la suma de datos se le suma o resta un número constante o mismo número, la media aritmética queda aumentada o disminuidas en ese mismo número.

e) Si a todos los valores de los datos de una serie de datos se le multiplica o divide por un número constante o mismo número, la media aritmética queda multiplicada o dividida por ese mismo número.

1.1.2 Desventajas de la media aritmética a) Los valores de datos extremos influyen de manera importante en el valor

de la media aritmética, distorsionándola. b) No se puede calcular en serie de datos ordenados cuyos extremos se

consideren abiertos. c) Es muy sensible a los cambios que se haga en alguno de sus valores.

1.2 Media Geométrica: Es una medida de tendencia central que resulta de promediar

fundamentalmente datos que responda a crecimientos geométricos, como tasas porcentuales, razones y tasa o índices de crecimientos. 1.2.1 Propiedades de la media geométrica.

a. En su cálculo intervienen todos los datos de la serie de datos y es única. b. El valor de la media geométrica siempre es menor que él de la media

aritmética.

1.2.2 Ventajas de la media geométrica. a) Se define rígidamente por una fórmula matemática. b) Cuando los valores ordenados de los datos responden a un crecimiento

geométrico se recomienda el uso de la media geométrica. c) Es utilizable cuando se requiere dar importancia a valores pequeños de la

variable d) Su valor es poco influenciable por los datos extremos, no siendo así con

los otros promedios conocidos. e) Su resultado puede utilizarse en trabajos estadísticos posteriores, puesto

que los promedios geométricos de varias muestras se pueden combinar para obtener el promedio global de las muestras.

1.2.3 Desventajas de la Media Geométrica.

a) La complicación para su cálculo b) Cuando en una serie de datos existe un valor nulo (0) ó negativo, la media

geométrica no se calcula; ya que no responde a la realidad de la serie datos, la cual tiene que dar algún valor promedio real positivo.

23

c) En una serie de datos los valores extremos distorsionan la media geométrica en menor cuantía que la media aritmética.

d) Es sensible a cualquier cambio en alguno de los valores de la distribución.

1.2.4 Fórmulas para su cálculo

G= 1

1 2n

nG X X X

G= 1 2

1

1 2nff f n

nG X X X

Aplicando logaritmo

Para cualquier caso: G=

Problemas Resueltos

Problema Nº 01.- De manera aleatoria se toman la edad de 30 estudiantes del I. U. G. T., las cuales fueron: Se pide: comprobar que la Media Aritmética es mayor que la Media Geométrica

Solución

Edades

Xi

Cantidad

fi

21 26 18 20 20 25 26 24 28 21 21 20 23 25 25 20 20 21 21 26 20 23 21 21 18 28 23 24 20 21

24

X1=18

X2=20 X3=21 X4=23 X5=24 X6=25 X7=26 X8=28

2

7 8 3 2 3 3 2

∑ 30

Presenta 8 datos y 30 observaciones De la Distribución de Frecuencias

Xi fi Xifi

18 2 36

20 7 140

21 8 168

23 3 69

24 2 48

25 3 75

26 3 78

28 2 56

∑ 30 670

Por ser una muestra ya que se seleccionaron 30 estudiantes de los que conforman la población estudiantil del I. U. G. T., para la Media Aritmética:

67022,33

33

0

i iX fX X

nX

Media Geométrica:

1 2

1 12 7 8 3 2 3 3 2 30

1 2 18 20 21 23 24 2 25 2,17226 28nff f nnG X X X G x x x x x Gx x

Problema N° 02.- El Director Ejecutivo de una empresa de transporte aéreo desea determinar la tasa de crecimiento promedio que se refleja en tabla anexa. Si la tasa de crecimiento promedio es menor que el promedio industrial del 10%, se asumirá una nueva campaña publicitaria. Se pide: a) Razonar, ¿Por qué es más conveniente utilizar el promedio geométrico y no el aritmético para realizar este estudio? Demostrarlo, y b) ¿Será necesaria realizar esa campaña

publicitaria?

Ingresos del Transporte Aéreo

Año Ingresos en Bolívares

1992 500.000

1993 550.000

1994 660.000

25

1995 600.000

1996 780.000

Solución

a) Como se ve en el cuadro se presenta los ingresos inter-anuales de la empresa de transporte aéreo, y por ser ingresos inter-anuales se recomienda usar el promedio geométrico, que es una de las aplicaciones naturales de la Media Geométrica.

Año Ingresos en Bolívares Incremento Anual

1992 500.000 -------

1993 550.000 1,100

1994 660.000 1,200

1995 600.000 0,909

1996 780.000 1,300

PrIngreso Año esenteIncremento Anual

Ingreso Año Anterior

Media Geométrica de los Ingresos Anuales: 1 1

4. . 1 . .2 . . 1,1 1,2 0,909 1,11,3 178n

I A n II A AG I I I G x x x G

Media Aritmética de los Ingresos Anuales:

1 2. . . .. .

1,1 11,

,2 0,909

47

1 32

,1n

I I AA I A

I I IX X X

n Hagamos una proyección año por año utilizando tanto el incremento geométrico

como el incremento aritmético.

Año Utilizando Incremento Geométrico Utilizando Incremento Aritmético

1992 500.000,00x1,1178 558.890,00 500.000,00x1,127 563.500,00

1993 558.890,00x1,1178 624.738,42 563.500,00x1,127 635.064,50

1994 624.738,42x1,1178 698.332,61 635.064,50x1,127 715.717,59

1995 698.332,61x1,1178 780.596,19 715.717,59x1,127 806.613,84

1996 780.596,19 806.613,84

De este cuadro se desprende que utilizando el incremento geométrico en la proyección hacia 1996 que fue de 780.596,19; observamos que se acerca con bastante aproximación al ingreso real del año 1996 que fue de 780.000,00; razón por la cual podemos concluir que para este tipo de estudio es más conveniente utilizar la Media Geométrica. b) Si la media de los Crecimientos Geométricos es de 1,1178 eso significa que la tasa de crecimiento industrial de la empresa de transporte aéreo estará por el orden del 11,78%, con lo cual concluimos: “Que la empresa de transporte aéreo no debe asumir una nueva campaña publicitaria por cuanto su tasa de crecimiento industrial de 11,78% es mayor que la del 10,00% crecimiento industrial que sirve de base para tomar la decisión” Problema N° 03.- Inversiones y Construcciones CONANDEL C. A., paga a sus trabajadores que laboran por hora Bs 244,20; Bs 281,20 o Bs 370,00. Hay 42 trabajadores para trabajar por hora; 20 de los cuales recibirán el pago de Bs 244,20; 16 recibirán pago de Bs 281,20 y 6 recibirán el pago de 370,00. ¿Cuál es el pago promedio por hora que se le cancelan a los 42 trabajadores?

Solución

26

Este problema se puede calcular empleando la fórmula de Media Aritmética Ponderada, donde el número de trabajadores cumplen el rol de ponderación y el pago por hora la variable.

20 244,20 16 281,20 6 370,00

20 16 6276,27i i

p p

i

p

X p x x xX X

pX

Problema N° 04.-Para construir una escuela en el poblado capital de una parroquia venezolana, se requiere conocer la posible población escolar para el año 2015. La información que se tiene estima que el 3% del total de la población del país tiene entre los 7 y 12 años inclusive, y además el número de habitantes de ese poblado durante los últimos cinco años y que se muestra en tabla al final. ¿Cuál sería la población escolar estimada de

ese poblado hacia el 2015?

Año 2007 2008 2009 2010 2011

Población (miles de Hs.) 9,821 10,202 10,389 10,501 10,792

Solución

Para un crecimiento poblacional la fórmula sería: Re

. .

AñodeEstimación Añode ferencia

E R C PP P G

Y la de los crecimientos poblacionales: . .Población Año Presente

C PPoblación Año Anterior

Operación 1

10,202. .

9,821C P 2

10,389. .

10,202C P 3

10,501. .

10,389C P

4

10,792. .

10,501C P

C. Poblacional 1,039

1,018 1,011 1,028

1 1

4. . 1 2 3 4 . . . .. . . . . . . . 1,039 1,018 1,011 1,0202 41, 8 C P

NC P C PG C P C P C P C P G x x Gx

2015 2011 4

2015 2011 . . 2015 201510,792 1, 110 .86624C P PP P G P x

Población Escolar para el Año 2015 2015 2015

3 11.866. .

100. . 356P E

xP E

Capítulo 04

MEDIDAS DE POSICION O DE UBICACIÓN

1. Medidas de Posición

Son medidas estadísticas cuyo cómputo se ubican en cualquier lugar del rango originado por los valores de la serie de datos, como la moda o el modo que depende a

27

de la mayor frecuencia absoluta, y otros, los fractiles, determinados a partir de patrones pre-establecidos que responden a valores porcentuales especificados. Modo o Moda (Mo) Medidas de posición Mediana (Md) Cuartiles (Qi) Fractiles Deciles (Di)

Centiles o Percentiles (Pi)

1.1. Modo o Moda: Es el valor del dato que más se repite, es decir el valor del dato que presenta, el mayor número de observaciones o la mayor frecuencia absoluta en el caso de datos sueltos, simples o no agrupados. De acuerdo a este concepto pueden existir series de datos multimodales, ya que puede darse el caso de series de datos con más de un modo, es decir el modo no necesariamente puede ser único. Para datos agrupados se obtiene de una fórmula, donde la mayor frecuencia absoluta define el intervalo donde debe encontrarse el modo. Esta Frecuencia Absoluta, la

conoceremos como Frecuencia Absoluta Modal f

1.1.1. Su cálculo: a) Para serie de datos sueltos o no agrupados, la definición nos da

su valor y b) Para datos agrupados

1

1 2

xI

q ICM L

q q

= Limite real inferior del intervalo de clase o clase donde se ubica la frecuencia

modal.

= –

of = frecuencia modal

= frecuencia anterior a la frecuencia modal

= frecuencia posterior a la frecuencia modal

Propiedad de la Moda o Modo Por depender para su obtención siempre de la mayor frecuencia absoluta tanto en Datos No Agrupados como en Datos Agrupado, su cálculo se hace sencillo Ventajas del Modo o Moda a) Es un concepto de muy fácil manejo para su calculo b) Los valores extremos no la afectan c) Cuando una distribución es muy asimétrica, se observa que el modo es el

dato más representativo de la serie d) Si la diferencia entre el valor del Modo y el valor de la Media Aritmética es muy

significativo, es preferible utilizar el Modo, para el estudio que se realiza.

28

e) En series polimodales, el modo permite dividir la serie con fines de estratificación

f) Algunos profesionales de la estadística consideran a la moda o modo como la mejor medida de posición.

Desventajas del Modo o Moda

a) En una serie de datos agrupados su valor no es muy preciso, por lo tanto no es confiable, y se hace algo complicado su cálculo

b) En una serie de datos agrupados, su valor depende de cómo se estructuren los intervalos de clase o clase.

c) El Modo es muy inestable en el muestreo d) El Modo no puede ser usado en procesos algebraicos posteriores. e) El Modo no es sensible a cambios de valores de la serie de datos, a menos que

esos cambios afecten su propio valor. f) No es recomendable usar el Modo en la variable continua cuando la amplitud

de los intervalos no son constantes. 1.2. Fractiles: Son medidas de posición que se ubican en cualquier parte o lugar del

rango originado por los valores de los datos de la serie, luego de ordenados, y atendiendo a fraccionamiento de este rango con patrones porcentuales pre-establecidos. Si se fracciona en dos partes iguales, el punto medio es la mediana (50%); si es en cuatro partes iguales (Cada uno de 25%), los puntos de cada cuarto es el cuartil; si es en diez partes iguales (Cada 10%); el punto de cada decimo es el decil; y si es en cien partes iguales (Cada 1%), el punto de cada centésimo es el centil o percentil. Estas medidas se utilizan para las series de Datos No Agrupados que presentan muchas categorías, o en Datos Agrupados que presentan muchos intervalos de clases o clases, cuando se quieren obtener promedios en una parte de la serie o en la distribución de esos datos.

1.2.1. Mediana: Es el valor del punto medio de los valores de una serie de datos

previamente ordenados en orden creciente o decreciente. 1.2.1.1. Propiedades de la Mediana:

a) Se ubica en todo el medio de la recta originada por el rango de los valores de la serie de datos y es única.

b) Cuando las desviaciones se toman respecto a la Mediana, la suma de sus valores absolutos toman un valor mínimo.

1.2.1.2. Ventajas de la Mediana

a) Es un concepto fácil de manejar para su cálculo

b) Los valore extremos no influyen para su calculo c) Se puede obtener en series abiertas de datos d) Sustituye a la media aritmética en series abiertas de datos. e) Por ubicarse en la mitad del rango de una serie de datos, se presentan

situaciones en las cuales la es única medida estadística que se puede calcular.

f) A pesar que tiene menos estabilidad en el muestreo que la Media Aritmética, es más estable que otras medidas estadísticas.

1.2.1.3. Desventajas de la Mediana a) No es tan conocida como la Media Aritmética.

29

b) Para obtenerla es requisito indispensable ordenar los datos por lo general en orden creciente, o en orden decreciente según sea el caso.

c) La Mediana obtenida directamente de la totalidad de los datos, no es la misma, si divida la serie de datos en grupos y obtener medianas de esos grupos al buscar por esa vía la Mediana de la serie no es la misma.

d) La Mediana no es sensible a cambios de datos que puedan producirse en la serie de datos.

1.2.2. Calculo de los fractiles.

1.2.2.1. Datos no agrupados o sueltos 1.2.2.1.1. Formula General para obtener el lugar donde se ubica el fractil en

una serie de datos.

Número de observaciones

iP = Percentil deseado.

De esta fórmula general se obtiene el resto de las fórmulas para obtener los lugares de la serie de datos donde se ubican el resto de los fractiles

Lugar del valor del percentil buscado

1.2.2.1.2. Fórmula para obtener el fractil luego de ubicado su lugar en la serie de

dato

.int. .int .int.. .i m M mD p d D D

.int.

.int.

;

;

;

. .

i

m

M

Fractil a calcular

D Dato menor delos valores entrelos cuales seubica la posición del fractil acalcular

D Dato mayor delos valores entrelos cuales seubica la posición del fractil acalcular

p d Parte decimal del valor que seobtuvo al obtener la posición dela serie de datos donde

seubica el fractil a calcular

1.2.2.2. Datos agrupados

30

1.2.2.2.1. Fórmulas para obtener los fractiles de manera directa en Datos Agrupados

100i i aa

i

IC iNPercentiles P L F

f

10i i aa

i

IC iNDeciles D L F

f

4i i aa

i

IC iNCuartiles Q L F

f

2D i aa

i

IC NMediana M L F

f

= Frecuencia absoluta acumulada anterior

= índice del fractil a calcular.

1.2.2.2.2. Fórmulas para obtener el porcentaje de cualquier número de observaciones que sean menores o mayores que cualquier dato ubicado en algún intervalo de la distribución.

100% .

% . 100 % .

iaa I

fdeobs D F D L

IC N

deobs D deobs D

D Datoque setomacomoreferencia paracalcular el porcentaje

Problemas Resueltos Problema 01.- De manera aleatoria se seleccionan las notas de 7 estudiantes de Estadística Instrumental del I. U. G. T., las cuales resultaron ser: 12 10 09 10 15 11 08 Se pide obtener: la Media Aritmética, la Media Geométrica, el Modo o Moda, la Mediana, el tercer Cuartil, sexto Decil y el Percentil 43. Número de datos Impares

12 7

8 9 2 10 11 12 15:

710,714

10: 8 9 10 11 12 15 ,510

xMedia Aritmética X

Media Geométrica G x x x x Gx

X

Para obtener el resto de la Medidas Estadísticas que son de posición lo primero que hacemos es ordenar los datos generalmente en orden creciente salvo que se diga lo contrario y se le asigna el respectivo lugar en la serie.

01 02 03 04 05 06 07 08 09 10 10 11 12 14

31

3

43

6

3

6 6

:

7 1: 4

2

3 7 13: 6

4

10

10 4

12 6

103 7 1

6: 4,8 10 0,8 11 1 ,805

4343:

o

DD

M El dato que más se repite

M Dato queocupa el lugar dela serie

Q Da

Modo

Mediana L M

Cuartil L to queocupa el lugaQ

Decil L D D

Percentil L P

r dela serie

D

43 43

7 13,44 10 0,44 10 10

10010PP

Si agregamos un nuevo dato, supongamos 16, entonces el número de datos serán impares

12 8

8 9 2 10 11 111,380

11

2 15

,0

16:

8

: 8 9 10 11 12 15 616 8

xMedia Aritmética X

Media Geométri

X

ca G x x x x x x G

Para obtener el resto de la Medidas Estadísticas que son de posición lo primero que hacemos es ordenar los datos generalmente en orden creciente salvo que se diga lo contrario y se le asigna el respectivo lugar en la serie.

01 02 03 04 05 06 07 08 08 09 10 10 11 12 14 16

3 3

6 6

43

6

43

3

:

8 1: 4,5 10 0,5 11 10

2

3 8 13: 6,75 1

10

10,5

13,5

11

2 0,75 14 124

3 8 16: 5,4 11 0,4 12 11

5

43 8 143: 3,87 10

1 0

,

0

4

D DD

oModo

Mediana L M M

Cuartil L Q Q

Decil L D D

Percen

M El dato que más se repite

M

Q

D

til L P P 430,87 10 10 10P

Problema 02.- Los siguientes datos corresponden a las ventas (En miles de bolívares) realizados por una comercial que vende materiales de oficinas en un lapso de 30 días. Se pide calcular: a) el Modo, la Mediana, Cuartil 1 y Cuartil 3, Decil 1 y Decil 9, y Percentil 83 y b) Porcentaje de valore que sean menores que el Modo de la distribución y mayores que 40

32

NIC LI LS fi Fi

1 09,5 16,5 5 5

2 16,5 23,5 7 12

3 23,5 30,5 6 18

4 30,5 37,5 3 21

5 37,5 44,5 3 24

6 44,5 51,5 6 30

30

Solución

a)

2 7: 16,5 21,1 7

16

2o o

xo M MM do

7: 23,5 15 12

627,000D DMedian Ma L M

3 1

71: 16,5 7,5 5

719,000Cuart Qil Q

3 3

73: 37,5 22,5 21

341,000Cuart Qil Q

1 6

71: 9,5 3 0

513,7D cil D De

9 6

79: 44,5 27 24

648,000DDecil D

8 63

783: 44,5 24,9 24

644,55,7Percent Dil P

b)

7 100% . 21,167 16,5 21,167 16,5

7 30

3 100% . 40 21,5 40 37,5

7 30

% . 40

% . 21,167 70,56%

% . 40 75,24%

% . 40 24100 75 6, 4 72 , %

o odeobs M

deobs D

deobs D

deobs M

deobs D

deobs D

Capítulo 05

Medidas de Desviación o de Dispersión 1. Medidas de Dispersión: Son medidas estadística que determinan, como se agrupan o

se alejan los datos alrededor de un promedio.

33

Desvío Medio (Dµ, Dx) Desvíos Desvío Mediano (DMd) Varianza (σ2, S2) y Desviación Estándar (σ, S) Medidas de Dispersión Rango propiamente dicho (R) de Desviación Rangos Rango Intercuartílico ( RQ ) Desvío o Amplitud Semi-intercuartílica (AQ) Rango Interdecílico (RD)

1.1.- Rango: Es la medida de dispersión que mide la oscilación o recorrido en una serie de datos desde el dato de menor valor al dato de mayor valor inclusive

R= DM – Dm + 1

1.2.- Desvío medio: Es la medida de dispersión que se determina a través de la media aritmética de los valores absolutos de los desvíos respecto a la media aritmética.

Conjunto Tipo de Datos

Población

Muestra

No Agrupados, Sueltos o Sencillos

i iX fD

N

i i

X

X X fD

n

Agrupados o Por Intervalos de Clases o Clases

mi iX fD

N

i i

X

X X fD

n

1.3.- Desvío Mediano: Es la medida de dispersión que se determina a través de la media aritmética de los valores absolutos de los desvíos respecto a la mediana.

Tipo de Datos Fórmula Datos No Agrupados, sueltos o

Sencillos d

i d i

M

i

X M fD

f

Datos Agrupados, Por Intervalos de Clases o Clases

d

mi d i

M

i

X M fD

f

34

1.4.- Varianza y Desviación Estándar o Típica: Son medidas de dispersión que

describe la cantidad de variación en una distribución de frecuencia o serie de datos. La desviación estándar o típica siempre será la raíz cuadrada de la Varianza poblacional o muestral de datos no agrupados o agrupados

Desviación Estándar o Típica: 2 2; ;En Población y en Muestra S S

1.5.- Rango Intercuartílico: Es la medida de dispersión que mide la oscilación o

recorrido en una serie de datos desde el Cuartil uno hasta el Cuartil tres.

1.6.- Desviación o Amplitud semi-Intercuartílica: Es la medida de dispersión que

toma como valor la mitad del Rango Intercuartílico.

1.7.- Rango Interdecílico: Es la medida de dispersión que mide la oscilación o

recorrido en una serie de datos desde el decil uno al Decil Nueve.

; RD = P90 – P10

Problemas Resueltos Problema 01.- De manera aleatoria se seleccionan las notas de 7 estudiantes de Estadística Instrumental del I. U. G. T., las cuales resultaron ser: 12 10 09 10 14 11 08

Conjunto Tipo de Datos

Población

Muestra

No Agrupados, Sueltos o Sencillos

2

2

2 22

22 2

i i

i i

i i

X f

N

X f N

N

X f

N

2

2

2 22

1

1

i i

i i

X X fS

n

X f NS

n

Agrupados o Por Intervalos de Clases o Clases

2

2

2 22

22 2

mi i

mi i

mi i

X f

N

X f N

N

X f

N

2

2

2 22

1

1

i i

mi i

Xm X fS

n

X f NS

n

35

Se pide obtener: la Varianza y la Desviación Estándar

22

2

22

2

2

8 9 2 10 11 12 15:

7

835 7 10,714:

1 6

64 81 200 121 144 225 835

: 5,2

10,714

5,245

2,295 04

i i

i i

xMedia Aritmética X

X f nXLa Varianza Muestral S

n

X f

La Desviación Estándar Muestral S

X

S

SS

Problema 02.- Los siguientes datos corresponden a las ventas mensuales (En miles de bolívares) realizados por una comercial que vende materiales de oficinas.

Se pide calcular: a) La Varianza y la Desviación Estándar o Típica, b) El Rango Intercuartílico y el Rango Interdecílico, y c) La Desviación o Amplitud Semi-intercuartílica.

Solución

NIC LI LS fi Fi Xmi Xmifi Xmi2fi

1 09,5 16,5 5 5 13 65 845

2 16,5 23,5 7 12 20 140 2800

3 23,5 30,5 6 18 27 162 4374

4 30,5 37,5 3 21 34 102 3468

5 37,5 44,5 3 24 41 123 5043

6 44,5 51,5 6 30 48 288 13824

30 880 30354

a) La Varianza.

880

39 3

02 ,33

2 2 230.35429,3 151,37533

30

La Desviación Estándar.

151,375 12,304

b) Rango Intercuartílico.

3 1

71: 16,5 7,5 5

719,000Cuart Qil Q

3 3

73: 37,5 22,5 21

341,000Cuart Qil Q

41 19 22D DR R

Rango Interdecílico.

1 6

71: 9,5 3 0

513,7D cil D De ;

9 6

79: 44,5 27 24

648,000DDecil D

36

48,000 13 34,3,7 DD RR

c) Desviación o Amplitud Semi-Intercuartílica

19

29,5Q QA A

Capítulo 06

Análisis de la curva originada por el Polígono de Frecuencias de una

Distribución de Frecuencias de Clases 1. Para el análisis de la curva originada por el polígono de frecuencias, se debe observar

su comportamiento hacia los lados (comportamiento lateral), así como también su comportamiento hacia su parte superior (comportamiento de agudeza o apuntamiento). 1.1 Análisis de simetría: Analiza el comportamiento lateral de la curva originada por

un Polígono de Frecuencias y se apoya en los coeficientes de asimetría de Pearson.

1 1

2 2

33

3 2

: , ; ,

3( ) 3( )mod : , ; ,

: . . , ; , ;

o o

d d

ii

M X MEn Distribuciones Modales Población CA Muestra ca

S

M X MEn Distribuciones Bi ales Población CA Muestra ca

S

X XXo por la fórmula del Sesgo D S Población Sg Muestra Sg

N ns3

3

3 2. . , ; ,

mimiX XX

D A Población Sg Muestra SgN ns

Una curva será simétrica o normal; cuando la media aritmética, la mediana y modo o moda sean iguales, la curva presenta una forma de campana. Una curva será asimétrica si presenta sesgo a los lados. Si sesga a la derecha, presenta asimetría o sesgo positivo, es decir

o Sg > 0. Esto ocurre cuando: la media aritmética es mayor

que la mediana. Si sesga a la izquierda, presenta asimetría o sesgo negativo, es decir

o Sg < 0. Esto ocurre cuando: la media es menor que la

mediana. 1.2 Análisis de la agudeza o el apuntamiento: Analiza la curva observando su

comportamiento hacia la parte superior; y para realizar el análisis nos apoyaremos en el coeficiente de Kurtosis.

K= ; =

37

Una curva será: a) Puntiaguda o Leptocúrtica si K>0,263 b) Normal o Mesocúrtica si K = 0,263 c) Achatada o Platicúrtica si K < 0,263

Problemas Resueltos Problema 01.- Los siguientes datos corresponden a las ventas mensuales (En miles de bolívares) realizados por una comercial que vende materiales de oficinas. Se pide calcular: analizar la curva originada por el Polígono de Frecuencias.

Solución En cálculos anteriores se obtuvo que:

29,333; 21,167; 12,304; 34,3 9,5o D QM R y A

Asimetría o Sesgo:

1 1

29,333 21,167

12,300 4 0

4,66CACA

Agudeza o Apuntamiento:

0,277 0,269,5

34,33K K

Conclusión: “La curva originada por el Polígono de Frecuencias de esta distribución presenta Asimetría Positiva ya que CA1 = 0,664 > 0, por lo tanto sesga a la derecha; y además es Puntiaguda o Leptocúrtica por cuanto K = 0,277 > 0,263” Problema 02.- La Distribución de Frecuencias anexa al final nos presenta el ingreso diario que paga la empresa “Constructora Mayor, C. A.” (MAYORCA) a sus trabajadores, tanto empleados administrativos como obreros. Se pide determinar: a) Ingreso diario a cancelar por la empresa antes del aumento a los trabajadores distribuido en el 40% central del total de ellos, b) El presupuesto anual original y el presupuesto modificado si los dueños de la empresa conceden un aumento de manera lineal del 15% a sus trabajadores, c) Diagramar el Histograma y el Polígono de Frecuencias de esta distribución y d) Analizar el comportamiento de la curva que origina el Polígono de Frecuencias.

Ingresos Diarios (Bs.)

Número de Trabajadores

150 200 6

200 250 8

250 300 20

300 350 12

350 400 4

Solución a) Si la parte central de la recta de los datos originada por el Rango representa el 40% de

ella, tanto la parte derecha como la parte izquierda de esa recta representan parte

iguales es decir: 100 40

302

; Ingreso Mínimo = P30 por lo que Ingreso Máximo =P70

30 30 70 70

50 50250 15 14 252,5; 300 35 34 304,167

20 12P P P P

38

N° de Trab. Con Ingresos < 252,50 = 14 +0,025x50 = 15,25 y N° de Trab. Con Ingresos < 304,167 = 34 + 0,04167x50 = 36,08. N° de Trab. en el 40% del sector central = (36,08 – 15,25) = aproximadamente 21 Ingreso Diario Sector Central = 21µ implica que: I. D. S. C= 21x275 = 6.775

b) 13.750

27550

Pr sup 365 50 365 50 275

sup od : ´ 0,15

275 0,15 275 316,25

Pr sup 365 50 ' 365 50 316,2

. . 5.018750 var

. . 5.775

e uesto Original

Para el Pre uesto M ificado la nueva Media Aritmética sería

e uesto Modific

P O Bolí es

P Mado 1.562,50

NIC LI LS Xmi fi Fi Xmifi Xmi2fi

1 150 200 175 6 6 1050 183750

2 200 250 225 8 14 1800 405000

3 250 300 275 20 34 5500 1512500

4 300 350 325 12 46 3900 1267500

5 350 400 375 4 50 1500 562500

50 13750 3931250

c) Histograma

0

5

10

15

20

Polígono de Frecuencias

39

0

5

10

15

20

25

d) Análisis de la curva originada por el Polígono de Frecuencias

2 2

3 1

9

12 50275; 250 280;

12 8

3.931.250275 3.000 3.000 54,772

50

275 280. .

54,7

12 3 50 8 1 50300 34 300,84; 200 6 201,04;

50 4 50 4

. . 0,0 0

3

91

00

o oM M

C A

Q Q

D

C A

9

12 9 50 6 1 5034 302,64; 150 0 150,60

50 4 50 4

300,84 201,040,327

2 302,64 150,60,32

07

D

K K

Conclusión: “La curva originada por el Polígono de Frecuencias de esta distribución de datos presenta Asimetría Negativa por cuanto CA1=-0,091<0, por lo tanto sesga a la Izquierda, y además por ser K=0,327>0,263 la curva es Puntiaguda o Leptocúrtica”

40

RESUMEN DE LAS FORMULAS DE LAS

MEDIDAS ESTADISTICAS 1.- Media Aritmética

Conjunto Tipo de Datos

POBLACION

MUESTRA

Datos No Agrupados, Sueltos o Sencillos

Datos Agrupados, Por Intervalos de Clases o Clases

Media Ponderada

2.- Media Geométrica

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos

1 2 1 2

1

1 2 1 2

1

1 2 1 2n n

n nn n

f ff f f fn nn n

G X X X X X X

G X X X X X X

Datos Agrupados, Por Intervalo de Clase o

Clases 1 2 1 2

1

1 2 1 2

1

1 2 1 2n n

n nm m mn m m mn

f ff f f fn nm m mn m m mn

G X X X X X X

G X X X X X X

3.- Modo

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos

Se toma definición del Modo o Moda como base para obtenerlo. No necesariamente es el hay un solo modo.

Datos Agrupados, Por Intervalo de Clase o Clases

1

1 2

1 2

, :

;o o

o I o

o Anterior a f o Siguientea f

q ICM L f Frecuencia Modal

q q

q f f q f f

4.- Mediana

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos . . .

: 0,5 1

. .

. .

d

d Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición

d

Obtención dela posición dela Mediana L M n

M D p d D D

p d Parte decimal del cálculo de L M

41

Datos Agrupados, Por Intervalo de Clase o Clases

2d I aa

i

IC NM L F

f

5.- Cuartil 01:

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos

1

1 . . .

1

01: 0,25 1

. .

. .

Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición

Obtención dela posición del Cuartil L Q n

Q D p d D D

p d Parte decimal del cálculo de L Q

Datos Agrupados, Por Intervalo de Clase o Clases

14

I aa

i

IC NQ L F

f

6.- Cuartil 03

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos 3 . . .

3

03: 0,75 1

. .

. .

d

Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición

Obtención dela posición del Cuartil L M n

Q D p d D D

p d Parte decimal del cálculo de L Q

Datos Agrupados, Por Intervalo de Clase o Clases

3

3

4I aa

i

IC NQ L F

f

7.- Decil 01

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos

1

1 . . .

1

01: 0,10 1

. .

. .

Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición

Obtención dela posición del Decil L D n

D D p d D D

p d Parte decimal del cálculo de L D

Datos Agrupados, Por Intervalo de Clase o Clases

110

I aa

i

IC ND L F

f

8.- Decil 09

42

TIPOS DE DATOS FÓRMULAS

Datos No Agrupados, Sueltos o sencillos

1

9 . . .

9

09 : 0,90 1

. .

. .

Menor del Int de Posición Mayor del Int de Posición Menor del Int de Posición

Obtención dela posición del Decil L D n

D D p d D D

p d Parte decimal del cálculo de L D

Datos Agrupados, Por Intervalo de Clase o Clases

9

9

10I aa

i

IC ND L F

f

9.- Fórmula para obtener el fractil luego de ubicado su lugar en una serie de Datos No Agrupados

.int. .int .int.. .i m M mD p d D D

.int.

.int.

;

;

;

. .

i

m

M

Fractil a calcular

D Dato menor delos valores entrelos cuales seubica la posición del fractil acalcular

D Dato mayor delos valores entrelos cuales seubica la posición del fractil acalcular

p d Parte decimal del valor que seobtuvo al obtener la posición dela serie de datos donde

seubica el fractil a calcular

10.- Obtención de porcentaje de valores de una Distribución de Frecuencias en Datos Agrupados por Intervalos de Clases o Clases

100% .

% . 100 % .

iaa I

fdeobs D F D L

IC N

deobs D deobs D

D Datoque setomacomoreferencia paracalcular el porcentaje

11.- Rango

1R Dato Mayor Dato Menor

12.- Desviación Media o Desvío Medio

43

Conjunto

Tipo de Datos

Población

Muestra

No Agrupados, Sueltos o Sencillos

i iX fD

N

i i

X

X X fD

n

Agrupados o Por Intervalos de Clases o Clases

mi iX fD

N

i i

X

X X fD

n

13.- Desviación Mediana o Desvío Mediano

Tipo de Datos Fórmula Datos No Agrupados, sueltos o

Sencillos d

i d i

M

i

X M fD

f

Datos Agrupados, Por Intervalos de Clases o Clases

d

mi d i

M

i

X M fD

f

14.- La Varianza

Conjunto Tipo de Datos

Población

Muestra

No Agrupados, Sueltos o Sencillos

2

2

2 22

22 2

i i

i i

i i

X f

N

X f N

N

X f

N

2

2

2 22

1

1

i i

i i

X X fS

n

X f NS

n

Agrupados o Por Intervalos de Clases o Clases

2

2

2 22

22 2

mi i

mi i

mi i

X f

N

X f N

N

X f

N

2

2

2 22

1

1

i i

mi i

Xm X fS

n

X f NS

n

44

15.- Desviación Estándar o Típica

2 2; ;En Población y en Muestra S S

16.- Rango Intercuartílico

17.- Desviación o Amplitud Semi – intercuartilica

18.- Rango Interdecílico

; RD = P90 – P10

DEFORMACION Y APUNTAMIENTO O AGUDEZA DE LA CURVA ORIGINADA POR EL

POLIGONO DE FRECUENCI Deformaciones laterales o sesgos: Coeficiente de Asimetría.

1 1

2 2

3

3

: , ; ,

3( ) 3( )mod : , ; ,

. : , ; ,

o o

d d

ii

M X MEn Distribuciones Modales Población CA Muestra ca

S

M X MEn Distribuciones Bi ales Población CA Muestra ca

S

X XXo por la fórmula del Sesgo D Sueltos Población Sg Muestra Sg

N

3

2

33

3 2

;

. : , ; ,mimi

ns

X XXD Agrupados Población Sg Muestra Sg

N ns

Xmi

> 0 (+) = 0 0 (-)

Sg > 0 (+) Sg = 0 (+) Sg < 0 (+)

> 0 (+) = 0 0 (-)

Asimetría Positiva Simétrica o normal Asimetría Negativa Sesgo a la derecha Sesgo a la izquierda

45

Apuntamiento o agudeza Coeficiente de Kurtosis

K ; K ; K ; K

Puntiaguda o Leptocúrtica K > 0,263 Normal o Mesocúrtica K = 0,263 0,263 Achatada o Platicúrtica K < 0263

Xmi

Problemas propuestos para los Capítulos tratados en el Título II

Problema 01.- Los directivos de una fábrica de refresco están pensando lanzar al mercado un nuevo

producto. Realizada una encuesta a objeto de medir la aceptación del producto, en una muestra de 30 niños y utilizando una escala de 0 a 10 puntos para medir el grado de aceptación; este fue el resultado

obtenido:2-6-8-7-4-5-10-6-6-7-6-7-3-8-7-6-8-6-5-4-7-8-5-7-6-7-2-7-2-7. La muestra tomó 15 niñas y

15 niños, con edades comprendidas entre los 5 y 12 años de edad, residentes en un barrio de la

ciudad de Caracas. Se pide: a) Estructurar una tabla de Distribución de Frecuencias y b) Calcular;

media aritmética, mediana, modo, cuartil uno y tres, decil uno y nueve, el percentil 42, la varianza y la

desviación estándar o típica Problema 02.- Leer el siguiente texto: “Una vez recolectados los datos en forma ordenada, es

necesario en forma tal que se facilite su comprensión y su posterior análisis y utilizaciones.

Para ello se ordenan en cuadro numéricos y luego se representan en gráficos, para variable

discreta mediante diagramas de frecuencias tanto para absolutas ó relativas”. Se pide: a)

Considerando a rr y ll como letra única, formar una tabla de Distribución de Frecuencias de Datos Agrupados en Clases ó Intervalos de Clases, tomando como base el número el número de letras que

forma cada palabra y b) Analizar la curva originada por el Polígono de Frecuencias. Problema 03.- (Modelo para datos sueltos).- Un grupo de productores de maíz del Estado Guárico

entrega su producción en toneladas, a una planta receptora del producto, y 20 de ellos entregaron el

siguiente tonelaje: 29 24 35 42 25 24 29 27 27 38 44 25 40 42 42 32 35 32 44 32.

Se pide: a) Elaborar una tabla de distribución de frecuencias. b) Calcular el porcentaje de productores que entregaron menos de 29 toneladas y el porcentaje de los productores que entregaron 32 o más

toneladas c) Calcular las medidas estadísticas más importantes de tendencia central, de posición y de

dispersión.

Problema 04.- (Modelo para datos agrupados).-Dentro de los televidentes del país se seleccionaron 50 que ven R.C.T.V. entre personas mayores de 18 años, a las cuales se le consultaron sus edades;

49 26 33 25 19 48 19 52 48 38

38 34 25 21 38 40 40 46 38 20

36 22 38 25 42 19 38 20 23 33

46

41 20 24 38 41 36 28 34 40 51

21 33 25 24 20 23 20 38 28 31.

Se pide: a) Elaborar la tabla estadística para La Distribución de Frecuencias, b) Calcular un

aproximado del número de personas que tienen menos de 28 años y el porcentaje de personas que

tienen 36 o más años, c) Calcular las medidas estadísticas más importantes de Tendencia Central, de

Posición y de Dispersión y f) Estudiar la curva originada por el Polígono de Frecuencias.

Problema 05.- Se seleccionaron 30 estudiantes del I.U.G.T. de acuerdo a sus edades y luego de realizados los cálculos, se presentaron las Marcas de Clases con sus respectivas Frecuencias

Absolutas:

Xmi 18 22 26 30 34

fi 6 7 10 5 2

Se pide: a) Calcular las Medidas Estadísticas y b) Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el Polígono de Frecuencias.

Problema 06.- Un profesor de Estadística General para instruir a sus alumnos sobre todo lo

referente a la Distribución de Frecuencias en cuanto a Datos Sueltos o No Agrupado en Intervalos de

Clase, tomó las notas de un trabajo previo al primer examen parcial las cuales fueron: 16 08 14 10

07 11 11 14 10 11 14 13 12 11 10 08 13 12 07 12.Se pide: a) Tabla de Distribución de Frecuencias y b) Calcular las medidas de Tendencia Central, las medidas de Posición y las medidas

más usuales de Dispersión

Problema 07.- La tabla que se presenta anexa, representa los salarios diarios cancelados por una

empresa constructora a sus obreros. Se pide; A.- Determinar: a) Salario máximo y mínimo entre los cuales se encuentra 40% central de la cantidad de obreros de la empresa, b) El salario diario que

comprende el 50% de la cantidad de obreros de la empresa, c) El porcentaje de la cantidad de obreros

con salarios inferiores al Modo y el número de obreros con salarios superiores a la Media Aritmética de

la Distribución de Frecuencias representada por la Tabla Estadística, d) El presupuesto anual original

y el presupuesto anual modificado luego que los dueños de la empresa concedieran un aumento diario

del 10% sobre los salarios de los obreros; y B.- Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el Polígono de Frecuencias, trazando un esbozo de misma sobre el

Histograma o Polígono de Frecuencias elaborados.

Ingresos

Diarios

Número

de Obreros

20 30

30 40

40 50

50 60

60 70

70 80 80 90

50

60

80

100

60

40 10

Total 400

Problema 08.- Obtenidas las Marcas de Clases de una Distribución de Frecuencias tomadas de la vida

de unas 40 baterías de automóviles, las cuales se presentan al final, se pide: a) Porcentajes del

número de baterías tomadas que son inferiores a la Media Aritmética y el número de las mismas que

son superiores al Modo, b) Límites entre los cuales se ubican el 50% y el 28% central de las baterías según su vida útil y c) Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva

originada por el Polígono de Frecuencias trazando un esbozo de misma.

Años de vida útil (Xmi): 1,7 2,2 2,7 3,2 3,7 4,2 4,7

47

Número de baterías (fi): 2 1 4 10 15 5 3

Problema 09.- Una línea aérea a través de su departamento de control estadístico lleva una relación del número de pasajeros que se movilizaron durante los últimos 40 días entre Maiquetía y Maracaibo,

Distribución de Frecuencias la cual originó las Marcas de Clases que se presentan al final; se pide: a)

Porcentajes del número de pasajeros movilizados que son superiores a la Media Aritmética y el número

de las mismos que son inferiores al Modo, b) Límites entre los cuales se ubican el 30%y central de los

pasajeros movilizados durante los 40 días y c) Analizar el comportamiento lateral y el apuntamiento o

agudeza de la curva originada por el Polígono de Frecuencias trazando un esbozo de misma.

Movimiento de Pasajeros (Xmi): 56,5 64,5 72,5 80,5 88,5 96,5 104,5

Día en que se hizo el estudio (fi): 11 6 6 10 1 5 1

Problema 10.- A continuación se presenta número de obreros que laboran en 40 empresas de construcción que contratan con el sector público:

53 58 63 56 53 62 95 98 83 97

56 59 64 71 84 96 102 57 76 69

57 85 93 83 68 72 79 81 80 56

61 80 70 77 80 63 60 59 78 74

Se pide: a) Desarrollar la Distribución de Frecuencias y señalar, b) Calcular las Medidas Estadísticas

más usuales y c) Analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada

por el Polígono de Frecuencias.

Problema 11.- Un productor de cítricos hizo 60 entregas de sacos de naranjas californias en el

Mercado al por Mayor de Coche, relación de entregas que se presenta a continuación por sacos

entregados:

67 56 52 56 73 79 64 72 72 58 73 69 54 67 51 59 58 59 76 66 79 57 69 64 69 60 68 63 74 67

63 61 74 67 70 63 71 64 75 71 67 59 76 67 71

64 72 67 57 58 58 68 73 58 74 72 60 59 69 60

Se pide: a) Desarrollar la Distribución de Frecuencias y b) Calcular las Medidas Estadísticas para analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el Polígono

de Frecuencias, dar la conclusión de este análisis.

Problema 12.- Un matadero industrial estableció una clasificación de los frigoríficos a los cuales les

suministra sus productos, tomando como referencia el pesaje de los pedidos por mes. Luego de hacer

un estudio estadístico estableció sus Marcas de Clase con sus respectivas Frecuencias Absolutas:

Kilogramos despachados (Xmi): 216,5 256,5 296,5 336,5 376,5 416,5

Frigoríficos receptores del producto (fi) 10 15 30 25 15 05

Se pide: a) Desarrollar la Distribución de Frecuencias y b) Calcular las Medidas Estadísticas y con éstas analizar el comportamiento lateral y el apuntamiento o agudeza de la curva originada por el

Polígono de Frecuencias y dar la conclusión.

Problema 13.- Los estudiantes Pedro Pérez, Zulgrey González y Jenny Rodríguez hacen tres consultas

diferentes a un profesor de Estadísticas: a) Pedro Pérez, entrega al profesor las ponderaciones y las

notas obtenidas en los cinco exámenes parciales en la materia consultada, quiere saber si aprueba la

materia, b) Zulgrey González quiere saber cuánto debe obtener en el último examen parcial para aprobar con 12 puntos la materia consultada y c) Jenny Rodríguez, llegó a un acuerdo con el profesor

48

de la materia sometida a consulta para presentar al final del período el segundo examen parcial, y

quiere saber cuánto debe obtener en ese parcial para aprobarla. Dadas ponderaciones y notas de cada

uno de esos estudiantes se pide dar respuestas a sus interrogantes:

Pedro

Pérez

Zulgrey González

Jenny Rodríguez

Problema 14.- Los datos que se presentan al final, representan las exportaciones de determinado

producto en toneladas métricas (T.M.) en un lapso de 30 días: 5 6 5 8 9 9 7 6 4 3 2 1 6 5 4 8 9 3 2 2 5 4 6 7 1 2 8 9 7 6. Se pide: a) Agrupar los datos, b) Obtener la Media Aritmética y la

Mediana c) Calcular el porcentaje de días con exportaciones superiores a 3 T. M. y con exportaciones

inferiores a 6 T. M. y con exportaciones que estén entre 4 a 8 T. M. y c) Analizar el comportamiento

lateral y el apuntamiento o agudeza de la curva originada por el Polígono de Frecuencias

Problema 15.- Una empresa textilera posee 20 empleados los cuales se beneficiarán del Decreto Gubernamental que establece un aumento lineal del 10%. El Departamento de personal lleva una

relación de los ingresos mensuales de sus empleados los cuales se presentan en cuadro final. ¿Cuánto

recurso tendría que disponer la empresa en un año para satisfacer este aumento?, ¿cuánto sería el

presupuesto anual original y cuánto sería el presupuesto nuevo presupuesto modificado?

Ingresos Número de Mensuales Empleados

1.500-2.000 2

2.000-2.500 3

2.500-3.000 10

3.000-3.500 2 3.500-4.000 3

Problema 16.- Se dispone de los índices de precios del consumidor del área metropolitana de Caracas.

Si se pretende obtener un índice de precios promedio: a) Razonando su respuestas, ¿qué Medida

Estadística utilizaría? Y b) Determinarla.

Año: 1.977 1.978 1.979 1.980 1.981 1.982

Índice General 160,7 172,2 193,4 235,4 273,1 300,2

Problema 17.- El Profesor Scott tomó el promedio de sus cursos de Estadísticas del I. U.G T. el cual

dio como resultado 13 puntos. Él desea saber, ¿Cuál es el promedio de sus cursos de Estadística Instrumental, si conoce los promedios de las notas de sus estudiantes de Estadística I, Estadística II y

Estadística General (Ver cuadro)

Materia: Estadística I Estadística II Estadística Inst. Estadística Gral.

Estudiantes: 40 20 138 42

Promedios: 11 08 X 16

Problema 18.- Se observa un determinado déficit de viviendas para el año 2.010. Si se asume que el

25% de las familias demanda vivienda, y partiendo de la base que cada familia está formada por un

Parcial 01 02 03 04

Pond. 3/10 7/25 11/50 1/5

Nota 07 12 07 13

Parcial 01 02 03 04

Pond. 3/10 7/25 11/5 1/5

Nota 08 11 12 X

Parcial 01 02 03 04

Pond. 3/10 7/25 11/5 1/5

Nota 06 X 12 10

49

promedio de 6 miembros. Se pide determinar el déficit de viviendas para el año 2.010, si los datos

interanuales fueran los que se presentan en tabla anexa.

Año: 1.998 1.999 2.000 2.001 2.002 2.003

Población (Millones de habitantes): 19,7 19,9 20,4 20,8 21,6 22,2

Problema 19.- Se tiene pensado construir una edificación para una Unidad Educativa en Guayabal,

estado Guárico en el año 2.012. Las poblaciones estimadas se presentan al final. El porcentaje de

menores de edad que van de los 7 a los 13 años se conoce que es del 3%. De acuerdo a la norma cada aula debe tener una capacidad útil para 50 alumnos. ¿Cuántas aulas debe tener la edificación a

construir?

Años: 2.001 2.002 2.003 2.004 2.005 2.006

Población (Miles de habitantes): 10,1 10,3 10,6 10,9 11,5 11,9

Problema 20.- Una empresa de comida rápida desea determinarla tasa de crecimiento promedio en los

ingresos con base a las cifras dadas en la tabla anexa. Si la tasa de crecimiento promedio es menor

que el promedio industrial del 10%, entonces se realizará una campaña publicitaria para mejorar los

ingresos, ¿cuál será la decisión?

Año: 1.992 1.993 1.994 1.995 1.996

Ingresos: 1,10 1,13 1,18 1,23 1,48

Problema 21.- La recuperación de la inversión obtenida por una empresa de construcción durante

cuatro años fue: 30%, 20%, -40%, y 200%. ¿Cuál es la tasa media geométrica de recuperación?

Problema 22.- En el año 1.998 la población del Municipio Mellado se estimó en 38.000 y en el año 2.004 en 44.000. ¿Cuál será el aumento medio geométrico anual para el período?

Problema 23.-Una empresa grande de equipos deportivos está probando el efecto de dos publicitarios

planes sobre ventas en los primeros cuatro meses del año. Dadas las ventas que se ven en el cuadro

anexo; ¿cuál programa de publicidad parece producir el crecimiento promedio más alto en ventas

mensuales?

Mes Plan 1 Plan 2

Enero

Febrero

Marzo

Abril

5.251,05

6.293,70

7.141,05

10.810,80

14.915,25

15.878,00

17.258.85

17.605,50

Problema 25.- El Director Ejecutivo de una empresa de transporte aéreo desea determinar la tasa de

crecimiento promedio en los ingresos anuales en base a la información que se refleja en tabla anexa. Si la tasa promedio es menor al promedio industrial del 10% se asumirá una nueva campaña

publicitaria. Se pide: a) ¿Será necesaria una nueva campaña publicitaria?, b) Razonar ¿por qué? se

utiliza el promedio geométrico para este tipo de estudio comparándolo con el crecimiento aritmético.

Año Ingresos

(Bs)

1.992

1.993 1.994

1.995

1.996

500.000

550.000 660.000

600.000

780.000

Problema 26.- Dada las siguiente distribución de frecuencias de las notas tomadas de 01 a 40

a80obtenidas por 80 estudiantes de un liceo de Caracas, según se muestra en tabla anexa, se pide

responder: a) Porcentaje y número de estudiantes por encima de la mediana, b) Porcentaje y número

50

de estudiantes inferiores a la media aritmética, c) Las calificaciones entre las cuales se encuentra el

50% de la parte central de la distribución y d) Analizar la curva originada por el polígono de frecuencia

y comprobar con esbozo de la misma que el análisis se corresponde.

Xi XI XS fi Xi XI XS fi 1 01 04 4 6 21 24 15

2 05 08 7 7 25 28 12

3 09 12 9 8 29 32 6

4 13 16 10 9 33 36 2

5 17 20 14 10 37 40 1

51

TÍTULO III

Capítulo 07

ESTUDIO DE LAS PROBABILIDADES

Introducción.- Los orígenes en la utilización de las matemáticas para obtener una valoración de las probabilidades se remontan al siglo XVI. Fueron aplicaciones relacionadas básicamente con los juegos de azar. Los jugadores en la búsqueda de obtener ganancias utilizaron la experiencia en cuanto a llevar una secuencia de los resultados de los juegos de azar para desarrollar una estrategia que los ayudara en la realización de sus apuestas. Actualmente con el avance de las tecnologías sobre todo en el campo de la computación, se simplifica el trabajo en cuanto a la verificación de resultados tomando en cuenta una relación histórica de los mismos y que son utilizados para realizar predicciones o pronósticos de los posibles resultados en los sorteos de loterías, en casinos, carreras de caballo y en los deportes organizados. Sin embargo la dinámica actual ha impuesto que el uso de la probabilidad vaya más allá de los juegos de azar. En estos tiempos, los gobiernos, las empresas particulares y diversas organizaciones profesionales y sin fines de lucro utilizan la Teoría de la Probabilidad en su cotidiano proceso en la toma de decisiones. Cuando las instituciones como las mencionadas anteriormente recurren al uso de las probabilidades indica la existencia de algún elemento aleatorio o de incertidumbre relativa o no a la ocurrencia de algún evento futuro. En muchos por no decir todos lo casos, es imposible predecir qué sucederá, pero es posible establece lo que podría pasar. Sin embargo combinando el conocimiento, el instinto, la experiencia y llevando una relación histórica de la ocurrencia de determinados eventos, con frecuencia se podría aseverar cuan probable puede darse un suceso en el futuro. En consecuencia las probabilidades se presentan como una valiosa herramientas, muy útiles en el desarrollo de estrategias para ponerlas en práctica en el logro de fines y objetivos. Nuestro estudio nos llevará en todos los casos posible a desarrollar toda una teoría de análisis apoyada fundamentalmente en nuestros conocimientos matemáticos para tener la capacidad de cuantificar cuan probable es determinado evento. En este capítulo presentaremos unas series de definiciones, teoremas, reglas e instrumentos de apoyos útiles para obtener la valoración de las probabilidades. 1.- Definiciones Fundamentales

1.1.- Probabilidad: Es la posibilidad o viabilidad numérica medida entre cero y uno inclusive, de que ocurra un evento de manera relativa.

Interpretación y comentario: Puede ser interpretado como algo indefinible, pero utilizado para expresar, de algún modo, un grado de creencia que se tiene de la ocurrencia de un suceso o evento; evento que puede suceder con base en la experiencia que se tenga de la ocurrencia de uno similar en el pasado, o en base de la consecuencia de un experimento en particular. Por lo tanto las probabilidades se usan para expresar cuan probable es determinado evento.

52

Cuando la probabilidad es igual a uno (1) es una probabilidad de certeza absoluta; ejemplo, ¿Cuál es la probabilidad de que alguna persona muera? Cuando la probabilidad es igual a cero (0) es una probabilidad de imposibilidad absoluta; ejemplo, ¿Cuál es la probabilidad de que alguna persona atraviese nadando el océano atlántico? De toda la literatura desarrollada anteriormente podemos asumir la definición de los siguientes conceptos:

1.2.- Evento, Suceso o punto muestral: Es el conjunto de uno o más resultados de un experimento. Existen eventos simples o elementales, los cuales se especifican con una sola característica y eventos compuestos los cuales resultan de combinar dos o más eventos simples o elementales.

1.3.- Resultado: Es la consecuencia de un experimento en particular, es decir es la

respuesta a alguna prueba.

1.4.- Experimento o Prueba: Es el proceso que lleva a la ocurrencia de uno y solo uno de varias observaciones posibles.

1.5.- Experimento Aleatorio: Es un fenómeno empírico, caracterizado por la propiedad de que observado bajo determinado conjunto de condiciones idénticas no siempre arroja el mismo resultado. Propiedades: a) Se efectúa de acuerdo a un conjunto bien definido de supuestos, b) Es repetitivo y c) El resultado de cada repetición depende del azar; es decir no es posible predecir con certeza un resultado en particular.

1.6.- Espacio Muestral: Es el conjunto de todos los resultados posibles de un

experimento o muestra y lo designaremos por S. 1.7.- Espacio o Conjunto de Probabilidades: Es el conjunto de todas las

probabilidades posibles de un espacio muestral particular originado por un experimento, y lo designaremos por SP. De esta definición se desprende que SP siempre será igual a uno ( SP = 1)

1.8.- Resultados Posibles: Es la suma de todos los resultados de eventos que

pueden derivarse de un Espacio Muestral (EP0).

1.9.- Resultado Probable o Favorable: Son resultados que se derivan de la ocurrencia de eventos favorables en particular y que forman parte de un Espacio Muestral (EFA).

2.- Modelos para estudiar las probabilidades :

Modelo Objetivo Probabilidades Clásicas

Modelos Probabilidades Empíricas o Relativas Modelo Subjetivo 2.1 .- Modelo Objetivo: Establece un proceso para estudiar el cálculo de

probabilidades a través de experimentaciones con resultados reales y tangibles o tomando y llevando un control histórico de experiencias en la ocurrencia de

53

eventos en el tiempo para aplicarla a la ocurrencia de eventos similares en el presente. 2.1.1.- Enfoque Clásico o Teórico de la Probabilidad: Se obtiene el valor de la

probabilidad basándose en la suposición de que los resultados de un

experimento son igualmente probable.

EFEP E

EPO

EFA: Evento Favorable en el Experimento. EPO: Evento Posible

2.1.2.- Enfoque Empírico o Relativo de la Probabilidad: Se obtiene el valor de

la probabilidad basándose en la realización de experimentaciones

indefinidamente repetibles desde el punto de vista teórico, de manera tal, que

en la práctica cotidiana se pueda pensar que los resultados obtenidos en un

número grande de repeticiones, den una buena aproximación a los resultados

que se obtendrían en las indefinidas repeticiones, dentro de las cuales se

podría considerar la ocurrencia del evento en consideración y que presente

cierta similitud en las mismas condiciones a los eventos estudiados en esas

experimentaciones

EFOP E

ETO

EFO: Eventos Favorables Observados. ETO: Eventos Totales Observados

2.2 Modelo Subjetivo: Se sustenta en la evaluación personal de la posibilidad de que ocurra un evento, basados en la experiencia y las intuiciones

3.- Posibilidades.- Las posibilidades y las probabilidades están estrechamente vinculadas, pero no son lo mismo. Muchas veces se toma a las posibilidades como otra forma de expresar probabilidades. Sin embargo existe una diferencia; mientras las posibilidades comparan el número de eventos favorables con el número de eventos no favorables, las probabilidades comparan el número de eventos favorables con el número total de eventos posibles. En consecuencia definiremos a la Posibilidad a favor de un evento, a la razón del número de eventos favorables entre el número de eventos no favorables.

4.- Algunos eventos y sus respectivas probabilidades: 4.1.- Eventos Independientes: Son eventos en los cuales la ocurrencia o no

ocurrencia de ellos no tiene ningún efecto en la ocurrencia del otro o de los otros. 4.2.- Eventos Dependientes: Son eventos los cuales deben su ocurrencia a que

previamente haya ocurrido otro u otros. 4.3.- Evento Complementario: Son aquellos eventos que de no ocurrir; los otros si

deben ocurrir. 4.4.- Eventos Mutuamente excluyentes: Son eventos que al ocurrir da como

consecuencia que ninguno de los otros eventos ocurran en ese mismo experimento. 4.5.- Eventos Colectivamente exhaustivos: Por lo menos uno de los eventos de un

espacio muestral debe ocurrir al realizarse un experimento. 4.6.- Probabilidad a Priori: Se considera como la probabilidad inicial basada en un

nivel de información actual.

54

4.7.- Probabilidad a Posteriori: Se considera como una probabilidad revisada en base a información adicional.

4.8.- Probabilidad Conjunta: Es la probabilidad que mide la posibilidad de que dos o más eventos ocurran al mismo tiempo (Eventos no mutuamente excluyentes)

4.9.- Probabilidad Condicional: Es la probabilidad cuya ocurrencia depende a que previamente haya ocurrido otro evento (Eventos dependientes)

4.10.- Probabilidad Complementaria: Es la probabilidad que se obtiene restando a la unidad la ocurrencia del evento contrario.

5.- Axiomas de las probabilidades 5.1.- Las probabilidades no pueden ser mayor a 1 ni menor que 0 (No puede ser

negativa) si se expresa en tanto por 1. Si fuera en tanto por 100, no sería ni mayor a 100 ni menor a 0 (No ha probabilidad negativa)

0 ≤ P(E) ≤ 1 ó 0 ≤ P(E ) ≤ 100

5.2.- La suma de las probabilidades de los eventos posibles (Mutuamente Excluyentes y Colectivamente Exhaustivo) de un espacio muestra siempre será 1.

P(E1)+P(E2)+………+P(En)= S = 1 6.- Instrumentos Matemáticos de apoyo para el cálculo de Probabilidades

6.1.- Técnicas de conteo: Pudiendo contar todos los eventos posibles y

determinando a través de ciertos mecanismos el número de veces de la ocurrencia de algún evento, podemos determinar probabilidades en su enfoque clásico (A priori) a través de técnicas muy sencillas enriquecidas con la teoría combinatoria, que nos crea las técnicas del conteo.

6.1.1- Principio de la multiplicación: Las maneras posibles de llegar a un resultado final partiendo de un punto inicial, transitando por caminos diferentes y teniendo otros posibles puntos intermedios. En otras palabras si una tarea consta de pasos distinto y otra también, no siendo ambas excluyentes, sino que se da la posibilidad de realizarlas juntas o en sucesión entonces el total de pasos distintos o manera en que puedan concretarse es de:

EPO= a∙b.c……

Ejemplo 01.- Se tiene que la placa de un vehículo consta de dos letra y cuatro números. Calcular la cantidad total de autos diferente que se podrían emplacar. Datos: Letra del alfabeto español 25 (Desechando la ll y la ñ) Número de dígitos 10.

Desarrollo: EPO= 25.25.10.10.10.10=6.250.000 Ejemplo 02.- Un juego de barajas españolas tiene 40 naipes. Si extraemos cinco cartas sucesivamente cinco sin reposición; ¿Cuántos serían los eventos posibles? Datos: Los 40 naipes de las barajas españolas

Desarrollo: EPO=40.39.38.37.36=78.960.960

55

6.1.2- Principio del exponente: Se puede considerar como un caso especial del principio de la multiplicación y se da cuando existen más de una tarea de pasos iguales pudiendo las otras tareas presentar las mismas condiciones. Se puede considerar como una tarea a un instrumento de experimentación y los pasos el número de eventos que en si pueda posea ese instrumento de experimentación. Un dado se puede considerar como una tarea y cada una de sus caras los pasos a dar, así mismo sucedería con una moneda. Los eventos posibles se obtienen tomando como la base exponencial el número de pasos o eventos que presenta el instrumento de experimentación o tarea y como exponente el número de instrumentos de experimentación o tareas utilizados en el experimento aleatorio.

P nE O b

Ejemplo 01.- Se tiene que la placa de un vehículo consta de dos letra y cuatro números. Calcular la cantidad total de autos diferente que se podrían emplacar. Datos: Letra del alfabeto español 25 (Desechando la ll y la ñ) Número de dígitos 10.

Desarrollo: 2 4P 25 10 6.250.000E O

Ejemplo 02.- Un juego de barajas españolas tiene 40 naipes. Si extraemos sucesivamente cinco cartas con reposición; ¿Cuántos serían los eventos posibles? Datos: Los 40 naipes de las barajas españolas

Desarrollo: 5P 40 102.400.000E O

Ejemplo 03.- Una moneda se lanza cinco veces o en su defecto se lanzan cinco monedas Calcular los eventos posible para este experimento. Datos: Los 5 lanzamientos de las monedas o el lanzamiento de cinco monedas

Desarrollo: 5P 2 32E O

Ejemplo 04.- Un dado se lanza tres veces o en su defecto se lanzan tres dados calibrados. ¿Cuántos serían los eventos posibles? Datos: Los 3 lanzamientos de un dado o en su defecto tres dados calibrados

Desarrollo: 3P 6 216E O

Ejemplo 05.- Una moneda se lanza cinco veces o en su defecto se lanzan cinco monedas y un dado se lanza tres veces o en su defecto se lanzan tres dados calibrados. ¿Cuántos serían los eventos posibles? Datos: Los 5 lanzamientos de las monedas o el lanzamiento de cinco monedas y los 3 lanzamientos de un dado o en su defecto tres dados calibrados

Desarrollo: 5 3P 2 6 6.912E O

6.1.3- Permutaciones absolutas: Es una forma de arreglar u ordenar a la totalidad de

los elementos de un conjunto en posiciones previamente jerarquizadas. Se señala que es absoluta si las posiciones jerarquizadas coinciden con el número de elementos que se disponen para ser posicionadas u ocupadas.

P ! 1 2 3 ....... 2 1E O nPn n n n n

56

n=Número de elementos y número de posiciones jerarquizadas

n!=Número factorial

Axioma: 0! =1!= 1 Ejemplo 01.- Un automóvil solo tiene lugar para cinco pasajero incluyendo al chofer. Suponer que cinco amigos van a realizar un viaje y utilizarán el automóvil ¿De cuántas maneras se podrán ubicar los amigos si: a) Cualquiera de ellos pueden conducir? Y b) Sólo uno de los cinco puede conducir? Datos: Cinco lugares a ocupar y cinco amigos

Desarrollo: a) 5 5P 5! 5 4 3 2 1 120E O P

b) Al solo poder conducir uno de los amigos queda libre solo 4 lugares de asiento los cuatro amigos que no pueden conducir

4 4P 4! 4 3 2 1 24E O P

Ejemplo 02.- Se tiene un torneo de bolas criollas donde participan cuatro equipos. ¿De cuántas maneras pueden quedar las posiciones finales del torneo? Datos: Los equipos de bolas criollas y las cuatro posiciones del torneo

Desarrollo: 4 4P 4! 4 3 2 1 24E O P

6.1.4- Permutaciones Relativas o Variaciones: Es una forma de arreglar u ordenar

una parte preestablecidas de los elementos que componen un conjunto en posiciones previamente jerarquizadas. Se señala que es relativa si las posiciones jerarquizadas son menores al el número de elementos que se disponen para ser posicionadas u ocupadas.

!

Pr!

nEPO n

n r

n= totalidad de elementos

r = Posiciones jerarquizadas.

Ejemplo 01.- Un automóvil solo tiene lugar para cinco pasajero incluyendo al chofer. Suponer que siete amigos van a realizar un viaje y utilizarán el automóvil, se quedarán dos amigos pues todos no pueden ir ¿De cuántas maneras se podrán ubicar los amigos si: a) Cualquiera de ellos pueden conducir? Y b) Sólo uno de los siete puede conducir? Datos: Cinco lugares a ocupar y siete amigos

Desarrollo:

a) 7 5

7! 7 6 5 4 3 2 1P 7 6 5 4 3 2.520

7 5 ! 2 1E O P

b) Al solo poder conducir uno de los amigos queda libre solo 4 lugares de asiento los cuatro amigos que no pueden conducir

57

6 4

7! 6 5 4 3 2 1P 6 5 4 3 360

6 4 ! 2 1E O P

Ejemplo 02.- Se tiene un torneo de bolas criollas donde participan ocho equipos y solo se premiaran los equipos que ocupen la cuatro primeras posiciones. ¿De cuántas maneras pueden optar los equipos las cuatro primeras posiciones del torneo? Datos: Los equipos de bolas criollas y las cuatro posiciones del torneo Desarrollo:

8 4

8! 8 7 6 5 4 3 2 1P 8 7 6 5 1.680

8 4 ! 4 3 2 1E O P

6.1.5- Permutaciones con repetición: Es una forma de arreglar u ordenar una parte preestablecidas de los elementos que componen un conjunto en posiciones previamente jerarquizadas. Se señala que es con repetición si las posiciones jerarquizadas son mayores al el número de elementos que se disponen para ser posicionadas u ocupadas.

nEPO rRn r

Ejemplo 01.-Un jugador de basquetbol tiene cuatro balones para encestarlo en dos canastas. ¿De cuántas maneras pueden lo puede hacer? Datos: Los 4 balones y las 2 canastas

Desarrollo: 4

2 4P 2 16E O R

Ejemplo 02.-Una persona requiere realizar 7 llamadas telefónicas y dispone para ello de 3 celulares. ¿De cuántas maneras puede hacer las llamadas? Datos: Los 4 balones y las 2 canastas

Desarrollo: 7

3 7P 3 2.187E O R

6.1.6- Permutaciones indistinguibles: En ocasiones se presentan operaciones de permutaciones entre los cuales hay algunos elementos que, si bien son objetivamente diferentes, para loe efectos prácticos se pueden considerar iguales o idénticos. Este tipo de elementos se le conoce con el nombre de indistinguibles.

1 2. ......

1 2

!P

! ! .......kn n n

k

nEPO n

n n n

Ejemplo 01.- ¿De cuántas maneras es posible dividir un conjunto de 6 elementos en 2 subconjuntos que contengan respectivamente 4 y 2 de esos elementos?

58

Datos: Un conjunto de seis elementos y dos subconjuntos uno de 4 y otro de 2 de

esos elementos

Desarrollo: 6 4 2

6! 6 5 4 3 2 1 6 5P 15

4! 2! 4 3 2 1 2 1 2 1EPO

Ejemplo 02.-A una conferencia a realizarse en la ciudad capital de una organización benéfica la delegación de una de las provincias de un país cualquiera está integrada por 9 delegados a los cuales les asignas 3 habitaciones las cuales tienen 4, 3 y 2 camas respectivamente. ¿De cuántas maneras se podrán acomodar los integrantes de la delegación provincial? Datos: 9 delegados, 4, 3 y 2 camas

Desarrollo:

9 4 3 2

9! 9 8 7 6 5 4 3 2 1 9 8 7 6 5P 1.260

4! 3! 2! 4 3 2 1 3 2 1 2 1 3 2 1 2 1EPO

6.1.7- Combinaciones: Son arreglos de los elementos de un conjunto sin importar el

orden en que se dispongan, ya que no existen posiciones preestablecidas jerarquizadas y evitando que cada arreglo de las partes hagan igualdades.

!

r! !

nEPO nC

n r r

Propiedades de las combinaciones:

0 1 1) 1; ) ; ) ) 1n n n n nn

a b n c n y d

Ejemplo .- En un recipiente se introducen 6 bolitas azules, 7 blancas y 5 coloradas. Si se extraen en un solo puño 4 bolitas: a) ¿De cuántas maneras posibles se pueden arreglar las bolitas?, b) Maneras de que sean todas azules?, c) Todas blancas?, d) Todas coloradas? y e) Dos azules y dos blancas? Datos: 18 bolitas, 6 azules, 7 blancas y 5 coloradas

Desarrollo:

a) 18 4

18!3.060

18 4 ! 4!EPO C

b) 6 4

6!15

6 4 ! 4!Azules

EFE C

c) 7 4

7!35

7 4 ! 4!Blancas

EFE C

d) 5 4

5!5

5 4 ! 4!Coloradas

EFE C

59

e)

6 2 7 22 2

6! 7!15 21 315

6 4 ! 4! 7 4 ! 4!

Azules y BlancasEFE C C

6.2.- Reglas de la probabilidad

6.2.1.- Reglas de la Adición o Suma: Matemáticamente se define como la unión

de conjunto y gramaticalmente con la conjunción disyuntiva “o”.

6.2.1.1.- Regla General de la Adición o Suma: Aplica para eventos no

mutuamente excluyentes. Este tipo de eventos da origen a la probabilidad

conjunta, siendo ésta la probabilidad que se estudia cuando dos o más

eventos pueden ocurrir a la vez.

P (A U B)

= P (A) + P (B) – P (A y B)

P (A o B)

P (A U BUC)

= P (A) + P (B)+P(C) – P (A y B)-P(A y C)-P(B y C)+P(A y B y C)

P (A o B o C)

Ejemplo 01.- Un grupo de estudiantes se reúnen en una refresquería para conversar sobre los exámenes, un 22% consume una bebida refrescante de “Flor de Jamaica”, un 32% consume “Papelón con Limón” y un 13% consume ambas bebidas refrescantes. Si se elige uno de esos estudiantes de manera aleatoria; ¿Cuál será la probabilidad de que consuma la bebida refrescante “Flor de Jamaica” o “Papelón con Limón” Datos: El 22% toma “Flor de Jamaica”, el 32% toma “Papelón con Limón y el 13% ambas bebidas refrescantes. Desarrollo: Para identificar al evento “Flor de Jamaica” le asignamos la letra A y al evento “Papelón con Limón” la letra B

P (A)=0,22; P (B)=0,32; P (A∩B)=P (A y B)=0,13. (Probabilidad Conjunta)

P (A o B)=0,22+0,32-0,13 P (A o B)=0,41

Explicación.- La Interjección Disyuntiva “o” nos induce a interpretar el problema para aplicar una de las Reglas de la Suma, y al observar el vocablo “ambos” que establece la comunidad entre los dos eventos para dar origen a la Probabilidad Conjunta, concluiríamos en que es la Regla General de la Suma.

“Ambos” P(A∩B)=P(A y B);

“Ya sea……o” P(AUB)=P(A o B)

60

Interpretación gráfica del problema apoyándonos en un Diagrama de Venn

9% 13% 19%

Ejemplo 02.-Se realizó una encuesta entre mil ciudadanos seleccionados aleatoriamente para determinar cuáles son los centros comerciales más visitados en el área metropolitana, dando los siguientes resultados: 516 persona visitan el Centro Comercial A, 452 el Centro Comercial B y 393 el Centro Comercial C. Es posible que los entrevistados visiten otros centros comerciales, en este sentido se verificó que 182 visitan a los centros comerciales A y B, 148 a los centros comerciales A y C, 166 a los centros comerciales B y C y 74 visitan los tres centros comerciales. Si de manera aleatoria seleccionamos uno de los ciudadanos que fueron encuestados en este estudio;¿Cuál será la probabilidad de que visite al centro comercial A, al B, al C; al A y B, al A y C, al B y C o a todos los centros comercial? Datos: Visitas: A=516, B=452, C=393, (A y B)=182, (A y C)=166, (B y C)=166 y 74 a todos los centros comerciales

Desarrollo:

Siendo EPO=1.000, entonces las probabilidades de los eventos simples y conjuntos serían: P(A)=0,516; P(B)=0,452; P(C)=0,393; P(A y B)=0,182; P(A y C)=0,148; P(B y C)=0,166 y P(A y B y C)=0,074

P (A o B o C)=0516+0,452+0,393-0,182-0,148-0,166+0,074

P (AUBUC)=0,9390

Pap. con

Limon

61

Interpretación gráfica del problema apoyándonos en un Diagrama de Venn

A∩B=182 B∩C=166 A∩B∩C=74 A∩C=148

6.2.1.2.- Regla Especial de la Adición o Suma: Aplica para eventos

mutuamente excluyentes.

P (A U B)

= P (A) + P (B)

P (A o B)

P (A U BUC)

= P (A) + P (B) + P(C)

P (A o B o C)

Ejemplo.- En un recipiente se introducen 6 bolitas azules, 7 blancas, 5 coloradas y 8 doradas. Si se extrae una bolitas; ¿Cuál será la probabilidad de que: a) Sea azul o colorada?, b) Blanca o dorada?, c) Azul, blanca o dorada? y d) Colorada y dorada? Datos: 26 bolitas, 6 azules, 7 blancas, 5 coloradas y 8 doradas

Desarrollo:

26 1 26n rEPO . Cada grupo de bolitas representa un evento por lo

que: Bolitas Azules evento A, bolitas Blancas evento B, bolitas Coloradas evento C y bolitas Doradas D. Apoyándonos en el enfoque clásico de las

probabilidades donde ( ) EFEP EEPO

definimos cada una de las

probabilidades del Espacio Muestral de este experimente por lo tanto: P(A)=3/13; P(B)=7/26; P(C)=5/26 y P(D)=4/15. Sin entrar en extensas explicaciones, a las claras observamos que son eventos mutuamente excluyentes en una operación inducida por la conjunción disyuntiva “o”, por lo tanto se aplica la Regla Especial de la Suma.

a) 11

0,3 5

13 242

631

26P AC CP A o

62

b) 15

0,7 4

26 157

369

26P BD DP B o

c) 3 7 4

13 26 1

210,8077

23 6P Ao BP DA o B D

d) 0P CD DP C y Probabilidad imposible ya que no existe

una bolita que contenga en si misma el color colorado y el color dorado, a eso es a lo que nos induce la conjunción copulativa “y” es un vocablo inclusivo.

Probabilidad Complementaria.- Para que exista alguna Probabilidad Complementaria los eventos tienen que ser mutuamente excluyentes

pudiéndose considerar como un caso particular de la Regla Especial de la Suma, su expresión matemática sería:

1 ( );

" "

C

C

P E P E

Donde P E es la probabilidad del complemento de E

Supongamos que en el ejemplo anterior se nos incluya las preguntas: e) Colorada y f) Ninguna azul.

e) 21

1 ( ) 1 15

0,19232626

CP C P CP C P A B D

f) 3

1 ( ) 11

100

133,7692P P B C DB oC o D P A

Interpretación gráfica del problema apoyándonos en un Diagrama de Venn, como se puede observar no hay elementos comunes entre ninguno de los eventos, es decir

no hay intercepciones.

63

6.2.2.- Reglas de la Multiplicación: Matemáticamente se define como la intersección de conjuntos y gramaticalmente por la conjunción copulativa “y”.

6.2.2.1.- Regla General de la Multiplicación: Aplica para eventos dependientes. Este tipo de eventos son la consecuencia para que se produzcan las Probabilidades Condicionales las cuales por su importancia se le dedicará especial estudio.

P (A ∩ B)

= P(A) x P (B/A)

P (A y B)

P (A ∩ B∩C)

= CBP A P PA B

A

P (A y B y C)

Ejemplo.- En un recipiente se introducen 6 bolitas azules, 7 blancas, 5 coloradas y 8 doradas. Si se extraen tres bolitas una a una y sin reemplazo; ¿Cuál será la probabilidad de que en cada extracción las bolitas salgan de la siguiente manera: a) Azul, blanca y colorada?, b) Blanca, dorada y azul?, c) Azul, blanca y dorada?, d) Colorada, colorada y dorada? Y f) Azul, azul, y azul Datos: 26 bolitas, 6 azules, 7 blancas, 5 coloradas y 8 doradas

Desarrollo:

a) 6 7 5

26 25 20,013

45

CBP AA B

CP A

BA

BA

A

b) 7

0,0215325

7 8 6

26 25 24

ADP BB D

AP B

DB B

DB

c) 7

0,0135520

6 7 8

26 25 24

DBP AA B

DP A

BA A

BA

d) 2

0,0103195

5 4 8

26 25 24

DCP CC C

DP C

CC C

CC

e) 1

0,0077130

6 5 4

26 25 24

AAP AA A

AP A

AA A

AA

64

6.2.2.2.- Regla especial de la multiplicación: Aplica para eventos

independientes

P (A ∩ B)

= P(A) x P (B)

P (A y B)

P (A ∩ B∩C)

= P A P B P C

P (A y B y C)

Ejemplo 01.- En un recipiente se introducen 6 bolitas azules, 7 blancas, 5 coloradas y 8 doradas. Si se extraen tres bolitas una a una y con

reemplazo; ¿Cuál será la probabilidad de que en cada extracción las bolitas salgan de la siguiente manera: a) Azul, blanca y colorada?, b) Blanca, dorada y azul?, c) Azul, blanca y dorada?, d) Colorada, colorada y dorada? Y f) Azul, azul, y azul Datos: 26 bolitas, 6 azules, 7 blancas, 5 coloradas y 8 doradas

Desarrollo:

a) 6 7 5

26 2

1050,0119

826 8.786P AB CA BP C

b) 7 8 6

26 2

420,0191

2.196 76 2P BP B D D AA

c) 6 7 8

26 2

420,0191

2.196 76 2P AP A B B CD

d) 5 5 8

26 2

250,0114

2.196 76 2P CP C C C DD

e) 6 6 6

26 2

270,0123

2.196 76 2P AP A A A AA

Ejemplo 02.- Se lanzan dos dados y una moneda previamente calibrados para garantizar la pureza del experimento, los dados son uno azul y el

otro blanco; ¿Cuál será la probabilidad que: a) En el dado azul caiga un número par, en el dado blanco un tres y en la moneda el sello? y b) En el dado azul salga un número mayor que el cuatro, en el dado blanco un número menor o igual al tres y en la moneda una cara? Datos: Los seis eventos en un dado azul, los 6 eventos en un dado blanco y los eventos cara y sello de la moneda. Dado azul=A; dado blanco=B y moneda=C Desarrollo: Al ser evento independientes ya que lo que ocurra en

cualquiera de los instrumentos de experimentación no tienen incidencia

65

entre uno del otro por lo tanto se aplica la Regla Especial de la

Multiplicación

a) 3 1 1

6

10,0417

246 2P A B CP A B C

b) 2 3 1

6

10,0833

126 2P A B CP A B C

Probabilidad Condicional.- La Probabilidad Condicional es muy utilizada en el estudio de probabilidades, ya que en muchos estudios de las mismas requieren de la utilización de circunstancia adicionales. Son términos muy usuales en la utilización de Probabilidades Condicionales

el “si” condicional, o “dado que”

;( ) ( )

P A B P A y B P A B P A y BB AP o P

A BP A P A P B P B

Ejemplo 01.- en un curso de Estadística Aplicada de 44 estudiantes hay 11 que obtuvieron más de 14 puntos en Matemática Financiera, 8 más de 12 puntos en Matemática Instrumental y 5 de los contados anteriormente cumplieron con esas notas. Si seleccionamos aleatoriamente uno de esos estudiantes y se comprueba que aprobó Matemática Financiera con más de 15 puntos, ¿Cuál será la probabilidad de que haya aprobado Matemática Instrumental con más de 12 puntos

Datos: 11 estudiantes con más de 14 puntos, en Mat. Fin., 8 estudiantes con más de 12 puntos en Mat. Inst. y 5 estudiantes cumplieron con ambas condiciones Desarrollo: Evento A estudiantes con más de 14 puntos de Mat. Financiera, Evento B estudiantes con más de 12 puntos en Mat. Instrumental y evento A∩B estudiantes que cumplen con ambas condiciones.

11 8 2 5;

44 44 11 44

5

54411 11

50,4545

11

44

P A P B Y P A B

A BPA

BPA

Ejemplo 02.- En una empresa manufacturera dedicada a fabricar elementos eléctricos trabajan 1.150 personas 652 hombres y 498 mujeres. En los últimos años fueron ascendidos 426 trabajadores entre hombres y mujeres (Hombres 264 y mujeres 162). Si de manera aleatoria seleccionamos una persona de esos trabajadores, ¿Cuál será la probabilidad de que sea: a) Mujer si se sabe que está entre los ascendidos? y b) hombre si sabe que está entre los no ascendidos?

66

Datos: Hombres=652, mujeres=498; ascendidos=426, no ascendidos=724,

hombres no ascendidos=388 y mujeres ascendidas=162

Desarrollo: Evento ascendido=A, Evento no ascendidos=B, evento hombre=C, evento

mujer=D, hombres no ascendidos=(B∩C) y evento mujeres ascendidas=(A∩D).

P(A)=213/575; P(B)=362/575; P(A∩D)=81/575 y P(B∩C)=194/575

a)

8181575

213 213

57

270,3803

71

5

P A DD

PP

AA ADP

b)

194194575

362 362

57

970,5359

5

181D

P B CCP

P BB BP

6.3.- Instrumentos de apoyo a las probabilidades

6.3.1.- Tablas de contingencias: Tablas que se utilizan para clasificar las observaciones de la muestra de acuerdo con dos o más características que se puedan identificar. Estas tablas dan origen a las tablas de probabilidades y tablas de probabilidades condicionales, útiles en la elaboración del diagrama del árbol y en la aplicación para el cálculo del teorema de Bayes. Así mismo es una de las maneras más efectiva para estudiar las probabilidades de acuerdo al enfoque relativo o empírico.

Ejercicio 01.-.- Se realizarán los barajos suficientes a un juego de naípes

españoles que consta de 40 cartas, para garantizar la confiabilidad de las experimentaciones. Al extraer una carta del juego de naipes se quiere conocer la probabilidad de que ésta sea: a) Un cinco, b) Un Rey de Copas, c) Un basto, d) Una figura de Oros, e) Un siete o un As, f) Una Espada o una Figura y g) Si se selecciona un As; ¿Cuál será la probabilidad que sea de Oro?

TABLA DE CONTINGENCIA DE LOS NAÍPES

Palos

Pintas

1 (As)

( A1)

2

(A2)

3

(A3)

4

(A4)

5

(A5)

6

(A6)

7

(A7)

10(Sot)

(A8)

11(Cab)

(A9)

12(Rey)

(A10)

Total

Bastos (B1) 1 1 1 1 1 1 1 1 1 1 10

Copas (B2) 1 1 1 1 1 1 1 1 1 1 10

Espadas (B3) 1 1 1 1 1 1 1 1 1 1 10

Oros (B4) 1 1 1 1 1 1 1 1 1 1 10

Total 4 4 4 4 4 4 4 4 4 4 40

Figuras (F)=12

40 1 40EPO

67

a) Cinco = Evento A. Como no señalan ¿Cuál es el palo del cinco?, se consideran todos los cincos, es decir 4, por lo tanto:

10,100

0

4

400

1P PA A

b) Un Rey de Copas = Evento B. Solo existe un Rey de Copas, por lo tanto

1

0,0250

1

400

4P PB B

c) Basto = Evento C. Como no señalan ¿Cuál es la pinta de la copa?, por lo tanto se consideran todas las copas, es decir 10, por lo tanto:

10

40

10,2500

4PP CC

d) Una figura de Oro = Evento D. Solo existen tres figuras de oro por lo tanto:

30,075

0

3

400

4P PD C

e) Un Siete o un As = Evento E. Al observar la Tabla de Contingencia de los naipes españoles vemos que las columnas del Siete y del As no tienen elementos en común, es decir no se interceptan; por lo tanto se nos presenta la Regla Especial de la Suma, entonces:

1 7

4 4 8

40 40 40

10,2000

5P E P A A P C

f) Una Espada o una Figura = Evento F. Al observar la Tabla de Contingencia de

los naipesespañoles vemos que la fila de las Espadas tiene tres elementos comunes con la columnas de las figuras, es decir se interceptan en tres elementos; por lo tanto se nos presenta la Regla General de la Suma, entonces:

3

10 12 3 19

40 40 40

190,4750

4040PP P CF B F

g) Para que salga el Oro se está condicionando que tiene que ser el As, por lo tanto:

4 1

1

4 1

1

10,2500

4

1

4

B AP

A AB A

P

Ejemplo 02.- En una empresa manufacturera dedicada a fabricar

elementos eléctricos trabajan 1.150 personas 652 hombres y 498 mujeres. En los últimos años fueron ascendidos 426 trabajadores entre hombres y mujeres (Hombres 264 y mujeres 162). Si de manera aleatoria seleccionamos una persona de esos trabajadores, ¿Cuál será la probabilidad de que sea: a) Mujer si se sabe que está entre los ascendidos? y b) hombre si sabe que está entre los no ascendidos? Datos: Hombres=652, mujeres=498; ascendidos=426, no ascendidos=724, hombres no ascendidos=388 y mujeres ascendidas=162

Desarrollo:

68

Como podrá observarse es el mismo ejercicio 02 del punto referido a las Probabilidades Condicionales el cual vamos a resolver aplicando Tablas de Contingencias.

TABLA DE CONTINGENCIA

Sexo Condición

Hombres (C)

Mujeres (D)

Total

Ascendido (A) 264 162 426

No ascendido (B) 388 336 724

Total 652 498 1.150

a) Para que sea mujer la persona seleccionada se condiciona a que

ésta se encuentre entre las personas ascendidas, por lo tanto:

162

426

270,3803

71D

P A DDP P

AA P A

b) Para que sea hombre la persona seleccionada se condiciona a que

ésta se encuentre entre las personas no ascendidas, por lo tanto:

388

72

970,5359

1814DP

P B

B

CCP

B P B

6.3.2.- Diagrama del Árbol: Es una gráfica que se utiliza para organizar los cálculos que comprenden varias etapas, cada etapa se representa por ramas las cuales se ponderan por medio de probabilidades. Es una herramienta muy efectiva para el cálculo de probabilidades conjuntas. Tomemos la tabla de contingencia del problema anterior:

TABLA DE CONTINGENCIA

Sexo Condición

Hombres (C)

Mujeres (D)

Total

Ascendido (A) 264 162 426

No ascendido (B) 388 336 724

Total 652 498 1.150

Con esta tabla de contingencia elaboremos un diagrama del árbol tomando como tronco primario la condición de cada trabajador en cuanto a la mejora obtenida.

69

DIAGRAMA DEL ÁRBOL

Hombres

4471

CPA

Ascendido

213575

P A

Mujeres

2771

DPA

Cond. Hombres

97181

CPB

No ascendido

362575

P B

Mujeres

84181

DPB

213 44 1320,2296

575 71 575

CP A PA

213 27 810,1409

575 71 575

DP A PA

362 97 1940,3374

575 181 575

CP B PB

362 84 1680,2922

575 181 575

DP B PB

6.3.3.- Teorema de Bayes: Una probabilidad condicional a posteriori, se obtiene

partiendo de una probabilidad a priori inicial basada en un nivel de información en el momento la cual es revisada tomando como sustento información adicional. Es un teorema que permite verificar las probabilidades existentes en el momento actual basándose en información obtenida por muestreo. Una probabilidad a priori es regulada mediante evidencia empírica para obtener para obtener una probabilidad a posteriori, siguiendo el siguiente esquema:

Esquema Sugerido

Probabilidad a priori P(A) +

Probabilidad de Evidencia Empírica P(B/A)

Probabilidad a posteriori P(A/B)

Consideremos la Regla General de la Multiplicación y la propiedad conmutativa de

esta operación matemática que establece que el orden de los factores no altera el producto, por lo que:

1

BP A PAB A AP A B P B A P A P P B P P

A B B P B

Siendo ésta otra manera de expresar la Probabilidad Condicional. También sabemos que:

70

1 21 2 1

..........n

n in ii

B B B BP B P P A P P A P P A P P AA A A A

Sustituyendo en 1 y generalizando se tiene que:

1 21 2

1

..........

iii

nn

iii

n

iii

BP A PAA

PB

B B BP P A P P A P P AA A A

BP A PAA

PB

BP P AA

Esta es la expresión matemática del Teorema de Bayes

Ejemplo.- En la Tabla de Contingencia que se presenta al final resume los datos de la fabricación de un artículo mediante tres máquinas, donde se contabilizan la producción de artículos por cada máquina y la condición de cada artículo. Se pide: a) ¿Cuál será la probabilidad que al seleccionar de manera aleatoria un artículo defectuoso éste provenga de la Máquina 02? y b) ¿Cuál será la probabilidad de que al seleccionar de manera aleatoria un artículo sin defectos este provenga de la Máquina 01?

Estado

Equipo

Sin Defectos

1A

Defectuoso

2A

Total

Máquina 01 1B 36 5 41

Máquina 02 2B 43 7 50

Máquina 03 3B 21 3 24

Total 100 15

115

Desarrollo:

Del Diagrama del árbol que se encuentra al final podemos obtener los

valores para aplicar el Teorema de Bayes.

71

22

22

2 2 2 21 2 3

2

1

2

2 3

7

1151 7 3

23 115 1

7

15

15

AP B P

BBP

A A A AP P B P P B P P B

B B

BP

A

B

1

11

11

1 1 1 11 2 3

1 3

1

2

36

11536 43 21

115 1

25

15

9

115

AP B P

BBP

A A A AP P B P P B P P B

B B B

BP

A

Desarrollo:

DIAGRAMA DEL ÁRBOL

Sin Defectos

1

1

36

41

AP

B

11

1

41 36 360.3130

115 41 115

AP B P

B

Máquina 01

1

41

115P B

Defectuosos

2

1

5

41

AP

B

21

1

41 5 10,0435

115 41 23

AP B P

B

Sin Defectos

1

2

43

50

AP

B

12

2

10 43 430,3739

23 50 115

AP B P

B

Equipos

Máquina 02

2

10

23P B

Defectuosos

2

2

7

50

AP

B

22

2

10 7 70,0609

23 50 115

AP B P

B

Sin Defectos

1

3

7

8

AP

B

12

2

10 43 430,3739

23 50 115

AP B P

B

Máquina 03

3

24

115P B

Defectuosos

2

3

1

8

AP

B

23

3

24 1 30,0261

115 8 115

AP B P

B

72

Problemas Resueltos

PROBLEMA 01.- Una urna contiene tres bolas rojas y s ie te b lancas. Se extraen dos bolas al azar. Escr ib ir e l espacio muestral y hal lar la probabil idad de: a) Extraer las dos bolas con reemplazamiento.

b) Sin reemplazamiento.

PROBLEMA 02.- Se extrae una bola de una urna que contiene 4 bolas ro jas, 5 blancas y 6 negras, ¿cuál es la probabil idad de que la bola sea ro ja o blanca? ¿Cuál es la probabil idad de que no sea blanca?

PROBLEMA 03. - En una clase hay 10 alumnas rubias, 20 morenas, c inco alumnos rubios y 10 morenos. Un día as is ten 44 alumnos, encontrar la probabil idad de que el alumno que falta: a) Sea hombre.

b) Sea mujer morena.

c) Sea hombre o mujer.

PROBLEMA 04.- Un dado está trucado, de forma que las probabil idades de obtener las dis tintas caras son proporcionales a los números de estas. Hallar:

a) La probabil idad de obtener el 6 en un lanzamiento.

73

b) La probabil idad de conseguir un número impar en un lanzamiento.

PROBLEMA 05.-Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: a) La probabil idad de que salga el 7.

b) La probabil idad de que el número obtenido sea par.

c) La probabil idad de que el número obtenido sea múlt ip lo de tre s.

PROBLEMA 06.- Se lanzan tres dados. Encontrar la probabil idad de que: a) Salga 6 en todos.

b) Los puntos obtenidos sumen 7.

PROBLEMA 07.- Hallar la probabil idad de que al levantar unas f ichas de dominó se obtenga un número de puntos mayor que 9 o que sea múltip lo de 4.

PROBLEMA 08.- Busca la probabil idad de que al echar un dado al aire, salga: a) Un número par.

b) Un múltip lo de tres.

74

c) Mayor que cuatro.

PROBLEMA 09.-

Hallar la probabil idad de que al lanzar al aire dos monedas, salgan: a) Dos caras.

b) Dos cruces.

c) Dos caras y una cruz.

PROBLEMA 10.- En un sobre hay 20 papeletas, ocho l levan dibujado un coche las restantes son blancas. Hallar la probabil idad de extraer al menos una papeleta con el dibujo de un coche: a) Si se saca una papeleta.

b) Si se extraen dos papeletas.

c) Si se extraen tres papeletas.

PROBLEMA 11.- Los estudiantes A y B tienen respectivamente probabil idades 1/2 y 1/5 de suspender un examen. La probabil idad de que suspendan el examen simultáneamente es de 1/10. Determinar la probabil idad de que al menos uno de los dos estudiantes suspenda el examen.

75

PROBLEMA 12.- Dos hermanos salen de caza. El pr imero mata un promedio de 2 piezas cada 5 disparos y el segundo una pieza cada 2 disparos. Si los dos disparan al mismo tiempo a una misma pieza, ¿cuál es la probabil idad de que la maten?

PROBLEMA 13.- Una c lase consta de 10 hombres y 20 mujeres; la mitad de los hombres y la mitad de las mujeres tienen los ojos castaños. Determinar la probabil idad de que una persona elegida al azar sea un hombre o tenga los ojos castaños.

Sexo T. Ojos

Hombre A1

Mujer A2

∑B i

Castaños B1 5 10 15

No Castaños B2 10 20 30

∑A i 15 30

PROBLEMA 14.- La probabil idad de que un hombre viva 20 años es ¼ y la de que su mujer v iva 20 años es 1/3. Se pide calcular la probabil idad: a) De que ambos vivan 20 años.

b) De que el hombre viva 20 años y su mujer no.

c) De que ambos mueran antes de los 20 años.

PROBLEMA 15.- En una clase en la que todos practican algún deporte, e l 60% de los alumnos juega al fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay un 60% que no juega al fútbo l, ¿cuál será la probabil idad de que escogido al azar un alumno de la clase:

a) Juegue sólo al fútbol.

76

b) Juegue sólo al baloncesto.

c) Practique uno solo de los deportes.

d) No juegue ni al fútbol ni al baloncesto.

Problemas de Probabilidades Condicionales

PROBLEMA 16.- En un centro escolar los alumnos pueden optar por cursar como lengua extranjera inglés o f rancés. En un determinado curso, e l 90% de los alumnos estudia inglés y el resto f rancés. El 30% de los que estudian inglés son chicos y de los que estudian f rancés son chicos el 40%. El e legido un alumno al azar, ¿cuál es la probabil idad de que sea chica?

p(chica) = 0.9 · 0.7 + 0.1 · 0.6 = 0.69 PROBLEMA 17.- De una baraja de 48 cartas se extrae simul táneamente dos de el las. Calcular la probabil idad de que: a) Las dos sean copas.

77

b) Al menos una sea copas.

c) Una sea copa y la o tra espada

PROBLEMA 18.- Ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la mater ia del mismo. Éste se real iza en trayendo al azar dos temas y dejando que el alumno escoja uno de los dos para ser examinado del mismo. Hal lar la probabil idad de que el alumno pueda elegir en el examen uno de los temas estudiados

PROBLEMA 19.-Una clase está formada por 10 chicos y 10 chicas; la mitad de las chicas y la mitad de los chicos han elegido f rancés como asignatura optativa. a) ¿Cuál es la probabil idad de que una persona elegida al azar sea chico o

estudio f rancés?

b) ¿Y la probabil idad de que sea chica y no estudié f rancés?

PROBLEMA 20.- Un tal ler sabe que por término medio acuden: por la mañana tres automóviles con problemas eléctr icos, ocho con problemas mecáni cos y tres con problemas de latoneríaa, y por la tarde dos con problemas eléctr icos, tres con problemas mecánicos y uno con problemas de chapa.

a) Hacer una tabla ordenando los datos anter iores.

Prob. T. Ojos

Elect. A1

Mecan. A2

Laton. ∑B i

Mañana B1 3 8 3 14

Tarde B2 2 3 1 6

78

∑A i 5 11 4 20

b) Calcular e l porcentaje de los que acuden por la tarde.

c) Calcular e l porcentaje de los que acuden por problemas mecánicos.

d) Calcular la probabil idad de que un automóvil con problemas eléctr icos

acuda por la mañana.

PROBLEMA 21.- Una c lase consta de 6 niñas y 10 niños. Si se escoge un comité de tres al azar, hallar la probabil idad de:

a) Seleccionar tres niños.

b) Seleccionar exactamente dos n iños y una niña.

79

c) Seleccionar por lo menos un niño.

d) Seleccionar exactamente dos niñas y un niño

PROBLEMA 22.- Una caja contiene tres monedas. Una moneda es corr iente, o tra t iene dos caras y la o tra está cargada de modo que la pro babil idad de obtener cara es de 1/3. Se selecciona una moneda lanzar y se lanza al aire. Hallar la probabil idad de que salga cara.

PROBLEMA 23.- Una urna contiene 5 bolas ro jas y 8 verdes. Se extrae una bola y se reemplaza por dos del otro color. A continuación, se extrae una segunda bola. Se pide: a) Probabil idad de que la segunda bola sea verde.

80

b) Probabil idad de que las dos bolas extraídas sean del mismo color .

PROBLEMA 24.- En una c iudad, e l 40% de la poblac ión t iene cabellos castaños, e l 25% tiene o jos castaños y el 15% tiene cabellos y ojos castaños. Se escoge una persona al azar: a) Si t iene los cabel los castaños, ¿cuál es la probabil idad de que tenga

también ojos castaños?

Cabellos Ojos

Castaño A1

No Castaño A2

∑Bi

Cataño B1 15 10 25

No castaño B2 25 50 75

∑Ai 40 60 100

b) Si tiene ojos castaños, ¿cuál es la probabil idad de que no tenga cabellos

castaños?

c) ¿Cuál es la probabil idad de que no tenga cabellos ni o jos castaños?

PROBLEMA 25.- En un aula hay 100 alumnos, de los cuales: 40 son hombres, 30 usan lentes, y 15 son varones y usan lentes. S i seleccionamos al azar un alumno de dicho curso: a) ¿Cuál es la probabil idad de que sea mujer y no use lentes?

Sexo Hombres Mujeres

81

Lentes A1 A2 ∑Bi

Usan B1 15 15 30

No Usan B2 25 45 70

∑Ai 40 60 100

b) Si sabemos que el alumno seleccionado no usa gafas, ¿qué probabil idad

hay de que sea hombre?

PROBLEMA 26.- Disponemos de dos urnas: la urna A contiene 6 bolas ro jas y 4 bolas blancas, la urna B contiene 4 bolas rojas y 8 bolas blancas. Se lanza un dado, s i aparece un número menor que 3; nos vamos a la urna A; s i e l resultado es 3 ó más, nos vamos a la urna B. A continuación extraemos una bola. Se pide: a) Probabil idad de que la bola sea roja y de la urna B.

b) Probabil idad de que la bola sea blanca.

PROBLEMA 27.- Un estudiante cuenta, para un examen con la ayuda de un despertador, e l cual consigue despertarlo en un 80% de los casos. Si oye el despertador, la probabil idad de que real iza el examen es 0.9 y, en caso contrar io, de 0.5

82

a) Si va a real izar el examen, ¿cuál es la probabil idad de que haya oído el despertador?

b) S i no real iza el examen, ¿cuál es la probabil ida d de que no haya oído el despertador?

PROBLEMA 28.- Se supone que 25 de cada 100 hombres y 600 de cada 1000 mujeres usan gafas. Si e l número de mujeres es cuatro veces superior al de hombres, se pide la probabil idad de encontrarnos: a) Con una persona sin gafas.

b) Con una mujer con gafas.

PROBLEMA 29.- En una estanter ía hay 60 novelas y 20 l ibros de poesía. Una persona A elige un l ibro al azar de la estanter ía y se lo l leva. A continuación otra persona B elige otro l ibro al azar

a) ¿Cuál es la probabil idad de que el l ibro selecc ionado por B sea una novela?

83

b) Si se sabe que B el ig ió una novela, ¿cuál es la probabil idad de que el l ibro seleccionado por A sea de poesía?

PROBLEMA 30.- En una casa hay tres l laveros A, B y C; e l pr imero con cinco l laves, e l segundo con sie te y el tercero con ocho, de las que sólo una de cada l lavero abre la puerta del trastero. Se escoge a Lázaro l lavero y, de él, una l lave intenta abr ir e l trastero. Se pide:

a)¿Cuál será la probabil idad de que se acier te con la l lave?

b) ¿Cuál será la probabil idad de que el l lavero escogido sea el tercero y la l lave no abra?

84

c) Y si la l lave escogida es la correcta, ¿cuál será la probabil idad de que pertenezca al pr imer l lavero A?

Capítulo 08

Distribución de Probabilidad

1. Distribución de probabilidad: Lista de todos los resultados de un experimento y la probabilidad relacionada con cada uno de ellos. Si se observaran las Frecuencias Relativas en una Distribución de Frecuencias de una población, se podría aceptar que la Distribución de Probabilidades guarda relación con la Distribución de Frecuencias Relativas

2. Variable Aleatoria: Resultado obtenido al azar de un experimento y que puede asumir diferentes valores. En otras palabras es una función de términos numéricos, cuyo valor está regido por factores en los cuales interviene el azar. 2.1.- Tipos de variable aleatoria.

2.1.1- Variable aleatoria discreta: Variable aleatoria que puede asumir solamente valores que claramente se puedan contar.

2.1.2- Variable aleatoria continua: Variable aleatoria que supone un número infinito de valores dentro de un rango o intervalo determinado, es decir puede asumir cualquier valor dentro de ese rango o intervalo

3. Esperanza matemática, valor esperado o media de una distribución de probabilidad discreta: Es un valor típico que se utiliza para representar la ubicación central de una distribución de probabilidad, es decir, es un valor esperado de una variable aleatoria a través de una media ponderada de todos los posibles resultados en los cuales lo pesos son las respectivas probabilidades de tales resultados. La Esperanza Matemática o Valor Esperado se obtiene de la siguiente manera:

1

; .

n

i ii

i i

x P x

x es el valor que toma la Variable Aleatoria y P x es la probabilidad relacionada con ella

4. Varianza y Desviación Estándar: La Varianza es un valor que describe la cantidad de

dispersión o variación de una distribución cualquiera, y la Desviación Estándar es la raíz cuadrada de la Varianza.

85

Varianza: 22

1

n

i ii

x P x

Desviación Estándar:

Problemas Resueltos

Problema 01 De manera aleatoria se seleccionan las notas de ocho estudiantes de Estadística Instrumental las cuales fueron: 11 09 12 12 15 09 11 12. Con estos datos se pide desarrollar una Distribución de Probabilidades y de allí obtener: a) La Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Estándar o Desviación Típica; b) Si seleccionamos de manera aleatoria una de esas ocho notas; ¿Cuál es la probabilidad de que sea: i.- Exactamente 12? y ii.- No más de 11? Desarrollo

EFAP E

EPO

ix

if

iEFA

ix

iP x

ESPERANZ

A MATEMÁT.

VARIANZA DESVIAC.

ESTÁND.

i ix P x

2

2

i ix P x

2

09 2 09

EFA

3,234 11 2

11EFA 09 0,250 2,250 1,410

12 3 12

EFA 11 0,250 2,750 0,035

15 1 15

EFA 12 0,375 4,500 0,146

EPO 8

15 0,125 1,875 1,643

∑ 1,00 11,375

2 3,234 1,798

) 12 11

; ) 0,20,3 5 0,2575 0,50

b Evento B Exactamente igual a y Evento C no más de

y c P P CCP B

Problema 02.- Una moneda previamente calibrada se lanza 5 veces. Se pide: a) Desarrollar una Distribución de Probabilidades, y Calcular la Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Estándar o Desviación Típica, b) ¿Cuál será la probabilidad que caigan exactamente 2 caras? y c) ¿ Cuál es la probabilidad de que caiga no menos de 4 caras?

86

Desarrollo5; 2 32

EFAP E EPO EPO

EPO a)

ix

if

iEFA

ix

iP x

ESPERANZ

A

MATEMÁT.

VARIANZA DESVIAC.

ESTÁND.

i ix P x

2

2

i ix P x

2

0 1 0

EFA

1,25

1 5 1

EFA 0 0,03125 0,000 0,195

2 10 2

EFA 1 0,15625 0,1563 0,352

3 10 3

EFA 2 0,31250 0,6250 0,078

4 5 4

EFA 3 0,31250 0,9375 0,078

5 1 5

EFA 4 0,15625 0,6250 0,352

EPO 32

5 0,03125 0,1562 0,195

∑ 1,00 2,500 2 1,250 1,118

) 2 4

; ) 0,15620,3125 0,15 0,03125 875P B

b Evento B Exactamente y Evento no menos de

y c P P CC

Problema 03.- Al final se presentan tres distribuciones diferentes. Diga: ¿Cuál de las tres es una Distribución de Probabilidades? Si alguna de ella resultarse ser de probabilidades calcular la Esperanza Matemática, la Varianza y la Desviación Típica

xi P(xi) xi P(xi) xi P(xi)

1 0,20 2 0,18 1 0,42

3 0,25 4 0,28 4 -0,20

5 0,18 6 0,20 6 0,38

7 0,36 8 0,34 9 0,40

Desarrollo Las probabilidades de la primera suma 0,99; la segunda 1 (Uno) con todos valores positivos y

la tercera 1 (Uno) pero con un valor negativo, como los valores probables de un espacio

muestral deben sumar 1 (Uno) con todos los valores positivos, se concluye que: la Distribución

de Probabilidades es la segunda.

87

ix

iP x

ESPERANZA MATEMÁT.

VARIANZA DESVIAC. ESTÁND.

i ix P x

2

2

i ix P x

2

5

2 0,18 0,36 2,081

4 0,28 1,12 0,549

6 0,20 1,20 0,072

8 0,34 2,72 2,298

∑ 1,00 5,400 2 5,000 2,236

Problema 04.- Pedro Iriarte vende carros usados en la empresa de su propiedad Inversiones

Iriarte C. A. Por lo general Pedro vende la mayor cantidad de automóviles el jueves. Él

desarrolló para la venta de automóviles en los días jueves de un año cualquiera la siguiente

Distribución de Probabilidades:

Cantidad de Carros

Vendidos

(xi)

Probabilidades P(xi)

0 0,15

1 0,35

2 0,30

3 0,10

4 0,10

Total 1,00

a) ¿Qué tipo de Distribución es? b) ¿Cuántos carros espera vender Pedro un jueves normal?

c) ¿Cuál será la Varianza y la Distribución Estándar de la distribución? Solución

,

.

2 ,)

1,

) Es una Distribución de Variable Aleatoria Discreta ya que los carros son elementos

claramente contables usandovalores enteros positivos

Pedro esperaría vender en un jueves normal carros ya que la Esperanza

Matemática es

a

b

65

)

2.

c

88

ix

iP x

ESPERANZA MATEMÁT.

VARIANZA DESVIAC. ESTÁND.

i ix P x

2

2

i ix P x

2

1,327

0 0,15 0,00 0,408

1 0,35 0,35 0,148

2 0,30 0,60 0,037

3 0,10 0,30 0,182

4 0,10 0,40 0,552

∑ 1,00 1,65 2 1,327 1,152

Capítulo 09

Distribución de Probabilidades de Variables Aleatorias Discretas Especiales

1. Distribución de Probabilidades Binomial Hablar de binomial en Distribución de Variable Discreta es hablar de solo dos eventos, que pueden ser agrupados en dos clases o categorías, por lo tanto los datos son nominales. Las categorías o clases deben ser mutuamente excluyentes, de manera que sea eminente establecer a que clase pertenece una observación en particular, por lo que las clases deben ser colectivamente exhaustivas, lo cual garantiza que los resultados no cambien, por lo tanto se concluye que una Distribución de Probabilidad Binomial: “Es una distribución de variable aleatoria discreta donde existe un número fijo de ensayos repetidos (n) y donde cada uno al experimentarlos concluye en sólo uno de dos resultados mutuamente excluyentes, favorables (éxito) o desfavorable (fracaso); el resultado de éxito de un evento es fijo, los ensayos se realizan con reemplazo, siendo independientes, interesándonos el número de éxito en n pruebas” Ejemplo de variables aleatorias que se podrían considerar como binomiales: repuestas de verdadero o falso de una evaluación, clasificación de los resultados de un examen entre aprobados y aplazados, productos observados con defectos o sin defectos, el resultado de una maternidad varón o hembra, son algunas de las consideraciones de la infinitas situaciones binomiales que se puedan presentar. Manera de calcular la probabilidad de este distribución;

89

x n x x n x

n x

nP x p q p q

x

Valor esperado: = ; Varianza:

= Operación de combinación

= Número de ensayos o pruebas

= Variable aleatoria definida como el número de éxito al que se le va a calcular la

probabilidad de su ocurrencia = Proporción que establece la probabilidad de éxito en cada ensayo o prueba

= Proporción que establece la probabilidad de fracaso en cada ensayo o prueba.

De lo anterior se concluye que:

1

1

q p

p q

p q

Esperanza Matemática o Valor Esperado: np

Varianza: 2 q npq

Desviación Estándar o Desviación Típica: 2 2 q npq

Problemas Resueltos

Problema 01.-Suponga que el 38% de las empanadas que vende en las noches la señora Yadira Gudiño que se ubica a media cuadra del IUGT son vegetarianas. Si aleatoriamente seleccionamos 7 de sus clientes; ¿Cuál será la Probabilidad de que: a) Todos las quieran vegetarianas? y b) No más de uno la quiera vegetarianas?

Solución

Datos: p=0,38 q=0,62; n=7.

Fórmulas: x n x

n xP x p q

a. 7 0

7 77 0,38 0,72P x P(x=7)=0,3186

b. 0 7 6

7 0 7 10 1 0,38 0,62 0,38 0,62 0,0352 0,1511 0,1863P x ó

P(x=1 ó 1)=0,1863

Problema 02.- Realizado un estudio de las calificaciones obtenidas en las evaluaciones por los estudiantes de Estadística Instrumental del Profesor Scott en el período de clases 2013-1N, se concluyó que aprobaron la materia el 62%. Si de manera aleatoria se seleccionan 6 de esos estudiantes; ¿Cuál será la probabilidad de qué: a) Exactamente 2 hayan aprobado la materia? b) Exactamente 3 ó 4 hayan aprobado la materia? c) No menos o al menos 2 hayan aproado la materia? y d) Calcular la Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Típica o Desviación Estándar

90

2

2 6 2

6 2

3 6 3

6 3

4 6 4

6 4

: 0,62; 0,38; 6; : ; ; ;

:

) 2 2 0,62 0,38

) 3 4, 3 4 3 4 0,62 0,38

0,62 0,38 0,2616 0,32

2 0,1202

3 4 001

X n X

n XDatos p q n Fórmulas P X p q np npq

npq

Desarrollo

a Para X P X

b Para X

P

ó P X ó

P

P

X

P X X

X

ó

2 6 2 3 6 3 4 6 4

6 2 6 3 6 4

5 6 5 6 6 6

6 5 6 6

) 2 2,...,5 6 2,...,5 6 2 3 4

5 6 0,62 0,38 0,62 0,38 0,62 0,38

0,62 0,38 0,62 0,38 0,1202 0,2616 0,3201 0,2089 0,0

,5817

2,...

5

,5 6 0,

68

c Para al menos X ó P X ó P X P X P X

P X P

ó

X

P X

0 6 0 6 1

6 0 6

2 2

1

: 2,...,5 6 1 0 1 1 0 1

1 0,62 0,38 0,62 0,38 1 0,0030 0,0294

) 0,62 6 ; 0,38 3,72 ; 1,41

9676

2,...,5 6 0,9676

3,72 1,4136 1,3 1886 9

Por complemento sería P X ó P X ó P x P X

P

d

X ó

Para calcular probabilidades de Distribución Binomial se utiliza su fórmula de manera directa sobre cada problema o tablas las cuales provienen de la aplicación de la referida fórmula para los diversos casos posibles. Sin embargo si se aplica de manera acertada la fórmula resulta más práctica la utilización de la misma en la solución de problemas para calcular este tipo de probabilidades.

2. Distribución de probabilidades Hipergeométrica Si tomamos un conjunto de N elementos que pueden ser individuos u objetos y que una parte S de ellos tienen una determinada característica siendo esa parte la que vamos a tomar como elementos base para el cálculo de probabilidades, y si de ese conjunto de N elementos consideramos un subconjunto n de esos elementos debemos intuir que una parte x de ellos también obedecen a esa determinada característica, y es la probabilidad sobre la ocurrencia de x la que vamos a estudiar. La situación planteada en estos términos nos lleva a un tipo de

distribución de variable discreta a la cual se le ha asignado el nombre de Distribución Hipergeométrica y la definimos como: “Una distribución de variable discreta asociada generalmente con un proceso de muestreo sin reemplazo o sin reposición en una población finita conocida que contiene una proporción relativamente grande (0,05 N < n) de esa población, de tal manera que la probabilidad de éxito sea perceptible alterada de una prueba a la siguiente, lo que hace que el resultado de un ensayo dependa del anterior.

91

S x N S n x

N n

N S S

n x xP x P x

N

n

Valor Esperado:

Varianza:

Desviación Estándar o Típica: 2

1

nS N S N n

N N

N: Tamaño del conjunto seleccionado para el estudio n: Tamaño de la muestra o subconjunto tomado del conjunto x: Probabilidad de éxito en cada ensayo o prueba S: Tamaño de la parte del conjunto favorable o exitoso

Problema Resuelto

Problema 01 Se va a seleccionar una comisión de 25 estudiantes en una institución educativa que tiene una matrícula de 417 estudiantes para hacer una evaluación avanzada del sistema educativo del país y presentar una ponencia a objeto de mejorarla. Si en esa matricula están incorporadas 263 mujeres; ¿Cuál será la probabilidad de qué en la referida comisión sean seleccionadas: a) Exactamente 12 mujeres? b) Entre17 ó 20 mujeres inclusive? y c) Calcular la Esperanza Matemática o Valor Esperado, la Varianza y la Desviación Típica o Desviación Estándar.

2

263 12 417 263 25 12

417 25

1

: 417; 263; 25; : ;

; ;1 1

:

) 12 12 12

) 1

2

7 2

0,0470

0

S X N S n X

N n

Datos N S n Fórmulas P X

nS N S N n nS N S N nnS

N N N N N

Desarrollo

P Xa Para X P X P X

b Entre ó mujeres inclusive X

263 17 263 18417 263 25 17 417 263 25 18

417 25 417 25

17,18,19 20 17,..., 20 17 18

19 20 17,..., 20

ó P X P X P X

P X P X P X

92

263 17 263 18417 263 25 17 417 263 25 18

417 25 417 25

263 19 263 20417 263 25 19 417 263 25 20

417 25 417 25

19 20 17,..., 20

0,1510 0,1123 0,0685 0,033

17,..., 20 0

7

,3655

P X P X P X

P X

2

263 12 417 263 25 12

417 25

1

: 417; 263; 25; : ;

; ;1 1

:

) 12 12 12

) 1

2

7 2

0,0470

0

S X N S n X

N n

Datos N S n Fórmulas P X

nS N S N n nS N S N nnS

N N N N N

Desarrollo

P Xa Para X P X P X

b Entre ó mujeres inclusive X

263 17 263 18417 263 25 17 417 263 25 18

417 25 417 25

263 19 263 20417 263 25 19 417 263 25 20

417 25 417 25

17,18,19 20 17,..., 20 17 18

19 20 17,..., 20

0,1510 0,1

ó P X P X P X

P X P X P X

2 2

1

17,..., 20 0,3655

15,76

23 0,0685 0,0337

25 263 417 263 417 2525 263) ;

417 47 2.288,090

47,

17 417 1

2.288,09 834

P

c

X

3. Distribución de probabilidades de Poisson

“Es una distribución de probabilidades discreta que describe el número de veces

que ocurre un evento durante un intervalo especifico, el cual puede ser de tiempo,

distancia, área o volumen”.

!

x

P x ex

Valor esperado: Varianza:

Desviación Estándar Típica: 2 q npq

93

= Número de ocurrencias exitosas de la medida en un intervalo especifico. e= 2,718281; número base de los logaritmo neperianos x= número de éxitos.

Problema Resuelto Problema.- El número de accidentes que se producen en una empresa manufacturera sigue una distribución de Poisson con una media de 2,6 accidentes por mes. ¿Cuál será la probabilidad de qué: a) Menos de 2 accidentes en un mes dado? y b) Más de 3 accidentes en un mes dado?

0 22,6 2,6 2,6

: 2,6 ; : 1!

) 2 0,1 2 0,1 2 0 1

2,6 2,6 2,62 0,0743 0,1934 0,2510

0

0

!

,1

! 1! 2

X

Datos accidentes por mes Fórmulas P X eX

a Menos de accidentes diarios X ó P X ó P X P X

P

P X

X e e e

ó

0 2 32,6 2,6 2,6 2,6

) 3 4,5,......; : 4,5...

2,6 2,6 2,6 2,61 0,1,2 3 1

0! 1! 2! 3!

1 0,0743 01934 0,2510 0,2

2 0,5187

b Más de accidentes diarios X por complemento sería P X

P X ó e e e e

4,5...1 776 0,263P X

Capítulo 10

Distribuciones de Probabilidades de Variables

Aleatorias Continúas

1.- Distribución de Probabilidad Uniforme: Es el valor que asume una variable aleatoria en una escala continua entre dos puntos, de tal manera que todos los valores tengan la misma probabilidad. Su gráfica se puede representar como un rectángulo limitado por dos puntos extremos a y b los cuales se constituyen en el intervalo de los resultados pesebres. La altura del rectángulo se considera igual a la unidad y el área del mismo se puede considerar igual al 100%. En consecuencia, el área bajo el rectángulo entre dos puntos

cualesquiera c y d, es igual al porcentaje del intervalo total incluido entren c y d, por lo que:

d cP c x d

b a

La Media: 2

a b , La Varianza:

2

2

12

b a

Gráfica

94

f(x)

0 a

P(x) c d

b

Ejercicio.- Las ventas de calzados en una tienda de ropas para caballeros tienen una demanda media diaria de Bs. 25.000 y un máximo de Bs. 35.000. Suponer que para el cálculo es apropiada usar la Distribución Uniforme; a( Determinar las ventas mínimas diarias y b) ¿Cuál será la probabilidad de días en que la demanda excederá en Bs. 30.000? Datos: µ = 25.000; b = 35.000 y k 0 30.000 Desarrollo:

a) 2 2 25000 35000 15.000a b a

b) 35.000 30.000

15.000 35.00035.

15.000 15.00

000 35.000 0,250

P xP x

2.- Distribuciones de Probabilidad Normal:

Una distribución normal la define las características que muestra su gráfica, la cual presenta una forma de campana que tiene una sola cima o vértice en el centro de la gráfica de la distribución, por donde pasa un eje vertical que la divide en dos partes iguales para apoyarse en un punto sobre el eje horizontal que lo define la media. Esta condición la hace simétrica y estas partes se expanden o caen a ambos lados llegando a estar infinitamente cerca del eje horizontal por lo cual es una gráfica asintótica; la distribución normal se determina a través de la media, µ y la dispersión, variación o

extensión por medio de la desviación estándar

2.1.- Distribución Normal Estándar “Z”:

No existe solo una distribución de probabilidad normal, sino una familia de ellas. Cada situación en particular presenta su propia distribución normal, lo cual dificulta su uso. Sin embargo y por fortuna un miembro de la familia puede utilizarse para determinar las probabilidades de todas las distribuciones normales, la que conocemos con el nombre de Distribución Normal Estándar la cual es única ya que se define como: “La distribución normal que presenta una media de 0 y una desviación estándar de 1” Cualquier distribución normal puede llevarse a una distribución normal estándar a través del Valor Tipificado de Z o Variación Normal Estándar; el cual se define como “el numero de desviaciones estándar a los que una observación está por encima o por debajo de la media es decir mide la distancia entre un valor seleccionado x y la media

aritmética ( )x dividida entre la desviación estándar, σ

La razón de utilizar una campana (Gauss) con las características señaladas en la gráfica (grafica de una distribución continua estándar normal) para el cálculo de probabilidades de una distribución continua estriba en que el área encerrada por su gráfica se corresponde con una gran aproximación a la correspondiente probabilidad. El área total de la curva es igual a 1, distribuida en mitades simétricas de 0,5. el área igual a 1 coincide con el espacio muestral que es igual a 1 de todos los eventos posibles de un experimento.

95

Ilustración de la gráfica de una desviación estándar normal.

0,5 0,5

- Z +Z

Z=0, para µ y σ=1

Cola Izquierda Cola Derecha

Eje de Simetría=V

96

Valor Tipificado de z o Desviación Estándar Normal y Tabla Orientadora para obtener

las probabilidades de la Distribución Normal interpretando la media Campana de Gauss

xz

GRÁFICA EN LA

CAMPANA DE GAUSS

PROBABILIDAD

SOLICITADA

PARÁMETRO

RESPECTO A LA

MEDIA POBLACIONAL

SIGNO DE Z

OBTENCIÓN DEL

ÁREA EN LA

TABLA DE Z

Un solo acotamiento

(X<a; X>a)

P X a a Z 0,5 aA A

P X a a Z 0,5 aA A

P X a a Z 0,5 aA A

P X a a Z 0,5 aA A

Doble acotamiento (a<X<b; X<a ó X>b)

P a X b a b ;a bZ y Z b aA A A

P a X b a b ;a bZ y Z b aA A A

P a X a b Z aA A

P X b a b Z bA A

P a X b a b ;a bZ y Z a bA A A

P a X ó P X b a b ;a bZ y Z

1 a bA A A

97

Problemas Resueltos

Problema 01.-Suponiendo que la variable aleatoria Z sigue una Distribución Normal Estándar; se pide hallar: a) P (Z<-1,53), b) P (Z<1,15), c) P (-1,53<Z<1,15), d) P (1,15<Z<2,16)

a)

a) P(Z<-1,53)=0,5-0,4370

P(Z<-1;53)=0,0630

b)

b) P(Z<1,15)=0,5+0,3749

P(<1,15)=0,8749

c)

c) P(1,53<Z<1,15)=

0,4370+0,3749 P(-1,53<Z<1,15)=0,8119

d)

d) P(1,15<Z<2,16)=0,4846-0,3749 P(1,16<Z<2,16)=0,1097

Problema 02Una determinada marca de cauchos tiene desgaste que sigue una Distribución Normal que tiene una de duración promedio de 35.000 kilómetros y una Desviación Estándar de 4.000 kilómetros; ¿Cuál será la probabilidad de que: a) Estos cauchos tengan una duración de más de 38.000 kilómetros? y b) Estos cauchos tengan una duración que oscile entre 32.000 y 38.000 kilómetros?

98

Datos: µ = 35.000; σ = 4.000.

Fórmula: X

Z

a.- P(38.000<X) = 0,2266

38.000 35.0000,75

4.000Z

A = 0,5 – 0,2734 = 0,2266

b.-P(32.000<X<32.000) = 0,5468

38.000 35.0000,75

4.000Z

38.000 35.0000,75

4.000Z

A =0,2734+0,2734 = 0,5468

3.- Aproximación de la Distribución Normal a la Binomial:

Para calcular el éxito o el fracaso de una serie de n ensayos de una distribución binomial

recurrimos a su fórmula o su respectiva tabla; sin embargo si n es demasiado grande, que

exceda a los confines de cualquier tabla, debemos ir a la aplicación de una fórmula lo cual

resulta altamente engorrosa, y es por ello que se diseñó el método alternativo de usar la

distribución normal para aproximarse a la distribución binomial. Esta aproximación se

considera lo suficiente precisa si y Si está próximo a 0,50,

valor que se toma como factor de corrección de continuidad, f.c.c. = 0,5 y se define como

“el valor de 0,5 restado o sumado, según sea el caso, a un valor seleccionado cuando una

Distribución de Probabilidades Binomial (discreta) se calcula por medio de una

Distribución de Probabilidad Normal (continua)”

Manera de aplicar el f.c.c.

99

No. Probabilidad Vocablo Forma Consideraci

ón

1 Probabilidad De que al menos ocurra X ( x – 0,5 ) Ya que X >

2 Probabilidad De que a lo más que ocurra X ( x + 0,5 )

Ya que X <

3 Probabilidad De que por lo menos ocurra X ( x – 0,5 ) Ya que X <

4 Probabilidad De que por lo más ocurra X ( x + 0,5 )

Ya que X >

Problema.- Se sabe que el 10% de todos los artículos que salen de un determinado proceso de producción tienen un defecto. Aleatoriamente se eligen 400 artículos de un elevado volumen de producción en un día; ¿Cuál es la probabilidad de que: a) Al menos 35 de los artículos seleccionados presenten un defecto? y b) De que exactamente 48 presenten algún defecto?

2 2: 0,10; 0,90; 400; : ; ; ;

0,10 400 40; 0,90 40 6;

CXDatos p q n Fórmulas np npq Z

35 0,8212) P Xa

35 0,5 34,5

34,5 400,92

6

cX

Z

A = 0,5000 + 0,3212 = 0,8212

35 0,8212) P Xb

48 0,5 47,5

47,5 401,25

6

48 0,5 48,5

48,5 401,42

6

c

c

X

Z

X

Z

A = 0,4222 – 0,3944 = 0.0278

Problemas propuestos para los Capítulos tratados en el Título III

Problema 01.- Definir el espacio muestral en los siguientes experimentos: a) Lanzar un dado

previamente calibrado. b) Lanzar tres monedas y ver la manera como caen respecto a las caras, c)

Familia con tres hijos respecto al sexo, d) Lanzar dos dados previamente calibrado y e) Al extraer dos

bolitas que contiene: 4 azules, 3 blancas y 2 coloradas.

100

Problema 02.- Al lanzar un dado previamente calibrado, ¿cuál es la probabilidad de que aparezca en

su cara superior: a) Un valor par y b) Un número mayor que dos?

Problema 03 .- Al lanzar dos dados previamente calibrados, ¿cuál será la probabilidad de que salgan

en su caída valores tales que al sumarlos den como resultado: a) Exactamente 3. b) Mayor que 4. c)

Menor o igual a 9 y d) Un múltiplo de 3?

Problema 04.- Se tienen tres lápiz cuadrado, (azul, blanco y colorado) cuyos lados están numerados

del 1 al 4, determinando el respectivo espacio muestral se pide obtener la probabilidad de que: a) Una

de las caras expuestas presente exactamente el número 2. b) Dos de las caras expuesta presenten el número 2 y c) Las tres caras sea el número 2.

Problema 05.- Se introducen en una caja, 4 bolitas azules, 6 blancas, 5 coloradas y 8 doradas, ¿cuál

es la probabilidad de ganar o perder, si las premiadas son las azules y las doradas?

Problema 06.- Se tiene un juego de naipes españoles lo suficientemente barajados, ¿cuál es la

probabilidad de que al extraer del mazo una carta ésta sea: a) Un as o un rey. b) Una espada o una

sota. c) Un cinco de copa o un oro y d) Una figura o un basto?

Problema 07.-Una agencia de viaje con el fin de promover el turismo abre un plan vacacional para 90

personas para que visiten a Canaima y a Los Roques, 44 reservaron cupo con pasaje incluido para ir a Los Roques, 46 a Canaima y 30 a ambos lugares. Si de manera aleatoria seleccionamos una persona,

¿ cuál es la probabilidad de que viaje a Los Roques o a Canaima?

Problema 08.-Se tienen dos juegos de naipes españoles, calcular las siguientes probabilidades al

extraer dos barajas de manera conjuntas una de un juego y la otra del otro juego: a) ¿Qué las dos sean reyes? b) ¿Qué sean una sota y un basto? y c) ¿ Qué sean un caballo de oro o una espada.

Problema 09.- Se lanzan dos monedas y dos dados previamente calibrados, ¿cuál es la probabilidad

de caiga cara-sello y un múltiplo de 3 al sumar los dos números de las caras superiores de los dados?

Problema 10.- Se tiene un juego de naipes españoles y se realizan tres extracciones sin reposición o sin reemplazo estudiar, ¿cuál es la probabilidad de que en los experimentos siguientes se extraiga: a)

Un rey y una sota y un as. b) Un caballo y un siete y un caballo. c) Un as de oro y un oro y seis de

copa o de basto y d) Un oro y una espada y un rey de copas.

Problema 11.-En una caja se introducen 4 bolitas azules, 5 blancas y 6 coloradas y se realizan de la caja tres extracciones sin reposición o sin reemplazo, calcular la probabilidad en los experimentos

siguientes: a) De que salga una bolita blanca y una azul y una blanca. b) Todas coloradas. c) Una

colorada y colorada y azul y d) Colorada y blanca y azul.

Problema 12.- En una caja se introducen 4 bolitas azules, 3 blancas y 2 coloradas, si extraemos de la

caja dos bolitas, ¿Cuál es la probabilidad de que sean: a) Del mismo color. b) Las dos azules. c) Una blanca y la otra colorada y d) Una azul y la otra colorada?

Problema 13.- En una caja se introducen las mismas bolitas del problema anterior, si se extraen de la

caja tres bolitas, ¿cuál es la probabilidad de que sean: a) Del mismo color. b) Dos azules y una blanca.

c) Una azul y dos coloradas y d) todas azules.

Problema 14.- En una caja se introducen 9 bolitas azules y 6 blancas, si de la caja extraemos 3

bolitas, ¿cuál es la probabilidad de que sean: a) De igual color. b) De colores diferentes. c) Dos azules y

d) Dos blancas.

Problema 15.- Un juego de naipes españoles consta de 40 barajas y lo vamos a dividir de manera arbitraria en dos partes iguales. Determinar las probabilidades de los eventos siguientes: a) Cada

101

parte contenga dos caballos. b) Una parte no contiene ningún caballo, la otra parte contiene 4 caballos

y c) Una parte contiene un caballo, la otra parte contiene 3 caballos.

Problema 16.- En el torneo de baloncesto profesional local participan 10 equipos, de los cuales al

azar se forman dos grupos de 5 equipos cada uno. Entre los equipos se consideran 3 de de mayor

calidad. Determinar las probabilidades de los siguientes eventos: a) Los equipos considerados de

mayor calidad se encuentran en el mismo grupo y b) En un grupo se encuentran 2 de mayor categoría

y 1 en el otro.

Problema 17.- Un profesor lanza dos dados sobre una mesa, observa los números que salieron y los

tapa con la mano para que sus alumnos no los vean, y les formula las preguntas siguientes: a)

Probabilidad que uno de los dados muestre un seis o un dos y b) Suponiendo que el profesor les dijo a

los estudiantes que en uno de los dados salió el dos, probabilidad que el otro dado muestre el seis.

Problema 18.- En un grupo de 25 estudiantes del I.U.G.T. hay nueve que viajan a Valencia todos los

viernes y seis a Maracay y cuatro a ambas ciudades (incluidos entre los anteriores). Si seleccionamos

un estudiante al azar y se comprueba que viaja a Maracay, ¿Cuál es la probabilidad de que también

viaje a Valencia?

Problema 19.- Se realizó un estudio sobre el consumo de café en el área metropolitana y se seleccionaron de manera aleatoria 300 personas consumidoras del producto para ser encuestadas. Al

recibir el material del estudio realizado éste estaba incompleto, sin embargo con la información

obtenida se puede completar la tabla de datos, (Tabla incompleta al final).

Se pide: A.- a) Completar la Tabla de Contingencia. b) Elaborar la respectiva Tabla de Probabilidades

c) Elaborar las Tablas de Probabilidades Condicionales y d) Elaborar un diagrama del árbol. B.- Si de manera aleatoria se selecciona un consumidor, ¿cuál es la probabilidad: a) De que éste tenga

entre 40 y 50 años? b) De que tenga un consumo moderado de café? c)De que tenga un consumo bajo

de café y su edad sea menor de 30 años? d) De que tenga un consumo alto de café y cuya edad esté

comprendida entre los 30 y 40 años e) Consumidor moderado de café ó que su edad sea menor de 30

años y f) Consumidor bajo o alto de café

C.- Responder: a) ¿Cuál será la probabilidad de seleccionar un consumidor de café que lo consuma moderadamente si tiene más de 50 años? y b) ¿Cuál será la probabilidad de seleccionar un

consumidor de café cuya edad esté entre 40 y 50 si lo consume de manera alta?

Problema 20.- Se consultaron las opiniones de 500 economistas que laboran en la academia, la industria privada y el sector público sobre el futuro de la economía del país, si ésta sería estable, se

expandiría ó se contraería en un futuro próximo. Sin embargo parte de la información se extravió,

resultando la siguiente tabla de contingencia parcial:

Consumo de café

Edad (Años)

Bajo

(B1)

Moderado

(B2)

Alto

(B3)

Total

Menos de 30 (A1) 32 24 92

De 30 a 40 (A2) 75

De 40 a 50 (A3) 24 20

Más de 50 (A4) 26 24 79

Total 90 100

102

Se pide: A.- a) Completar la Tabla de Contingencia. b) Elaborar la Tabla de Probabilidades. c) Elaborar

las Tablas de Probabilidades Condicionales y d) Desarrollar el Diagrama del Árbol.

B.- Si de manera aleatoria seleccionamos un economista, ¿cuál es la probabilidad de que éste sea.: a)

Del sector privado? b) Que opine que la economía se va a contraer? c) Del sector público y que opine

que va a ver expansión en la economía? d) Del sector público ó del sector académico? y e) De la

opinión que la economía va estar estable ó es del sector privado?.

C.- Responder: a) ¿Cuál es la probabilidad de que la opinión sea de que la economía se expande si

esta opinión proviene del sector público? Y b) ¿Cuál es la probabilidad que una opinión provenga del

sector académico si se opina que la economía se contrae?

Problema 21.- El equipo de béisbol profesional Leones del Caracas, juega el 70,00% de sus partidos por la noche y el 30,00 durante le día; ganando el 60,00% de los juegos nocturnos y el 70,00% de los

juegos diurnos. Según las páginas deportivas de los periódicos ganaron el partido de ayer; ¿cuál es la

probabilidad de que el partido jugado haya sido nocturno?

Problema 22.- Una cuarta parte de los residentes de la Urbanización Las Abejitas de San Juan de los Morros dejan la puertas de sus garajes abiertas no estando en casa. El vigilante de la entrada a la

urbanización estima que el 5% de las casa con garajes con las puertas abiertas son robados y el 1%

de las casas con los garajes de puertas cerradas. Si hay un robo en un garaje; ¿cuál es la probabilidad

de que el garaje robado haya tenido la puerta abierta?

Problema 23 .- Se lanzan 3 monedas sobre una mesa, tomando como referencia como cae respecto a cara, se pide: a) Estructurar una Distribución de probabilidades. b) Obtener la Esperanza

Matemáticas ó Valor Esperado y c) Calcular la Varianza y la Desviación Estándar ó Desviación Típica.

Problema 24.- Un dado se lanza 50 veces, donde cada cara cayó como se muestra:

Cara 1 2 3 4 5 6

Veces 7 8 5 9 11 10 Se pide: a) Crear una Tabla de Distribución de Probabilidades. b) Obtener la Esperanza Matemática y

c) Calcular la Desviación Estándar.

Problema 25.-Pedro Martínez vende automóviles para una agencia concesionaria. Pedro vende el

mayor número de vehículos los días sábados y obtiene la Distribución de Probabilidad para el número

de automóviles que espera vender un día Sábado en particular: Vehículos vendidos 0 1 2 3 4

Probabilidad: P(x) 0,1 0,2 0,3 0,3 0,1

a) ¿Qué tipo de distribución es ésta?

b) ¿Cuántos automóviles espera vender Pedro en un Sábado típico

c) ¿Cuál es la Varianza y la Desviación Estándar de la distribución?

Problema 26 .- De las tres tablas que se presentan al final siendo de variables aleatoria solo una

responde a una Distribución de Probabilidad. a) Identificar la que responde a una Distribución de

Probabilidad y explicar el ¿por qué? De su respuesta y b) Obtener de la verdadera Distribución de

Probabilidad, su Esperanza Matemática o Valor Esperado, su Varianza y su Desviación Estándar.

Cuadro 01 Cuadro 02 Cuadro 03

x 5 10 15 20 x 5 10 15 20 x 5 10 15 20

Economistas Sector

Estable (B1)

Expansión (B2)

Contracción (B3)

Total

Academia (A1) 125 100

Sec. Privado (A2) 35 110

Sec. Público (A3) 25 40 65

Total 200

103

P(x) 0,3 0,3 0,2 0,4 P(x) 0,1 0,3 0,2 0,4 P(x) 0,5 0,3 -0,2 0,4

Problema 27.- El servicio de correspondencia de un banco informa que el 85% de los documentos

enviados dentro el área metropolitana se entregan en un período de 3 días a partir del momento en

que se envían. Se enviaron 7 cartas de manera aleatoria a diferentes partes de la ciudad. ¿Cuál será la probabilidad de que: a) Exactamente 7 lleguen en tres días? b) Exactamente 5 lleguen en tres días? c)

Al menos 5 lleguen en tres días? d) A lo sumo 4 lleguen en tres días? y e) Calcular la Esperanza

Matemática o Valor Esperado, la Varianza y la Desviación Estándar del número de documentos

enviados que llegarán en un plazo de tres días.

Problema 28.- Las normas de garantías establecida por la industria automotriz sugiere que 20% de los nuevos vehículos se les dé un plazo de garantía de año y medio. Una agencia de ventas de

vehículos del área metropolitana el día sábado vendió 9 vehículos los cuales están dentro de cualquier

tipo de garantías. ¿Cuál es la probabilidad de que: a) Ninguno de los vehículos vendidos tengan

garantía de año y medio? b) Exactamente uno tengan esta garantía? c) Menos de cuatro la requieran?

d) Cuatro o más la requieran y e) Calcular la Esperanza Matemática, Media o Valor Esperado; La Varianza y la Desviación Típica o Estándar de esta distribución.

Problema 29.- Sólo el 20% de los empleados de la población civil que presta sus servicios en una base

militar portan su carnet de identificación personal. Si llegan diez empleados, ¿cuál es la probabilidad

de el guardia de seguridad encuentre: a) Ocho empleados con carnet? b) Cuatro empleados con

carnet? c) Por lo menos cuatro con carnet? d) A lo sumo 5 empleados con carnet y e) Entre cuatro y siete empleados inclusive con carnet?

Problema 30.- Resolver el problema anterior pero partiendo de la base que sólo el 55% de los

empleados portan el carnet.

Problema.- 31 Al Jefe de Recursos Humanos de una empresa comercializadora de materias primas, la

Gerencia General lo autorizó par que contrataran 12 personas entre 35, de las cuales 24 tienen títulos

universitarios. ¿Cuál es la probabilidad de que 7 de las personas que se contraten tengan un título

universitario?

Problema 32.- Cuarenta trabajadores han recibido para su oficina nuevos computadores. Veintisiete trajeron incorporados quemadores de C.D. Si se seleccionan de manera aleatoria 10 trabajadores;

¿cuál es la de probabilidad de que el equipo de computación de 3 trabajadores tengan quemador de

C.D.? y ¿la probabilidad de que el equipo de 7 no lo tengan?

Problema 33.- En un curso de Estadística Instrumental que tiene una matrícula de 72 estudiantes se resuelve nombrar un equipo integrado por 7 estudiantes para que evalúe unas guías teóricas que

contienen los concepto que van a ser base de los exámenes parciales. Si el curso posee 46 mujeres;

¿cuál es la probabilidad de que 5 mujeres integren el equipo a nombrar? Y ¿ 3 hombres?

Problema 34.- Un promedio 16 automóviles cada dos minutos ingresan a la parroquia Coche desde la

autopista viniendo del centro de la ciudad. La distribución de ingreso responde a una Distribución de Poisson. ¿Cuál es la probabilidad de que: a) Ningún automóvil ingrese en 30 segundos? y b) Por lo

menos 2 ingresen en un minuto?

Problema 35.- La central telefónica del I.U.G.T. atiende un promedio de dos llamadas telefónicas por

minuto y se sabe que sigue una Distribución de Poisson. Si la operadora se distrae por un minuto; ¿cuál es la probabilidad de que: a) El número de llamadas no respondidas sea ninguna? b) Por lo

menos una? Y c) Entre 3 y 5 inclusive?

Problema 36.- En el problema anterior suponga que la operadora se distrae por cuatro minutos,

responder las mismas preguntas.

104

Problema 37.- Repuestos Pernía C.A. compra repuestos para motores de arranque a uno de sus

proveedores que presentan defectos de 3 por cada 100 repuestos. Saúl Pernía el dueño, necesita

comprar 150 repuestos pero no aceptará una probabilidad de más del 50% de que más de dos repuestos sean defectuosos. ¿Saúl Pernía le compraría a dicho proveedor?

Problema 38.- El peso medio de las cajas de frutas de un gran cargamento es de 15 Kgs., con una

desviación estándar de 1,62 Kgs.; si sus pesos están distribuidos normalmente, ¿Qué porcentaje

tendrá un peso: a) Entre 15 y18 Kgs.,b) Entre 17y 19 Kgs., c) Menos de 13 Kgs., d) Menos de 16 Kgs. y

e) Entre 14 y 17 Kgs.

Problema 39.- Una distribución normal tiene una media de 50 y una desviación estándar de 4. Se

pide calcular la probabilidad de un valor: a) Entre 44 y 55, b) Mayor que 55 y c) Entre 52 y 55.

Problema 40.- Una población normal tiene una media de 80 y una desviación estándar de 14. Se pide calcular la probabilidad de un valor: a) Entre 75 y 90, b) 75 o menos y c) Entre 55 y 70.

Problema 41.- Una máquina expendedora de refrescos está ajustada para servir un promedio de 250

gramos por vaso, con una desviación estándar de 3,57. La distribución de cantidades servidas sigue

una distribución normal. Se pide calcular la probabilidad de que la máquina sirva: a) Entre 253,57 y

258,93 gramos, b) 258,93 o más gramos y c) Entre 242,86 y 258,93 gramos.

Problema 42.- Un número reciente de una revista especializada sugirió que las parejas que están

planeando su boda saben que dos terceras partes de las personas que se les envía una invitación

respondan que si asistirán. Pedro y María tienen planeado casarse más adelante este año y piensan

enviar 197 invitaciones. Responder: a) ¿Cuántos invitados deben esperar que esperen la invitación?, b) ¿Cuál es la desviación estándar?, c) ¿Cuál es la probabilidad de que 140 o más acepten la invitación?

y d) ¿Cuál es la probabilidad de que exactamente 140 acepten la invitación?

Problema 43.- Según los últimos estudios realizados por una empresa especialista la tasa real de

desempleo está por el orden del 9,2%. Si se seleccionan de manera aleatoria 100 aptas para trabajar;

¿Cuál será: a) La cantidad esperada de desempleados?, b) La varianza y la desviación estándar de desempleados?, c) La probabilidad que exactamente 5 estén desempleados? y d) La probabilidad de

que cuando menos 4 estén desempleados?

Problema 44.- Un hotel del área metropolitana tiene 120 habitaciones. En los meses de poco

movimiento, alquila un promedio del 75% de sus habitaciones. Responder; ¿Cuál es la probabilidad de qué: a) Al menos se ocupe la mitad de las habitaciones de las habitaciones en cierto día?, b) 100 o más

habitaciones en cierto día? y c) 80 o menos habitaciones en cierto día?

Problema 45.- Se lanza una moneda 500 veces. Calcular la probabilidad de que el número de caras no

difiera de 250 por: a) Más de 10 veces y b) Más de 30.

Problema 46.- Los paquetes de cereal de Comercializadora Johan C.A vienen en cajas de 36 Kg, que

tienen una desviación estándar de 1,9 Kg. Se piensa que los pesos están distribuidos normalmente. Si

se selecciona una caja aleatoriamente, ¿Cuál es la probabilidad que la caja pese: a) Menos 34,8 Kg b)

Más 34,8 Kg c) Entre 34,3 Kg y 38,8 Kg d) Entre 39,5 Kg y 41,1 Kg?.

Problema 47.- El 45% de todos los empleados del Consorcio La China C.A tienen títulos

universitarios. ¿Cuál es la probabilidad de que de 150 empleados seleccionados aleatoriamente: a) 72

tengan título universitario y b) Más de 70?

Problema 48.- El Consejo Académico del I. U. G. T. designó un equipo de profesores para que

realizara un estudio del comportamiento en el rendimiento académico de los estudiantes que han hecho su vida estudiantil en la institución. Se observó que la estructura de los datos sigue una

distribución normal. El promedio de las notas de la población estudiantil en el tiempo fue de 13,45

105

con una desviación estándar de 1,93. Se quiere responder las siguientes interrogantes: a) ¿Porcentaje

de estudiantes que estarían por debajo 11 puntos?, b)¿Cuál sería la probabilidad de que un estudiante

seleccionado de manera de manera aleatoria obtenga una nota de 12 15 puntos?, c) De 500 estudiantes, ¿Cuántos aprobarían la materia con una nota de 14 a16 puntos y d) Si el Consejo

Académico resuelve otorgar becas estudiantiles al 10% de aquellos estudiantes que obtenga las

mayores notas, ¿Cuál sería la mínima nota a obtener para optar a esta beca?

Problema 49.- Un estudio realizado por el Instituto de Tierras de Venezuela ha concluido que las

precipitaciones diarias de los Andes Venezolanos parecen estar distribuidas normalmente con una media de 55,88 mms., durante la estación lluviosa. Se determinó que la desviación estándar era de

20,32mm. a) ¿Cuál es la probabilidad de que llueva más de 83,82 mm. en un día durante la estación

lluviosa?, b) que llueva más de 33,02 mm?, c) que las precipitaciones estén entre 68,58 y 76,20 y d)

¿Cuánta precipitación debe presentarse para exceder el 12% de las precipitaciones diarias?

Problema 50.- El 72% de los empleados entre obreros, administrativos y académicos que laboran en

el I. U. G.T. poseen títulos académicos. Se seleccionan de manera aleatoria 35 empleados: a) ¿Cuál es

la probabilidad de que exactamente 19 tengan títulos académicos?, b) Más de 28? y c) Menos de 22?

Problema 51.- Si se lanza una moneda equilibrada 160 veces, ¿Cuál será la probabilidad de que se

obtengan caras entre el 40% y el 55% de las veces?

106

TÍTULO IV

Capítulo 11

Teoría del Muestreo y Teorema del Limite Central

1. Definiciones Importantes 1.1. Estadística Inferencial: Estudia métodos y técnicas involucrando el uso de un

estadístico (muestra) para llegar a conclusión o inferencia sobre el parámetro (población) correspondiente.

1.2. Teoría del Muestreo: Estudio que nos enseña la técnica para analizar una población a través de una muestra representativa de la misma.

1.3. Distribución muestral de medias o distribuciones muestrales: Es una distribución de probabilidades de todas las medias posibles de muestras de un determinado tamaño de la población, es decir es una lista de todos los valores posibles para un estadístico (media) y las probabilidades relacionadas con cada valor.

2. Errores Dentro de un Estudio de Muestreo: 2.1. Error de Muestreo: Un error que se establece entre la muestra y población, definido

como, “la diferencia entre el estadístico muestral y el parámetro poblacional correspondiente”

Error de Muestreo: E x

2.2. Error Estándar de la Muestra: Es un error intrínseco de la propia muestra y depende de la normalización de cualquier distribución de probabilidad en estudio. “Es una medida de la dispersión de las medias muestrales alrededor de la media poblaciones (µ) por lo tanto mide la tendencia a sufrir del error de muestreo, en el esfuerzo por estimar a la media poblacional”.

2.3. Para definir este error debemos desarrollar el Teorema del Limite Central que nos señala: “Si todas las muestras de un particular tamaño se selecciona de cualquier población, la distribución muestral de medias se aproxima a una

distribución normal, es decir a medida que el tamaño de la muestra crece la

distribución de medias muestrales se aproximan a una distribución normal, donde la media de medias (Gran Media) es igual a la media poblacional y, y el

error estándar es igual a la desviación estándar o típica dividida entre la raíz cuadrada del tamaño de la muestra”

Error estándar de la muestra:

Gran media o media de media: i

X

X KX

N

Luego:

107

Varianza:

22

2 i i

X

X

X KX

NDesviación Estándar:

22

2 i i

X X

X

X KX

N

2.2.1Conclusiones Importantes del Teorema del Limite Central:

2.2.1.1 Población Grande n ≥30, para un estudio muestral se usa la

distribución Z (Distribución Normal).

2.2.1.2. Población Pequeña n <30, para un estudio muestral se usa la

distribución t (Distribución No Normal)

Distribución de probabilidades “t” de Student: Al igual que la distribución normal, la distribución “t” presenta en su gráfica

una forma de campana simétrica, pero más achatada y con mayor área en los

extremos o colas donde se encuentran las zonas críticas o de rechazo. No existe

una sola distribución “t”, sino una familia de ésta debido a que las desviaciones

estándar se modifican a medida que aumenta el tamaño de la muestra,

acercándose a la distribución normal.

Esta distribución se utiliza bajo las condiciones siguientes:

a) Muestra o Población Pequeña no normal, es decir n<30

b) Desviación Estándar Poblacional (σ) es desconocida, si fuera conocida se emplearía

la distribución normal estandarizada “Z” aun siendo la muestra pequeña

Mientras la distribución “Z” presenta una varianza (σ2) igual a uno (1), la varianza de

la distribución “t” es mayor que uno (1) y esto la hace más achatada, más alargada y

más dispersa que la distribución “Z” varianza:

2.1 Grados de libertad: En estudios posteriores realizados sobre la distribución “t” se

introdujo este término para mejorarla entendiéndose como: “el número de

observaciones menos el número de restricciones impuestas sobre tales observaciones”.

Observación: Si la población es normal aun cuando su tamaño sea pequeña

(n<30) se usa distribución Z

3. Factor de corrección para poblaciones finitas: La expresión es apropiada si el muestreo se realiza con reemplazo, o si la

muestra se toma de una población muy grande virtualmente infinita. Si el muestreo

se realiza sin reemplazo y si el tamaño de la muestra cumple que n>0,05N debe

aplicarse el factor de corrección para poblaciones finitas, en este caso:

108

4. Proporción muestral de la Distribución Muestral:

Valor esperado o esperanza matemática: p

p

pE

N

Error estándar; Población: 1

N; Muestra:

1p

p p

n

Error estándar corregido si n>0,05 N:

Población: 1

1

N n

N N; Muestra:

1p

p p

n 1

N n

N

Desviación Estándar para las Proporciones: p

p

pZ

5. Métodos de Muestreo:

5.1 Muestreo Aleatorio Simple: Método donde la muestra se selecciona de manera tal

que cada elemento o persona en la población tiene la misma oportunidad de ser

seleccionado.

5.2 Muestreo Aleatorio Sistemático: Método donde se selecciona un punto de inicio

aleatorio y después se elige cada K miembro de la población.

5.3 Muestreo Aleatorio Estratificado: Método donde la población a estudiar se divide

el sub-grupos, llamados estratos, y se selecciona de manera aleatoria un elemento de

cada estrato atendiendo al tamaño de cada uno.

5.2 Muestreo Aleatorio por Conglomerados: Método donde se divide la población en

grupos o conglomerados utilizando los límites naturales geográficos o de otros

tipos; seguidamente los grupos se seleccionan al azar y se recopila una muestra a

elegir en forma aleatoria de cada grupo.

109

RESUMEN DEL CAPÍTULO EN CUADROS

Cuadro de fórmulas y condiciones de z y de t para el estudio de parámetros

poblacionales.

Parámetro a estudiar Tipo de

Población

Fórmula a

utilizar

Media Poblacional

Grande (n≥30)

Pequeña (n<30)

(No Normal)

x

xz

x

xt

s

Proporción Poblacional

Grande (n≥30)

Pequeña (n<30)

(No Normal

p

pz

p

pt

s

Cuadro de fórmula y condiciones para obtener el error de muestreo.

Parámetro a estimar Fórmula

General

Tipo de

Población

Error máximo

permisible para

cualquier Nivel de

Confianza (N.C.)

Media Poblacional E x

Grande (n≥30)

Pequeña (n<30) (No Normal)

0 xE z .

0 xE t s

Proporción. Poblacional E p Grande (n≥30)

Pequeña (n<30)

(No Normal)

0 pE z

0 pE t s

110

Cuadro de fórmulas y condiciones para estudiar el error estándar de la muestra.

Error Estándar Fórmula para cada caso Tipo de Población

Media Muestral

,x

n

No Finita

1x

N n

Nn

Finita

Proporción Poblacional

1p

p p

n

No Finita

1

1p

p p N n

n N

Finita

Problemas Resueltos

Problema 01.- Los 7 empleados de una tienda de vender ropas tienen los siguientes ingresos mensuales en bolívares: 11.100; 10.800; 11.100; 15.000; 12.300; 10.800 y 13.500. Se pide; a) Desarrollar una Distribución de Frecuencias y obtener su Media Poblacional; b) Construir una Distribución de Medias Muestrales y obtener la Gran Media, comparar con la Media Poblacional y comentar y c) Calcular la Varianza y la Desviación Estándar de la Distribución de Medias Muestrales o Distribución Muestral Datos: En la serie de datos.

Fórmulas:

22

2 2, ; ; ;1

i ii i i i

N nX X X X

X X

X K XX f X KN X

N N N

Solución

iX if i iX f a)

84.60012.085,714

7

µ=12.085,714

10.800 2 21.600

11.100 2 22.200

12.300 1 12.300

13.500 1 13.500

15.000 1 15.000

7 84.600

b)

111

A=11.100; B=10.800; C=11.100; D=15.000; E=12.300; F=10.800 y G=13.500 {

iX iX

in iX

iX

in iX iX

01 ABC 33.000 11.000 16 BCD 36.900 12.300 31 CFG 35.400 11.800

02 ABD 36.800 12.300 17 BCE 34.200 11.400 32 DEF 38.100 12.700

03 ABE 34.200 11.400 18 BCF 32.700 10.900 33 DEG 40.800 13.600

04 ABF 32.700 10.900 19 BCG 35.400 11.800 34 DFG 39.300 13.100

05 ABG 35.400 11.800 20 BDE 38.100 12.700 35 EFG 36.600 12.200

06 ACD 37.200 12.400 21 BDF 36.600 12.200

07 ACE 34.500 11.500 22 BDG 39.300 13.100

423.00012.085,714

35X

12.085,714X

08 ACF 33.000 11.000 23 BEF 33.900 11.300

09 ACG 35.700 11.900 24 BEG 36.600 12.200

10 ADE 38.400 12.800 25 BFG 35.100 11.700

11 ADF 36.900 12.300 26 CDE 38.400 12.800

12 ADG 39.600 13.200 27 CDF 36.900 12.300

13 AEF 34.200 11.400 28 CDG 39.600 13.200

14 AEG 36.900 12.300 29 CEF 34.200 11.400

15 AFG 35.400 11.800 30 CEG 36.900 12.300

Comentario: “Ambas medias son iguales lo cual nos lleva a concluir que partiendo de una población pequeña aun cuando no sea normal, al transformarla en una Distribución Muestral, tomando un adecuado tamaño de muestra en la cual vamos a partir la población dada podemos transformarla en población grande y considerar esa Distribución Muestral como una que responde a una Distribución Normal

Distribución de Medias Muestrales

iX iK i iX K

2

i iX K

10.900 2 21.800 237.620.000

11.000 2 22.000 242.000.000

11.300 1 11.300 127.690.000

11.400 4 45.600 519.840.000

11.500 1 11.500 132.250.000

11.700 1 11.700 136.890.000

11.800 4 47.200 556.960.000

11.900 1 11.900 141.610.000

12.200 3 36.600 446.520.000

12.300 6 73.800 907.740.000

12.400 1 12.400 153.760.000

12.700 2 25.400 322.580.000

12.800 2 25.600 327.680.000

13.100 2 26.200 343.220.000

13.200 2 26.400 348.480.000

13.600 1 13.600 184.960.000

∑ 35 423.000 5.129.800.000

112

222 5.129.800.000 35 12.085,714

501.23 501.231,3951,395935

501.231,3959 707,9

9

707,7 977 7

X

X

X

X

Problema 02.- Los 314 0breros que trabajan en una empresa automotriz se observa que tienen un promedio de 32 años, con una desviación estándar de 10 años. Si la distribución de estos datos sigue una Distribución Normal; se pide: a) Probabilidad de que la media muestral de 25 de ellos resulte menor de 28 años y b) Probabilidad de que sobrepase los 31 años.

Datos: 314; 32; 10; 25N n Fórmulas: ;1x

x

N nXZ

Nn

314 25101,922

314 125x x

a) 28 0,0188P X

28

28 322,08

1,922Z

0,5 0,4812 0,0188A

b)

31 0,6985P X

28

31 320,52

1,922Z

0,1985 0,5 0,6988A

Ejercicio 03.- El promedio de notas de los estudiantes del IUGT es de 12,7 con una

desviación estándar de 6,2ptos. Si se toma una muestra de 36 estudiantes, ¿cuál será la

probabilidad que la media de esa muestra?:

a. Sea menor que 11

b. Sea menor que 14

c. Ese entre 11 y 14

d. Entre 14 y 15

Solución

Datos: μ =12,7; σ =6,2. Fórmulas: ;x

x

XZ

n

6,21,033

36x

113

a) P( X < 11) 0,0495

11

11 12,71,65

1,033Z

A = 0,5000 – 0,4505=0,0495

b) P( X < 14) 0,8962

14

14 12,71,26

1,033Z

A = 0,5000 + 0,3962=0,8962

c) P(11< X <14) 0,8467

11

14

1,65

1,26

Z

Z

A = 0,4505 + 0,3962=0,8467

d) P(14< X <15) 0,0909

14 1,26Z

15

15 12,72,23

1,033Z

A = 0,4871 – 0,3962=0,0909

Capítulo 12

ESTIMACION CON INTERVALO DE CONFIANZA

1. Estimación: Una estimación es el proceso mediante el cual se obtiene un estimador. 1.1 Estimador Puntual: Estadístico que se calcula a partir de la información de la

muestra y se utiliza para estimar el parámetro de la población, el cual es un único

valor. 1.2 Estimación por Intervalos de Confianza: Es el rango de valores creado a partir

de los datos de la muestra, de modo que el parámetro poblacional es probable que ocurra dentro de ese rango dentro de una probabilidad específica. Cuando se estima un Intervalo de Confianza, ese rango obtenido nos está señalando que la Media Poblacional o la Proporción Poblacional según sea el caso oscila entre eso valores extremos a los que se llama Límites de Confianza, es decir pueden existir infinitos valores que pueden ser asumidos por esos parámetros. Por eso es que se tiene que los mejores estimadores puntuales son los estadísticos que obtenemos de una muestra, los cuales combinados en operaciones sencillas con el

114

Error Estándar de la muestra y el Nivel de Confianza, nos permite obtener el error de muestreo que sumado o restado al Estimador Puntual que disponemos se obtiene los Límites de Confianza.

1.3 Nivel o Coeficiente de Confianza: Es la probabilidad específica que define el rango dentro del cual debe estar el parámetro poblacional desconocido.

2. Intervalos de Confianza para Medias Poblacionales ( ). 2.1 Población Grande (n≥30)

Se utiliza Z.

IC de =

LIC = Límite inferior de confianza

LSC = Límite superior de confianza

LIC = X – ; LSC = X +

2.2 Población Pequeña (n<30)

Se utiliza t.

LIC = X -

Debe cumplirse también para usar que la desviación estándar poblacional

sea desconocida entonces se usa la desviación estándar muestral y que además la población sea normal o casi normal.

3. Intervalos de Confianza para Proporciones Poblacionales

3.1 Población Grande (n≥30)

Se utiliza Zo.

LIC = X – ; LSC = X +

3.2 Población Pequeña (n<30)

Se utiliza to.

4. Determinación del tamaño apropiado de la muestra

Seleccionado todo el nivel de confianza, en el tamaño muestral dos factores

importantes influyen: a) la varianza de la población ( 2

x), expresa el grado de

variabilidad que presentan las unidades de la población, siendo para proporciones

poblacionales: 2

x= pq = π(1- π) y en el mejor de los casos 2

x= 0,25; b) el tamaño del

error tolerable (E) fijado por el investigador de acuerdo al estudio a realizar y c) el nivel de confianza (NC), tiene relación directa con el tamaño de la muestra a mayor nivel de confianza el tamaño de la muestra será mayor. De acuerdo a lo estudiado hasta ahora podemos obtener una conclusión importante, el tamaño de la muestra a determinar es el mínimo tamaño requerido para cumplir con el Nivel de Confianza establecido y el margen de Error estimado, es una cuestión de economía. Sin embargo esta conclusión nos lleva a afirmar que a mayor tamaño de la muestra, mayor es el Nivel de Confianza y menor el margen del Error de Muestreo lo cual sería mejor para cualquier estudio de investigación a realizar.

115

4.1 Tamaño de la muestra para estimar en poblaciones no finitas

4.2 Tamaño de la muestra para estimar en poblaciones no finitas

Eπ = p – π

Si se optimizara el tamaño de la muestra, haríamos más confiable la investigación; y esto se logra si obviamos la proporción que se nos suministre, y

asumimos la proporción óptima que sería = 0,5. Para el margen de error

estimado y el Nivel de Confianza establecido obtendríamos el tamaño de la

muestra óptimo, ya que 0,5 1 0,25 por lo que:

2

0,25Z

nE

4.3 Tamaño en el muestreo aleatorio simple para poblaciones finitas (N)

2

22

2 2

2 2 2 2

: ; Pr , :

1 0,25; 0,5

1 0,25

N ZPara Medias Poblacionales n para oporciones Poblacionales normal

NE Z

NZ NZn para que sea óptima se hace n

NE Z NE Z

5. Propiedades de un buen estimador: 6.

6.1 Estimador insesgado: Un estimador es insesgado, si la medias de su de distribución muestral es igual al parámetro correspondiente.

6.2 Estimador eficiente: Dado todo estimador insesgado, el más eficiente es aquel que tenga la menor varianza

6.3 Estimador consistente: Un estimador es consistente si, a medida que n aumenta el valor del estadístico se acerca al parámetro

6.4 Estimador suficiente: Un estimador es suficiente si ningún otro estimador puede proporcionar más información sobre el parámetro

RESUMEN DEL CAPÍTULO EN CUADROS

Intervalos de Confianza

Parámetro Intervalo de confianza

Media Poblacional I.C. de µ: L.I.C. ≤ µ ≤ L.S.C.

Proporción Poblacional I.C. de : L.I.C. ≤ ≤ L.S.C.

116

Cuadro de fórmulas y condiciones para determinar cualquier Intervalo de Confianza

Tipo de Población Parámetro Límite Determinación Tipo de Distribución

Grandes No-finitas

(n≥30)

Media

Poblacional

Inferior de

Confianza L.I.C.= x - 0 xZ

Distribución a utilizar. Sé

utiliza la Distribución

Normal Estándar (Z). Sin

embargo se utiliza también

en poblaciones pequeñas,

siempre y cuando ésta sea

una población

normal.Comentario.Para

conseguir el valor de Z0, se

debe conocer el Nivel de

Confianza (NC), y con ese

valor conseguir el valor del

área (A0) dentro de la tabla,

la cual nos define el valor

de Z0.

Superior de

Confianza L.S.C.= x + 0 xZ

Proporción

Poblacional

Inferior de

Confianza L.I.C.=p - 0 xZ

Superior de

Confianza L.S.C.= p+ 0 xZ

Grandes Finitas

(n≥30)

Media

Poblacional

Inferior de

Confianza L.I.C.= x - 0 xZ fcpc

Superior de

Confianza L.S.C.= x + 0 xZ fcpc

Proporción

Poblacional

Inferior de

Confianza L.I.C.= p - 0 xZ fcpc

Superior de

Confianza L.S.C.= p + 0 xZ fcpc

Pequeñas No-Finitas

(n<30)

Media

Poblacional

Inferior de

Confianza L.I.C.= x - 0 xt s

Distribución a utilizar. Se

utiliza la Distribución

Simétrica Platicúrtica de

Student (t), para

poblaciones pequeñas no

normales. Comentario.

Para conseguir el valor de

t0, se debe conocer el Nivel

de Confianza (NC), y ese

valor se combina con el

grado de libertad (g.l.),

ubicado en la primera

columna a la derecha de la

tabla t, ubicando en la

parte de la fila superior

donde se señalados colas

al N.C. g.l.= n –1

,n=tamaño de la muestra;

r=restricción que presenta

la población

Superior de

Confianza L.S.C.= x + 0 xt s

Proporción

Poblacional

Inferior de

Confianza L.I.C.= p - 0 xt s

Superior de

Confianza L.S.C.= p + 0 xt s

Pequeñas Finitas

(n<30)

Media

Poblacional

Inferior de

Confianza L.I.C.= x - 0 xt s fcpf

Superior de

Confianza L.S.C.= x + 0 xt s fcpf

Proporción

Poblacional

Inferior de

Confianza L.I.C.= p - 0 xt s fcpf

Superior de

Confianza L.S.C.= p + 0 xt s fcpf

Factor de corrección para poblaciones finitas: 1

N nfcpf

N

117

Determinación del tamaño adecuado de la muestra

Tipo de

Población

Parámetro Fórmula Ordinaria Fórmula

Óptima

Comentario

No finita

Media

Poblacional

2Z

nE

Seleccionado el N.C., en el

tamaño muestral 2 factores

importantes influyen: a) la

varianza de la pobl. (2

),

expresa el grado de

variabilidad que presentan

las unidades de la pobl.,

siendo para prop. Poblacs.:

2= π (1- π) y en el mejor

de los casos 2

x= 0,25; b) el

tamaño del error tolerable (E)

fijado por el investigador de

acuerdo al estudio a realizar

y c) el nivel de confianza

(NC), tiene relación directa

con el tamaño de la muestra

a mayor nivel de confianza el

tamaño de la muestra será

mayor.

Proporción

Poblacional

2

1Z

nE

2

0,25Z

nE

Finita

Media

Poblacional

2

22

N Zn

NE Z

Proporción

Poblacional

2

2 2

1

1

NZn

NE Z 2

2 2

0,25

0,25

NZn

NE Z

Problemas Resueltos

Problema 01.- Si la desviación estándar de las notas de los estudiantes de un curso de Estadística Instrumental del I. U. G. T. es de 1,6 puntos. Si se toma una muestra de 36 estudiantes de estos estudiantes, ¿Cuál es la probabilidad de que se presente un error de muestreo de 0,6 puntos o más?

Datos: 36; 0,6; 1,6n E

Fórmulas: ; ;x x

E Zn

1,6 0,60,267; : 2,2

0,6 0,

5;0,26736

0,6 0,5 0,4878 0,0122; :

0122

xluego Z como se nos pide que la probabilidad

sea igual o mayor que eso A luego

P X

Problema 02.- Una empresa de investigación realizó una encuesta para determinar la

cantidad media que los fumadores gastan en cigarrillos durante una semana. Una muestra

de 49 fumadores reveló que la media muestral es de Bs. 20 y una desviación estándar

118

muestral de Bs. 5. a) ¿Cuál es el estimador puntual de la media de la población? Explicar

que indica y b) Utilizando el nivel de confianza de 95%, determinar el intervalo de confianza

para la media poblacional. Explicar que indica.

Datos: 49; 20; 5; 95%n X S NC

Fórmulas: ;x x

SE Z S S

n

a) “El mejor estimador es la Media Muestral=20, ya que partiendo de ella se puede estimar el rango de valores donde puede ubicarse la Media Poblacional”

b)

50,7143; 95% 1,96 1,96 0,7143 1,4

7

20 1,4 18,6; 20 1,4 21,

: 18,6 21,4

" , 18,6 21,4"

4

x

IC de

Explica que la Media Poblacional con estos datos debe oscilar entre

S para NC Z E x

LIC X E LSC X E

a

Problema 03.- Para realizar un estudio de manera aleatoria se selecciona una muestra de

81 trabajadores cuyo ingreso mensual promedio fue de Bs. 3.890,00 conociéndose que para

condiciones similares la desviación estándar poblacional es de Bs. 998,00. Se toma un nivel

de confianza del 96%, para realizar un estudio de estimación. Se pide: a) ¿Cuál será la media

poblacional? b) ¿Cuál sería el mejor estimador puntual?, c) ¿Qué distribución de variable

continua se utilizaría para obtener el error estándar de la muestra, el error de muestro y un

intervalo de confianza? ¿Por qué?, d) Calcular el error estándar de la muestra y el error de

muestreo, e) Desarrollar el intervalo de confianza para este estudio e interpretar resultados y

f) ¿ Se podría afirmar que un ingreso de Bs. 3.800,00 es una media poblacional? ¿Qué tal un

ingreso de Bs. 3.650?

Datos: 81; 3.890,00; 998,00; 96%n X NC

Fórmulas: ;x x

SE Z S S

n a) “No se puede considerar una media poblacional como tal en virtud que en el

Intervalo de Confianza que se podría desarrollar con esta información existirían infinitos valores que podrían asumir la función de Media Aritmética Poblacional”.

b) “El mejor estimador es la Media Muestral (Bs. 3.890,00) , ya que partiendo de ella se puede estimar el rango de valores donde puede ubicarse la Media Poblacional”

c) “Se utilizará la Distribución Normal o Z, ya que n=81>30, Población Grande. d)

998; 96% 2,05

81

2

110,889

227,,05 110,889 322

x xpara NC Z

EE x

e)

119

: 3.662,678 4.117,322

3.890 227,322 3.662,678; 3.890 227,322 4.1

" ,

3.662,678 4.117,

17,3

322

2

"

2

IC de

Explica que la Media Poblacional con estos datos debe

LIC X E LSC

oscilar desde a inclusive

X E

f) Como Bs. 3.800,00 está dentro del Intervalo de Confianza se puede considerar como uno de los valores de la Media Aritmética Poblacional; no así Bs. 3.650,00 que está fuera de ese intervalo”

Problema 04.- Una agencia de turismo tomó muestras de las personas que en vacaciones participaban en cruceros por El Caribe y que visitaban a Puerto Rico. Dentro de un nivel de confianza de 96%, ¿Cuál será el intervalo de confianza para la proporción de vacacionistas venezolanos si de las 1822 personas encuestadas 531 eran venezolanos?

a) Datos: 531; 1.822; 96%n N NC

b) Fórmulas: 1

; ;p p

p pnp E Z

N n

c)

0,2914 1 0,29145310,2914; 0,0197; 96% 2,05

1.822 531

2,05 0,0197 0,0403

0,2914 0,0403 0,251

: 0,2511 0,33

1; 0.2914 0.0403 0,3317

17

pp para NC Z

E x

LIC p E LSC p E

IC de

Problema 05.- ¿Qué tan grande se requiere que sea el tamaño de una muestra para que proporcione una estimación del 90% del número promedio de graduados de las universidades nacionales con un error de muestreo de 2.000 estudiantes si una muestra piloto reporta una desviación estándar de 8.659?

Datos: 2000; 8.659; 90%E NC

Fórmulas:

2Z

nE

2

1,65 8.65990% 1,65; : 51,0321

2.

2

000

5n

xPara NC Z luego n

Problema 06.- Para realizar un estudio se requiere un nivel de confianza del 95% para la

tasa de rendimiento promedio de una empresa que gana sobre sus proyectos para

presupuestar capital. ¿Cuántos proyectos debe tener la muestra, si su supervisor especifica

un error máximo de sólo del 5% y una desviación estándar de 0,23?

Datos: 5%; 95%; 0,23E NC

Fórmulas:

2Z

nE

120

2

1,96 0,2395% 1,96 81,2

8

8830,05

2

xPara NC n

n

Z

Problema 07.- El comisionado para supervisar el funcionamiento de los institutos de educación universitaria requiere hacer un estudio sobre los graduandos de dichos institutos en esta parte del año. Solo sabe que el año pasado por esta época solo se graduó el 82% de los que tenían opción al grado. Se toma un nivel de confianza del 96%, y se estima un error de muestreo del 3%, para realizar una encuesta sobre la posibilidad que tiene cada estudiante de graduarse. Para hacerla se va a tomar una muestra de manera aleatoria de los 25.683 graduandos. ¿Cuál sería el tamaño mínimo de la muestra para realizar esta investigación?

Datos: 0,82; 0,03; 96%; 25.683E NC N Población Finita

Fórmula:

2

2 2

1

1

o

o

NZn

NE Z

2

2 2

0,82 0,18 25.683 2,05671,198

25.683 0,03 0,82 0,18 2,05672n graduandn os

Problema 08.- El comisionado para supervisar el funcionamiento de los institutos de educación universitaria requiere hacer un estudio sobre los graduandos de dichos institutos en esta parte del año. No teniendo una información referencial para un basamento en el muestreo de los graduandos actuales; se toma un nivel de confianza del 96%, y se estima un error de muestreo del 3%, para realizar una encuesta sobre la posibilidad que tiene cada estudiante de graduarse. Para hacerla se va a tomar una muestra de manera aleatoria de los 25.683 graduandos. ¿Cuál sería el tamaño mínimo de la muestra para realizar esta investigación?

Datos: 25.683; 0,03; 96%N E NC Población Finita

Fórmulas:

2

2 2

0,25

0,25

o

o

NZn

NE Z

2

2 2

0,25 25.683 2,051.116,608

25.683 0,03 0,251

2,05.117n graduandosn

Problema 09.- Para introducir un nuevo producto en el mercado una empresa de bebidas gaseosas requiere realizar una encuesta para estudiar el grado de aceptación del nuevo producto, la cual se realizaría tomando un Nivel de Confianza del 97% y un error permisible del 3% ¿Cuál será el tamaño de la muestra?

Datos: 3%; 97%E NC

Fórmulas:

2

0,25Z

nE

121

2

2,1797% 2,17 0,25 1.308,0278

0,0

1. 09

3

3

Para NC Z

n

n

Problema 10.- Si el nuevo producto de la empresa de bebidas gaseosas va dirigido a una

población de 458.564 consumidores de refrescos, para realizar la encuesta del problema

anterior se necesita conocer el tamaño de la muestra, dentro de un nivel de confianza del

97% y un margen de error del 3% ¿Cuál será el tamaño de la muestra?

Datos: 458.564; 0,03; 97%N E NC Población Finita

Fórmulas:

2

2 2

0,25

0,25

o

o

NZn

NE Z

2

2 2

0,25 458.564 2,171.304,3073

458.564 0,03 0,251.3

2,105

7n consumidon res

Capítulo 13 PRUEBA DE HIPOTESIS

1. Definiciones básicas 1.1. Hipótesis: Afirmación o enunciado acerca de un parámetro o población que se

desarrolla o elabora con el propósito de probar. 1.2. Prueba de Hipótesis: Procedimiento basado en la evidencia muestral y la

teoría de la probabilidad que se emplea para determinar si la hipótesis es una afirmación razonable.

2. Procedimiento de Hipótesis de cinco pasos para probar una hipótesis

2.1 Primer Paso: Establecer la hipótesis

2.1.1. Hipótesis Nula (Ho): Afirmación acerca del atributo numérico de un

parámetro poblacional.

2.1.2. Hipótesis Alternativa: Afirmación que se acepta si los datos de la

muestra proporciona suficiente evidencia de que la hipótesis nula es falsa.

2.2 Segundo paso: Seleccionar un nivel de significancia

2.2.1. Nivel de Significancia: Es la probabilidad de rechazar la hipótesis nula

siendo verdadera.

2.2.2. Error Tipo I: Rechazar la hipótesis nula siendo verdadera.

2.2.3. Error Tipo II: Aceptar la hipótesis nula siendo falsa

2.2.4. Tipos de Prueba

122

a) Prueba de dos colas:

Prueba de una cola

0Hipótesis Nula H AHipótesis Alternativaa H

a a

Zona de Aceptación

0 2 0Z 0Z Zona de Rechazo

c) Prueba de una cola: Se presenta cuando (cola a la derecha) ó cuando

(cola a la izquierda)

Prueba de una cola

0Hipótesis Nula H AHipótesis Alternativaa H

a

a

a

a

a

a

a

a

123

Cola a la derecha Cola a la izquierda

0Z 0 0Z

Zona de Aceptación Zona de Rechazo Zona de Aceptación

2.3. Tercer Paso: Determinar el estadístico de prueba

2.3.1 Estadístico de Prueba: Valor determinado a partir de la información de la

muestra que se utiliza para definir si se rechaza la o se acepta la hipótesis nula.

2.3.2 Casos que se presentan para probar hipótesis

A) Para una población (Muestra Grande; n≥30, µ y p)

En medias poblacionales (µ) En proporciones poblacionales (p)

Cuando no se conocen se asume la desviación estándar de la muestra S y

p.

B) Para una población (Muestra pequeña; n<30,

2.4 Cuarto Paso: Formular una regla de decisión

124

Si la prueba es de dos colas, para aceptar la hipótesis nula debe cumplirse que

(Muestra grande) ó – to< t < to (Muestra pequeña) de lo contrario

se rechaza Si la prueba es de una cola a la derecha, debe cumplirse que Z ≤ Zo

(Muestra grande) ó t < to (Muestra pequeña) ya

Si la prueba es de una cola a la izquierda, debe cumplirse que – Zo Z (muestra

grande) o t < to (muestra pequeña), ya que

2.5 Quinto Paso: La toma de decisión:

Estudiados y analizados los supuestos de los cuatro pasos anteriores, se toma

la decisión y se redacta en base a los resultados obtenidos.

3. Valores p: Uso e interpretación, en una prueba de hipótesis

3.1 Valor p: Es la probabilidad de observar un valor de muestra tan

extremo o más que el valor observado, dado que la hipótesis nula es verdadera

3.2 Uso e interpretación: El valor p se usa para probar hipótesis, y es un valor

del área según la tabla de distribución normal correspondiente a Z (A).

Si lo prueba es de dos colas se acepta la hipótesis nula, ya que A = 0,5 – A, de lo

contrario se rechaza.

Si la prueba es de una cola se acepta la hipótesis nula, de lo contrario se rechaza.

Problemas Resueltos

Problema 01.-Una embotelladora de salsa de tomates quiere comprobar que el producto contenido en cada botella tiene un peso promedio de 450 gramos. Para realizar la comprobación se tomó una muestra de 250 botellas, y se le calculó al producto, un peso promedio de 452,75 gramos, con una desviación estándar de 24,55 gramos. Para la comprobación se toma un nivel de significancia del 5%. ¿Será cierto lo que quiere comprobar la embotelladora de salsa de tomates?

Datos: µ =450 grs., n=250 botellas; =452,75 grs.; S=24,55 grs.; α=5%

Fórmulas: 0 0; ; 0,5

x

x

XZ A

n

Solución 01. Planteamiento de la Hipótesis:

Hipótesis Nula; H0: µ =450 grs. Hipótesis Alternativa; HA: µ 450 grs.

02. Seleccionar un nivel de significancia:

Como µ=450 grs., eso implica que la prueba es de dos colas, por lo que:

125

0

0,050,025

2 2

03. Determinar el estadístico de prueba:

Siendo n=250 > 30, muestra grande, se usa la Distribución Z; por lo que

24,55 452,75 450,001,553 1,77

1,5532501,77

xZ Z

04 Formular la regla de decisión:

Dos Colas Aceptación

-Z0=-1,96 0 Z=1,77 +Z0=+1,96

Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5 - α0, por lo tanto A0=0,5-

0,025=0,4750, buscando este valor en la tabla de Z, resulta que Z0 =1,96.

05 Toma de Decisión:

Cumpliéndose lo establecido en la regla de decisión, por cuanto –Z0=-1,96<1,77=Z<1,96=Z0, se acepta la hipótesis nula, es decir: “la embotelladora comprobó con esta prueba de hipótesis, que realmente el contenido de cada botella de salsa de tomate pesa un promedio de 450 gramos”

Ejercicio 02.-Una embotelladora de salsa de tomates quiere comprobar que el producto contenido en cada botella tiene un peso promedio mayor o igual a 450 gramos. Para realizar la comprobación se tomó una muestra de 250 botellas, y se le

calculó al producto, un peso promedio de 452,75 gramos, con una desviación estándar de 24,55 gramos. Para la comprobación se toma un nivel de significancia del 5%. ¿Será cierto lo que quiere comprobar la embotelladora de salsa de tomates?

Datos: 450 grs., n=250 botellas; =452,75 grs.; S=24,55 grs.; α=5% grs.,

Fórmulas: 0 0; ; 0,5

x

x

XZ A

n

126

01. Planteamiento de la Hipótesis:

Hipótesis Nula; H0: µ 450 grs. Hipótesis Alternativa; HA: µ 450 grs.

02. Seleccionar un nivel de significancia:

Como, 450, que la prueba es de una cola, como =452,75 > 450 = µ, y la cola

es a la derecha por lo que αo=α= 0,05

03. Determinar el estadístico de prueba: Siendo n=250 > 30, muestra grande, se usa la Distribución Z; por lo que

24,55 452,75 450,001,553 1,77

1,5532501,77

xZ Z

04. Formular la regla de decisión:

Cola Derecha Aceptación 0 +Z0=1,65 Z=1,77

Por ser una prueba de una cola y es a la derecha, para aceptar la Hipótesis Nula debe cumplirse que Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5 - α0, por lo

tanto A0=0,5-0,05=0,4500, buscando este valor en la tabla de Z, resulta que Z0 =1,65.

05 Toma de Decisión:

No cumpliéndose lo establecido en la regla de decisión, por cuanto Z=1,77> 1,65=Z0, se rechaza la hipótesis nula, es decir: “la embotelladora comprobó con esta prueba de hipótesis, que realmente el contenido de cada botella de salsa de tomate pesa menos del promedio de 250 gramos”

Problema 03.-Una comercializadora de agua potable lleva botellones de agua a una zona del área metropolitana, donde el responsable de esa zona informa a la gerencia operativa que mensualmente por lo menos 386 botellones de agua se venden allí. El gerente de operaciones piensa que esa cifra puede estar abultada, y para varios meses cualquieras se consignaron 400 botellones de agua para esa zona, llegándose a vender un promedio de 380 botellones de agua por mes, con una desviación estándar de 110 botellones de agua. Se toma un nivel de significancia del 2%, para completar el estudio sobre la venta de los botellones de agua en esa zona de la ciudad. ¿Cuál será el destino del responsable de la venta de botellones de agua en esa zona del área metropolitana?

Datos: Datos: 386 grs., n=400 botellas; =380 grs.; σ=110 grs.; α=2% grs.,

127

Fórmulas: 0 0; ; 0,5

x

x

XZ A

n

01. Planteamiento de la Hipótesis: Hipótesis Nula; H0: µ 386 botellones Hipótesis Alternativa; HA: µ 386

botellones.

02. Seleccionar un nivel de significancia:

Como, 386, que la prueba es de una cola, como =380 < 386=µ , la cola

es a la izquierda por lo que αo=α= 0,02

03. Determinar el estadístico de prueba: Siendo n=400 > 30, muestra grande, se usa la Distribución Z; por lo que

110 380 3865,5 1,09

51,09

,5400x

Z Z

04. Formular la regla de decisión:

Cola Izquierda Z=-2,05 Z=-1,09 0 Aceptación

Por ser una prueba de una cola y es a la izquierda para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z, de lo contrario se rechaza. Se sabe que A0= 0,5- α0, por lo tanto

A0=0,5-0,02=0,4800, buscando este valor en la tabla de Z, resulta que Z0 =2,05

05. Toma de Decisión:

Cumpliéndose lo establecido en la regla de decisión, por cuanto Z0=-2,05<-1,09=Z, se acepta la hipótesis nula, es decir: “El Gerente de Operaciones de la comercializadora de botellones de agua potable, comprobó que es cierta la información que le dio el responsable de la zona metropolitana que él atiende, por lo tanto su destino sería quedarse en la empresa trabajando”

Problema 04.-Una empresa chequeando el fondo de pensiones de sus empleados, llega a la conclusión, de que los empleados tienen un promedio de más de Bs. 99.200,00. Al tomar de manera aleatoria una muestra de 100 de sus empleados, y haciendo los respectivos cálculos en esta muestra, encuentra que la media es de Bs. 100.371,20 con una desviación estándar de Bs. 6.060,80. Para un nivel de significancia del 4%; ¿podrá tomarse como cierta la conclusión de la empresa?

Datos: Datos: 99.200,00 Bs., n=100 empleados; =100.371,20 Bs.; σ=6.060,80

Bs.; α=4% grs.,

128

Fórmulas: 0 0; ; 0,5

x

x

XZ A

n

01. Planteamiento de la Hipótesis:

Como, 450, que la prueba es de una cola, como =452,75 > 450 = µ, y la

cola es a la derecha por lo que αo=α= 0,04

Hipótesis Nula; H0: µ 99.200,00 Bs. Hipótesis Alternativa; HA: µ

99.200,00 Bs.

Seleccionar un nivel de significancia:

Como, 99.2000, que la prueba es de una cola, como =100.321,20,75 >

99.200,00 = µ, y la cola es a la derecha por lo que αo=α= 0,04

02. Determinar el estadístico de prueba:

Siendo n=100 > 30, muestra grande, se usa la Distribución Z; por lo que:

6.080,80 100.371,20 99.200,00608,08 1,93

608,01,

810093

xZ Z

03. Formular la regla de decisión:

Aceptación

Cola Derecha 0 +Z0=1,75 Z=1,926

129

Por ser una prueba de una cola y es a la derecha, para aceptar la Hipótesis Nula debe cumplirse que Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5 - α0, por lo

tanto A0=0,5 - 0,04=0,4600, buscando este valor en la tabla de Z, resulta que Z0 =1,75.

05. Toma de Decisión:

No cumpliéndose lo establecido en la regla de decisión, por cuanto Z=1,93> 1,75=Z0, se rechaza la hipótesis nula, es decir: “La conclusión que tiene la empresa sobre el fondo de pensiones de sus empleados está errada, para este nivel de significancia”

Problema 05.-Un grupo de estudiantes de Estadística Instrumental del I.U.G.T., cuestionan

la afirmación de que las procesadoras de hamburguesas utilizan 115 grs. de carne en sus productos, algunos estudiantes piensan que contienen más carne. Para aclarar esta duda, cada uno de los 22 estudiantes del curso lleva una hamburguesa y la pesan en una balanza bien calibrada obteniéndose una media de 109,72 grs. con una desviación estándar de 22,5 grs. ¿Cuál sería la conclusión a que se llegaría para un nivel de significancia del 5%?

Datos: µ=115 grs. n=22 hamburguesas; =109,72 grs.; S= 22,5 grs.; α=5%

0 0; ; 0,5x

x

X St S A

S n

01. Planteamiento de la Hipótesis:

Hipótesis Nula; H0: µ =115grs. la Hipótesis Alternativa; HA: µ 115 grs.

02. Seleccionar un nivel de significancia:

Como µ =115 grs., que la prueba es de dos colas, y siendo una muestra

pequeña ya que: n = 22 < 30, y además no es normal se usará la Tabla de Distribución de Student, donde se contemplan los dos casos de las colas.

03. Determinar el estadístico de prueba: Siendo n=22 < 30, muestra pequeña y además no es normal, se usa la

Distribución t; por lo que

22,5 109,72 115,00

4,797 1,104,79722

1,10x

Z Z

04 Formular la regla decisión.

130

Aceptación

-t0 =-2,08 t=-1,10 0 +t0=2,08

Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que

–t0<t<t0, de lo contrario se rechaza. Como es una sola población pequeña, r=1, por lo

que: g. l.=n - r=22 - 1=21, y entrando a la tabla t de Student en prueba de dos colas

para un a=5% y g.l. de 21, to = 2,080 05 Toma de Decisión:

Cumpliéndose lo establecido en la regla de decisión, por cuanto –t0=-2,08<-

1,10=t<2,08=t0, se acepta la hipótesis nula, es decir: “Se debe concluir que para un

nivel de significancia del 5%, el contenido de carnes de las hamburguesas no tienen un peso superior a los 115 gramos”

Problema 06.-El Director de Operaciones de una empresa de mercadeo, considera que el 60% de los clientes de la firma se han graduado en universidades. Se desea intentar una estructura de precios respecto a esta proporción. Una muestra de 800 clientes revela que 452 de ellos tienen grado universitario. ¿A qué conclusión se llegaría sobre la proporción de todos los clientes que tiene el Director de Operaciones de la empresa aceptando para el análisis un nivel de significancia del 5%?

Datos: =0,60 clientes., n=800 clientes; x = 452 clientes; α=5%;

Fórmulas: 0 0

1; ; 0,5 ;p

p

p pp xZ A p

n n

01. Planteamiento de la Hipótesis:

Hipótesis Nula; H0: =0,60 clientes la Hipótesis Alternativa; HA: 0,60

clientes

131

02. Seleccionar un nivel de significancia:

Como =0,60 clientes, eso la prueba es de dos colas, por lo que

0

0,050,025

2 2

03. Determinar el estadístico de prueba:

Siendo n=800 > 30, muestra grande, se usa la Distribución Z; por lo que:

0,565 1 0,5654520,565; 0,0175

800 800

0,565 0,6002,00

0,01752,00

pp

ZZ

04 Formular la regla de decisión:

Aceptación

Z=-2,00 -Z0 =-1,96 0 +Z0=1,96

Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5- α0, por lo tanto A0=0,5-

0,025=0,4750, buscando este valor en la tabla de Z, resulta que Z0 =1,96.

05 Toma de Decisión:

No cumpliéndose lo establecido en la regla de decisión, ya que Z = -2,00 no pertenece al intervalo definido, luego: “La consideración del Director de Operaciones de la

empresa de mercadeo no es cierta, el 60% de los clientes no tienen grado universitario”

Problema 07.- Una compañía desea comparar las expectativas sociales anuales de su personal de ventas, entre mujeres y hombres, según un nuevo plan de

compensaciones de ventas más comisión. Para que predijeran sus ingresos anuales se pidió n1= 42 vendedoras y n2= 40 vendedores, seleccionadas de manera aleatoria. Las medias muestrales y las desviaciones de las predicciones que se

formularon son: 1X =Bs. 31.083,00 y S1=Bs. 2.312,00; 2X =Bs. 29.745,00 y S2=Bs.

132

2.569,00; considerar un nivel de significancia del 1%. ¿Proporcionan los datos suministrados evidencias que indiquen una diferencia en el promedio del ingreso

anual esperado tanto entre las vendedoras como los vendedores?

Datos: 1X =Bs. 31.083 y

2X =Bs. 29.745; n1=42 mujeres y n2=40 hombres; S1=Bs. 2.312

y S2=Bs. 2569; α=5%

Fórmulas:1 2

2 2

1 2

1 2

S SS

x x n n;

1 2

1 2 1 2ZS

x x

x x

01. Planteamiento de la Hipótesis:

Hipótesis Nula; H0: µ1=µ2 la Hipótesis Alternativa HA: µ1 µ2

02. Seleccionar un nivel de significancia:

Como µ1=µ2, la prueba es de dos colas, por lo que 0,01

0,0052 2

o

03. Determinar el estadístico de prueba:

Siendo n1=42 y n2=40 > 30, muestra grande, se usa la Distribución Z; entonces:

1 2

1 2 1 2ZS

x x

x x;

31.083 29.745 02,48

540,6146Z

1 2

2 2

1 2

1 2

S SS

x x n n,

1 2

2 22.312 2.569540,6146

42 40S

x x

04 Formular la regla de decisión:

Aceptación

- Z0=- 2,58 0 Z= 2,48 Z0= 2,58

133

Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que –Z0<Z<Z0, de lo contrario se rechaza. Se sabe que A0= 0,5- α0, por lo tanto A0=0,5-

0,005=0,4950, buscando este valor en la tabla de Z, resulta que Z0 =2,58.

05 Toma de Decisión:

Cumpliéndose lo establecido en la regla de decisión, por cuanto –Z0=-2,58<2,48=Z<2,58=Z0, se acepta la hipótesis nula, es decir: “Los datos obtenidos para el estudio dentro de un nivel de significancia del 1%, proporcionan las evidencias de que no existen diferencias en el promedio del ingreso anual esperado tanto en las vendedoras como en los vendedores”

Problema 08.- La Máxima Central Obrera discutiendo el Contrato Colectivo de ajustes salariales para nivelar los ingresos y las condiciones sociales de los

trabajadores de la salud y la construcción. El negociador laboral llega a un acuerdo con la representación patronal de establecer un nivel de significancia del 2%, para estimar la diferencia entre los niveles salariales promedio. Realizado un estudio

muestral que se presenta al final para realizar el ajuste para nivelar a ambos grupos de trabajadores. ¿Cuál sería el ajuste si es del caso?

SALUD CONSTRUCCIÓN

n1=23 n2=19

1.110 BsXDía

2

.98BsXDía

1.24,04 BsSDía

2

.22,69BsSDía

Datos: SALUD CONSTRUCCIÓN

n1=23 n2=19

1.110 BsXDía

2

.98BsXDía

1.24,04 BsSDía

2

.22,69BsSDía

α=2%;

Fórmulas:

2 2 2 2

1 2 1 1 2 21 2 2

1 2 1 2

1 ( 1); ;

2

p p

pp

p

S S S n S nt S S

S n n n n

x x

Solución 02. Planteamiento de la Hipótesis:

Hipótesis Nula; H0: µ1=µ2 HA: µ1 µ2

02. Seleccionar un nivel de significancia:

134

Como µ1=µ2, implica que la prueba es de dos colas, por lo que 0,02

0,012 2

o

03. Determinar el estadístico de prueba:

Siendo n1=23 y n2=19 < 30, muestra pequeña, se usa la Distribución t; entonces:

2 22 (24,04 )(22) (22,69 )(18)

549,533140

pS ;

549,5331 549,53317,2674

23 19pS

110 98

1,6517,2674

t ;

04 Formular la regla de decisión:

Aceptación

-t0=2,423 0 t=1,651 t0=2,423

Por ser una prueba de dos colas para aceptar la Hipótesis Nula debe cumplirse que

–t0<t<t0, de lo contrario se rechaza. Al usar la Distribución t de Student y teniendo en

cuenta que estamos estudiando dos poblaciones pequeñas no normales, entonces g.l.=n1+n2-

2= 23+19-2=40 y como la prueba es de dos colas para α=2%; t0=2,423

05 Toma de Decisión:

Cumpliéndose lo establecido en la regla de decisión, ya que –t0=-2,423<1,6512=t<2,423=t0,

se acepta la hipótesis nula, es decir: “Los ajuste establecidos en el estudio realizado cumple con lo convenido entre el negociador laboral y el representante patronal”

Problemas propuestos para los Capítulos tratados en el Título IV

Problema 01.- Una librería-papelería tiene 7 trabajadores y los ingresos mensuales en bolívares son:

900; 960; 1.020; 900; 1.050; 1.200 y 1.020. Se pide: a) Calcular la media poblacional, la varianza y la

desviación estándar; b) Con los ingresos mensuales dados elaborar una distribución muestral o

distribución de medias si organizamos los datos de la población a estudiar en muestras de tamaño

constante de tres (3) miembros, c) Calcular la gran media o media de medias, la varianza y la

desviación estándar de la distribución muestral o distribución de medias. Comentar y d) Elaborar la gráfica de barras de la distribución dada y la distribución muestral o distribución de medias

elaborada. Comentar

135

Problema 02.- Las ventas de una empresa de líneas blancas en miles de bolívares durante los últimos

cinco meses fueron: 176,7; 189,6; 168,0; 209,1 y 187,2. Asumiendo que estos cincos meses

constituyen la población, se pide: a) Calcular la media poblacional, la varianza y la desviación estándar; b) Con los movimientos económicos mensuales dados elaborar una distribución muestral o

distribución de medias si organizamos los datos de la población a estudiar en muestras de tamaño

constante de tres (3) miembros, c) Calcular la gran media o media de medias, la varianza y la

desviación estándar de la distribución muestral o distribución de medias. Comentar y d) Elaborar la

gráfica de barras de la distribución dada y la distribución muestral o distribución de medias

elaborada. Comentar. Problema 02.- Las latas de refresco vendidas en la refresquería Pedroso S.R.L tienen un promedio

16,11 onzas con una desviación estándar de 1,2 onzas. Si se tenía una muestra de 200 latas de

refresco ¿Cuál es la probabilidad de que la media sea: a) Menor que 16,27 b) Por lo menos 15,93 y c)

Entre 15,9 y 16,3.

Problema 04.- Una población normal tiene una media de 85 y una desviación estándar de 17. Si

selecciona una muestra de 16, calcular la probabilidad de que la media de las medias muéstrales sea:

a) Mayor que 90, b) Menor que 75 y c) Entre 75 y90.

Problema 05.- Una población cuya forma no se conoce tiene una media de 75 con una desviación

estándar de 5. Si se selecciona una muestra de 40, calcular la probabilidad de que la media de las medias muestrales sea: a) Mayor que 77, b) Menor que 74, c) Entre 74 y 76 y d) Entre 76 y 77.

Problema 06.- Según estudio realizado por SENIAT, las personas contribuyentes naturales tardan 330

minutos en promedio en preparar, copiar y archivar en un medio electrónico la planilla modelo para

este tipo de declaración. Una empresa gestora que orienta a los consumidores en el preparado de estas

planillas, seleccionó una muestra de 40 de sus clientes y comprobó que el tiempo requerido para preparar, copiar y archivar la planilla les llevó un promedio de 320 minutos. a) ¿Cuál es el error

estándar?, b) ¿Cuál es la probabilidad de que la media de las medias muestrales sea mayor que 325

minutos?, c) ¿Cuál es la probabilidad de que la media de las medias muestrales se encuentre entre

320 y 350? y d) ¿Cuál es la probabilidad de que la media de medias muestra esa mayor que 350?

Problema 07.- Una encuesta realizada por una empresa especializada reveló que los estudiantes de último año de secundaria ven televisión en un promedio de 37,2 horas por semana. Se asume una

desviación estándar de 5,4 horas. En una muestra de 500 estudiantes de secundaria, qué tan

probable es que la media muestral sea: a) ¿Más de 38 horas?, b) ¿Menos de 36,6 horas? Y c) ¿Entre

36,4 y 37,9?

Problema 08.- El consumo diario de agua en San Juan de los Morros, promedia 92,2 litros por hogar,

con una desviación estándar de 17,56 litros. El Alcalde de la ciudad desea estimar esta media no

conocida con una muestra de 100 hogares, ¿Qué tan probable es que el error de muestreo exceda los

1,89 litros?

Problema 09.- El 30% de los empleados tienen formación avanzada. Si una muestra de 500 empleados menos del 27% estaban preparados de forma adecuada, todos los nuevos empleados

contratados necesitarán inscribirse en un programa de formación. ¿Cuál es la probabilidad de que se

inicie el programa?

Problema 10.- La proporción de todos los clientes Pizza Spósito C. A. que comen en el sitio es del 75%. En una muestra de 100 clientes, ¿Cuál es la probabilidad de que menos del 20% lleven su comida a

casa?

Problema 11.- Una empresa elabora cables con una resistencia media de 800 Kgs. Y una desviación

estándar de 60 Kgs. ¿Qué probabilidad debe existir si se toma una muestra de 16 cables del mismo

tipo, de tengan resistencia: a) Más de 820 Kgs.? y b) Menos de 785?

136

Problema 12.- De 314 0breros que trabajan en una empresa automotriz se observa que tienen un

promedio de 32 años, con una desviación estándar de 10 años. Se pide: a) Probabilidad de que la

media muestral de 25 de ellos resulte menor de 28 años y b) Probabilidad de que sobrepase los 31 años.

Problema 13.- Si la desviación estándar de las notas de los estudiantes de un curso de Estadística

Instrumental del I. U. G. T. es de 1,6 puntos. Si se toma una muestra de 36 estudiantes de estos

estudiantes, ¿Cuál es la probabilidad de que se presente un error de muestreo de 0,6 puntos o más?

Problema 14.- Para estimar el gasto promedio de los clientes de un restaurant de comida rápida, los

estudiantes de una clase toman una muestra de 200 clientes y encuentran un gasto promedio de 5,67

Bs. con una desviación estándar del 1,10 Bs. ¿Cuál es el intervalo de confianza del 95% para los

gastos promedio de todos los clientes? Interpretar resultados.

Problema 15.-En una sala de conferencia, una tertulia estudiantil popular vende vasos de tizana de

16 onzas. Diez estudiantes compran un total de 22 vasos y utilizando su propia taza de medida

estiman los contenidos promedios, la media muestral es de 15,2 onzas con una desviación estándar

muestral de 0,86. ¿Con un nivel de confianza de 95% los estudiantes creen que su dinero vale?

Interprete el intervalo.

Problema 16.- Cien latas de 453,58 grs. de salsa de tomate de una reconocida marca nacional tienen un promedio de 430,91 grs. La desviación estándar poblacional en peso es de 27,22 grs. Dentro de un

nivel de confianza del 95%, ¿Las latas parecen estar llenas realmente con un promedio de 453,58?

Problema 17.- Las bonificaciones para 10 jugadores de la Liga Nacional de las Grandes Ligas se

utilizan para estimar la bonificación promedio para todos los nuevos jugadores. La media muestral es de $ 65.890,00 con S = $ 12.300,00. ¿Cuál es su estimación con un intervalo de confianza del 90%

para la media poblacional?

Problema 18.- Una empresa especializada informó que el 68% de todos los estudiantes de secundaria

tenían computadoras en su casa. Si una muestra de 1.020 estudiantes revela que 673 tienen

computadoras caseras. ¿Será que dentro de un intervalo del 99% apoya a esa empresa especializada?

Problema 19.- Una empresa de investigación realizó una encuesta para determinar la cantidad media

que los fumadores gastan en cigarrillos durante una semana. Una muestra de 49 fumadores reveló

que la media muestral es de Bs. 20 y una desviación estándar muestral de Bs. 5. a) ¿Cuál es el

estimador puntual de la media de la población? Explicar que indica y b) Utilizando el nivel de confianza de 95%, determinar el intervalo de confianza para la media poblacional. Explicar que indica.

Problema 20.- El dueño de una granja avícola quiere calcular el número medio de huevos que pone

una gallina. Una muestra de 20 gallinas indica que ponen un promedio de 20 huevos al mes con una

desviación estándar de 2 huevos por mes. a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el

mejor estimador de este valor? b) Explicar ¿Por qué? se necesita usar la distribución t, ¿Qué suposición debe hacer?, c) Para un intervalo de confianza del 95%, ¿Cuál es el valor de t?, d)

Desarrolle el intervalo de confianza del 95% para la media poblacional y e) ¿Sería razonable llegar a la

conclusión de que la media de la población es 21 huevos, ¿Qué tal 25 huevos?

Problema 21.- Una embotelladora de agua potable proporciona el producto en botellones de 25 litros a

un sector de una parroquia caraqueña. El gerente desea estimar el número promedio de botellones que una casa consume en un mes. Se toma una muestra de 75 viviendas y se registra el número de

botellones consumidos, proporcionando una media de 3,2 botellones con una desviación estándar de

0,78. Se desea investigar: a) ¿Qué revelará un Nivel de Confianza del 92%? b) ¿Cuántas viviendas se

deben tomar en cuenta para estar el 97% seguro de que el Intervalo de Confianza no esté errado en

más de 0,10 de botellones de agua?, c) Al seleccionar una muestra más pequeña de 10 viviendas para

estimar el promedio de miembros de la familia por vivienda, arrojó los resultados siguientes: 1, 3, 4, 7, 2, 2, 3, 5, 6 y 6, personas por cada vivienda; ¿cuáles serán los resultados para un Nivel de

Confianza del 97% para el número promedio de miembros de la familia por viviendas donde la

137

Desviación Estándar es 4,1 botellones de agua. d) De las 75 viviendas de la muestra 22 tienen filtros

de agua en su vivienda, ¿cuál será el estimado para un Nivel de Confianza del 95% de la proporción de

todas las viviendas en el sector de la parroquia que tienen filtros de agua? y e) Con el Nivel de Confianza anterior de todas las viviendas que tienen filtros de agua y carece de precisión, ¿cuál será el

tamaño de la muestra para producir un Intervalo de Confianza del 10%?

Problema 22 .- Para estimar gastos promedio de los clientes de un local de Mc Donald s, los

estudiantes de estadística toman una muestra de de 200 clientes y encuentran un gasto promedio de

Bs16,25, con una desviación estándar de Bs 3,15. ¿Cuál es el intervalo de confianza para los gastos promedio de todos los clientes dentro de un nivel de confianza del 95%? Interpretar resultados.

Problema 23.- Una agencia de turismo tomó muestras de las personas que en vacaciones

participaban en cruceros por El Caribe y que visitaban a Puerto Rico. Dentro de un nivel de confianza

de 96%, ¿Cuál será el intervalo de confianza para la proporción de vacacionistas venezolanos si de las 1822 personas encuestadas 531 eran venezolanos?

Problema 24.- ¿Qué tan grande se requiere que sea el tamaño de una muestra para que proporcione

una estimación del 90% del número promedio de graduados de las universidades nacionales con un

error de muestreo de 2.000 estudiantes si una muestra piloto reporta una desviación estándar de 8.659?

Problema 25.- Para realizar un estudio se requiere un nivel de confianza del 95% para la tasa de

rendimiento promedio de una empresa que gana sobre sus proyectos para presupuestar capital.

¿Cuántos proyectos debe tener la muestra, si su supervisor especifica un error máximo de sólo del 5% y una desviación estándar de 2,3%?

Problema 26.- Un investigador está interesado en estimar la ganancia en peso total, en 0 a 4

semanas de 1.000 pollitos alimentados con una nueva ración. Obviamente, pesar cada ave sería

tedioso y llevaría demasiado tiempo. Por lo tanto, se debe determinar el número de pollitos a

seleccionar en una muestra, para estimar el total con un límite para el error de estimación igual a 1.000 gramos. Muchos estudios similares sobre nutrición de pollitos se han llevado a cabo en el

pasado. Usando datos de estos estudios, el investigador encontró que la varianza es,

aproximadamente de 36 gramos. Determinar el tamaño de muestra requerido, con un nivel de

confianza del 95%.

Problema 27.-Para una población de 123.318 electores se desea calcular el tamaño de una muestra

para una encuesta donde el nivel de confianza debe ser del 98% con un error permisible del 2%. ¿Cuál

es el tamaño de la muestra?

Problema 28 .- El fabricante de un nuevo auto compacto sostiene que este promediará un consumo

de 14Km./lit. en carreteras normales. En 40 corridas de prueba el auto promedió13,9 Km. /lit. de consumo con una desviación estándar de 0,933 Km. / lit. ¿Podrá rechazarse la afirmación del

fabricante dentro de un nivel de significancia del 5%?

Problema 29.- Doris de Comida C. A. construirá un nuevo establecimiento en una localidad propuesta

solo si durante ciertas horas pasa por ella más de 200 automóviles por hora. En 20 horas aleatoriamente muestreadas durante el horario establecido, el número promedio que pasan es de

208,5; con una desviación estándar muestral 30,0. Se supone que estadística es aproximadamente

normal. Dentro de un nivel de significancia del 5%, ¿Se podrá rechazar la hipótesis nula?.

Problema 30.- El encargado para colocar en el mercado de trabajo a los graduados del I. U. G. T.

sostuvo que al menos el 50% de los nuevos graduados habían cerrado un trato de empleo para el 1ro de Agosto. Supongamos que reúne una muestra aleatoria de 30 estudiantes próxima a graduarse y

que solo 10 de ellos señalan haber cerrado un trato de empleo para el 1ro de Agosto. Dentro de un

138

nivel de significancia del 5%; ¿Se podrá rechazar que sostiene el encargado del I. U. G T para la

colocación en el mercado de nuevos graduado?

Problema 31.- Se estudia la ubicación de un centro comercial y se consideran las alternativas de dos

localidades tomando en cuenta el ingreso económico mensual de los miembros de la comunidad. Se

desea probar la hipótesis de que no existe diferencia entre el ingreso económico medio de ambas

comunidades y se supone que la desviaciones estándar de ese ingreso medio también son iguales. En

una muestra de 30 hogares de la primera comunidad el ingreso mensual promedio es de Bs. 8.150,00

con una desviación estándar de Bs. 332. En una muestra de 40 hogares en la segunda comunidad, el ingreso mensual promedio es de Bs. 7.790,00 con una desviación estándar de Bs. 430. Para un nivel

de significancia del 5%, ¿Se cumplirá la hipótesis planteada?

Problema 32.- En problema anterior considere:

Comunidad 01 n1 = 16, X1 = Bs. 8.000,00; S1 = 0,326 Comunidad 02 n2 = 25; X2= Bs. 7.750,00; S2 = 0,428

α = 0,05

Problema 33.- Un fabricante evalúa dos tipos de equipos para la fabricación de un componente; los

datos de la investigación se presentan al final. El índice de fabricación de ambas marcas es el mismo. Sin embargo debido a que el costo de la

primera marca es sustancialmente menor, el fabricante le concede el beneficio de la duda y formula la

tesis de que π1 < π2. Para un nivel de significancia del 5% probar la hipótesis planteada.

n Defectuoso

Equipo 01 50 5

Equipo 02 80 6

Problema 34.- Un profesor de Estadística Instrumental del I. U. G. T. sugiere dos textos de estudios

para los cursos donde dicta la materia y quiere probar que el texto de estudio 01 da mejor rendimiento

que el texto de estudio 02, y toma apoyo un reciente estudio realizado, el cual se muestra en cuadro

anexo, donde se presenta el número de estudiantes aprobados según el texto utilizado. Dentro de un nivel de confianza del1%; ¿Será que el

profesor de estadística estará en lo cierto?

Problema 35.-En 1997 una empresa de inversiones informó que los empresarios en un país

desarrollado invierten un promedio de 18.600 Bs. cada mes en el mercado de títulos. Si esta

afirmación está apoyada en un nivel de significancia del 5% y tomamos una muestra de 36 meses que

nos presenta una media de inversión de Bs. 17.100 y una desviación estándar de 2.400 Bs. ¿Será que

la información que presenta la empresa de inversiones es cierta? Problema 36.-Un distribuidor de bebidas plantea la hipótesis que las ventas por mes se estiman en

más de Bs. 12 si seleccionamos una muestra de 10 meses donde se reporta una media de Bs 11,277 y

una desviación estándar de Bs 3,772. Para un nivel de significancia del 5% será cierta la aseveración

del distribuidor de bebidas.

Curso

Texto

1

2

3

4

5

6

7

8

9

Total

Equipo 01 12 10 15 09 14 15 14 14 11 114

Equipo 02 13 10 16 10 11 13 12 12 14 111

139

Problema 37.- Como gerente de compras la Señora Rosa María Cavero debe decidir si se actualizan o

no las computadoras de la oficina. A ella se le informado que el costo promedio de las computadoras

es de Bs 2.100,00. Una muestra de 64 minoristas revela un promedio de 2.251,00, con una desviación estándar de Bs 812,00. Si tomamos un nivel de significancia del 5%; ¿Será correcta la

Información?

Problema 38.- Debido a los retardos que se producen en el tiempo para que los estudiantes lleguen a

tiempo a clase en el I. U. G. T., el Director Académico desea plantear una revisión de los horarios de

clase. Él considera que el tiempo promedio de los estudiantes para llegar a clase es de 50 minutos.

Encuestados 70 estudiantes se constató que ellos tardan un promedio de 47,2 minutos con una desviación estándar de 18,9 minutos. Para un nivel de significancia del 1%, ¿Será que el Director

Académico está en lo cierto?

140

TÍTULO V Capítulo 14

ANALISIS DE VARIANZA

1. Análisis de varianza (ANOVA): Es un modelo estadístico diseñado específicamente para probar si dos o más poblaciones presentan la misma media. Sin embargo el propósito del ANOVA es realizar pruebas es hallar diferencias en las medias poblacionales, realizando un estudio en las varianzas muestrales. Partiendo de la base que el termino ANOVA define a la realización de un análisis de varianza para observar si al aplicar un tratamiento en particular a una población, éste tendrá un impacto significativo en su media 1.1. Definiciones básicas

1.1.1. Distribución F o de Fisher: Es la distribución de probabilidad utilizada como la distribución del estadístico de pruebas para diferentes casos, permitiendo, probar si dos muestras provienen de poblaciones que tienen varianzas iguales, siendo útil también cuando se desea comparar simultáneamente varias medias poblacionales, en este caso el proceso de comparación se llamará Análisis de Varianza (ANOVA)

1.1.1. Unidades experimentales: Es cada sub-grupo en los cuales se divide una población o muestra para realizar el estudio y que serán sometidos a los tratamientos

1.1.2. Tratamiento: Es la influencia o efecto que pueda tener los valores o datos externos sobre las medias de las unidades experimentales de las poblaciones examinadas.

1.1.3. Factor: Es la variable de cada unidad experimental que se desea medir en el estudio que se realiza.

1.1.4. La razón F tal y como se utiliza en ANOVA: La razón F es una razón de la variación entre muestras y la variación dentro de las muestras. Este factor aumentará al tener medias poblacionales diferentes, donde se presenta el efecto del tratamiento; siendo grandes las desviaciones entre las muestras comparadas con la desviación del error dentro de una muestra. En el desarrollo de este estudio estudiaremos la aplicación del ANOVA sobre modelos fijos, donde seleccionaremos tratamientos específicos o se fijan antes de comenzar a realizar el estudio.

1.2 Comparación de las varianzas de población: Teniendo las observaciones de dos

poblaciones se establece como estadística de pruebas:

La varianza mayor se toma en el numerador y la menor en el denominador 87+1.3 Análisis de varianza a una sola vía (Diseño completamente aleatorio) Para realizar el ANOVA a una sola vía se requiere obtener la gran media de todas las observaciones en último lugar:

iXX

K

y en primer lugar la media aritmética de cada subgrupo en la cual fue dividida la muestra o la población:

141

jiXX

n

1.3.1 Variación total: Es la suma de las diferencias elevadas al cuadrado entre cada observación y la media total o gran media es decir es el desvío elevado al cuadrado de la observación de la población o muestra respecto a la media total o gran media.

2

1j

j

K

i

i

SCT X X

1.3.2 Variación tratamiento: Es la suma de las diferencias elevadas al cuadrado entre la media aritmética de cada Unidad Experimental y la media total o gran media, es decir el desvió elevado al cuadrado de cada media aritmética de las Unidades Experimentales respecto a la media total o gran media.

2

1

j

j

n

ij

c

SCTR c X X

1.3.3. Variación de error o aleatoria: Es la suma de las diferencias elevadas al cuadrado entre las observaciones por Unidades Experimentales y sus respectivas medias (media de cada Unidad Experimental) o es el desvío al cuadrado de cada observación vinculada a la respectiva media o promedio de cada Unidad Experimental

2

1 1j

j

K n

i i

i j

SCE X X

Para comprobar resultado debe cumplirse que SCE= SCTR + SCE

1.3.4. Cuadrados Medios: Para obtener los cuadrados medios a cada variación obtenida, se le divide el valor de cada una entre sus respectivos grados de libertad.

a) Grado de libertad para la variación total; g.l. de SCT= n-1; n= número total de

observaciones de la población o muestra, y tienen una (1) sola restricción ya que

(gran media) es única. b) Grado de libertad para la variación de tratamiento; g.l. de SCTR = C-1, donde se tiene que C = número de Unidades Experimentales, y cada una de ellas solo tiene una

(1) restricción ya que iX (media de cada Unidad Experimental) es única para cada

Unidad Experimental. c) Grado de libertad para la variación de error o aleatoria; g.l. de SCE = n-c, ya que se estudia el error de todos las Unidades Experimentales y el error total de la población estudiada, en consecuencia tenemos que: 1.3.4.1. Cuadrado medio total

1.3.4.2. Cuadrado medio de tratamiento

1.3.4.3. Cuadrado medio del error o aleatoria

1.3.5. Estadístico de prueba para las conclusiones de ANOVA Razón de Fisher o F para una prueba de medias

142

Si F es menor que (F<Fo) se acepta la hipótesis nula de lo contrario (F>Fo) se

rechaza. 1.3.6. Suposiciones de ANOVA Se supone: a) Las poblaciones siguen la distribución normal b) las poblaciones presentan desviaciones típicas o estándares iguales c) las muestras se seleccionan de manera independiente.

Problemas Resueltos

Problema 01.-La siguiente es información de una muestra. Probar la hipótesis de que las medias de tratamientos son iguales, para un nivel de significancia del 5%.

Trat. 01 Trat. 02 Trat. 03

9 10 12

7 20 9

13 14 12

9 13 14

12 15

10

Datos: 5%; el restoestáenlatabla

Fórmulas: 2

2

1 1 1

2

1 1

: ; :

: ; :1

:

k

k

k

cf c

jij j

i j j

f c

ij j

i j

SumaCuadradoTotal SCT X X Suma deCuadrados deTratamientos SCTR f X X

SCTSumaCuadrado del Error SCE X X Cuadrado MedioTotal CMT

n

SCTRCuadrado Medio delTratamiento CMTR

c; : ; ;

1

; ; .

SCE CMTRCuadrado MedioTotal CMT F

n c CME

n Tamañototal dela población f Número de filas c Número decolumnas

Solución Primer Paso.- Plantear la hipótesis

" "

" ",

; :

;

La Hipótesis Nula H

La Hipótesis Alterna

Las medias delostratamientos son iguales

Las medias delostratamientos sondiferenttiva es

Segundo Paso.- Determinar el Estadístico de Prueba

143

XC1 XC1 XC1

9 10 12 8,6025 0,0045 22,419 1,000 0,160

7 20 9 24,3345 8,6025 21,474 9,000 11,560

13 14 12 1,1385 0,0045 1,0904 9,000 0,160

9 13 14 8,6025 4,2725 1,000 2,560 CMTR 22,492

12 15 0,0045 9,4065 4,000 6,760

10 3,7365 0,000

Mc1 Mc2 Mc3 3,7365 18,063 CME 8,163

10,000 14,250 12,400 65,0765 33,063

4,2725 0,063

1,1385 1,563

120,643 22,2904 76,750 21,200 F 2,76

SCT 142,933 SCTR 44,983 SCE 97,950

VALOR DE FISHER

MED. CUAD. ERROR

SCT SCTR SCE GRAN MEDIA

MED. CUAD. TRAT.

11,933

Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de decisión y tomar la decisión

Como es ANOVA, para probar la Hipótesis

Nula se usa la Didtribción de Fisher, la

prueba es de una sola cola y positiva, por

o= 5%. Para aceptar la

Hipótesis Nula debe cumplirse que:

. . . 2; . . 12; % 5%g l N g l DF F

Como . . . 2; . . 12; % 5%2,76 3,89

g l N g l DF F ,

Se acepta la hipótesis nula, es decir: “Las

medias de los tratamientos son iguales”

Problema 02.- Se emplean tres sistemas de inyección de aire y se quiere probar si existe una diferencia significativa entre ellos. Se eligen cinco elementos de cada sistema y se mide la eficiencia de cada uno de los elementos. Los resultados fueron tabulados y se presentan al final. Para un nivel de significancia del 2,5% probar si realmente existe una diferencia significativa entre ellos.

Muestra Eficiencia

A B C

1 35 21 35

2 24 27 17

3 46 17 21

4 30 37 20

5 29 29 28

144

Datos: 2,5%; el restoestáenlatabla

Fórmulas: 2

2

1 1 1

2

1 1

: ; :

: ; :1

:

k

k

k

cf c

jij j

i j j

f c

ij j

i j

SumaCuadradoTotal SCT X X Suma deCuadrados deTratamientos SCTR f X X

SCTSumaCuadrado del Error SCE X X Cuadrado MedioTotal CMT

n

SCTRCuadrado Medio delTratamiento CMTR

c; : ; ;

1

; ; .

SCE CMTRCuadrado MedioTotal CMT F

n c CME

n Tamañototal dela población f Número de filas c Número decolumnas

Solución Primer Paso.- Plantear la hipótesis

" "

" ",

; :

;

La Hipótesis Nula H

La Hipótesis Alterna

Existe una grandiferenciaentrelostres sistemas deinyeccióndeaire

Noexisteuna grandiferenciaentrelostres sistemas deinyeccióndeaitiva re

Segundo Paso.- Determinar el Estadístico de Prueba

XC1 XC1 XC1

35 21 35 72,812 72,812 200,534 4,840 213,160

24 27 17 6,086 89,624 0,356 77,440 11,560

46 17 21 381,538 29,888 184,042 174,240 0,360

30 37 14 12,482 155,426 7,840 40,960 CMTR 67,567

29 29 15 6,416 131,492 14,440 29,160

29,888 27,040

Mc1 Mc2 Mc3 0,284 0,640 CME 192,467

32,800 26,200 20,400 89,624 84,640

110,944 116,640

6,416 7,840

716,491 479,2424 515,600 295,200 F 2,85

SCT 1195,733 SCTR 384,933 SCE 810,800

MED. CUAD. ERROR

VALOR DE FISHER

SCT SCTR SCE GRAN MEDIA

MED. CUAD. TRAT.

26,467

Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de decisión y

tomar la decisión

Como es ANOVA, para probar la

Hipótesis Nula se usa la Didtribción de

Fisher, la prueba es de una sola cola y

o= 2,5%. Para

aceptar la Hipótesis Nula debe cumplirse

que: . . . 2; . . 12; % 2,5%g l N g l D

F F

Como:

. . . 2; . . 12; % 2,5%2,85 5,10

g l N g l DF F , Se

acepta la hipótesis nula, es decir: “Si existe

una gran diferencia entre los tres

sistemas de inyección de aíre”

145

Capítulo

LA PRUEBA NO PARAMETRICA DEL

CHI – CUADRADO

1. Definiciones básicas. 1.1. Pruebas no paramétricas: Son procedimientos estadísticos que pueden

utilizarse para contrastar hipótesis cuando no son posibles los supuestos respecto a los parámetros o a las distribuciones poblacionales.

1.2. CHI-CUADRADO (2) Es la suma de las fracciones que tienen por numerador

el cuadrado de las diferencias entre las frecuencias observadas o reales y las

frecuencias esperadas o teóricas y por denominador la frecuencia esperada 2

2 i i

i

O E

E

1.3. Aplicaciones más comunes de las prueba CHI-CUADRADO 1.3.1. Pruebas de Bondad de Ajuste: Medidas sobre qué tan cerca se ajustan los

datos muestrales observados a una forma de distribución particular planteada como hipótesis.

Para entrar a la tabla del CHI-CUADRADO y obtener , se necesita conocer

el nivel de significancia y el grado de libertad

donde K es el número de categorías o clases y m es el número de parámetros a estimar, sino se estima ningún parámetro m=0

1.3.1.1. Prueba para un ajuste uniforme: Cuando las frecuencias esperadas o teóricas se presentan iguales.

1.3.1.2. Prueba específica a un patrón específico: Es cuando las frecuencias esperadas o teóricas no son iguales.

i iE np ;

n= tamaño de la muestra ip = posibilidad de cada categoría.

1.3.1.3 Prueba de Normalidad: Apoyados en la distribución normal probar si esta se cumple para series abiertas.

Para cualquier prueba de bondad de ajuste la regla de decisión se establece de la

manera siguiente: si 2 2

0, se acepta la hipótesis nula.

1.3.2. Pruebas de independencia. La prueba del CHI-CUADRADO, también permite la comparación de dos atributos para determinar si existe una relación entre ellos. La mejor manera de probar la independencia entre dos atributos, es revisando esta independencia entre dos variables con escala nominal en una tabla de contingencia.

Ejercicios Ejercicio 01.- América Uzcátegui, Gerente General y dueña de la empresa mayorista, ”Uzcátegui de Alimentos C.A.”, asume la responsabilidad de tomar la decisión de comprar las cajas de mermeladas cada una de 24 envases, entre cuatro empresas productoras del artículo. América considera que las cuatro empresas productoras presentan la misma demanda del artículo. Ante la escasez de alimentos, se piensan comprar 106 cajas el total de

146

existencia del producto en los depósitos de la comercializadora y que se estima vender en la semana siendo la existencia de esas cuatro marcas de mermeladas la siguiente: Marca “A” 26 cajas, Marca “B” 23 cajas, Marca “C” 29 cajas, Marca “D” 28 cajas y de la Marca E 24. Para un nivel de significancia del 2,5%; ¿Será que el criterio de América Uzcátegui es válido?

Solución

Datos: 2,5%; el restoestáenlatabla

Fórmulas:

2

2

1

; ;

ki i

i i

i i

O E

E

E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales

K Númerodecategoríasoclases

Desarrollo:

Pr .

; :"

" ";

Lasventas delos artículos demermeladasesuniforme según

imer Paso Plantear la Hipótesis

La Hipótesis Nula H

La Hip

lo

dicelaGerenteGeneral Lasventas delos artículos demermelaótesis Altern das

noesunifo

ati

rme

v

ont

a

c ",

. min PrSegundo Paso Dete

rario

r ar el

alodic

Estadí

eGerent

sticode

eGener

a

al

ueb

Marcas fO X fE (fO-fE)2

(fO-fE)2/fE

"A" 26 0,200 26,0 0 0,000

"B" 23 0,200 26,0 9 0,346

"C" 29 0,200 26,0 9 0,346

"D" 28 0,200 26,0 4 0,154

"E" 24 0,200 26,0 4 0,154

∑ 130 130,0 X2= 1,000

Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y

Tomar la Decisión

Ejercicio 02.- Un laboratorio está procesando un fármaco para utilizarlo en una investigación médica. Se están probando cinco métodos para determinar cuál es el método que tiene menos probabilidad de contaminar el fármaco procesado. Los científicos que realizan el estudio consideran que la contaminación está distribuida normalmente. Se selecciona la producción durante 120 días para cada método de procesamiento, anotando el

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 2,5%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 . . 4; 2,5%g l

0

2 2

0 . . 4; 2,5%1,000 11,143

g l, Se

acepta la hipótesis nula, es decir:

“La venta de los artículos de mermeladas se venden de manera

uniforme según lo afirma la Gerente General”

147

método que produce las ampollas menos contaminadas en ese día. Considerando las tasas de contaminación uniformes. Para un nivel de significancia del 1%, probar si realmente la contaminación es uniforme tomando lo datos de la tabla siguiente, donde se anotaron los resultados de los días donde no se encontraron ampollas no contaminadas

Solución

Datos: 1%; el restoestáenlatabla

Fórmulas:

2

2

1

; ;

ki i

i i

i i

O E

E

E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales

K Númerodecategoríasoclases

Desarrollo:

Pr .

; : ;" min " "

m

. min Pr

in ",

imer Paso Plantear la Hipótesis

La Hipótesis Nula H La HipótesiLa conta ación es uniforme La

conta ación no es unifo

s Alternativa

Segundo Paso Deter ar el Estadísticode

r

ueba

me

Método fO X fE (fO-fE)2

(fO-fE)2/fE

"A" 36 0,2000 24 144 6,000

"B" 21 0,2000 24 9 0,375

"C" 19 0,2000 24 25 1,042

"D" 18 0,2000 24 36 1,500

"E" 26 0,200 24 4 0,167

120 96 X2= 8,917

Ejercicio 03.- El Gerente de una agencia bancaria, trata de seguir una política de conceder créditos de acuerdo a las siguientes actividades productivas: Actividad Comercial (A) un 35%, Actividad Agrícola (B) un 25%, para la Exportación un (C) 16%, para Comercialización al detal (D) un 13% y a Personas Naturales (E) el resto de la cartera crediticia. Se quiere evaluar si la política trazada por el gerente se está llevando a cabo, para lo cual selecciona aleatoriamente 165 créditos otorgados en el último mes y esto fue el resultado del inventario: “A” 61 créditos, “B” 45; “C” 26; “D” 18 y “E” 15. Para un nivel de significancia del 2%; ¿Será que se está siguiendo la política crediticia del gerente del banco?

Métodos de procesamiento A B C D E

Días en los cuales no hubo contaminación 36 21 19 18 26

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 1%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 . . 4; 1%g l

0

2 2

0 . . 4; 1%8,917 13,277

g l, Se

acepta la hipótesis nula, es decir: “La contaminación es uniforme”

148

Solución

Datos: 2%; el restoestáenlatabla

Fórmulas:

2

2

1

; ;

ki i

i i

i i

O E

E

E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales

K Númerodecategoríasoclases

Desarrollo:

Pr .

; :

;

. min

"

Pr

"

" "

imer Paso Plantear la Hipótesis

La Hipótesis Nula H La HipótesiSe siguela política del Gerentebancario

No se siguela política d

s

Alternativa

Segundo Pas

el Gerentebancari

o Deter ar el Estadístico

o

de ueba

Ac. Com. fO X fE (fO-fE)2

(fO-fE)2/fE

"A" 61 0,3500 57,750 10,56 0,183

"B" 45 0,2500 41,250 14,06 0,341

"C" 26 0,1600 26,400 0,16 0,006

"D" 18 0,1300 21,450 11,90 0,555

"E" 15 0,1100 18,150 9,92 0,547

165 165,000 X2= 1,631

Ejercicio 04.- Para un nivel de significancia del 2% probar si la distribución de frecuencia que se presenta al final constituye una Distribución Normal. Para una Media Poblacional:

Notas De 0 a 4 De 4 a 8 De 8 a12 De 12 a 16 De 16 a 20

Estudiantes 05 10 20 10 05

Solución

Datos: 1%; 10; 4,381; el restoestáenlatabla

Fórmulas:

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 1%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 . . 4; 2%g l

0

2 2

0 . . 4; 2%1,631 11,668

g l, Se

acepta la hipótesis nula, es decir: “Se sigue la política del Gerente

Bancario”

149

2

2

1

; ;

ki i

i i

i i

O E

E

E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales

K Númerodecategoríasoclases

Desarrollo:

Datos: % 2%; el restodelos datosenlatabla

Fórmula:

2

2

1

ki i

i i

O E

E

Desarrollo:

Primer Paso.- Planteamiento de la Hipótesis. Hipótesis Nula; H0: “Esta distribución responde a una Distribución Normal”

Hipótesis Alternativa; HA: “Esta distribución no responde a una Distribución Normal” Segundo Paso.- Determinar el Estadístico de Prueba.

Clases fO X fE (fO-fE)2

(fO-fE)2/fE

"A" 5 0,0853 4,265 0,54 0,127

"B" 10 0,2375 11,875 3,516 0,296

"C" 20 0,3544 17,720 5,198 0,293

"D" 10 0,2375 11,875 3,516 0,296

"E" 5 0,0853 4,265 0,54 0,127

50 50,000 X2= 1,012

4

4 101,37

4,381Z 4 0,5000 0,4147 0,0853MenosdeA

8

8 100,46

4,381Z

4 8 0,4147 0,1772 0,2375A

12

12 100,46

4,381Z

8 12 0,1772 0,1772 0,3544A

16

16 101,37

4,381Z

12 16 0,4147 0,1772 0,2375A

150

16

16 101,37

4,381Z

16 0,5 0,4147 0,0853MásdeA

Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y

Tomar la Decisión

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 2%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 ( . . 4, % 2%)g l

0

2 2

0( . . 4; % 2%): 1,12 11,668 g lComo ,

Se acepta la hipótesis nula, es decir:

“Esta distribución responde a una Distribución Normal”

Ejercicio 06.- Al final se presenta una distribución de frecuencias que refleja el número de sacos de naranjas recibidas por un comerciante del Mercado al por Mayor de Coche durante 100 días. Se obtuvo que la media era: 80,5; con una desviación estándar, 18,09, Para un nivel de significancia del 5%, probar si esta distribución es normal.

Sacos de naranjas Días

Menos de 10 De 10 a 50 De 50 a 90 De 90 a 130 Más de 130

15 20 30 20 15

Solución

Datos: 5%; 80,5; 18,09; el restoestáenlatabla

Fórmulas:

2

2

1

; ;

ki i

i i

i i

O E

E

E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales

K Númerodecategoríasoclases

Desarrollo:

Pr .

; : ;

. min

" " "

",

Pr

imer Paso Plantear la Hipótesis

La Hipótesis Nula H La HipótesiEsta distribuciónes normal Esta

distribuciónnoes n

s Alternativa

Segundo Paso Deter ar el Estadísticode

orm

u

al

eba

151

Para x<10

10

10 70,52,01

30,09Z

A=0,5000 - 0,4778=0,0222

Para: 10<x<50

50

50 70,50,68

30,09Z

A=0,4778 - 0,2518=0,2230

Para 50<x<90

90

90 70,50,65

30,09Z

A=0,2518 + 0,2422 = 0,4940

Para 90<x<130

130

130 70,51,98

30,09Z

A=0,4762 – 0,2422 = 0,2340

Para 130<x

130

130 70,51,98

30,09Z

A= 0,5000 - 0,4762 = 0,0238

"A" 15 0,0222 2,220 163,3 73,571

"B" 20 0,2260 22,600 6,76 0,299

"C" 30 0,4940 49,400 376,4 7,619

"D" 20 0,2340 23,400 11,56 0,494

"E" 15 0,0238 2,380 159,3 66,918

100 100,000 X2= 148,901

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 2%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 . . 4; 5%g l

0

2 2

0 . . 4; 5%148,901 9,488

g l, No se

acepta la hipótesis nula, es decir: “Esta distribución no responde a una

Distribución Normal”

Ejercicio 06.- Una compañía trabaja con cuatro máquinas en tres turnos diarios. La siguiente tabla de contingencia presenta las veces que fallaron y se pararon las máquinas durante un período de seis meses.

152

Tabla de contingencia de número de paros

Máquinas Turno

A B C D Total por turnos

Turno 01 10 12 06 07 35

Turno 02 10 24 09 10 53

Turno 03 13 20 07 10 50

Total por máquina 33 56 22 27 138

Para un nivel de significancia del 5% probar que para un paro arbitrario, la máquina que ocasiona ese paro es independiente del turno cuando ocurre.

Solución

Datos: % 5%; el restodelos datosenlatabla

Fórmula:

2

2

1

ki i

i i

O E

E

Desarrollo Primer Paso.- Planteamiento de la Hipótesis. Hipótesis Nula; H0: “Para un paro arbitrario la máquina que lo ocasiona, no tiene nada que ver con el

turno cuando ocurre” Hipótesis Alternativa; HA: “Para un paro arbitrario la máquina que lo ocasiona, si tiene nada que ver

con el turno cuando ocurre””

Segundo Paso.- Determinar el Estadístico de Prueba.

O E O E O E O E O E

T-01 10 8,370 12 14,203 6 5,580 7 6,848 35 35,00

T-02 10 12,674 24 21,507 9 8,449 10 10,369 53 53,00

T-03 13 11,956 20 20,290 7 7,971 10 9,783 50 50,00

T-MQ. 33 33,000 56 56,000 22 22,000 27 27 138 138,00

0,317 0,342 0,032 0,003

0,564 0,289 0,036 0,013

0,091 0,004 0,118 0,005

1,814

X2

X2

X2

X2

A B C D T-T

X2=

Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y

Tomar la Decisión

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 5%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 ( . . 6, % 5%)g l

0

2 2

0( . . 6; % 5%): 1,814 12,592 g lComo ,

Se acepta la hipótesis nula, es decir:

“Para un paro arbitrario la máquina que lo ocasiona, no tiene nada que

ver con el turno cuando ocurre”

153

Ejercicio 07.- Se registraron un total de 309 muebles defectuosos, se clasificaron los defectos en cuatro tipos (A; B; C; D). Al mismo tiempo el turno (1; 2; 3), cuando se produjo cada uno de los muebles. Esta información se presenta en la tabla de contingencia que se presenta al final. Para un nivel de significancia del 5%; ¿Proporciona los datos suficientes evidencias para concluir que las proporciones de los cuatro tipos de defectos varían de un turno a otro?

Turno

Tipo de defecto Total A B C D

1 15 21 45 13 94

2 26 31 34 05 96

3 33 17 49 20 119

Total 74 69 128 38 309

Solución

Datos: 5%; el restoestáenlatabla

Fórmulas:

2

2

1

; ;

ki i

i i

i i

O E

E

E Frecuencias deeventosesperados O Frecuencias deeventosobservadosenlos datos muestrales

K Númerodecategoríasoclases

Solución

Datos: % 2%; el restodelos datosenlatabla

Fórmula:

2

2

1

fO E

j E

f f

f

Desarrollo Primer Paso.- Planteamiento de la Hipótesis.

Hipótesis Nula; H0: “Las proporciones de los cuatro tipos de defectos varían de un turno a otro” Hipótesis Alternativa; HA: “Las proporciones de los cuatro tipos de defectos no varían de un turno a

otro” Segundo Paso.- Determinar el Estadístico de Prueba.

154

O E O E O E O E O E

T-01 15 22,511 21 20,990 45 38,939 13 11,560 94 94,00

T-02 26 22,990 31 21,437 34 39,767 5 11,806 96 96,00

T-03 36 28,499 17 26,573 49 49,294 20 14,634 119 119,00

T-DEFC. 74 74,000 69 69,000 128 128,000 38 38,000 309 309,00

2,560 0,000 0,943 0,179

0,394 4,266 0,836 3,924

2,447 3,449 0,002 1,968

20,968

X2

X2

X2

X2

A B C D T-T

X2=

Tercer Paso.- Seleccionar el Nivel de Significancia, formular la Regla de Decisión y

Tomar la Decisión

Problemas Propuestos para los Capítulos del Título V Problema 01.- Dadas las siguientes hipótesis:

2 2

0 1 2

2 2

1 2A

H

H

Una muestra aleatoria de 10 observaciones de la primera población resultó con una desviación estándar de 12. Una muestra aleatoria de observaciones de la segunda población resultó con una desviación estándar de 9. Con un nivel de significancia del 2%, ¿Existe alguna diferencia en la variación de las dos poblaciones? Problema 02.- Dadas las siguientes hipótesis:

2 2

0 1 2

2 2

1 2A

H

H

Una muestra aleatoria de 8 observaciones de la primera población resultó con una desviación estándar de 15. Una muestra aleatoria de 9 observaciones de la segunda población resultó con una desviación estándar de 10. Con un nivel de significancia del 1%, ¿Existe alguna diferencia en la variación de las dos poblaciones? Problema 03.- Se quiere saber si habrá igualdad en las medias de las poblaciones de las notas obtenidas por un grupo de estudiantes en las materias que se presenta en tabla anexa. Realizar el estudio para un nivel de significancia del 5%

Como es una prueba de Chi-Cuadrado es de una sola cola y

o= 5%. Para aceptar la Hipótesis Nula debe cumplirse que:

0

2 2

0 ( . . 6, % 2%)g l

0

2 2

0( . . 6; % 2%): 20,968 15,033 g lComo ,

No se acepta la hipótesis nula, es

decir: “ Las proporciones de los cuatro tipos de defectos no varían de un turno a otro”

155

Contabilidad Estadística Instrumental

Matemática Instrumental

15 16 15

13 13 08

16 07 09

07 15 16

09 14

13

Problema 04.- Un dado de seis caras se lanza 40 veces y aparecen los números del 1 al 6 según se muestra en la distribución de frecuencias a continuación. Con un nivel de significancia del 5%, ¿Podemos concluir que el dado está legal?

Cara 1 2 3 4 5 6

Resultado 5 7 8 5 9 6

Problema 05- Una empresa mayorista de de artículos de ferretería trata de utilizar una política de extender sus movimientos económicos, para lo cual decide establecer un cuadro de créditos que de manera porcentual sería: a) Empresas Comerciales de la Capital, 31%; b) Para Empresas Comerciales fuera de la Capital, 18%, c) Empresas de Construcción, 24%, d) Comerciales para la Venta al Detal,16% y a Personas Natrales, 11% . El dueño del negocio quiere demostrar si esta política se está cumpliendo y resolvió revisar 250 créditos otorgados de los cuales 74 fueron otorgados a Empresas Comerciales de la Capital, 38 a Empresas Comerciales fuera de la Capital, 64 a Empresas de Construcción, 45 a Comerciales para la Venta al Detal y 29 a Personas Naturales. Si a nivel de significancia del 2,5%; ¿Se mantuvo el patrón de la política de extender sus movimientos económicos? Problema 06.- A los consumidores de un centro comercial se le piden calificar un nuevo producto en una escala continua que comienza en cero. Con base a los datos presentados en cuadro anexo; ¿Se podrá concluir a un nivel de significancia del 1%, que los datos están distribuidos normalmente con una media de 51,25 y una desviación estándar de 11,18?

Problema 07.- A los consumidores de un centro comercial se le piden calificar un nuevo producto en una escala continua que comienza en cero. Con base a los datos presentados en cuadro anexo; ¿Se podrá concluir a un nivel de significancia del 1%, que los datos están distribuidos normalmente con una media de 51,25 y una desviación estándar de 11,18?

Calificación Frecuencia Calificación Frecuencia

Menos de 35 7 De 55 a 60 65

De 35 a 40 14 De 60 a 65 15

De 40 a 45 26 De 65 a 70 8

De 45 a 50 79 Más de 70 3

De 50 a 55 83

Calificación Frecuencia Calificación Frecuencia

156

Problema 08.- El Gerente de Producción de una empresa de equipos electrónicos desea comparar los tiempos medios empleados para instalar un equipo electrónico según tres métodos diferentes de montaje A, B y C. Se escogieron los seis más expertos técnicos para realizar el experimento, y cada uno de ellos montó el equipo usando los tres métodos los cuales se le suministraron de manera aleatoria, y en tabla anexa se muestran los tiempos

medios. Para un Nivel de Significancia del 5%; ¿Los datos presentados en la tabla proporcionan la información para indicar que existe diferencia en el tiempo medio de instalación para los tres métodos?

INSTALADOR

MÉTODO

1

2

3

4

5

6

A 20,2 22,6 19,2 22,5 18,7 21,5

B 23,7 24,1 22,6 24,3 20,2 21,5

C 21,4 23,0 22,9 22,0 19,8 20,1

Problema 09.- Se seleccionaron tres marcas de gasolina A, B y C, y se tomaron cuatro automóviles de la misma marca y modelo, para probar un experimento donde cada en cada automóvil vamos a usar las tres marca de gasolina de un solo tipo. Al utilizar cada marca de gasolina en un mismo automóvil, se elimina la variabilidad de un automóvil a otro. En tabla anexa se suministran los datos que arrojó el resultado de experimento, en Kilómetros por litros. Para un Nivel de Significancia del 2,5%, ¿Hay evidencia de una diferencia promedio para los cuatros automóvil?

Automóvil M. Gasolina

1

2

3

4

A 7,29 7,56 7,66 7,25

B 7,63 7,84 7,87 7,80

C 7,25 7,94 7,49 7,84

Problema 10.- Una empresa de construcción de viviendas tiene pensado realizar un desarrollo comercial en San Juan de los Morros. Se evalúan tres terrenos. Los ingresos diarios de los pobladores de la zona vecina al centro comercial es de especial importancia. Se selecciona aleatoriamente cuatro familias que habitan cerca de cada terreno. En tabla anexa se presentan los resultados muestrales de la investigación. Para un Nivel de Significancia del 5%; ¿Se puede concluir para la empresa que existe una diferencia en los ingresos promedios diarios?

Menos de 35 7 De 55 a 60 65

De 35 a 40 14 De 60 a 65 15

De 40 a 45 26 De 65 a 70 8

De 45 a 50 79 Más de 70 3

De 50 a 55 83

157

Vía

Fermín Toro

Avenida

Bolívar

Avenida

Fuerza Armada

505 725 805

450 665 980

655 645 755

475 655 925

Problema 11.- En un centro de juego de billar el encargado lleva una relación de las jugadas diaria de lunes a viernes que se realizan en las cuatro mesas que componen el conjunto y los resultados se anotan al final. Tomando un Nivel de Significancia del 5%; ¿Será que existe diferencias entre el número de jugadas diaria para las 610 jugadas que se hicieron en una semana determinada?

Día Lunes Martes Miércoles Jueves Viernes

Jugadas 145 87 122 115 141

Problema 12.- En la compra diaria realizada durante dos meses en una tienda el Gerente de Administración estableció que la compra por una persona podría contabilizarse por el número de veces que visite para comprar en la tienda. Por una visita el 35%, por dos visitas, el 22%, por tres visitas el 17%, por cuatro visitas el 12%, por cinco visitas el 9% y por seis visitas 5%. Al realizar un estudio sobre lo comprado por visita realizado por los clientes se determinó la siguientes compras en miles de bolívares promedio: en una visita Bs. 7,56; en una segunda visita Bs. 4,25; en una tercera visita Bs. 3,86; en una cuarta visita Bs. 3,36, en una quita visita 2,15 y en una sexta visita Bs1,88. Para un Nivel de Significancia del 2%, ¿Será que el Gerente de Administración de la tienda tiene una buena apreciación en su planteamiento? Problema 13.- En un estudio realizado por el Ingeniero Andrés Scott Velásquez, Coordinador del Departamento de Matemáticas y Estadística del Instituto Universitario de Gerencia y Tecnología, sobre los sueldos de los profesores de varios institutos universitarios recopiló la información que se presenta en cuadro anexo. Utilizando un sistema programático para estadística determinó que el pago promedio es de Bs. 53,94 con una desviación estándar de Bs 12,98. Para un Nivel de Significancia del 5%; ¿Coinciden las frecuencias observadas con las frecuencias esperadas, con base a la Distribución Pirobalística Normal?

10Sueldo (Miles de bolívares)

Menos de 30

De 30 a 40

De 40 a 50

De 50 a 60

De 60 a 70

De 70 a 80

De 80 a 90

Más de

100

Número de

Institutos

2 10 21 22 14 8 1 2 80

Problema 14.- Para un Nivel de Significancia del 2%, verificar si en la Tabla de Contingencia que se presente al final existe relación entre los resultados presentados en las filas con los presentados en las columnas.

158

Columnas Filas

1 2 3 4

1 120 70 55 16

2 79 108 95 43

3 31 49 81 140

Problema 15.- Se han recolectado datos sobre 700 economistas en la Docencia Universitaria, el Sector Privado y el Sector Público respecto a sus opiniones sobre la economía podría ser estable, podría expandirse o podría entrar en un período de contracción en el futuro próximo. Para un Nivel de Significancia del 2,5%; ¿Se podría considerar que existe una relación entre lo que opinan los economistas sobre la situación de la economía y el sector donde ellos prestan servicios? (Ver Tabla de Contingencia)

Economía Economista

Estable Expansión Contracción Total

Docentes 80 100 115 295

Sector Privado 55 40 125 220

Sector Público 40 60 85 185

Total 175 200 325 700

159

TÍTULO VI Capítulo 16

ESTADISTICA INFERENCIAL PARA EL ESTUDIO DE DOS VARIABLES

CORRELACION Y REGRESION LINEAL

La estadística aborda el tema de la relación que puede concretarse entre dos variables estableciendo el comportamiento de una variable respecto a la otra en cuanto a su dependencia o independencia y en cuanto a su fortaleza. Lo cierto es que el estudio de esta relación es muy utilizado en el mundo de los negocios, y si se quiere nos da la herramienta más sencilla para la iniciación del estudio de los pronósticos o predicciones.

1. Correlación Lineal: Establece la relación existente entre dos variables 1.1 Análisis de correlación: Es el grupo de técnicas que nos permite medir la

asociación existente entre dos variables. 1.1.1 Variable Dependiente: Es una variable que se calcula o predice. 1.1.2 Variable Independiente: Es una variable que proporciona las bases para el

cálculo, es la variable de predicción. 1.2 Coeficiente de Correlación: Establece la medida de la magnitud de la relación

entre dos variables.

Correlación Correlación Correlación Negativa Nula Positiva Perfecta Perfecta

Correlación Correlación Negativa Positiva Moderada Moderada Correlación Correlación Correlación Correlación Negativa Negativa Positiva Positiva Fuerte Débil Débil Fuerte -1 -- 0,5 0 + 0,5 +1 Fuerza y dirección del coeficiente de correlación

Calculo del Coeficiente de correlación Lineal

Fórmula fundamentada en los Mínimos Cuadrados

Fórmula fundamentada en el concepto de la Desviación Estándar de cada variable

2 22 2

i i i i

i i i i

n X Y X Yr

n X X n Y Y

1

i ixy

x y x y

X X Y YSr

S S n S S

Recordando que: 2 22 2

2 2; ;1 1 1

i ii i

x y xy

X X Y YX nX Y nYS S S

n n n

160

Ejercicio resuelto

Dados los siguientes pares ordenados de (x, y) observados; {(2, 5), (5, 8), (3, 7), (1, 2), (8, 15)} aplicando la fórmula de los Mínimos Cuadrados calcular la Correlación Lineal y comprobar con la fórmula de las desviaciones estándar de ambas variables.

Solución

2 22 219 361; 37 1.369X Y

2 22 2

2 22 2

2 22 2

5 193 19 37

5 103 361 5 367 1.369

; ;1 1 1

103 5 3,8 367 5 7,47,7 2,775; 23,3 4,8

0,978

274 4

5

i i i i

i i i i

i ii i

x y xy

x x y y

xy

n X Y X Yr

n X X n Y Y

X X Y YX nX Y nYS S S

n n n

S S S S

S

r

2,4 13,113,1

4 2,775 4,0,

8978

27

xy

x y

Sr

S Sr

2. Regresión Lineal: Establece el análisis para desarrollar una ecuación que permite

expresar la relación lineal entre dos variables. 2.1 Análisis de Regresión Lineal: Es la técnica utilizada para desarrollar la ecuación lineal y proporcionar los estimados. Ecuación de Regresión Lineal: Es la ecuación que expresa la relación lineal entre dos variables. Forma General de la Ecuación de Regresión Lineal:

Y A BX

2.2. Determinación de los valores de A y B

Método de los Mínimos Cuadrados: Determina la ecuación de la recta de regresión minimizando la suma de los cuadrados de las distancias verticales entre los valores reales dependientes Y y dos valores pronosticados de la misma variable dependiente Y

Nº Xi Yi XiYi Xi2 Yi

2 Xi-MediaXi Yi-MediaYi (DesXi)x(DesYi)

1 2 5 10 4 25 -1,80 -2,4 4,32

2 5 8 40 25 64 1,20 0,6 0,72

3 3 7 21 9 49 -0,80 -0,4 0,32

4 1 2 2 1 4 -2,80 -5,4 15,12

5 8 15 120 64 225 4,20 7,6 31,92

∑ 19 37 193 103 367 52,4

161

Calculo de B

Método de los Mínimos Cuadrados Método Conceptual

22

i i i i

i i

n X Y X YB

n X X

y

x

SB r

S

Calculo de A

i iY XA B A Y BX

n n

2.3. El poder explicativo de una Ecuación de Regresión Lineal El estudio que se presenta sobre la Regresión Lineal intenta explicar los cambios que puede experimentar una Variable Dependiente Y provocado por

una Variable Independiente X. Si solo las observaciones que se tuvieran fueran de la Variable Dependiente Y, la tendencia central de Y se representaría por la

Media Aritmética Y y la variabilidad total en torno a Y se representa por el

numerador del estimador de la varianza muestral 2

iY Y . Cuando se tienen

las medidas de la Variable Independiente X, la tendencia central de Y se puede expresar en función de X, por lo tanto es de esperarse que la recta de la Ecuación de Regresión Lineal esté más cerca de los valores particulares de Y y que, por lo tanto, la variabilidad en torno a la Ecuación de Regresión Lineal sea menor que la variabilidad en torno a la Media Aritmética. Por lo tanto se han establecido condiciones que permite desarrollar medidas que señalen la eficacia con que la Variable Independiente X explica el comportamiento de la Variable Dependiente Y, siendo el Coeficiente de Determinación la medida que explican esta eficacia. Coeficiente de determinación: Es el porcentaje de la variación total en la variable dependiente Y que se explica o contabiliza por la variación en la variable independiente X. Realizando un análisis de varianza sobre la explicación del poder explicativo de la Ecuación de Regresión Lineal, donde la suma total de los cuadrados (STC); es igual a la suma del cuadrado de la regresión (SCR); más la suma de los cuadrados de los errores (SCE); donde:

2 2 2 22;i i iSTC Y Y SCR Y Y B X X y SCE Y Y

Por lo que STC = SCR + SCE y de allí tendríamos que:

2 1S C R S C E

D rS T C S T C

162

Problema Resuelto

Dados los siguientes pares ordenados de (x, y) observados; {(2, 5), (5, 8), (3, 7), (1, 2), (8, 15)} aplicando la fórmula de los Mínimos Cuadrados calcular: a) La Ecuación de la Recta de Regresión Lineal, b) El valor Y’ para X = 4 (Y’(X=4)) y c) El Coeficiente de Determinación y

demostrar que r D

Solución

a) 2 22

5 193 19 371,701

5 103 19

i i i i

i i

n X Y X YB B

n X X=

37 1,701 190,936

5 5

0,936 1,701

i iY XA A

n

X

Bn

Y

b) 44

7,70,936 1,701 , 4 0.936 1,701 4 4X X

Y X pa Yra X Y

c) Cálculo de D

2

iSTC Y Y 2 2 2

2 2

5 7,4 8 7,4 7 7,4

2 7,4 15 7,4

93,2

22SCR B X X

2 2 2

2

2 2

2 3,8 5 3,8 3 3,81,701

1 3,8 8 3,8

89,117

0,956 0,9789,117

0,95693,2

8S C R

D r D rS T C

D

Nº Xi Yi XiYi Xi2 Yi

2 Xi-MediaXi Yi-MediaYi (DesXi)x(DesYi)

1 2 5 10 4 25 -1,80 -2,4 4,32

2 5 8 40 25 64 1,20 0,6 0,72

3 3 7 21 9 49 -0,80 -0,4 0,32

4 1 2 2 1 4 -2,80 -5,4 15,12

5 8 15 120 64 225 4,20 7,6 31,92

∑ 19 37 193 103 367 52,4

163

2.4. Error Estándar de Estimación: Es una medida de la dispersión, o extensión, de los valores observados alrededor de la recta de regresión. Cálculo de Error Estándar de Estimación:

22

;2

y x y x

Y A Y B XYS S Y Y

n

2.5. Intervalos de Confianza e Intervalos de Predicción: Intervalos de Confianza, reporta el valor medio de una variable dependiente Y

para una variable independiente determinada X. Intervalo de Predicción, Reporta el rango de valores de la variable dependiente Y para un particular valor de la variable independiente X. Cálculo de ambos intervalos:

Tenemos que

2

2

2

1 E

i

i

X X

n XX

n

Intervalo de Confianza:

. . ;

;

y x

I C LIC LSC

tS

LIC Y LSC Y

Intervalo de predicción:

. . ;

1 ; 1y x y x

I P LIP LSP

LIP Y tS LSP Y tS

2.6 Consideraciones necesarias para aplicar la Regresión Lineal a) Para cada valor de X, una grupo de valores de Y que dependen de ese valor seguir una distribución normal. b) Las medias de estas distribuciones normales se ubican en la recta de regresión.

164

c) Todas las desviaciones estándar de estas distribuciones normales son iguales; siendo su mejor estimador d) Los valores de la variable dependiente Y son estadísticamente independiente X de manera particular, éste no depende de ningún otro valor de X.

3.- Graficas de la Correlación Lineal y de Regresión Lineal 3.1Diagrama de dispersión o nube de puntos. Es la gráfica que representa la correlación lineal, se hace a través de puntos que definen las variables cada X y cada Y definen un punto. 3.2 La recta de Regresión Lineal. Se puede obtener sobre el diagrama de dispersión definiendo analíticamente dos puntos correspondientes a esa recta.

Problemas Resueltos Problema 01.-Con la información suministrada en el ejercicio anterior y la obtenida por los respectivos cálculos desarrollar; a) los intervalos de: confianza y de pronósticos, para

98%4,541t y b) Elaborar el Diagrama de Dispersión y la gráfica de la recta de la Ecuación

de Regresión Lineal Solución

a)

2

367 0,936 37 1,701 191

3

2,165

3y xy x

Y A Y B XYS

nS

22

2

2

4 3,81 10,201

3615103

5

E

i

i

X X

n XX

n

. . ;

4,541 1,165 0,201 2,372

; 7,74 2,372 5,368; 7,74 2,372

: 5,368 10,

10 1 2

112

, 1

y x

I C LIC LSC

tS

LIC Y LSC Y LIC LS

IC Y

C

. . ;

1 4,541 1,165 1 0,201 5,798

7,74 5,798 1,942; 7,74 5,798 13,5

:5,798 13,5 8

3

3

8

y x

I P LIP LSP

tS

LIP Y LSP Y

IP Y

b) Gráficas Diagrama de Dispersión y gráfica de la Ecuación de Regresión Lineal

165

x

y

-30 -20 -10 0 10 20 30

-10

0

10

Problema 02.- Un economista de Departamento de Recursos Humanos del Estado Barinas está preparando un estudio sobre el comportamiento de consumidor. Él recolectó los datos que aparecen en cientos de Bolívares para determinar si existe una relación entre el ingreso mensual del consumidor y los niveles de consumo mensual. Los datos recolectados se muestran a continuación:

Consumidor 1 2 3 4 5 6 7 8 9 10 11 12

Ingreso 24,3 12,5 31,2 28,0 35,1 10,5 23,2 10,0 8,5 15,9 14,7 15,0

Consumo 16,2 8,5 15,0 17,0 24,2 11,2 15,0 7,1 3,5 11,5 10,7 9,2

a) Determinar cuál es la variable dependiente b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para

el estudio que realiza el economista. c) Calcular e interpretar el modelo de regresión lineal. ¿Qué refleja este modelo sobre la

relación ingreso consumo? d) ¿Qué consumo pronosticará este modelo de regresión lineal para alguna persona que

tenga un ingreso de Bs. 27,5? e) Calcular e interpretar el error estándar de estimación para el estudio que realiza el

economista y elaborar una gráfica y la interpretación de la misma sobrepuesta sobre el diagrama de dispersión.

f) El economista para su estudio desea un Intervalo de Estimación y de Predicción para un nivel de confianza del 95% donde t = 2,228.

g) Diagramar la Dispersión de Puntos o Nube de Puntos. Comentar y la Recta de la Ecuación de Regresión Lineal.

166

Solución

N° X Y XY X2 Y2

1 24,3 16,2 393,66 590,49 262,44

2 12,5 8,5 106,25 156,25 72,25

3 31,2 15,0 468,00 973,44 225,00

4 28,0 17,0 476,00 784,00 289,00

5 35,1 24,2 849,42 1232,01 585,64

6 10,5 11,2 117,60 110,25 125,44

7 23,2 15,0 348,00 538,24 225,00

8 10,0 7,1 71,00 100,00 50,41

9 8,5 3,5 29,75 72,25 12,25

10 15,9 11,5 182,85 252,81 132,25

11 14,7 10,7 157,29 216,09 114,49

12 15,0 9,2 138,00 225,00 84,64

∑ 228,9 149,1 3337,82 5250,83 2178,81

a. Determinación del Tipo de Variables.

La Variable Dependiente es el consumo mensual y le asignaremos la letra Y. El nivel de consumo mensual depende del nivel de ingreso mensual de cada ciudadano

b. Coeficiente de Correlación y Coeficiente de Determinación Lineal

2 22 2

2 2

12 3337,82 228,9 149,1

12 5250,83 52.395,21 12 2178,81 22.230,81

5924,850,9191

6446,0,9191

% 84

378

% % % 0,9191 % 84,47% ,47%

n XY X Yr

n X X n Y Y

x

r

D

xr

x x

D r D

“La relación existente entre la Variable Independiente X y la Variable Dependiente Y, presenta un Coeficiente de Correlación Fuerte Positivo ya que 0,5 < 0,919 < 1, y además proporciona una variación total del 84,47% en el Consumo Mensual que se explica o contabiliza, por la variación en el Ingreso Mensual”

c. Análisis de Regresión Lineal Y´ = A + BX

167

22

5924,85

10.614,70,558

1,781

1,781

5

149,1 228,90,558

12 12

0,558

n XY X YB

n X X

Y XA B A

n n

B

A

Y X

“El Modelo de la Regresión Lineal que origina los datos de este problema presenta una pendiente negativa lo cual equivale a decir que el Consumo Mensual siempre será menor que el Ingreso mensual”

d. Consumo Mensual para un Ingreso Mensual de X = 27,5.

27,5 27,51,781 0,558 2 17,1267,5 YY

e. Cálculo e interpretación del Error Estándar de Estimación. f.

22178,81 1,781 149,1 0,558 3.337,

2,25

822,253

2 2

3

12Y X

Y X

Y A Y B XY xS

n

S

“El Error Estándar de Estimación SY-X = 6,233; nos presenta un promedio entre los

alejamientos y los acercamientos de los valores de la relación de la Variable

Independiente y la Variable Dependiente respecto a la Recta de Regresión Lineal”

g. Intervalo de Confianza e Intervalo de Predicción.

27,5

27,5

2

95% 95%2

2

2

:

:

1; ; 1

27,5 19,07510,164; 2,228 2,253 0,164 2,033;

52.395,21125250,83

12

2,228 2,253 1 0,164 5,416

Y X Y X

IC LIC Y LSC

IP LIP Y LSP

X Xt S t S

n XX

n

168

27,

27,5

27,5

27,5

27,

7 5

5

5

2 ,

:15,093 19,159

:1

17,126 2,033, 15,093;

17,126 2,033 19,159

17,126 5,416 11,710;

17,126 5,416 22

1,710 2

,54

2,54

2

2

LIC Y LIC

LSC Y LSC

LIP Y LIP

LSP Y L

IC Y

IP

SC

Y

h. Gráfica del Diagrama de Dispersión o Nube de Puntos y la gráfica de la Recta de

la Ecuación de Regresión

x

y

-60 -40 -20 0 20 40 60

-20

0

20

Capítulo 17 Series Cronológicas, Temporales o de Tiempo

1. Series de Tiempo.- Conocidas también como Series Temporales o Series Cronológicas

son recolecciones de datos para alguna o un conjunto de variables durante varios períodos de tiempo, es decir es un conjunto de mediciones sometidas a un estudio en el tiempo. De esta definición se desprende que una de las variables corresponde a los lapsos de tiempos durante los cuales se hace el estudio En una concepción más

169

sencilla se le puede considerar como un conjunto de datos registrados durante un período, semanal, mensual, trimestral o anual.

2. Componentes de una Serie de Tiempo. Son elementos característicos que conforma su estructura y que permite visualizar su comportamiento en el tiempo, bien sea a corto, mediano o a largo plazo.

a. El Componente Tendencial, Componente Secular o Tendencia Secular.- Es la tendencia de la Serie de Tiempo a largo plazo sin que se presente ningún tipo de alteraciones.

b. El Componente de Variación Cíclica.- Son los ascensos y descensos en forma de onda en períodos mayores a un año que al presentarse producen alteraciones que se reflejarán en la tendencia secular que define a la Serie de Tiempo.

c. El Componente de Variación Estacional.- Patrones en los movimientos de la

Serie de Tiempo que reflejan cambio en un año, y que tienden a repetirse de año en año.

d. El Componente de Variación Irregular.- Son variaciones que puede presentar

una Serie de Tiempo producidas por sucesos inusuales que producen movimientos sin patrón discernibles, y según muchos analistas la dividen en Variaciones Episódicas, las cuales no son predecibles pero si identificables ( Guerras, fenómenos de la naturaleza, conflictos laborables etc.,), y Variaciones Residuales, pasadas la Variaciones Episódicas los coletazos que de ellas quedan ya identificados conllevan a la Variación Residual de la Serie de Tiempo.

3. Modelos de serie de tiempos.- Un modelo de serie de tiempos puede expresarse en

función de una combinación de estos cuatro componentes. Por lo general dos tipos de modelos se relacionan con las series de tiempo: a) El Modelo Aditivo y b) El Modelo Multiplicativo.

Modelo Aditivo: t t t t tST T E C I

Modelo Multiplicativo: t t t t tST T E C I

; ; ;

;

t t t

t t

ST Serie deTiempo T TendenciaSecular E TendenciaEstacional

C TendenciaCíclica I Tendencia Irregular

En el modelo aditivo todos los valores son expresados en unidades originales, mientras

que en el modelo multiplicativo solo se expresa el valor de tT en unidades originales y

el resto en valores porcentuales.

Problemas Resueltos Problema 01.-Desarrollar un el Modelo Aditivo de Serie de Tiempo para la venta en bolívares para una de una librería donde:

3.150,00; 630,00; 157,50 63,00T S C y I .

Solución

170

3.150,00 630,00 157,50 63,00 3.559,50TST

Es de observar que este modelo es inusual por cuanto considera que cada componente es independiente una de otro lo cual no es como se presenta en la vida real, por lo tanto el más usado es el Modelo Multiplicativo que de una u otra manera si relaciona entre sí a las componentes de la Serie Tiempo. Problema 02.- Los valores para la deuda morosa de una entidad bancaria puede

registrarse como 63.000.000,00; 170%; 91% 87%T S C e I

663 10 1,7 0,91 0 8,87 4.791.070,00TST

Observación.- Para una Serie de Tiempo de datos anuales, no se tomaría en cuenta la Componente Cíclica, por cuanto esta componente produce alteraciones en períodos

mayores aun año, por lo tanto se tendría que:

t t t tST T E I

4. Métodos de Ajustes o Técnicas de Suavizamiento.

a. El Método de los Promedios Móviles o el Método de los Semipromedios. En muchas ocasiones una Serie de Tiempo presenta muchos apuntamientos y/o muchas depresiones, y a través de este método se busca en lo más posible reducir estas situaciones irregulares que se presentan en algunas Series de Tiempo, lo cual es de un gran apoyo para sincerar lo mejor posible la tendencia para producir predicciones más apegadas a la realidad. Dependiendo de la situación como se presente se determina que promedio se debe utilizar, por lo general es más cómodo promediar entre valores impares, porque cuando se usan valores pares para promediar hay que establecer línea por medio entre valores.

Problemas Resueltos

Problema 01.- En la tabla anexa se presentan las ventas de una comercial durante los doce meses del año. Se pide calcular el Promedio Móvil de tres meses y el de cinco meses y presentar gráficas para los datos dados originalmente y para los promedios móviles calculados. Mes Ene. Feb. Mar. Abril Mayo Jun. Julio Agost. Sept. Oct. Nov. Dic.

Ventas 327,6 510,3 296,1 409,5 315,0 459,9 283,5 378,0 315,0 497,7 283,5 390,6

171

Solución

Meses Nº Ventas ∑(1+2+3)/3+ (2+3+4)/3…

P. Móvil (3)

∑(1+2+3+4+5)/5+ (2+3+4+5+6)/3+…

P. Móvil (5)

Enero 1 327,6

Febrero 2 510,3 378,0 378,0

Marzo 3 296,1 405,3 405,3 371,70 371,70

Abril 4 409,5 340,2 340,2 398,16 398,16

Mayo 5 315,0 394,8 394,8 352,80 352,80

Junio 6 459,9 352,8 352,8 369,18 369,18

Julio 7 283,5 373,8 373,8 350,28 350,28

Agosto 8 378,0 325,5 325,5 386,82 386,82

Septiembre 9 315,0 396,9 396,9 351,54 351,54

Octubre 10 497,7 365,4 365,4 372,96 372,96

Noviembre 11 283,5 390,6 390,6

Diciembre 12 390,6

358

510 378

296 405 372

410 340 398

315 395 353

460 359 369

284 374 350

378 326 387

315 397 352

498 365 373

284 391

3910

100

200

300

400

500

600

1 2 3 4 5 6 7 8 9 10 11 12

Series1 Series2 Series3

Como se puede observar en la gráfica la serie que corresponde a los datos originales presenta apuntamientos y depresiones muy pronunciadas, la cuales se comienzan a minimizar en el Promedio Móvil 3 como se ve en el gráfico de la serie 2 y ya en el Promedio Móvil 5 según se ve en la serie 3 la gráfica presenta un Suavizamiento con la cual se pueden realizar cálculos que nos puede llevar a mejores predicciones.

Problema 02.- En la tabla anexa se presentan las ventas de una comercial durante los últimos ocho trimestres de los dos años anteriores. Se pide calcular el Promedio Móvil de dos trimestres y él de cuatro trimestres y presentar gráficas para los datos dados originalmente y para los promedios móviles calculados.

172

Mes 1 2 3 4 5 6 7 8

Ventas 32 51 29 41 30 46 28 37

Solución

Nº Ventas ∑(1+2)/2+

(2+3)/2…

P. Móvil (2) ∑(1+2+3+4)/4+

(2+3+4+5)/4+…

P. Móvil (4)

1 32 41,5 41,5 38,25 38,25

2 51 40,0 40,0 37,75 37,75

3 29 35,0 35,0 36,50 36,50

4 41 35,5 35,5 36,25 36,25

5 30 38,0 38,0 35,25 35,25

6 46 37,0 37,0

7 28 32,5 32,5

8 37

32 41 38

51 40 38

29 35 37

41 36 36

30 38 36

46 37

28 32

37

0

10

20

30

40

50

60

1 2 3 4 5 6 7 8

Series1 Series2 Series3

Como se puede observar en la gráfica la serie que corresponde a los datos originales presenta apuntamientos y depresiones muy pronunciadas, la cuales se comienzan a minimizar en el Promedio Móvil 2 como se ve en el gráfico de la serie 2 y ya en el Promedio Móvil 4 según se ve en la serie 3 la gráfica presenta un Suavizamiento bastante uniforme con la cual se pueden realizar cálculos que nos puede llevar a mejores predicciones.

b. Suavizamiento Exponencial.- El Suavizamiento Exponencial además de suavizar una Serie de Tiempo, también proporciona un medio bastante efectivo de predicción. El Suavizamiento Exponencial de Primer Orden se utiliza cuando los datos no tienen ningún patrón de tendencia.

1: 1t t tSuavizamiento Exponencial F A F

173

1 Pr

Pr

tan , 0 1

t

t

t

F onóstico para el siguiente período

A Valor real observado para el períodocorriente

F oyección previa para el períodocorriente

Cons te de suavizamiento

Problemas Resueltos

Problema 01.- El dueño una librería quiere pronosticar el ingreso por ventas en el mes de Agosto, entendiendo que lo quiere hacer conociendo que al realizar balance del ingreso mensual en el último día del mes de Julio este fue de Bs. 17.465,00; suponemos que es la primera vez que al dueño de la librería se le ocurre calcular un pronóstico, se tiene que para

el mes de Junio hubo un ingreso de Bs. 16.670,00. Si asumimos que la constante de Suavizamiento es de

Solución Consideremos al ingreso del mes de Junio como Ft proyección previa para el período corriente, entonces:

1

16.908,5

1

0,3 17.465 1 0,3 16.670

0,3 16.908,50 1 0,3 17.

0

17.298,05465

t t t

Agosto

Se

A

ptiembre

gosto

Septiembre

F F

A

F

F F

F

Problema 02.- Las tasas mensuales de inflación para el año 2003 se presentan al final. Una oficina de análisis económico va a realizar un pronóstico cual podría ser el índice inflacionario para Enero del 2004 para lo cual debe: a) Producir un Suavizamiento utilizando un Promedio Móvil con cuatro períodos y b) Utilizar un modelo de Suavizamiento exponencial fijando

Mes En. Feb. Mar. Abril Mayo Jun. Julio Agos. Sept. Oct. Nov. Dic.

Inflación 5,4 5,1 5,0 5,2 5,3 5,3 5,4 5,5 5,2 5,5 5,1 5,4

Solución

1 1 1 ; 1 0,4 0,6

0,4 5,1 0,6 5,4 5,28; 0,4 5,0 0,6 5,28 5,17;

0,4 5,2 0,6 5,17 5,18; 0,4 5,3 0,6 5,18 5,23;

0,4 5,3 0,6 5,23 5,26; 0,4 5,4 0,6 5,26 5,32;

t t t

Marzo Abril

Mayo Junio

Julio Agosto

Sept

F A F de donde

F F

F F

F F

F

2004

0,4 5,5 0,6 5,32 5,39; 0,4 5,2 0,6 5,39 5,31;

0,4 5,5 0,6 5,31 5,39; 0,4 5,1 0,6 5,39 5,27;

0,4 5,4 0,6 5,39 5,32;

iembre Octubre

Noviembre Diciembre

Enero

F

F F

F

174

Mes Tasa PM (4) PM (Centrado) Ft

Enero (2003) 5,4

Febrero 5,1 5,40

5,175

Marzo 5,0 5,163 5,28

5,150

Abril 5,2 5,175 5,17

5,200

Mayo 5,3 5,250 5,18

5,300

Junio 5,3 5,338 5,23

5,375

Julio 5,4 5,363 5,26

5,350

Agosto 5,5 5,375 5,32

5,400

Septiembre 5,2 5,363 5,39

5,325

Octubre 5,5 5,313 5,31

5,300

Noviembre 5,1 5,39

Diciembre 5,4 5,27

Enero (2004) 5,32

Al final se observa, es decir para Enero del 2004 que el pronóstico en cuanto al Índice de Inflación es de 5,32%

5. Análisis de tendencia por el Método de los Mínimos Cuadrados. a. Tendencia Lineal.- La tendencia lineal se fundamenta en el trazado de una recta

que representa el comportamiento de una Serie de Tiempo, quien aporta la información para que aplicando la metodología de los Mínimos Cuadrados logremos la Ecuación de Regresión Lineal.

Método de los Mínimos Cuadrados Método Conceptual

22

i i i i

i i

n X Y X YB

n X X

y

x

SB r

S

Calculo de A

i iY XA B A Y BX

n n

Error Estándar de Estimación.

175

22

;2

y x y x

Y A Y B XYS S Y Y

n

Intervalo de Confianza:

Tenemos que

2

2

2

1 E

i

i

X X

n XX

n

. . ;

;

y x

I C LIC LSC

tS

LIC Y LSC Y

Problema Resuelto Problema.- La tabla anexa representa los ingresos anuales en millones de bolívares de una tienda minoritaria durante los últimos 6 años. Usando una Tendencia Lineal proyectar los Ingresos hacia el año 2015 y establecer el respectivo intervalo de confianza, para

. . 4; . . 98%3,747

g l N Ct . El dueño de la tienda estima que si el posible ingreso anual para el

2015 no supera en un 15% el mejor de los ingresos anuales que hasta ahora ha obtenido este negocio, piensa cerrarla; ¿Qué se le recomendaría al dueño?

Año 2007 2008 2009 2010 2011 2012

Ingresos 1,283 1,199 1,207 1,319 1,342 1,236

Solución

X Y XY X2 Y2

1 1,283 1,283 1,000 1,646

2 1,199 2,398 4,000 1,438

3 1,207 3,621 9,000 1,457

4 1,319 5,276 16,000 1,740

5 1,342 6,710 25,000 1,801

6 1,236 7,416 36,000 1,528

21 7,586 26,704 91,000 9,609

2 22

6 26,704 21 7,586

6 910,009

21

i i i i

i i

n X Y X YB

n XB

X

176

0,009 217,586

61 3

6,23i iY

AX

A Bn n

9 9

2015 2006 9

1,233 0,009

1,1,233 0,009 9 314

Y A BX

X

Y

Y X

Y

2

9,609 1,233 7,586 0,009 26,7040 1

26

40,

y y xx

Y A Y B XYS

nS

2

2

2 2

2

219

1 11,

6

6 2191

5

6

89E

i

i

X X

n XX

n

. . ;

3,747 0,061 1,895

1,314 0,315 0,999; 1,314 0,315 1,629

. . :0,999 1,629

0,315y x

II C LIC LS CC

tS

LIC Y LSC

Y

Y

Recomendación: “Tomados los ingreso anuales que aparecen en el cuadro del problema, él del año 2011 es el mejor, y uno superior al 15% sería 1,342x1,15 = 1,543. Del estudio realizado observamos que en el Nivel de Confianza obtenido el Límite de Confianza Superior es mayor que el requerimiento solicitado (LSC =1,629>1,543), por lo tanto se recomienda mantener abierta la tienda, pero realizando los ajustes a los que haya lugar asesorándose con empresas serias que se dedican a este tipo de trabajo para que no se llegue al LIC=0,999, lo cual sería un desastre, se debe hacer lo posible para salvar el negocio” b. Tendencia Parabólica.- La tendencia parabólica se fundamenta en el estudio de

una parábola que representa el comportamiento de una Serie de Tiempo, quien aporta la información para que aplicando la metodología de los Mínimos

Cuadrados logremos la Ecuación de la Parábola. Ecuación General de la Parábola:

2Y A BX CX

Para obtener los valores de A, B y C se resuelve el siguiente sistema de tres ecuaciones con tres incógnitas:

177

2

2 3

2 3 4 2

nA B X C X Y

A X B X C X XY

A X B X C X X Y

Problema Resuelto Problema.- La tabla anexa representa los ingresos anuales en millones de bolívares de una librería durante los últimos 5 años. Utilizando la Tendencia Parabólica proyectar los Ingresos

hacia el año 2015 y establecer el respectivo intervalo de confianza, para . . 4; . . 95%

2,776g l N C

t .

El dueño de la tienda estima que si el posible ingreso anual para el 2015 no supera en un 15% el mejor de los ingresos anuales que hasta ahora ha obtenido este negocio, piensa

cerrarla; ¿Qué se le recomendaría al dueño?

Año 2007 2008 2009 2010 2011 2012

Ingresos 1,293 1,299 1,287 1,309 1,332 1,329

Solución

X Y XY X2Y X2 X3 X4 Y2

1 1,293 1,293 1,293 1 1 1 1,672

2 1,299 2,598 5,196 4 8 16 1,687

3 1,287 3,861 11,583 9 27 81 1,656

4 1,309 5,236 20,944 16 64 256 1,713

5 1,332 6,660 33,300 25 125 625 1,774

6 1,329 7,974 47,844 36 216 1296 1,766

21 7,849 27,622 120,160 91 441 2275 10,270

2 2

3 4 2

21; 7,849; 27,622; 120,16; 91;

441; 2.275 10,27

X Y XY X Y X

X X y Y

2

2 3

2 3 4 2

nA B X C X Y

A X B X C X XY

A X B X C X X Y

6 21 91 7,849 Re

21 91 441 27,622 1,294; 0,003; 0,002

91 441 2.275 120,16

A B C solviendo el sistemadeecuaciones

A B C A B C

A B C

Luego: 20,002 0,003 1,294Y X X

178

2

9 9

2015 2006 9

0,002 9 0,003 9 1,421,294 9Y

X

Y

2

10,27 1,294 7,849 0,003 27,6222 1

22

40,

y y xx

Y A Y B XYS

nS

2

2

2 2

2

219

1 11,

6

6 2191

5

6

89E

i

i

X X

n XX

n

. . ;

2,776 0,221 1,895

1,429 0,885 0,544; 1,429 0,885 2,314

. . :0,544 2,314

0,885y x

II C LIC LS CC

tS

LIC Y LSC

Y

Y

Recomendación: “Tomados los ingreso anuales que aparecen en el cuadro del problema, él del año 2011 es el mejor, y uno superior al 15% sería 1,332x1,15 = 1,531. Del estudio realizado observamos que en el Nivel de Confianza obtenido el Límite de Confianza Superior es mayor que el requerimiento solicitado (LSC =2,314>1,531), por lo tanto se recomienda mantener abierta la tienda”

6. Descomposición de las Series de Tiempo.- Por lo general es de gran utilidad

descomponer una Serie de Tiempo desglosando cada uno de sus cuatros componentes. a. Aislamiento de la Componente Estacional.- En un estudio serio sobre una Serie

de Tiempo, lo primero que debe obtenerse es el Índice Estacional, la cual mide las fluctuaciones que la serie sufre en el lapso de un año, por lo tanto lo conveniente es estudiar una Serie de Tiempo en períodos de tiempos menores a un año, si se quiere observar la influencia de las estaciones en el movimiento económico de una empresa. Lo primero que debe calcularse es un Promedio Móvil Centrado. Como se mencionó anteriormente la Componente Estacional ocurren en un año, la obtención de este promedio nos permite eliminar la influencia de la Componente Cíclica y la

Componente Irregular las cuales por lo general se dan en períodos mayores a un año.

Como el Modelo Multiplicativo de una Serie de Tiempo es: ST T C E I , el

promedio móvil realizado elimina la influencia de la Componente Estacional y la

Componente Irregular, entonces PM T C , luego podemos señalar que la Razón

por Promedio Móvil sería:

. . . .

ST T C E I STE I

P M T C P M

179

Seguidamente se debe calcular una razón media por promedio móvil para cada mes. Esto se logra promediando la razón por promedio móvil para cada mes. Finalmente se procede para normalizar estas razones promedios para obtener el Índice Estacional, lográndose al dividir 12 (Meses del año) por la suma de las razones promedio por su respectivo promedio móvil

Problema Resuelto Problema.- Al final se presenta un cuadro estadístico que refleja el ingreso (miles de Bolívares) por mes durante los últimos 2 años de una empresa de construcción. Obtener el Índice Estacional.

Mes Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic.

2011 100 90 110 120 180 230 270 260 180 130 100 100

2012 90 110 100 120 190 250 280 310 220 150 110 120

Solución

Año Mes Ingresos (Y)

PM (12) PMC Y/PMC = E.I.

Razón Prom.*PM

Índice Estacional

2011 Enero 100 155,833

Febrero 90

Marzo 110 155,000

Abril 120

Mayo 180 156,667

Junio 230

Julio 270 155,833 155,417 1,7373 1,7373 1,7637

Agosto 260 155,834 1,6684 1,6684 1,6938

Septiembre 180 156,667 156,250 1,1520 1,1520 1,1695

Octubre 130 156,250 0,8320 0.8320 0,8446

Noviembre 100 158,333 157,500 0,6349 0,6349 0,6446

Diciembre 100 158,333 0,6316 0,6316 0,6412

2012 Enero 90 158,333 158,750 0,5669 0,5669 0,5755

Febrero 110 162,250 0,6780 0,6780 0,6883

Marzo 100 159,167 165.000 0,6061 0,6061 0,6153

Abril 120 167,500 0,7164 0,7164 0,7273

Mayo 190 163,333 168,750 1,1259 1.1259 1,1431

Junio 250 170,000 1,4706 1,4706 1,4931

Julio 280 166,667

Agosto 310

Septiembre 220 168,333

Octubre 150

Noviembre 110 169,167

Diciembre 120

170,833

Total 11,8201 12,0000

Al factor a emplear para obtener el Índice Estacional para Mes (f(IEM)):

12 12

Pr . .1

11,8201,0152

IEM IEMf

Razón omedi Mf

o P

Al aplicar este factor para obtener cada Índice Estacional por Mes estamos eliminando cualquier actividad irregular que se pueda presentar en la Serie de Tiempo sometida al estudio. Índice Estacional para cada mes:

180

Pr . .i IEMIEM f Razón omedio P M

Si tomamos el mes de Agosto del 2011 como ejemplo para verificarla influencia del Índice

Estacional, observando que: 260

153,3831,6951

; lo cual quiere decir que por ser una empresa

de construcción para ese mes su actividad es mayor y a lo mejor se debe a las emergencias causadas por las lluvias.

b. Aislamiento de la Variación Cíclica

El Componente Cíclico en una Serie de Tiempo puede identificarse primero obteniendo la

Tendencia Secular y luego el Componente Estacional. En un estudio serio sobre una Serie de Tiempo, lo primero que debe tenerse claro que el Componente Cíclico se observa cuando los movimientos económicos que se estudian se dan en lapsos mayores a un año, por lo tanto lo conveniente es estudiar una Serie de Tiempo en períodos de tiempos mayores a un año, si se quiere observar la influencia de fluctuaciones cíclicas en el movimiento económico de una empresa. Lo primero que debe calcularse es un Promedio Móvil Centrado. Como el Modelo

Multiplicativo de una Serie de Tiempo es: ST T C E I , el promedio móvil realizado

elimina la influencia de la Componente Cíclico y el Componente Irregular, entonces

PM T E , luego podemos señalar que la Razón por Promedio Móvil sería:

. . . .

ST T C E I STC I

P M T E P M

Seguidamente se debe calcular una razón media por promedio móvil para cada período de tiempo. Esto se logra promediando la razón por promedio móvil para cada período. Finalmente se procede para normalizar estas razones promedios para obtener el Índice Cíclico, siguiéndose el mismo esquema como logramos el Índice Estacional.

Problema Resuelto

Problema.- Al final se presenta un cuadro estadístico que refleja el ingreso (miles de Bolívares) por trimestre durante los últimos 4 años de una empresa de construcción. Obtener

el Índice Estacional y el Índice Cíclico. La recta de tendencia es: 231,419 0,061Y X

Año 2010 2011 2012

Trimestre I II II IV I II III IV I II III IV

Ingreso 240 310 210 420 27 32 25 41 20 27 18 39

181

Solución

Año Trimestre Ingreso PM (4) PMC Y/PMC

= E.I.

2010 2011 2012 Razón

Promedio Por PM

Índice

Estacional IE

2010 I 240 0,8710 0,7306 0,8008 0,8030

1,0199 1,0286 1,0243 1,0270

II 310 0,7029 0,8230 0,7630 0,7650

295,00 1,3827 1,4199 1,4013 1,4050

III 210 298,75 0,7029

302,50

IV 420 303,75 1,3827

305,00

2011 I 270 310,00 0,8710

315,00

II 320 313,75 1,0199

312,50

III 250 303,75 0,8230

295,00

IV 410 288,75 1,4199

282,50

2012 I 200 273,75 0,7306

265,00

II 270 262,50 1,0286

260,00

III 180

IV 390

Total 3,9894 4,000

12 4

Pr . . 3,1,00

927

98 4IIEM EM

fRazón omedio P M

f

Año Trimestre Ingreso Proyección

de

tendencia

Índice Estacional

IE

Norma

Estadística

Componente Cíclico

irregular

Componente Cíclico

CC

2010 I 240 231,480 0,8030 185,8784 129,12

II 310 231,541 1,0270 237,7926 130,37

126,77

III 210 231,602 0,7650 177,1755 118,53 128,77

130,76

IV 420 231,663 1,4050 325,4865 129,04 131,27

131,78

2011 I 270 231,724 0,8030 186,0744 145,10 134,58

137,38

II 320 231,785 1,0270 238,0432 134,43 136,98

136,58

III 250 231,846 0,7650 177,3622 140,95 131,87

127,15

IV 410 231,907 1,4050 325,8293 125,83 124,51

121,87

2012 I 200 231,968 0,8030 186,2703 107,37 116,92

111,97

II 270 232,029 1,0270 238,2938 113,31 111,19

110,41

III 180 232,090 0,7650 177,5489 101,38

IV 390 232,151 1,4050 326,1722 119,57

Total

182

PriNorma Estadística NE oyección de Tendencia IE

100Ingreso

Componente Cíclico Irregular CCINorma Estadística

Logrados los Componentes Cíclicos Irregulares en un valor común, se procede a aislar el Componente Cíclico obteniendo el respectivo Promedio Móvil (En nuestro problema es de 4) y luego se obtiene el Promedio Móvil Centrado (Valores en azul remarcados en amarillos), los valores obtenidos son los Índices Cíclicos obtenidos de manera porcentual.

c. Componente Irregular.- Como esta componente obedece al algún evento fortuito o episódico con las consecuencias residuales que origina, por su casualidad no existe un patrón a seguir para sus aislamiento, por lo que se considera que habiendo realizado un buen trabajo en el aislamiento del Componente Estacional y el Componente Cíclico se podría estimar que ya en esas componentes vienen incluidas las incidencias de una Variación Irregular.

Capítulo 18 NÚMEROS ÍNDICES

1. Definiciones Fundamentales: Los Números Índice relacionan valores en un período de tiempo, el cual se toma como período base, con valores en otros períodos llamados períodos referenciales. Es un valor relativo expresado en términos porcentuales para expresar la relación entre las variables. Por lo general en una serie pequeña o corta, el período base corresponde al valor que la inicia, en serie de períodos es recomendable tomar valores que se encuentren lo menos afectados por factores internos y/o externos, que son los que presentan mayor estabilidad. El uso de los Números Índices constituye una herramienta de trabajo para quienes toman las decisiones, ya que permite visualizar en el tiempo el comportamiento de variables económicas, permitiendo hacer comparaciones con períodos más

significativos. Para elaborar un Número Índice se debe tener muy en cuenta: su cobertura, el período base, el sistema de ponderación y el método de promediación de las observaciones 1.1 Número Índice: Es un número que expresa el cambio relativo formulado

porcentualmente en el precio, la cantidad o el valor de un período de tiempo cualquiera en comparación con el precio, la cantidad o valor de un periodo de tiempo tomado como base.

183

1.2 Índice de Precio Simple (IPs): Indica el cambio relativo, en el precio de un producto o servicio, en el periodo de referencia respecto al periodo base.

PR = Precio de referencia. PB = Precio base.

Se dice que un Número Índice es de base fija cuando para los cálculos de los índices de una serie, el período tomado como base permanece inalterado durante toda la duración del índice, mientras que cuando es de base variable el período base varía sistemáticamente tomando siempre el valor correspondiente al del período anterior. Veamos el siguiente cuadro donde hemos calculado los índices simples con una base fija y con bases variables.

Años Valor Base Fija Base Variable

Índice Variación (%)

Índice Variación (%)

2007 141 100,00 0,00 100,00 0,00

2008 126 89,36 -10,64 89,36 -10,64

2009 118 83,69 -16,31 93,65 -6,35

2010 148 104,96 4,96 125,42 24,42

2011 139 98,51 -1,49 93,92 -6,35

2012 162 114,89 14,89 116,55 16,35

Problema Resuelto En el cuadro anexo se presenta los promedios de precio anuales de tres productos que se vende en la Carnicería y Charcutería Don Antonio C. A. de San Juan de los Morros. Usemos esa tabla para hacer un estudio de variación de precios respecto al año base (2010) respecto a los otros años señalados y elaborar los respectivos números indicadores de precios de los períodos señalados.

Artículo Unidad Precio (Bs.)/ unidad

2010 2011 2012

Res 1 Kg 29,00 36,25 49,75

Cerdo 1 Kg 32,00 41,50 59,50

Pollo 1 Kg 14,00 20,25 29,25

Solución

Aplicando la fórmula de Índice de Precios Simple:

184

2010 2011 2012

2010 2011 2012

2010 2

100,00 125,86 171,55

100,00 129,69 185,94

1

100

29 36,25 49,75Re : 100 ; 100 ; 100

29 29 29

32 41,5 59,5: 100 ; 100 ; 100

32 32 32

14: 100 ;00

400

1,

RS

B

PIP

P

s IP IP IP

Cerdo IP IP IP

Pollo IP IP 011 2012144,620,25 29,25

100 ; 10014 14

4 208,93IP

Res: Del año 2010 al 2011 el precio varió en 25,86%, es decir 125,86 – 100,00 Del año 2010 al 2012 el precio varió en 71,55%, es decir 171,55 – 100,00 Cerdo: Del año 2010 al 2011 el precio varió en 29,69%, es decir129,69 – 100,00

Del año 2010 al 2012 el precio varió en 85,94% es decir185,94 – 100,00 Pollo: Del año 2010 al 2011 el precio varió en 44,64%, es decir144,64 – 100,00 Del año 2010 al 2012 el precio varió en 108,93%, es decir208,93 – 100,00

2. Tipo de números índices: 2.1 Número Índice No Ponderado: Son aquellos que son elaborados, tomando en

consideración un solo componente, precios o cantidades. a. Índice de Precios de Promedio Simple: Es el promedio que se obtiene

sumando los índices de precios de productos a estudiar en un año o periodo cualquiera, dividiendo este valor entre el número de productos estudiados.

N = Número de productos. Problema Resuelto

Tomemos el problema anterior y utilicemos los Números Índices Simples calculado para cada artículo y apliquemos la fórmula para el Índice de Precios Promedio Simple.

Solución

Artículo 2010 2011 2012

Res 100,00 125,86 171,55

Cerdo 100,00 129,69 185,94

Pollo 100,00 144,64 208,93

∑ 300,00 400,19 566,42

(∑IPS/n)=IPPS= 100,00 133,40 188,81

Números Índices de cada artículo

185

La variación del Índice Promedio Simple del año 2011 respecto al año base es de 33,40% y él del 2012 sería 88,81%

b. Índice agregado simple: Son números índices que se elaboran sumando los

precios de los productos a estudiar o de referencia, dividiéndolos luego entre la suma de los precios de estos productos en el año que se toma como base y este valor se multiplica por 100.

100R

AS

B

PIP

P

Problema Resuelto Tomemos el problema anterior y utilicemos los Números precios asignado a cada artículo y apliquemos la fórmula para el Índice de Precio Agregado Simple.

Solución

Artículo Unidad 2010 2011 2012

Res Kgs. 29,00 36,25 49,75

Cerdo Kgs. 32,00 41,50 59,50

Pollo Kgs. 14,00 20,25 29,25

∑ 75,00 98,00 138,5

(∑PR/∑PB)x100=IPAS= 100,00 130,67 184,67

2.2 Número Índice Ponderado: Son aquellos números índices que son elaborados,

tomando en consideración la intervención del componente precio y componente cantidad del producto estudiado.

a. Índice de Laspeyres: Es un índice ponderado que utilizan las cantidades

de productos vendidas en el periodo base, como factor de ponderación.

b. Índice de Paashe: Es un índice de precios ponderado que utiliza las

cantidades de los productos vendidas en el periodo de referencia como factor de producción.

186

c. Índice ideal de Fisher: Es un número índice elaborado tomando la Media

Geométrica de los Números Índices de Laspeyres y de Paashe.

Existen otros tipos de Números Índices Ponderados que son menos utilizados como:

d. Índice de Sigwick-Drobisch: Es un número índice elaborado tomando la

Media Aritmética de los Números Índices de Laspeyres y de Paashe.

2

L PSD

IP IPIP

e. Índice de Precios de Marsshall-Edgeworth: indica la variación en los

precios entre dos períodos, tomando como ponderaciones la suma de las cantidades del período base más las del período sometido a la investigación.

100R B R

ME

B B R

P Q QIP

P Q Q

f. Índice de Walsh: indica la variación en los precios entre dos períodos,

tomando como ponderaciones la raíz cuadrada del producto de las cantidades del período base y las del período sometido a la investigación

100R B R

W

B B R

P Q QIP

P Q Q

g. Índice de Precios de Keynes: Toma como información para las

ponderaciones los mínimos valores de las cantidades más pequeñas ya sean del período base o del período investigado.

. ;100

. ;

R B R

K

B B R

P mín Q QIP

p mín Q Q

Problema Resuelto En el cuadro anexo se presenta la variación de precios de cuatro productos de alimentos de consumo diario desde el año 2000 al 2005; y las cantidades vendidas en el año 2000 y el año 2003. si tomamos como base el año 2000, se pide obtener:

a) El índice simple de la azúcar en el año 2001 y del aceite de comer en el 2002.

187

b) Promedio simple de los índices de precio en el 2004. c) Índice de agregado simple en el 2005. d) Índice de precio de Laspeyres, Paasche e Ideal de Fisher, Sigwich-Drobisch,

Marshall-Edgeworth, Walsh y Keynes para el 2003. e) Estimar el costo de: leche en polvo hacia el 2008.

Año

Producto

2000 2001 2002 2003 2004 2005

UNID. Po Qo P1 P2 P3 Q3 P4 P5

Aceite Lit. 75 100 95 115 120 120 145 180

Azúcar Kgs. 50 120 55 82 95 160 110 135

Harina de Maíz Kgs. 45 150 60 89 98 200 105 145

Leche en Polvo Kgs. 25 80 115 190 210 120 225 280

Solución

188

P(00) P(01) P(02) P(03) P(04) P(05) P(3) Q(0) P(3)*Q(0) P(3) Q(3) P(3)*Q(3)

Aceite 75 95 115 120 145 180 120 100 12000 120 120 14400

Azucar 50 55 82 95 110 135 95 120 11400 95 160 15200

H. Maíz 45 60 89 98 105 145 98 150 14700 98 200 19600

L. Polvo 25 115 190 210 225 280 210 80 16800 210 120 25200

∑ 195 325 476 523 585 740 54900 74400

a) P(0) Q(0) P(0)*Q(0) P(0) Q(3) P(0)*Q(3)

110,00 75 100 7500 75 120 9000

153,33 50 120 6000 50 160 8000

b) 45 150 6750 45 200 9000

IP S(4) 25 80 2000 25 120 3000

193,33 IP PS(04) 386,67 22250 29000

220,00

233,33

900,00

1546,7

c) IP AS 379,49

d) IP L 246,74

IP P 256,55

IP F 251,60

P(00) Q(0) P(3) Q(3) PR(QB+QR) PB(QB+QR) Qmín QmínxPR PR(QRQB)1/2

PR(QRQB)1/2

Aceite 75 100 120 120 26400 16500 100 12000 13145,34 8215,84

Azucar 50 120 95 160 26600 14000 120 11400 13163,59 6928,20

H. Maíz 45 150 98 200 34300 15750 150 14700 16974,10 7794,23

L. Polvo 25 80 210 120 42000 5000 80 16800 20575,71 2449,49

∑ 195 129300 51250 54900 63858,74 25387,76

IPSD= 251,65 QmínxPB

IPME= 252,29 7500

IPW= 251,53 6000

IPK= 246,74 6750

2000

22250

e) X Y XY X2

B 46,43 A 11,67

IPS(AZÚCAR)

IPS(ACEITE)

189

e) X Y XY X2 B 46,43

A 11,67

1 25 25 1 MED. X 3,50

2 115 230 4 MED. Y 174,167

3 190 570 9

4 210 840 16

Y' = 11,67 +46,43X

5 225 1125 25 Y' (9) = 429,524

6 280 1680 36

∑ 21 1045 4470 91

2.3 Algunos Números Índices para fines Especiales. a. Índice de Valores.

Un Numero Índice de Valores mide los cambios de precios y las cantidades involucradas en el estudio. Establece la relación que debe existir entre las cantidades de los productos y sus precios en la actualidad con respecto a las cantidades de los productos y sus precios en una fecha de tiempo tomada como fecha base.

100R R

B B

P QIV

P Q

Problema Resuelto

En el problema anterior calcular el Índice de Valores.

74.400294

100100

22., 5%

506

2

R R

B B

P QIV IV

P Q

b. Número de Precios al Consumidor Este número índice nos permite observar la realidad de cómo se mueven los precios de productos y servicios de una cesta básicas relacionada directamente con el consumidor. Describe los cambios de precios de un de un período a otro de una canasta básica de productos y servicios. Este número Índice es el utilizado fundamentalmente para estudiar la inflación.

Problema Resuelto Supongamos que vamos a calcular la inflación en un país para lo cual vamos a tomar tres renglones fundamentales: a) Alimentación (Cesta Básica), b) Vestidos y calzados y Servicios Básicos (Agua, Electricidad, Aseo Urbano y Telefonía). Las variaciones durante los últimos tres años se muestran en tabla. Tomando como año base el 2010 calcular la inflación de los años 2011 y 2012

Solución

190

Con la información suministrada preparemos un cuadro para aplicar el cálculo del Número Índice Promedios Simple.

Renglones Períodos de tiempo

2010 2011 2012

Alimentación 5.292,10 7.205,14 8.315,55

Vestidos y Calzados 2.108,85 2.831,38 3.915,17

Servicios Básicos 1.099,05 1.267,14 1.919,28

Solución

Cálculo de los Números Índices simple.

Renglones Números Índices Simple

2010 2011 2012

Alimentación 100,00 136,15 157,13

Vestidos y Calzados 100,00 134,26 185,65

Servicios Básicos 100,00 115,29 174,63

∑PSx100 300,00 385,70 517,41

2010 2011 2012

300 385,70 517,41100,00; 128,57; 172,47;

3 3 3S S S

IP IP IP

IPPS (2010) = 100,00% IPPS (2011) = 128,57% IPPS (2012) = 172,47% La Inflación en el 2011 respecto al 2010 fue del 28,57%, (128,57 – 100,00) La Inflación en el 2012 respecto al 2010 fue del 72,47%, (172,47 – 100,00)

Problemas propuestos para los Capítulos tratados en el Título VI

Problema 01.- El centro de estudios laborales de una reconocida universidad desea determinar si los promedios puntuales en notas de los estudiantes puede explicar el número de ofertas laborales que ellos reciben después de graduarse. Al final se presenta tabla donde los datos de 10 recién graduados con notas ponderadas de acuerdo a un patrón establecido al efecto.

a) Hacer un diagrama de dispersión para los datos. b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación

para el centro de estudios laborales de la universidad c) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la

relación notas ponderadas y las ofertas de trabajo? d) Si un estudiante tiene una nota ponderada de 3,22; ¿Cuántas ofertas laborales

pronostica usted que él recibirá? e) Calcular e interpretar el error estándar de estimación para la reconocida universidad y

elaborar una gráfica en la interpretación. f) El centro de estudios laborales de la reconocida universidad desea un estimado para

un nivel de confianza del 95% d0nde t = 2,306

191

Estudiante 1 2 3 4 5 6 7 8 9 10

Notas Ponderadas

3,25 2,35 1,02 0,36 3,69 2,65 2,15 1,25 3,88 3,37

Ofertas

3 3 1 0 5 4 2 2 6 2

Problema 02.- Un economista de Departamento de Recursos Humanos del Estado de Florida está preparando un estudio sobre el comportamiento de consumidor. Él recolectó los datos que aparecen en miles de dólares para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo. Los datos recolectados se muestran a continuación:

Consumido 1 2 3 4 5 6 7 8 9 10 11 12

Ingreso 24,3 12,5 31,2 28,0 35,1 10,5 23,2 10,0 8,5 15,9 14,7 15,0

Consumo 16,2 8,5 15,0 17,0 24,2 11,2 15,0 7,1 3,5 11,5 10,7 9,2

h) Determinar cuál es la variable dependiente i) Hacer un diagrama de dispersión para los datos. j) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para

el estudio que realiza el economista. k) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la relación

ingreso consumo? l) ¿Qué consumo pronosticará el modelo para alguien US$ 27,5? m) Calcular e interpretar el error estándar de estimación para el estudio que realiza el

economista y elaborar una gráfica en la interpretación. n) El economista para su estudio desea un estimado para un nivel de confianza del 95%

donde t = 2,228

Problema 03.- Una entidad bancaria se especializa en créditos para la agricultura intenta analizar el mercado de finca raíz, midiendo el poder explicativo que las tasas de interés tienen sobre el número de crédito aprobados en el área. Los datos recopilados en 10 meses son:

Mes 1 2 3 4 5 6 7 8 9 10

Tasa de interés 12,3 10,5 15,6 9,5 10,5 9,3 8,7 14,2 15,2 12,0

Créditos 196 285 125 225 248 303 265 102 105 114

a) Determinar cuál es la variable dependiente b) Hacer un diagrama de dispersión para los datos. c) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para

el análisis de mercado que realiza la entidad bancaria. d) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la relación

tasa de interés créditos otorgados? e) ¿Cuántos créditos se aprobarían siguiendo este modelo, si la tasa de interés fuera del

9,5%? f) Calcular e interpretar el error estándar de estimación para el estudio que realiza el la

entidad bancaria y elaborar una gráfica en la interpretación. g) La entidad bancaria para su estudio desea un estimado para un nivel de confianza del

98% donde t = 2,896

192

Problema 04.- El profesor Urquía ha notado que transcurriendo este período de clases muchos estudiantes no están asistiendo a las mismas. Considera que puede explicar estas ausencias fundamentalmente, por las distancias a que viven los estudiantes del instituto. Se hace un estudio tomando al azar como muestra a 11 estudiantes, según se presenta a continuación:

Estudiante 1 2 3 4 5 6 7 8 9 10 11

Kilómetros 8,1 9,7 3,5 0,7 14,6 19,5 19,5 8,1 11,4 0,6 6,5

Ausencia 2 2 4 5 4 2 5 2 3 1 4

a) Determinar cuál es la variable dependiente b) Hacer un diagrama de dispersión para los datos. c) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para

el análisis que realiza el Profesor Urquía. d) Calcular e interpretar el modelo de regresión. ¿Qué refleja este modelo sobre la relación

distancia ausencia? e) ¿A cuántas clases faltaría un estudiante que viviera a 5,2 Kilómetros? f) Calcular e interpretar el error estándar de estimación para el estudio que realiza el

Profesor Urquía y elaborar una gráfica en la interpretación. g) El Profesor Urquía para su estudio desea un estimado para un nivel de confianza del

98% donde t = 2,764

Problema 05- La tabla siguiente muestra presenta la recuperación anual media sobre el capital (utilidad) y el crecimiento porcentual anual medio de las ventas para ocho compañías de navegación aérea y defensa.

Compañía 1 2 3 4 5 6 7 8

Productividad 23,1 13,2 24,1 11,1 10,1 10,8 27,3 20,1

Crecimiento 8,0 15,6 31,2 2,5 35,4 6,0 8,7 3,2

a) Hacer un diagrama de dispersión para los datos. b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para

el análisis productividad crecimiento. c) Calcular e interpretar el modelo de regresión en base crecimiento. ¿Qué refleja este

modelo sobre la el valor de la pendiente? d) Siguiendo este modelo; ¿Cuál será la productividad para un crecimiento de

26.8?Comentar e) Calcular e interpretar el error estándar de estimación para la relación productividad-

crecimiento y elaborar una gráfica en la interpretación. f) Se desea un estimado productividad-crecimiento para un nivel de confianza del 95%

donde t = 2,447

Problema 06.- Los datos siguientes revelan el precio al detal para doce computadoras laptop seleccionadas al azar, además de la velocidades de su procesador.

Computadoras 1 2 3 4 5 6 7 8 9 10 11 12

Velocidad 2,0 1,6 1,6 1,8 2,0 1,2 2,0 1,6 2,0 1,6 1,0 1,4

Precio (Bs.) 12,4 5,7 6,5 11,9 13,1 6,2 13,5 8,5 13,0 12,3 5,7 5,3

193

a) Desarrollar una ecuación de regresión lineal que se pueda utilizar para describir el grado con el cual el precio depende de la velocidad del procesador.

b) Con base en la ecuación de la recta de regresión, ¿Existe algún equipo que parezca tener un precio más bajo del que le corresponde?

c) Calcule el coeficiente de correlación y de determinación entre las dos variables

Problema 07.- Se ha efectuado un estudio en que se relaciona los puntajes de aptitud con la productividad de una industria. Después de tres mese de entrenamiento del personal. Sus postulantes, elegidos al azar, obtuvieron los seis pares de puntajes de aptitud y productividad que se indican a continuación:

Par 1 2 3 4 5 6

Aptitud 9 17 20 19 20 23

Productividad 23 35 29 33 43 32

a) ¿Cuál es la productividad esperada de un trabajador, cuyo puntaje de aptitud fue de

16? b) Obtener el coeficiente de correlación y de determinación. c) Obtener el error estándar de estimación. d) Fijar una probabilidad del 95%, donde t = 2,776; la probabilidad estimada en el literal

Problema 08.- Al observar el número de sucursales y los costos mensuales en comunicación telefónica con la casa central, en millones de bolívares, se encontró:

Sucursales 3 5 3 2 4 1 5 2 6 3

Costos Mens. 2 3 5 4 6 2 5 1 3 5

a) Obtener el coeficiente de correlación y de determinación. Explicar que interpreta cada

uno. b) Obtener la ecuación de regresión lineal que muestre la relación de los costos en

función del número de sucursales. c) Estimar los costos de una empresa con 10 sucursales d) Obtener el error estándar de estimación para la estimación del literal.

Problema 09.- Con los ingresos y gastos de 10 familias tomadas al azar:

Familia 1 2 3 4 5 6 7 8 9 10

Ingreso (Cien miles Bs.)

6,5 7,0 8,0 10,0 11,0 7,5 8,0 9,0 10,8 8,3

Gastos (Cien miles Bs.)

6,3 6,7 7.0 8,2 9,0 7,3 7,9 8,5 8,6 7,7

a) Hacer un diagrama de dispersión para los datos. b) Calcular e interpretar el coeficiente de correlación y el coeficiente de determinación para

el análisis ingreso gasto.

194

c) Calcular e interpretar el modelo de regresión en base al ingreso en función de gastos, y en estas condiciones; ¿Cuál es la variable dependiente? y ¿Qué refleja este modelo sobre la el valor de la pendiente?

d) Siguiendo este modelo; ¿Cuál sería la gasto para un ingreso de 7,5 cien miles de bolívares? Comentar

e) Calcular e interpretar el error estándar de estimación para la relación ingresos gastos y elaborar una gráfica en la interpretación.

f) Se desea un estimado de ingreso-gastos del literal d para un nivel de confianza del 90% donde t = 1,860

Problema 10.- La solubilidad en el agua de cierto producto orgánico se hace más rápida con el auxilio de un agente químico. Según se presume de las siguientes observaciones efectuadas en seis muestras de 20 gramos del producto y diversas dosis del agente químico:

Muestra 1 2 3 4 5 6

Agente (grs.) 3 2 1 3 5 4

Solubilidad (seg.) 7 9 10 8 5 6

a) Calcular e interpretar, el coeficiente de correlación y el coeficiente de determinación. b) ¿Cuál es la rapidez de solución de 10 gramos del producto químico en ausencia del

agente químico? c) ¿Qué proporción del agente químico deberá contener el producto para que la solución

sea instantánea? Problema 11.- Con los ingresos y gastos de 10 familias tomadas al azar:

Familia 1 2 3 4 5 6 7 8 9 10

Ingreso (Cien miles Bs.)

6,5 7,0 8,0 10,0 11,0 7,5 8,0 9,0 10,8 8,3

Gastos (Cien miles Bs.)

6,3 6,7 7.0 9,0 7,3 7,9 8,5 8,6 7,7

¿Será que con esta información se podría estimar el gasto de la familia Nº 4?, y de ser posible, ¿Cuál sería el gasto estimado?

Problema 12.- Las importaciones realizadas por ARAUJO DE IMPORTACIÓN C.A. en millardo de bolívares desde los países asiático se presentan al final. Se pide calcular e interpretar los índices estacionales para cada trimestre.

Semestre 2009 Semestre 2010 Semestre 2011 Semestre 2012

I 5,16 I 6,45 I 4,30 I 5,16

II 6,45 II 7,74 II 6,45 II 6,02

III 7,74 III 9,03 III 6,02 III 6,45

IV 11,18 IV 15,48 IV 10,75 IV 10,75

Problema 13.- Los ingresos trimestrales en miles de Bolívares del establecimiento de comidas rápidas “MI BUENA COMIDA C.A.” se presentan al final. Comparar la recta de tendencia y los índices estacionales para cada trimestre.

195

Semestre 2009 Semestre 2010 Semestre 2011 Semestre 2012

I 215 I 366 I 587 I 621

II 253 II 471 II 571 II 655

III 351 III 451 III 569 III 687

IV 398 IV 652 IV 588 IV 699

Problema 14.- La sección de estadística de la CTV ha llevado una relación de los despedidos en el sector privado por trimestres en los últimos cuatro años según cuadro al final. Se pide:

a) Proyectar el número de posibles despidos para el primer y tercer trimestres del 2013 b) Desarrollar los índices estacionales para el número de despidos. c) Determinar los despidos eliminando los factores estacionales. d) Calcular los componentes cíclicos para cada período de tiempo.

e) Si los despidos para el primer trimestre del 2013 son 83; ¿Cuántos despidos se puede esperar para el año 2013?

f) Obtener cifras desestacionalizadas para cada período de tiempo.

Semestre 2009 Semestre 2010 Semestre 2011 Semestre 2012

I 45 I 51 I 63 I 69

II 49 II 58 II 67 II 76

III 58 III 61 III 67 III 79

IV 52 IV 69 IV 70 IV 81

Problema 15.- Con los siguientes datos:

Año 2000 2001 2002 2003 2004 2005 2006

Producción 360 383 337 390 406 459 480

Se pide:

a. Estimar la producción (Miles-Tons.) para el 2019 ajustando una recta y tomando como origen el año inicial

b. Estimar la producción (Miles-Tons.) para el 2014 ajustando una recta y tomando como origen el año más conveniente.

c. En la estimación anterior agregar el 2007, donde se obtuvo una producción de 600 Tons.

d. Fijar límites de confianza para un N.C. del 95%, donde t = 2,571 e. Calcular el coeficiente de correlación de Pearson.

Problema 16.-Con los índices de precios anuales:

Años 2000 2001 2002 2003 2004 2005 2006

Promedios 128 135 148 145 152 161 162

Se pide:

a. Estimar precio promedio para el 2008 b. Obtener el error estándar de estimación y fijar límites de confianza para un N.C. del

95% donde t = 2,571. c. Calcular el coeficiente de correlación de Pearson.

Problema 17.- Con los siguientes datos:

196

Años 2002 2003 2004 2005 2006

Yi Y1 Y2 550 600 750

Y 580’ 635

Se pide:

a. Estimar el valor de Y para el año 2006 mediante un ajuste rectilíneo. b. Calcular el valor de Y1 y Y2

Problema 18.- De acuerdo con los siguientes datos:

Años 2002 2003 2004 2005 2006

Yi 50 Y2 100 Y4 140

Y 90 148

Se pide:

a. Estimar el valor de Y para el 2016 mediante un ajuste rectilíneo. b. Calcular el valor de Y2 y Y4

Problema 19.- .- De acuerdo con los siguientes datos:

Años 2002 2003 2004 2005 2006 ∑

Yi 50 320 380

XiYi 0 3.260

Se sabe adicionalmente que la media de las observaciones es 280. Se pide reconstruir el cuadro anterior, y además estimar el valor de Y para el año 2013. Problema 20.- Los turistas extranjeros llegados a una ciudad X han sido, en los últimos cinco años:

Años 2002 2003 2004 2005 2006

Pasajeros 417.500 572.800 620.350 679.260 712.800

Se ha determinado que el 60% de estos turistas requieren alojamiento en establecimientos hoteleros y el resto en hoteles de cinco estrellas.

a. Determinar la demanda total de alojamientos en el 2012. b. Demanda de hoteles cinco estrellas en el 2012

Problema 21.- A continuación se presenta el número de llamadas telefónicas diarias que ingresan a un conmutador de una oficina muy ocupada. Calcular el promedio móvil para tres períodos.

Día 1 2 3 4 5 6 7 8 9 10 11

Llamadas 40 37 45 32 42 47 39 47 41 36 38

197

Problema 22.- Se presenta el número de empleados que se ausentan diariamente de sus trabajos en una fábrica grande. Calcular el promedio móvil de cuatro períodos relacionados con estos datos, centrando los promedios.

Día 1 2 3 4 5 6 7 8 9 10 11 12

Empleados 45 54 63 39 42 31 48 54 64 36 41 52

Problema 23.- Los créditos mensuales en miles de bolívares de una entidad bancaria local son:

Crédito 1 2 3 4 5 6 7 8 9

Monto 211 234 209 217 215 232 221 211 203

Utilizando el suavizamiento exponencial para proyectar los créditos al siguiente período, utilizando un valor α de 0,10. Calcular el cuadrado medio del error y compárelo con el cuadrado medio del error si α es 0,80. ¿Cuál valor α proporciona mejor pronóstico? Problema 24.- Las exportaciones desde 1995 a 1998 en miles de bolívares de accesorios para armar transformadores hacia los ´países del Caribe por parte de Trodica C.A., se presentan a continuación: Calcular e interpretar los índices estacionales para cada trimestre.

Trimestre y Año Bs.

I Bs.

II Bs.

III Bs.

IV Bs.

1995 12 15 10 12

1996 15 18 18 14

1997 18 21 14 15

1998 26 36 25 25

Problema25.- Los costos en cientos de bolívares de 1995 a 1998 en llamadas telefónicas internacionales realizadas desde las oficinas de Petróleos Nacionales Sociedad Anónima (PETNASA) aparecen a continuación. Calcular e interpretar los índices trimestrales

Trimestre y Año Bs.

I Bs.

II Bs.

III Bs.

IV Bs.

1995 14 21 21 26

1996 18 24 23 28

1997 26 29 38 48

1998 15 18 21 31

Problema 26.- Un supermercado está considerando ajustar los precios de sus servicios de carnicería, según se muestra en cuadro anexo:

198

Mes Enero Febrero Marzo Abril Mayo

Prec-Cant. Artículo

PB

Bs. QB

Kgs. P1

Bs. Q1

Kgs.

P2

Bs.

Q2

Kgs.

P3

Bs.

Q3

Kgs.

P4

Bs.

Q4

Kgs. Car. de res 21 700 21 720 25 680 24 620 26 760

Car. de cerdo 19 320 21 360 26 380 27 350 25 340

Car. de ternera 24 85 26 100 24 120 28 90 26 95

Pollo 12 850 15 880 13 850 13 890 14 950

Gallina 17 70 17 75 18 85 20 90 21 80

Se pide:

a. Índice de precio simple de la ternera en el mes de marzo. b. Índice de precios agregados de los productos considerados en el mes de abril. c. Índice ideal de Fisher de febrero. d. ¿En cuánto montó la inflación del 2007 al 2008?

Problema 27.- Un supermercado está considerando ajustar los precios de sus servicios de cosméticos (cantidades en miles de unidades), según se muestra en cuadro anexo:

Año 2006 2007 2008 2009 2010

Prec-Cant. Artículo

P0

Bs. Q0

Und. P1

Bs. Q1

Und.

P2

Bs.

Q2

Und.

P3

Bs.

Q3

Und.

P4

Bs.

Q4

Und.

Jabón 12,2 13 12,3 13 13,3 14 15,4 14 18,1 14

Champó 21,4 8 21,4 8 22,0 9 23,3 9 26,9 9

Enjuague 20,0 5 22,6 6 23,5 6 24,6 7 24,6 8

Pasta dental 19,1 10 22,5 11 22,7 11 26,5 13 31,7 14

Se pide:

a. Índice de precio simple de cada unidad de jabón en el año 2007. b. Índice de precios agregados de los productos considerados en el año 2009 c. Índice ideal de Fisher en el año 2008. d. ¿En cuánto se podría estimar el costo de la pasta dental para el 2013.

Problema 28.- Una ferretería está considerando ajustar los precios de sus ventas de equipos y herramientas (Precio por miles de bolívares), según se muestra en cuadro anexo

Año 2006 2007 2008 2009 2010

Prec-Cant. Artículo

P0

Bs. Q0

Und.

P1

Bs. Q1

Und.

P2

Bs.

Q2

Und.

P3

Bs.

Q

Und.

P4

Bs.

Q4

Und.

Martillo 22 103 23 112 24 123 24 136 32 132

Alicate 26 98 27 104 27 103 27 96 31 101

Destornillad. 13 148 14 158 14 138 16 146 18 152

Taladro 92 18 92 23 94 21 96 24 98 22

J. de llaves 38 15 40 17 42 18 45 18 51 20

Se pide:

199

a. Índice de precio simple de cada taladro en el año 2008. b. Índice de precios agregados de los productos considerados en el año 2007 c. Índice ideal de Fisher en el año 2009. d. ¿En cuánto se podría estimar el costo del destornillador para el 2015.

Problema 29.- Un supermercado está considerando ajustar los precios de tres de sus producto de leguminosas (cantidades en miles de toneladas, según se muestra en cuadro anexo:

Año 2006 2007 2008 2009 2010

Prec-Cant. Artículo

P0

Bs. Q0

Tn. P1

Bs. Q1

Tn.

P2

Bs.

Q2

Tn.

P3

Bs.

Q3

Tn.

P4

Bs.

Q4

Tn. Caraotas negr. 5,5 1,1 5,8 1,2 6,0 1,8 6,5 2,2 7,0 2,6

Frijoles 3,5 0,6 4,2 0,7 4,2 0,7 5,6 0,8 6,8 0,8

Lentejas 4,2 2,3 4,8 2,8 4,8 3,2 6,5 3,6 7,6 4,0

Se pide:

a. Índice de precio simple de una tonelada de caraotas negras en el año 2008. b. Índice de precios agregados de los productos considerados en el año 2007 c. Índice ideal de Fisher en el año 2009. d. ¿En cuánto se podría estimar el costo de las lentejas para el 2015? e. ¿En cuánto montó la inflación del 2008 al 2009?

Problema 30 .- Los números índices de la producción de un determinado bien de consumo desde el año 2000 al 2006 fueron los siguientes:

Años 2000 2001 2002 2003 2004 2005 2006

Índices 100,00 112,14 115,26 110,04 105,00 110,82 120,55

APÉNDICES

200

APÉNDICE “A”

DISTRIBUCIÓN DE PROBABILIDAD NORMAL O “Z” (Media Campana)

Z A Z A Z A Z A Z A Z A Z A Z A

0,00 0,0000 0,45 0,1736 0,90 0,3159 1,35 0,4115 1,80 0,4641 2,25 0,4878 2,70 0,4965 3,15 0,4992

0,01 0,0040 0,46 0,1772 0,91 0,3186 1,36 0,4131 1,81 0,4649 2,26 0,4881 2,71 0,4966 3,16 0,4992

0,02 0,0080 0,47 0,1803 0,92 0,3212 1,37 0,4147 1,82 0,4656 2,27 0,4884 2,72 0,4967 3,17 0,4992

0,03 0,0120 0,48 0,1844 0,93 0,3238 1,38 0,4162 1,83 0,4664 2,28 0,4887 2,73 0,4968 3,18 0,4993

0,04 0,0160 0,49 0,1879 0,94 0,3264 1,39 0,4177 1,84 0,4671 2,29 0,4890 2,74 0,4969 3,19 0,4993

0,05 0,0199 0,50 0,1915 0,95 0,3289 1,40 0,4192 1,85 0,4678 2,30 0,4893 2,75 0,4970 3,20 0,4993

0,06 0,0239 0,51 0,1950 0,96 0,3315 1,41 0,4207 1,86 0,4686 2,31 0,4896 2,76 0,4971 3,21 0,4993

0,07 0,0279 0,52 0,1985 0,97 0,3340 1,42 0,4222 1,87 0,4693 2,32 0,4898 2,77 0,4972 3,22 0,4994

0,08 0,0319 0,53 0,2019 0,98 0,3365 1,43 0,4236 1,88 0,4700 2,33 0,4901 2,78 0,4973 3,23 0,4994

0,09 0,0359 0,54 0,2054 0,99 0,3389 1,44 0,4251 1,89 0,4706 2,34 0,4904 2,79 0,4974 3,24 0,4994

0,10 0,0398 0,55 0,2088 1,00 0,3413 1,45 0,4265 1,90 0,4713 2,35 0,4906 2,80 0,4974 3,25 0,4994

0,11 0,0438 0,56 0,2123 1,01 0,3438 1,46 0,4279 1,91 0,4719 2,36 0,4909 2,81 0,4975 3,26 0,4994

0,12 0,0478 0,57 0,2157 1,02 0,3461 1,47 0,4292 1,92 0,4726 2,37 0,4911 2,82 0,4976 3,27 0,4995

0,13 0,0517 0,58 0,2190 1,03 0,3485 1,48 0,4306 1,93 0,4732 2,38 0,4913 2,83 0,4977 3,28 0,4995

0,14 0,0557 0,59 0,2224 1,04 0,3508 1,49 0,4319 1,94 0,4738 2,39 0,4916 2,84 0,4977 3,29 0,4995

0,15 0,0596 0,60 0,2258 1,05 0,3531 1,50 0,4332 1,95 0,4744 2,40 0,4918 2,85 0,4978 3,30 0,4995

0,16 0,0636 0,61 0,2291 1,06 0,3554 1,51 0,4345 1,96 0,4750 2,41 0,4920 2,86 0,4979 3,31 0,4995

0,17 0,0675 0,62 0,2324 1,07 0,3577 1,52 0,4357 1,97 0,4756 2,42 0,4922 2,87 0,4980 3,32 0,4996

0,18 0,0714 0,63 0,2357 1,08 0,3599 1,53 0,4370 1,98 0,4762 2,43 0,4925 2,88 0,4980 3,33 0,4996

0,19 0,0754 0,64 0,2389 1,09 0,3621 1,54 0,4382 1,99 0,4767 2,44 0,4927 2,89 0,4981 3,34 0,4996

0,20 0,0793 0,65 0,2422 1,10 0,3643 1,55 0,4394 2,00 0,4773 2,45 0,4929 2,90 0,4981 3,35 0,4996

0,21 0,0832 0,66 0,2454 1,11 0,3665 1,56 0,4406 2,01 0,4778 2,46 0,4931 2,91 0,4982 3,36 0,4996

0,22 0,0871 0,67 0,2486 1,12 0,3686 1,57 0,4418 2,02 0,4783 2,47 0,4932 2,92 0,4983 3,37 0,4996

0,23 0,0910 0,68 0,2518 1,13 0,3708 1,58 0,4430 2,03 0,4788 2,48 0,4934 2,93 0,4983 3,38 0,4996

0,24 0,0948 0,69 0,2549 1,14 0,3729 1,59 0,4441 2,04 0,4793 2,49 0,4936 2,94 0,4984 3,39 0,4997

0,25 0,0987 0,70 0,2580 1,15 0,3749 1,60 0,4452 2,05 0,4798 2,50 0,4938 2,95 0,4984 3,40 0,4997

0,26 0,1026 0,71 0,2612 1,16 0,3770 1,61 0,4463 2,06 0,4803 2,51 0,4940 2,96 0,4985 3,41 0,4997

0,27 0,1064 0,72 0,2642 1,17 0,3790 1,62 0,4474 2,07 0,4808 2,52 0,4941 2,97 0,4985 3,42 0,4997

0,28 0,0110 0,73 0,2673 1,18 0,3810 1,63 0,4485 2,08 0,4812 2,53 0,4943 2,98 0,4986 3,43 0,4997

0,29 0,1141 0,74 0,2704 1,19 0,3830 1,64 0,4495 2,09 0,4817 2,54 0,4945 2,99 0,4986 3,44 0,4997

0,30 0,1179 0,75 0,2734 1,20 0,3849 1,65 0,4505 2,10 0,4821 2,55 0,4946 3,00 0,4987 3,45 0,4997

0,31 0,1217 0,76 0,2764 1,21 0,3869 1,66 0,4515 2,11 0,4826 2,56 0,4948 3,01 0,4987 3,46 0,4997

0,32 0,1255 0,77 0,2794 1,22 0,3888 1,67 0,4525 2,12 0,4830 2,57 0,4949 3,02 0,4987 3,47 0,4997

0,33 0,1293 0,78 0,2823 1,23 0,3907 1,68 0,4535 2,13 0,4834 2,58 0,4951 3,03 0,4988 3,48 0,4998

0,34 0,1331 0,79 0,2852 1,24 0,3925 1,69 0,4545 2,14 0,4838 2,59 0,4952 3,04 0,4989 3,49 0,4998

0,35 0,1368 0,80 0,2881 1,25 0,3944 1,70 0,4554 2,15 0,4842 2,60 0,4953 3,05 0,4989 3,50 0,4998

0,36 0,1406 0,81 0,2910 1,26 0,3962 1,71 0,4564 2,16 0,4846 2,61 0,4955 3,06 0,4989 3,51 0,4998

0,37 0,1443 0,82 0,2939 1,27 0,3980 1,72 0,4573 2,17 0,4850 2,62 0,4956 3,07 0,4989 3,52 0,4998

0,38 0,1480 0,83 0,2967 1,28 0,3997 1,73 0,4582 2,18 0,4854 2,63 0,4957 3,08 0,4990 3,53 0,4998

0,39 0,1517 0,84 0,2996 1,29 0,4015 1,74 0,4591 2,19 0,4857 2,64 0,4959 3,09 0,4990 3,54 0,4998

0,40 0,1554 0,85 0,3023 1,30 0,4032 1,75 0,4599 2,20 0,4861 2,65 0,4960 3,10 0,4990 3,55 0,4998

0,41 0,1591 0,86 0,3081 1,31 0,4049 1,76 0,4608 2,21 0,4865 2,66 0,4961 3,11 0,4991 3,56 0,4998

0,42 0,1628 0,87 0,3079 1,32 0,4066 1,77 0,4616 2,22 0,4868 2,67 0,4962 3,12 0,4991 3,57 0,4998

0,43 0,1664 0,88 0,3106 1,33 0,4082 1,78 0,4625 2,23 0,4871 2,68 0,4963 3,13 0,4991 3,58 0,4998

0,44 0,1700 0,89 0,3133 1,34 0,4099 1,79 0,4633 2,24 0,4875 2,69 0,4964 3,14 0,4992 3,59 0,4998

201

Tabla Orientadora para obtener las probabilidades de la Distribución

Aplicando la Media Campana de Gauss APÉNDICE “B”

Valores notable de Z

N.C.

% A0 Z0 N.C.

% A0 Z0 N.C.

% A0 Z0 N.C.

% A0 Z0

80 0,400 1,28 85 0,425 1,44 90 0.450 1,65 95 0.475 1,96

81 0,405 1,31 86 0,430 1,48 91 0,455 1,72 96 0,480 2,05

82 0,410 1,34 87 0,435 1,51 92 0,460 1,75 97 0,485 2,17

83 0,415 1,37 88 0,440 1,56 93 0,465 1,81 98 0,490 2,33

84 0,420 1,41 89 0,445 1,60 94 0,470 1,88 99 0,495 2,58

GRÁFICA EN LA

CAMPANA DE GAUSS

PROBABILIDAD

SOLICITADA

PARÁMETRO

RESPECTO A LA MEDIA

POBLACIONAL

SIGNO DE Z

OBTENCIÓN DEL

ÁREA EN LA TABLA DE Z

Un solo acotamiento (X<a; X>a)

P X a a Z 0,5 aA A

P X a a Z 0,5 aA A

P X a a Z 0,5 aA A

P X a a Z 0,5 aA A

Doble acotamiento (a<X<b; X<a ó X>b)

P a X b a b ;a bZ y Z b aA A A

P a X b a b ;a bZ y Z b aA A A

P a X a b Z aA A

P X b a b Z bA A

P a X b a b ;a bZ y Z a bA A A

202

DISTRIBUCIÓN t DE STUDENT

APÉNDICE "C"

Intervalo de Confianza, IC

Intervalo de Confianza, IC

80% 90% 95% 98% 99% 99,9%

80% 90% 95% 98% 99% 99,9%

Nivel de significancia para prueba de una cola,

Nivel de significancia para prueba de una cola,

g.l. 0,100 0,050 0,025 0,010 0,005 0,0005

g.l. 0,100 0,050 0,025 0,010 0,005 0,0005

Nivel de significancia para prueba de dos colas,

Nivel de significancia para prueba de dos colas,

0,200 0,100 0,050 0,020 0,010 0,001

0,200 0,100 0,050 0,020 0,010 0,001

1 3,078 6,314 12,706 31,821 63,657 636,619

34 1,307 1,691 2,032 2,441 2,728 3,601

2 1,886 2,920 4,303 6,965 9,925 31,599

35 1,306 1,690 2,030 2,438 2,724 3,591

3 1,638 2,353 3,182 4,541 5,841 12,924

36 1,306 1,688 2,028 2,434 2,719 3,582

4 1,533 2,132 2,776 3,747 4,604 8,610

37 1,305 1,687 2,026 2,431 2,715 3,574

5 1,476 2,015 2,571 3,365 4,032 6,869

38 1,304 1,686 2,024 2,429 2,712 3,566

6 1,440 1,943 2,447 3,143 3,707 5,959

39 1,304 1,685 2,023 2,426 2,708 3,558

7 1,415 1,895 2,365 2,998 3,499 5,408

40 1,303 1,684 2,021 2,423 2,704 3,551

8 1,397 1,860 2,306 2,896 3,355 5,041

41 1,303 1,683 2,020 2,421 2,701 3,544

9 1,383 1,833 2,262 2,821 3,250 4,781

42 1,302 1,682 2,018 2,418 2,698 3,538

10 1,372 1,812 2,228 2,764 3,169 4,587

43 1,302 1,681 2,017 2,416 2,695 3,352

11 1,363 1,796 2,201 2,718 3,106 4,437

44 1,301 1,680 2,015 2,414 2,692 3,526

12 1,356 1,782 2,179 2,681 3,055 4,318

45 1,301 1,676 2,014 2,412 2,690 3,520

13 1,350 1,771 2,160 2,650 3,012 4,221

46 1,300 1,679 2,013 2,410 2,687 3,515

14 1,345 1,761 2,145 2,624 2,977 4,140

47 1,300 1,678 2,012 2,408 2,685 3,510

15 1,341 1,753 2,131 2,602 2,947 4,073

48 1,299 1,677 2,011 2,407 2,682 3,505

16 1,337 1,746 2,120 2,583 2,921 4,015

49 1,299 1,677 2,010 2,405 2,680 3,500

17 1,333 1,740 2,110 2,567 2,898 3,965

50 1,299 1,676 2,009 2,403 2,678 3,496

18 1,330 1,734 2,101 2,552 2,878 3,922

51 1,298 1,675 2,008 2,402 2,676 3,492

19 1,328 1,729 2,093 2,539 2,861 3,883

52 1,298 1,675 2,007 2,400 2,674 3,488

20 1,325 1,725 2,086 2,528 2,845 3,850

53 1,298 1,674 2,006 2,399 2,672 3,484

21 1,323 1,721 2,080 2,518 2,831 3,819

54 1,297 1,674 2,005 2,397 2,670 3,480

22 1,321 1,717 2,074 2,508 2,819 3,792

55 1,297 1,673 2,004 2,396 2,668 3,476

23 1,319 1,714 2,069 2,500 2,807 3,768

56 1,297 1,673 2,003 2,395 2,667 3,473

24 1,318 1,711 2,064 2,492 2,797 3,745

57 1,297 1,672 2,002 2,394 2,665 3,470

25 1,316 1,708 2,060 2,485 2,787 3,725

58 1,296 1,672 2,002 2,392 2,663 3,466

26 1,315 1,706 2,056 2,479 2,779 3,707

59 1,296 1,671 2,001 2,391 2,662 3,463

27 1,314 1,703 2,052 2,473 2,771 3,690

60 1,296 1,671 2,000 2,390 2,660 3,460

28 1,313 1,701 2,048 2,467 2,763 3,674

61 1,296 1,670 2,000 2,389 2,659 3,457

29 1,311 1,699 2,045 2,462 2,756 3,659

62 1,295 1,670 1,999 2,388 2,657 3,454

30 1,310 1,697 2,042 2,457 2,750 3,646

63 1,295 1,669 1,998 2,387 2,656 3,452

31 1,309 1,696 2,040 2,453 2,744 3,633

64 1,295 1,669 1,998 2,386 2,655 3,449

32 1,309 1,694 2,037 2,449 2,738 3,622

65 1,295 1,669 1,997 2,385 2,654 3,447

33 1,308 1,692 2,035 2,445 2,733 3,611

66 1,295 1,668 1,997 2,384 2,652 3,444

203

APÉNDICE “D”

FÓRMULAS PARA LA DETERMINACIÓN DEL TAMAÑO

ADECUADO DE LA MUESTRA

Tipo de

Población

Parámetro Fórmula Ordinaria Fórmula

Óptima

Comentario

No finita

Media

Poblacional

2Z

nE

Seleccionado el N.C., en el

tamaño muestral 2 factores

importantes influyen: a) la

varianza de la pobl. (2

),

expresa el grado de

variabilidad que presentan

las unidades de la pobl.,

siendo para prop. Poblacs.:

2= π (1- π) y en el mejor

de los casos 2

x= 0,25; b) el

tamaño del error tolerable (E)

fijado por el investigador de

acuerdo al estudio a realizar

y c) el nivel de confianza

(NC), tiene relación directa

con el tamaño de la muestra

a mayor nivel de confianza el

tamaño de la muestra será

mayor.

Proporción

Poblacional

2

1Z

nE

2

0,25Z

nE

Finita

Media

Poblacional

2

22

N Zn

NE Z

Proporción

Poblacional

2

2 2

1

1

NZn

NE Z 2

2 2

0,25

0,25

NZn

NE Z

204

(APÉNDICE “E”)

DISTRIBUCIÓN CHI-CUADRADO

α=20,0% α=10,0% α=5,0% α=2,5% α=2,0% α=1,0% α=0,5%

g.l. χ2 g.l χ2 g.l χ2 g.l χ2 g.l χ2 g.l χ2 g.l χ2

1 1,642 1 2,706 1 3,841 1 5,024 1 5,412 1 6,635 1 7,879

2 3,219 2 4,605 2 5,991 2 7,378 2 7,824 2 9,210 2 10,597

3 4,642 3 6,251 3 7,815 3 9,348 3 9,837 3 11,345 3 12,838

4 5,989 4 7,779 4 9,488 4 11,143 4 11,668 4 13,277 4 14,860

5 7,289 5 9,236 5 11,070 5 12,833 5 13,388 5 15,086 5 16,750

6 8,558 6 10,645 6 12,592 6 14,449 6 15,033 6 16,812 6 18,548

7 9,803 7 12,017 7 14,067 7 16,013 7 16,622 7 18,475 7 20,278

8 11,030 8 13,362 8 15,507 8 17,535 8 18,168 8 20,090 8 21,955

9 12,242 9 11,684 9 16,919 9 19,023 9 19,679 9 21,666 9 23,589

10 13,442 10 15,987 10 18,307 10 20,483 10 21,161 10 23,209 10 25,188

11 14,631 11 12,275 11 19,675 11 21,920 11 22,618 11 24,725 11 26,757

12 15,812 12 18,549 12 21,026 12 23,337 12 24,054 12 26,217 12 28,299

13 16,985 13 19,812 13 22,362 13 24,736 13 25,472 13 27,688 13 29,819

14 18,151 14 21,064 14 23,685 14 26,119 14 26,873 14 29,141 14 31,319

15 19,311 15 22,307 15 24,996 15 27,488 15 28,259 15 30,578 15 32,801

16 20,465 16 23,542 16 26,296 16 28,845 16 29,633 16 32,000 16 34,267

17 21,615 17 24,769 17 27,587 17 30,191 17 30,995 17 33,409 17 35,718

18 22,760 18 25,989 18 28,869 18 31,526 18 32,346 18 34,805 18 37,156

19 23,900 19 27,204 19 30,144 19 32,852 19 33,687 19 36,191 19 38,582

20 25,038 20 28,412 20 31,410 20 34,170 20 35,020 20 37,566 20 39,997

21 26,171 21 29,615 21 32,671 21 35,479 21 36,343 21 38,932 21 41,401

22 27,301 22 30,813 22 33,924 22 36,781 22 37,659 22 40,289 22 42,796

23 28,429 23 32,007 23 35,172 23 38,076 23 38,968 23 41,638 23 44,181

24 29,553 24 33,196 24 36,415 24 39,364 24 40,270 24 42,980 24 45,559

25 30,675 25 34,382 25 37,652 25 40,646 25 41,566 25 44,314 25 46,928

26 31,795 26 35,563 26 38,885 26 41,923 26 42,856 26 45,642 26 48,290

27 32,912 27 36,741 27 40,113 27 43,194 27 44,140 27 46,963 27 49,645

28 34,027 28 37,916 28 41,337 28 44,461 28 45,419 28 48,278 28 50,993

29 34,139 29 39,087 29 42,557 29 45,722 29 46,693 29 49,588 29 52,336

30 36,250 30 40,256 30 43,773 30 46,979 30 47,962 30 50,892 30 53,672

40 47,269 40 51,805 40 55,758 40 59,342 40 60,436 40 63,691 40 66,766

50 58,164 50 63,167 50 67,505 50 71,420 50 72,613 50 76,154 50 79,490

60 68,972 60 74,397 60 79,082 60 83,298 60 84,580 60 88,379 60 91,952

70 79,715 70 85,527 70 90,531 70 95,023 70 96,388 70 100,425 70 104,215

80 90,405 80 96,578 80 101,879 80 106,629 80 108,069 80 112,329 80 116,321

90 101,054 90 107,565 90 113,145 90 118,136 90 119,648 90 124,116 90 128,299

100 111,667 100 118,498 100 124,342 100 129,561 100 131,142 100 135,807 100 140,169

205

VALORES CRÍTICOS PARA LA DISTRIBUCIÓN F DE FISHER Nivel de significancia de 1,00% (N=Numerador; D=Denominador) APÉNDICE "F"

g.l. g.l. g.l. g.l. g.l. g.l. g.l. g.l.

D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0

1 1 4052 4 1 21,20 7 1 12,20 10 1 10,00 13 1 9,07 16 1 8,53 19 1 8,18 22 1 7,95

1 2 5000 4 2 18,00 7 2 9,55 10 2 7,56 13 2 6,70 16 2 6,23 19 2 5,93 22 2 5,72

1 3 5403 4 3 16,60 7 3 8,45 10 3 6,55 13 3 5,74 16 3 5,29 19 3 5,01 22 3 4,82

1 4 5625 4 4 16,00 7 4 7,85 10 4 5,99 13 4 5,21 16 4 4,77 19 4 4,50 22 4 4,31

1 5 5764 4 5 15,50 7 5 7,46 10 5 5,64 13 5 4,86 16 5 4,44 19 5 4,17 22 5 3,99

1 6 5859 4 6 15,20 7 6 7,19 10 6 5,39 13 6 4,62 16 6 4,20 19 6 3,94 22 6 3,76

1 7 5928 4 7 15,00 7 7 6,99 10 7 5,20 13 7 4,44 16 7 4,03 19 7 3,77 22 7 3,59

1 8 5981 4 8 14,80 7 8 6,84 10 8 5,06 13 8 4,30 16 8 3,89 19 8 3,63 22 8 3,45

1 9 6022 4 9 14,70 7 9 6,72 10 9 4,94 13 9 4,19 16 9 3,78 19 9 3,52 22 9 3,35

1 10 6056 4 10 14,50 7 10 6,62 10 10 4,85 13 10 4,10 16 10 3,69 19 10 3,43 22 10 3,26

1 12 6106 4 12 14,40 7 12 6,47 10 12 4,71 13 12 3,96 16 12 3,55 19 12 3,30 22 12 3,12

1 15 6157 4 15 14,20 7 15 6,31 10 15 4,56 13 15 3,82 16 15 3,41 19 15 3,15 22 15 2,98

1 20 6209 4 20 14,00 7 20 6,16 10 20 4,41 13 20 3,66 16 20 3,26 19 20 3,00 22 20 2,83

1 24 6235 4 24 13,90 7 24 6,07 10 24 4,33 13 24 3,59 16 24 3,18 19 24 2,92 22 24 2,75

1 30 6261 4 30 13,80 7 30 5,99 10 30 4,25 13 30 3,51 16 30 3,10 19 30 2,84 22 30 2,67

1 40 6287 4 40 13,70 7 40 5,91 10 40 4,17 13 40 3,43 16 40 3,02 19 40 2,76 22 40 2,58

2 1 98,50 5 1 13,30 8 1 11,30 11 1 9,65 14 1 8,86 17 1 8,40 20 1 8,10 23 1 7,88

2 2 99,00 5 2 13,30 8 2 8,65 11 2 7,21 14 2 6,51 17 2 6,11 20 2 5,85 23 2 5,66

2 3 99,20 5 3 12,10 8 3 7,59 11 3 6,22 14 3 5,56 17 3 5,18 20 3 4,94 23 3 4,76

2 4 99,20 5 4 11,40 8 4 7,01 11 4 5,67 14 4 5,04 17 4 4,67 20 4 4,43 23 4 4,26

2 5 99,30 5 5 11,00 8 5 6,63 11 5 5,32 14 5 4,69 17 5 4,34 20 5 4,10 23 5 3,94

2 6 99,30 5 6 10,70 8 6 6,37 11 6 5,07 14 6 4,46 17 6 4,10 20 6 3,87 23 6 3,71

2 7 99,40 5 7 10,50 8 7 6,18 11 7 4,89 14 7 4,28 17 7 3,93 20 7 3,70 23 7 3,54

2 8 99,40 5 8 10,30 8 8 6,03 11 8 4,74 14 8 4,14 17 8 3,79 20 8 3,56 23 8 3,41

2 9 99,40 5 9 10,20 8 9 5,91 11 9 4,63 14 9 4,03 17 9 3,68 20 9 3,46 23 9 3,30

2 10 99,40 5 10 10,10 8 10 5,81 11 10 4,54 14 10 3,94 17 10 3,59 20 10 3,37 23 10 3,21

2 12 99,40 5 12 9,89 8 12 5,67 11 12 4,40 14 12 3,80 17 12 3,46 20 12 3,23 23 12 3,07

2 15 99,40 5 15 9,72 8 15 5,52 11 15 4,25 14 15 3,66 17 15 3,31 20 15 3,09 23 15 2,93

2 20 99,40 5 20 9,55 8 20 5,36 11 20 4,10 14 20 3,51 17 20 3,16 20 20 2,94 23 20 2,78

2 24 99,50 5 24 9,47 8 24 5,28 11 24 4,02 14 24 3,43 17 24 3,08 20 24 2,86 23 24 2,70

2 30 99,50 5 30 9,38 8 30 5,20 11 30 3,94 14 30 3,35 17 30 3,00 20 30 2,78 23 30 2,62

2 40 99,50 5 40 9,29 8 40 5,12 11 40 3,86 14 40 3,27 17 40 2,92 20 40 2,69 23 40 2,54

3 1 34,10 6 1 13,70 9 1 10,60 12 1 9,33 15 1 8,68 18 1 8,29 21 1 8,02 24 1 7,82

3 2 30,80 6 2 10,90 9 2 8,02 12 2 6,93 15 2 6,36 18 2 6,01 21 2 5,78 24 2 5,61

3 3 29,50 6 3 9,78 9 3 6,99 12 3 5,95 15 3 5,42 18 3 5,09 21 3 4,87 24 3 4,72

3 4 28,70 6 4 9,15 9 4 6,42 12 4 5,41 15 4 4,89 18 4 4,58 21 4 4,37 24 4 4,22

3 5 28,20 6 5 8,75 9 5 6,06 12 5 5,06 15 5 4,56 18 5 4,25 21 5 4,04 24 5 3,90

3 6 27,90 6 6 8,47 9 6 5,80 12 6 4,82 15 6 4,32 18 6 4,01 21 6 3,81 24 6 3,67

3 7 27,70 6 7 8,26 9 7 5,61 12 7 4,64 15 7 4,14 18 7 3,84 21 7 3,64 24 7 3,50

3 8 27,50 6 8 8,10 9 8 5,47 12 8 4,50 15 8 4,00 18 8 3,71 21 8 3,51 24 8 3,36

3 9 27,30 6 9 7,98 9 9 5,35 12 9 4,39 15 9 3,89 18 9 3,60 21 9 3,40 24 9 3,26

3 10 27,20 6 10 7,87 9 10 5,26 12 10 4,30 15 10 3,80 18 10 3,51 21 10 3,31 24 10 3,17

3 12 27,10 6 12 7,72 9 12 5,11 12 12 4,16 15 12 3,67 18 12 3,37 21 12 3,17 24 12 3,03

3 15 26,90 6 15 7,56 9 15 4,96 12 15 4,01 15 15 3,52 18 15 3,23 21 15 3,03 24 15 2,89

3 20 26,70 6 20 7,40 9 20 4,81 12 20 3,86 15 20 3,37 18 20 3,08 21 20 2,88 24 20 2,74

3 24 26,60 6 24 7,31 9 24 4,73 12 24 3,78 15 24 3,29 18 24 3,00 21 24 2,80 24 24 2,66

3 30 26,50 6 30 7,23 9 30 4,65 12 30 3,70 15 30 3,21 18 30 2,92 21 30 2,72 24 30 2,58

3 40 26,40 6 40 7,14 9 40 4,57 12 40 3,62 15 40 3,13 18 40 2,84 21 40 2,64 24 40 2,49

206

VALORES CRÍTICOS PARA LA DISTRIBUCIÓN F DE FISHER Nivel de significancia de 2,50% (N=Numerador; D=Denominador) APÉNDICE "F"

g.l. g.l. g.l. g.l. g.l. g.l. g.l. g.l.

D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0 D N F0

1 1 648 4 1 12,2 7 1 8,07 10 1 6,94 13 1 6,41 16 1 6,12 19 1 5,92 22 1 5,79

1 2 800 4 2 10,7 7 2 6,54 10 2 5,46 13 2 4,97 16 2 4,69 19 2 4,51 22 2 4,38

1 3 864 4 3 9,98 7 3 5,89 10 3 4,83 13 3 4,35 16 3 4,08 19 3 3,90 22 3 3,78

1 4 900 4 4 9,60 7 4 5,52 10 4 4,47 13 4 4,00 16 4 3,73 19 4 3,56 22 4 3,44

1 5 922 4 5 9,36 7 5 5,29 10 5 4,24 13 5 3,77 16 5 3,50 19 5 3,33 22 5 3,22

1 6 937 4 6 9,20 7 6 5,12 10 6 4,07 13 6 3,60 16 6 3,34 19 6 3,17 22 6 3,05

1 7 948 4 7 9,07 7 7 4,99 10 7 3,95 13 7 3,48 16 7 3,22 19 7 3,05 22 7 2,93

1 8 957 4 8 8,98 7 8 4,90 10 8 3,85 13 8 3,39 16 8 3,12 19 8 2,96 22 8 2,84

1 9 963 4 9 8,90 7 9 4,82 10 9 3,78 13 9 3,31 16 9 3,05 19 9 2,88 22 9 2,76

1 10 969 4 10 8,84 7 10 4,76 10 10 3,72 13 10 3,25 16 10 2,99 19 10 2,82 22 10 2,70

1 12 977 4 12 8,75 7 12 4,67 10 12 3,62 13 12 3,15 16 12 2,89 19 12 2,72 22 12 2,60

1 15 985 4 15 8,66 7 15 4,57 10 15 3,52 13 15 3,05 16 15 2,79 19 15 2,62 22 15 2,50

1 20 993 4 20 8,56 7 20 7,47 10 20 3,42 13 20 2,95 16 20 2,68 19 20 2,51 22 20 2,39

1 24 997 4 24 8,51 7 24 4,41 10 24 3,37 13 24 2,89 16 24 2,63 19 24 2,45 22 24 2,33

1 30 1001 4 30 8,46 7 30 4,36 10 30 3,31 13 30 2,84 16 30 2,57 19 30 2,39 22 30 2,27

1 40 1006 4 40 8,41 7 40 4,31 10 40 3,26 13 40 2,78 16 40 2,51 19 40 2,33 22 40 2,21

2 1 38,5 5 1 10,61 8 1 7,57 11 1 6,72 14 1 6,30 17 1 6,04 20 1 5,87 23 1 5,75

2 2 39,00 5 2 8,43 8 2 6,06 11 2 5,26 14 2 4,86 17 2 4,62 20 2 4,46 23 2 4,35

2 3 39,17 5 3 7,76 8 3 5,42 11 3 4,63 14 3 4,24 17 3 4,01 20 3 3,86 23 3 3,75

2 4 39,25 5 4 7,39 8 4 5,05 11 4 4,28 14 4 3,89 17 4 3,66 20 4 3,51 23 4 3,41

2 5 39,30 5 5 7,15 8 5 4,82 11 5 4,04 14 5 3,66 17 5 3,44 20 5 3,29 23 5 3,18

2 6 39,33 5 6 6,98 8 6 4,65 11 6 3,88 14 6 3,50 17 6 3,28 20 6 3,13 23 6 3,02

2 7 39,36 5 7 6,85 8 7 4,53 11 7 3,76 14 7 3,38 17 7 3,16 20 7 3,01 23 7 2,90

2 8 39,37 5 8 6,76 8 8 4,43 11 8 3,66 14 8 3,29 17 8 3,06 20 8 2,91 23 8 2,81

2 9 39,39 5 9 6,68 8 9 4,36 11 9 3,59 14 9 3,21 17 9 2,98 20 9 2,84 23 9 2,73

2 10 39,40 5 10 6,62 8 10 4,30 11 10 3,53 14 10 3,15 17 10 2,92 20 10 2,77 23 10 2,67

2 12 39,41 5 12 6,52 8 12 4,20 11 12 3,43 14 12 3,05 17 12 2,82 20 12 2,68 23 12 2,57

2 15 39,43 5 15 6,43 8 15 4,10 11 15 3,33 14 15 2,95 17 15 2,72 20 15 2,57 23 15 2,47

2 20 39,45 5 20 6,33 8 20 4,00 11 20 3,23 14 20 2,84 17 20 2,62 20 20 2,46 23 20 2,36

2 24 39,46 5 24 6,28 8 24 3,95 11 24 3,17 14 24 2,79 17 24 2,56 20 24 2,41 23 24 2,30

2 30 39,46 5 30 6,23 8 30 3,89 11 30 3,12 14 30 2,73 17 30 2,50 20 30 2,35 23 30 2,24

2 40 39,47 5 40 6,18 8 40 3,84 11 40 3,06 14 40 2,67 17 40 2,44 20 40 2,29 23 40 2,18

3 1 17,44 6 1 8,81 9 1 7,21 12 1 6,55 15 1 6,20 18 1 5,98 21 1 5,83 24 1 5,72

3 2 16,04 6 2 7,26 9 2 5,71 12 2 5,10 15 2 4,77 18 2 4,56 21 2 4,42 24 2 4,32

3 3 15,44 6 3 6,60 9 3 5,08 12 3 4,47 15 3 4,15 18 3 3,95 21 3 3,82 24 3 3,72

3 4 15,10 6 4 6,23 9 4 4,72 12 4 4,12 15 4 3,80 18 4 3,61 21 4 3,48 24 4 3,38

3 5 14,88 6 5 5,99 9 5 4,48 12 5 3,89 15 5 3,58 18 5 3,38 21 5 3,25 24 5 3,15

3 6 14,73 6 6 5,82 9 6 4,32 12 6 3,73 15 6 3,41 18 6 3,22 21 6 3,09 24 6 2,99

3 7 14,62 6 7 5,70 9 7 4,20 12 7 3,61 15 7 3,29 18 7 3,10 21 7 2,97 24 7 2,87

3 8 14,54 6 8 5,60 9 8 4,10 12 8 3,51 15 8 3,20 18 8 3,01 21 8 2,87 24 8 2,78

3 9 14,47 6 9 5,52 9 9 4,03 12 9 3,44 15 9 2,12 18 9 2,93 21 9 2,80 24 9 2,70

3 10 14,42 6 10 5,46 9 10 3,96 12 10 3,37 15 10 3,06 18 10 2,87 21 10 2,73 24 10 2,64

3 12 14,34 6 12 5,37 9 12 3,87 12 12 3,28 15 12 2,96 18 12 2,77 21 12 2,64 24 12 2,54

3 15 14,25 6 15 5,27 9 15 3,77 12 15 3,18 15 15 2,86 18 15 2,67 21 15 2,53 24 15 2,44

3 20 14,17 6 20 5,17 9 20 3,67 12 20 3,07 15 20 2,76 18 20 2,56 21 20 2,42 24 20 2,33

3 24 14,12 6 24 5,12 9 24 3,61 12 24 3,02 15 24 2,70 18 24 2,50 21 24 2,37 24 24 2,27

3 30 14,08 6 30 5,07 9 30 3,56 12 30 2,96 15 30 2,64 18 30 2,44 21 30 2,31 24 30 2,21

3 40 14,04 6 40 5,01 9 40 3,51 12 40 2,91 15 40 2,59 18 40 2,38 21 40 2,25 24 40 2,15

207

VALORES CRÍTICOS PARA LA DISTRIBUCIÓN F DE FISHER Nivel de significancia de 5,00% (N=Numerador; D=Denominador) APÉNDICE "F"

g.l. g.l. g.l. g.l. g.l. g.l. g.l. g.l.

D N Fo D N Fo D N Fo D N Fo D N Fo D N Fo D N Fo D N Fo

1 1 161,0 4 1 7,71 7 1 5,59 10 1 4,96 13 1 4,67 16 1 4,49 19 1 4,38 22 1 4,30

1 2 200,0 4 2 6,94 7 2 4,74 10 2 4,10 13 2 3,81 16 2 3,63 19 2 3,52 22 2 3,44

1 3 216,0 4 3 6,59 7 3 4,35 10 3 3,71 13 3 3,41 16 3 3.24 19 3 3,13 22 3 3,05

1 4 225,0 4 4 6,39 7 4 4,12 10 4 3,48 13 4 3,11 16 4 3,01 19 4 2,90 22 4 2,82

1 5 230,0 4 5 6,26 7 5 3,97 10 5 3,33 13 5 2,96 16 5 2,85 19 5 2,74 22 5 2,66

1 6 234,0 4 6 6,16 7 6 3,87 10 6 3,22 13 6 2,85 16 6 2,74 19 6 2,63 22 6 2,55

1 7 237,0 4 7 6,09 7 7 3,79 10 7 3,14 13 7 2,76 16 7 2,66 19 7 2,54 22 7 2,46

1 8 239,0 4 8 6,04 7 8 3,73 10 8 3,07 13 8 2,70 16 8 2,59 19 8 2,48 22 8 2,40

1 9 241,0 4 9 6,00 7 9 3,68 10 9 3,02 13 9 2,65 16 9 2,54 19 9 2,42 22 9 2,34

1 10 242,0 4 10 5,96 7 10 3,64 10 10 2,98 13 10 2,60 16 10 2,49 19 10 2,38 22 10 2,30

1 12 244,0 4 12 5,91 7 12 3,57 10 12 2,91 13 12 2,53 16 12 2,42 19 12 2,31 22 12 2,23

1 15 246,0 4 15 5,86 7 15 3,51 10 15 2,85 13 15 2,46 16 15 2,35 19 15 2,23 22 15 2,15

1 20 248,0 4 20 5,80 7 20 3,44 10 20 2,77 13 20 2,39 16 20 2,28 19 20 2,16 22 20 2,07

1 24 249,0 4 24 5,77 7 24 3,41 10 24 2,74 13 24 2,35 16 24 2,24 19 24 2,11 22 24 2,03

1 30 250,0 4 30 5,75 7 30 3,38 10 30 2,70 13 30 2,31 16 30 2,19 19 30 2,07 22 30 1,98

1 40 251,0 4 40 5,72 7 40 3,34 10 40 2,66 13 40 2,27 16 40 2,25 19 40 2,03 22 40 1,94

2 1 18,50 5 1 6,61 8 1 5,32 11 1 4,84 14 1 4,60 17 1 4,45 20 1 4,35 23 1 4,28

2 2 19,00 5 2 5,79 8 2 4,46 11 2 3,98 14 2 3,74 17 2 3,59 20 2 3,49 23 2 3,42

2 3 19,20 5 3 5,41 8 3 4,07 11 3 3,59 14 3 3,34 17 3 3,20 20 3 3,10 23 3 3,03

2 4 19,20 5 4 5,19 8 4 3,84 11 4 3,36 14 4 3,11 17 4 2,96 20 4 2,87 23 4 2,80

2 5 19,30 5 5 5,05 8 5 3,69 11 5 3,20 14 5 2,96 17 5 2,81 20 5 2,71 23 5 2,64

2 6 19,30 5 6 4,95 8 6 3,58 11 6 3,09 14 6 2,85 17 6 2,70 20 6 2,60 23 6 2,53

2 7 19,40 5 7 4,88 8 7 3,50 11 7 3,01 14 7 2,76 17 7 2,61 20 7 2,51 23 7 2,44

2 8 19,40 5 8 4,82 8 8 3,44 11 8 2,95 14 8 2,70 17 8 2,55 20 8 2,45 23 8 2,37

2 9 19,40 5 9 4,77 8 9 3,39 11 9 2,90 14 9 2,65 17 9 2,49 20 9 2,39 23 9 2,32

2 10 19,40 5 10 4,74 8 10 3,35 11 10 2,85 14 10 2,60 17 10 2,45 20 10 2,35 23 10 2,27

2 12 19,40 5 12 4,68 8 12 3,28 11 12 2,79 14 12 2,53 17 12 2,38 20 12 2,28 23 12 2,20

2 15 19,40 5 15 4,62 8 15 3,22 11 15 2,72 14 15 2,46 17 15 2,31 20 15 2,20 23 15 2,13

2 20 19,40 5 20 4,56 8 20 3,15 11 20 2,65 14 20 2,39 17 20 2,23 20 20 2,12 23 20 2,05

2 24 19,50 5 24 4,53 8 24 3,12 11 24 2,61 14 24 2,35 17 24 2,19 20 24 2,08 23 24 2,01

2 30 19,50 5 30 4,50 8 30 3,08 11 30 2,57 14 30 2,31 17 30 2,15 20 30 2,04 23 30 1,96

2 40 19,50 5 40 4,46 8 40 3,04 11 40 2,53 14 40 2,27 17 40 2,10 20 40 1,99 23 40 1,91

3 1 10,10 6 1 5,99 9 1 5,12 12 1 4,75 15 1 4,54 18 1 4,41 21 1 4,32 24 1 4,26

3 2 9,55 6 2 5,14 9 2 4,26 12 2 3,89 15 2 3,68 18 2 3,55 21 2 3,47 24 2 3,40

3 3 9,28 6 3 4,76 9 3 3,86 12 3 3,49 15 3 3,29 18 3 3,16 21 3 3,07 24 3 3,01

3 4 9,12 6 4 4,53 9 4 3,63 12 4 3,26 15 4 3,06 18 4 2,93 21 4 2,84 24 4 2,78

3 5 9,01 6 5 4,39 9 5 3,48 12 5 3,11 15 5 2,90 18 5 2,77 21 5 2,68 24 5 2,62

3 6 8,94 6 6 4,28 9 6 3,37 12 6 3,00 15 6 2,79 18 6 2,66 21 6 2,57 24 6 2,51

3 7 8,89 6 7 4,21 9 7 3,29 12 7 2,91 15 7 2,71 18 7 2,58 21 7 2,49 24 7 2,42

3 8 8,85 6 8 4,15 9 8 3,23 12 8 2,85 15 8 2,64 18 8 2,51 21 8 2,42 24 8 2,36

3 9 8,81 6 9 4,10 9 9 3,18 12 9 2,80 15 9 2,59 18 9 2,46 21 9 2,37 24 9 2,30

3 10 8,79 6 10 4,06 9 10 3,14 12 10 2,75 15 10 2,54 18 10 2,41 21 10 2,32 24 10 2,25

3 12 8,74 6 12 4,00 9 12 3,07 12 12 2,69 15 12 2,48 18 12 2,34 21 12 2,25 24 12 2,18

3 15 8,70 6 15 3,94 9 15 3,01 12 15 2,62 15 15 2,40 18 15 2,27 21 15 2,18 24 15 2,11

3 20 8,66 6 20 3,87 9 20 2,94 12 20 2,54 15 20 2,33 18 20 2,19 21 20 2,10 24 20 2,03

3 24 8,64 6 24 3,84 9 24 2,90 12 24 2,51 15 24 2,29 18 24 2,15 21 24 2,05 24 24 1,98

3 30 8,62 6 30 3,81 9 30 2,86 12 30 2,47 15 30 2,25 18 30 2,11 21 30 2,01 24 30 1,94

3 40 8,59 6 40 3,77 9 40 2,83 12 40 2,43 15 40 2,20 18 40 2,06 21 40 1,96 24 40 1,89

208

Bibliografía

Título Autores Editorial

Estadística para los Negocios y la Economía

Allen Webster Mc Graw Hill

Estadística para los Negocios y la Economía

Douglas Lind William Marchal Samuel Wathen

Mc Graw Hill

Estadística y Muestreo

Ciro Martínez Bencardino Ecoe- Ediciones

Fundamentos de Estadística

Armando Soto Negrín Panapo

Estadística para Administración y la Economía

David Ánderson Dennis Sweeney Thomas Willians

Thonson

Estadística para Administración y la Economía

Paúl Newbold Pearson Prentice Hill

Estadística para Administración y la Economía

Paúl Newbold William Carlson Berry Thorne

Pearson Prentice Hill


Recommended