+ All Categories
Home > Documents > libro.pdf

libro.pdf

Date post: 24-Jan-2016
Category:
Upload: katia-rubit-benitez-castro
View: 414 times
Download: 1 times
Share this document with a friend
Popular Tags:
255
, . E/TflDIJTl~fl . · · . . ert 101 fl.E'GOCIOJ
Transcript
Page 1: libro.pdf

, .

E/TflDIJTl~fl . · · . .

ert 101 fl.E'GOCIOJ

Page 2: libro.pdf

. .

. ESTAbísTiCA EN LOS NEGOctqs ,¡

·r 15 PARA LA TOMA DE DECISIONES t. -~ ~

r~. ~§

H er: :i!' ·~i: ~i 11

.·il . :t

(CUARTA EDICÍÓN EN INGLÉS)

(PRIMERA EDICIÓN EN ESPÁÑOL)

Ken Black · Universidad del lago claro Houston

~ ·¡ "\

PRIME~~ EDICIÓN ME~CO, 2005

l ( .. .• f

...

-- COMPAÑÍA EDITORIAL CONTINENTAL

Page 3: libro.pdf

RESUMEN DEL CONTENIDO

1 Introducción a la Estadística 2

2 Tablas y gráficas 18

3 Estadística descriptiva 46

4 Probabilidad 96

5 Distribuciones discretas 140

6 Distribuciones continuas 182

7 Muestreo y distribuciones muestrales 220

8 Inferencia estadística: estimación para poblaciones individuales 252

9 Inferencia estadística: prueba de hipótesis para una población 288

1 O Inferencia estadística acerca de dos poblaciones 340

Page 4: libro.pdf

11 Análisis de varianza y diseño de experimentos 396

12 Análisis de datos categóricos 454

r 13 Análisis de regresión simple 480

14 Análisis de regresión múltiple . 522

15 Construcción de modelos de regresión múltiple 552

16 Pronóstico de series de tiempo y números índice 598

17 Estadísticas no paramétricas 656

18 Control estadístico de calidad 704

RESUMEN DE CONTENIDO v

Page 5: libro.pdf

CONTENIDO

Prefacio xxii Acerca del autor xxviii

1 Introducción a la estadística 2

Dilema de decisión: La estadística describe el estado de los negocios en las zonas rurales de la India 3

1.1 LA ESTADISTICA EN LOS NEGOCIOS 4 El mejor camino al mercado 4 Estrés en el trabajo 4 Decisiones financieras 5 ¡Cómo está la economía? 5 El impacto de la tecnología en el trabajo 5

1.2 CONCEPTOS ESTADlSTICOS BÁSICOS 6 1.3 MEDICIÓN DE DATOS s

Nivel nominal 8 Nivel ordinal 9 Nivel de intervalo 9 Nivel de razón l O Comparación de los cuatro niveles de datos 10 Análisis estadístico usando la computadora: Excel y MINITAB 11

Resumen 13 Términos clave 14 Problemas complementarios 14 Análisis de la base de datos 15 Caso: DiGiorno Pizzas: Introducción de una pizza congelada para competir con las pizzas para llevar 17

2 Tablas y gráficas 18

Dilema de decisión: Estado de la manufactura de autos 19

2.1 DISTRIBUCIONES DE FRECUENCIA 20 Marca de clase 20 Frecuencia relativa 21 Frecuencia acumulada 21

2.2 REPRESENTACIÓN GRÁFICA DE DATOS 24 Histogramas 24 Uso de histogramas para obtener una visión general de los datos 25 Polígonos de frecuencia 26

Page 6: libro.pdf

CONTENIDO vii

Ojivas 26 Gráficas de pastel 27 Gráficas de tallo y hoja 30 Gráficas de Pareto 31

2.3 DESCRIPCIÓN GRÁFICA DE DATOS NUMÉRICOS DE DOS VARIABLES: GRÁFICAS DE DISPERSIÓN 34

Resumen 38 Términos clave 39 Problemas complementarios 39 Análisis de la base de datos 42 Caso: Las jaboneras presentan batallas 42 Uso de la computadora 44

3 Estadística descriptiva 46 Dilema de decisión: Estadísticas de lavanderfas 47 3.1 MEDIDAS DE TENDENCIA CENTRAL: DATOS NO AGRUPADOS 48

Moda 48 Mediana 48 Media 49 Percentiles S l Pasos para determinar la ubicación de un percentil SI Cuartiles S2

3.2 MEDIDAS DE VARIABILIDAD: DATOS NO AGRUPADOS ss Rango S6 Rango intercuartil S6 Desviación media absoluta, varianza y desviación estándar S8 Desviación media absoluta S9 Varianza S9 Desviación estándar 60 Significado de desviación estándar 60 Regla empírica 61 Teorema de Chebyshev 62 Población contra varianza muestra/ y desviación estándar 63 Fórmulas de cálculo breve para varianza y desviación estándar 64 Valores z 66 Coeficiente de variación 66

3.3 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD: DATOS AGRUPADOS 70

Medidas de tendencia central 70 Media 70 Moda 7l Medidas de variabilidad 7l

3.4 MEDIDAS DE FORMA 76 Sesgo 76 Sesgo y relación de la media, mediana y moda 77 Coeficiente de sesgo 77 Curtosis 78 Gráficas de caja y bigote 78

Page 7: libro.pdf

vili ESTADISTICA EN LOS NEGOCIOS

3.5 MEDIDAS DE ASOCIACIÓN 80 Correlación 80

3.6 ESTADISTICA DESCRIPTIVA EN LA COMPUTADORA 84 Resumen 86 Términos clave 87 Fórmulas 88 Problemas complementarios 89 Análisis de la base de datos 93 Caso: Coca-Cola se hace pequeña en Rusia 93 Uso de la computadora 94

4 Probabilidad 96 Dilema de decisión: Igualdad de género en el lugar de trabajo 97 4.1 INTRODUCCIÓN A LA PROBABILIDAD 98

4.2 MÉTODOS PARA ASIGNAR PROBABILIDADES 99 Método clásico de asignar probabilidades 99 Frecuencia relativa 99 Probabilidad subjetiva 100

4.3 ESTRUCTURA DE LA PROBABILIDAD 100 Experimento 100 · Evento 101 Eventos simples 101 Espacio muestral 101 Uniones e intersecciones 102 Eventos mutuamente excluyentes 102 Eventos independientes 103 Eventos colectivamente exhaustivos 103 Eventos complementarios 103 Conteo de posibilidades l 04 La regla de conteo mn 104 Muestreo de una población con reemplazo 104 Combinaciones: muestreo de una población sin reemplazo 105

4.4 PROBABILIDADES MARGINALES, DE UNIÓN, CONJUNTAS Y CONDICIONALES 106

4.5 LEYESDELAADICIÓN 106 Matrices de probabilidad 108 Complemento de una unión 111 Ley especial de la adición 112

4.6 LEYES DE LA MULTIPLICACIÓN 115 Ley general de la multiplicación 115 Ley especial de la multiplicación ll8

4.7 PROBABILIDAD CONDICIONAL 121 Eventos independientes 124

4.8 REVISIÓN DE PROBABILIDADES: REGLA DE BAYES 128 Resumen 134 Términos clave 134

Page 8: libro.pdf

CONTENIDO ix

Fórmulas 134 Problemas complementarios 135 Análisis de la base de datos 138 Caso: Colgate-Pálmolive hace un esfuerzo "totsl" 138

5 Distribuciones discretas 140

Dilema de decisión: El bueno y el malo de la imagen pública de la industria bancaria 141

5.1 DISTRIBUCIONES DISCRETAS CqNTRA CONTINUAS 142

5.2 DESCRIPCIÓN DE UNA DISTRIBUCIÓN DISCRETA 143 Media, varianza y desviación estándar de distribuciones discretas 143 Valor medio o esperado 144 Varianza y desviación estándar de una distribución discreta 144

5.3 DISTRIBUCIÓN BINOMIAL 147 Resolución de un problema binomial 148 Uso de la tabla binomial 151 Uso de computadora para producir una distribución binomial 152 Media y desviación estándar de una distribución binomial 153 Gráficación de distribuciones binomiales 154

5.4 DISTRIBUCIÓN DE POISSON 158 Resolución de problemas de Poisson por fórmula 159 Uso de las tablas de Poisson 161 Media y desviación estándar de una distribución de Poisson 162 Gráficas de distribuciones de Poisson 162 Uso de computadora para generar distribuciones de Poisson 162 Cálculo de problemas binomiales por la distribución de Poisson 163

5.5 DISTRIBUCIÓN HIPERGEOMÉTRICA 168 Uso de la computadora para resolver probabilidades de distribución hipergeométrica 170

Resumen 173 Términos clave 173 Fórmulas 173 Problemas complementarios 174 Análisis de la base de datos 179 Caso: Fuji Film introduce el APS 179 Uso de la computadora 180

6 Distribuciones continuas 182

Dilema de decisión: Los rostros cambiantes de la industria de seguros 183

6.1 DISTRIBUCIÓN UNIFORME 184 Determinación de probabilidades en una distribución uniforme 185 Uso de la computadora para resolver probabilidades de distribución uniforme 187

6.2 DISTRIBUCIÓN NORMAL 188 Historia de la distribución normal 189 Función de densidad de probabilidad de la distribución normal 190 Distribución normal estándar 190

Page 9: libro.pdf

x ESTADISTICA EN LOS NEGOCIOS

Resolución de problemas de curva normal 191 Uso de la computadora para resolver probabilidades de distribución normal 199

6.3 USO DE LA CURVA NORMAL PARA CALCULAR APROXIMADAMENTE PROBLEMAS DE DISTRIBUCIÓN BINOMIAL 201

Corrección para continuidad 203

6.4 DISTRIBUCIÓN EXPONENCIAL 207 Probabilidades de la distribución exponencial 207 Uso de la computadora para determinar probabilidades de distribución exponencial 209

Resumen 212 Términos clave 213 Fórmulas 213 Problemas complementarios 213 Análisis de la base de datos 217 Caso: Mercedes va tras compradores jóvenes 217 Uso de la computadora 218

7 Muestreo y distribuciones muestrales 220

Dilema de decisión: ¿Cuál es la actitud de los trabajadores de maqui/adoras? 221 7.1 MUESTREO 222

Razones para muestreo 222 Razones para tomar un censo 223 Marco 223 Muestreo aleatorio contra no aleatorio 223 Técnicas de muestreo aleatorio 224 Muestreo aleatorio simple 224 Muestreo aleatorio estratificado 225 Muestreo sistemático 227 Muestreo de grupo (o área) 227 Muestro no aleatorio 228 Muestreo de conveniencia 229 Muestreo de juicio 229 Muestreo de cuota 230 Muestreo de bola de nieve 230 Error de muestreo 231 Errores no muestrales 231

7.2 DISTRIBUCIÓN DE MUESTREO DE LA MEDIA i 232 Muestreo con una población finita 239

7.3 DISTRIBUCIÓN MUESTRAL DE p 241 Resumen 246 Términos clave 247 Fórmulas 247 Problemas complementarios 247 Análisis de la base de datos 250 Caso: Shell trata de regresar al primer lugar 250 Uso de la computadora 251

Page 10: libro.pdf

,.

CONTENlDO xi

8 Inferencia estadística: estimación para poblaciones individuales 252 Dilema de decisión: Un reporte de encuestas sobre productividad, compensación y prestaciones 253

8.1 ESTIMACIÓN DE LA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO z/DISTRIBUCIÓN z 254

Factor de corrección finita 257 Intervalo de confianza para calcular u cuando a se desconoce 258 Uso de la computadora para construir intervalos de confianza z para la media 259

8.2 ESTIMACIÓN DE LA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO t/DISTRIBUCIÓN t 262

La distribución t 263 Solidez 263 Caracterlsticas de la distribución t 263 Lectura de la tabla de distribución t 264 Intervalos de confianza para estimar la media poblacional usando el estadlstico ti

distribución t 265 Uso de la computadora para construir intervalos de confianza t para la media 266

8.3 ESTIMACIÓN DE LA PROPORCIÓN POBLACIONAL 268 Uso de la computadora para construir intervalos de confianza para la proporción

poblacional 271

8.4 ESTIMACIÓN DE VARIANZA POBLACIONAL 273

8.5 ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA 276 Tamaño de la muestra al estimar u 277 Determinación de tamaño de la muestra al estimar p 278

Resumen 281 Términos eleve 282 Fórmulas 282 Problemas complementarios 283 Análisis de la bese de datos 286 Caso: Thermatrix 286 Uso de la computadora 287

9 Inferencia estadística: prueba de hipótesis para una población 288 Dilema de decisión: Referencias de negocios 289

9.1 INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS 290 Tipos de hipótesis 291 Hipótesis de investigación 291 Hipótesis estadlsticas 291 Hipótesis sustantivas 293 Uso del sistema HTAB para probar hipótesis 294 Regiones de rechazo y de aceptación 296 Errores tipo 1 y tipo 11 297

9.2 PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO z/DISTRIBUCIÓN z 298

Uso de una desviación estándar muestral 300 Prueba de la media con una población finita 301

Page 11: libro.pdf

xii ESTADISTICA EN LOS NEGOCIOS

Uso del método del valor p para probar hipótesis 301 Uso del método del valor critico para probar hipótesis 302 Uso de la computadora para probar hipótesis sobre una media poblacional que usa

el estadístico z 305

9.3 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO t/DISTRIBUCIÓN t 307

Uso de la computadora para probar hipótesis sobre una media poblacional con el uso de la prueba de t 310

9.4 PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN 313 Uso de la computadora para probar hipótesis sobre una proporción poblacional 317

9.5 PRUEBA DE HIPÓTESIS PARA LA VARIANZA 318

9.6 SOLUCIÓN DE ERRORES TIPO 11 322 Algunas observaciones sobre errores tipo I1 326 Curvas características de operación y potencia 326 Efecto de aumentar el tamaño de la muestra en los limites de rechazo 328

Resumen 332 Términos clave 332 Fórmulas 333 Problemas complementarios 333 Análisis de la base de datos 336 Caso: Frito-Lay apunta al mercado hispano 336 Uso de Ja computadora 339

1 O Inferencias estadísticas acerca de dos poblaciones 340

Dilema de decisión: Comparación de estadísticas internacionales de trabajo 341 10.1 PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA ACERCA

DE LA DIFERENCIA ENTRE DOS MEDIAS CON USO DEL ESTADÍSTICO DE z 342

Hipótesis 344 Intervalos de confianza 347 Uso de la computadora para probar hipótesis acerca de la diferencia entre dos medias

poblacionales usando la prueba de z 349

10.2 PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA ACERCA DE LA DIFERENCIA ENTRE DOS MEDIAS: MUESTRAS PEQUEÑAS INDEPENDIENTES Y VARIANZAS POBLACIONALES DESCONOCIDAS 352

Hipótesis 352 Uso de la computadora para probar hipótesis y construir intervalos de confianza acerca

de la diferencia entre dos medias poblacionales con el uso de la prueba de t 354 lntervalos de confianza 357

10.3 INFERENCIAS ESTADlSTICAS PARA DOS POBLACIONES RELACIONADAS 361

Hipótesis 361 Uso de la computadora para hacer inferencias estadísticas en dos poblaciones

relacionadas 363 Intervalos de confianza 366

Page 12: libro.pdf

CONTENIDO xiii

,.

10.4 INFERENCIAS ESTADÍSTICAS PARA DOS PROPORCIONES POBLACIONALES,pt - P2 370

Hipótesis 371 Intervalos de confianza 374 Uso de la computadora para analizar la diferencia entre dos proporciones 375

10.5 PRUEBA DE HIPÓTESIS SOBRE DOS VARIANZAS POBLACIONALES 377

Uso de la computadora para probar la hipótesis sobre dos varianzas poblacionales 379 Resumen 385 Términos clave 386 Fórmulas 386 Problemas complementarios 387 Análisis de la base de datos 392 Caso: Seitz Corporation: Fabricación de productos que se mueven mediante engranajes

y de manera lineal 392 Uso de la computadora 394

11 Análisis de varianza y diseño de experimentos 396

Dilema de decisión: Analizar las diferencias en rentabilidad de compañfas en tres países 397

11.1 INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS 398

11.2 EL DISEÑO COMPLETAMENTE ALEATORIO (ANOVA DE UN SENTIDO) 400

Análisis de varianza de un sentido 401 Lectura de la tabla de distribución de F 404 Uso de la computadora para una ANOVA de un sentido 405 Comparación de los valores de F y de t 406

11.3 PRUEBAS DE COMPARACIÓN MúLTIPLE 411 Prueba de diferencia honestamente significativa (HSD) de Tukey: caso con tamaño

de muestra iguales 412 Uso de la computadora para hacer comparaciones múltiples 414 Procedimiento de Tukey-Kramer: caso de tamaños muestrales desiguales 416

11.4 DISEÑO DE BLOQUE ALEATORIO 419 Uso de la computadora para analizar diseños de bloque aleatorios 423

11.5 DISEÑO FACTORIAL (ANOVA DE DOS DIRECCIONES) 429 Ventajas del diseño factorial 429 Diseños factoriales con dos tratamientos 429 Aplicaciones 430 Prueba estadística de un diseño factorial 430 Interacción 432 Uso de la computadora para hacer una ANOVA de dos sentidos 437

Resumen 446 Términos clave 446 Fórmulas 447 Problemas complementarios 448 Análisis de la base de datos 451 Ceso: J. R. Clarkson Company 451 Uso de la computadora 453

Page 13: libro.pdf

xiv ESTADISTICA EN LOS NEGOCIOS

12 Análisis de datos categóricos 454

Dilema de decisión: Selección de proveedores: comparación de pequeñas y grandes empresas en Ja industria electrónica 455

12.1 PRUEBA DE JI CUADRADA DE BONDAD DE AJUSTE 456 Prueba de una proporción poblacional con el uso de una.prueba de ji cuadrada de bondad

de ajuste como técnica alternativa a la prueba de z 462

12.2 ANÁLISIS DE CONTINGENCIA: PRUEBA DE JI CUADRADA DE INDEPENDENCIA 466

Resumen 475 Términos clave 475 Fórmulas 476 Problemas complementarios 476 Análisis de la base de datos 478 Caso: Foot Locker en Ja mezcla de calzado 478 Uso de la computadora 479

13 Análisis de regresión simple 480

Dilema de decisión: Predicción del volumen anual de ventas de empresas de corretaje o representación de bienes raíces por medio del precio promedio de venta 481

13.l INTRODUCCIÓN AL ANÁLISIS DE REGRESIÓN SIMPLE 482

13.2 DETERMINACIÓN DE LA ECUACIÓN DE LA RECTA DE REGRESIÓN 483

13.3 ANÁLISIS RESIDUAL 490 Uso de residuales para probar las suposiciones del modelo de regresión 491 Uso de la computadora para análisis de residuales 492

13.4 ERROR ESTÁNDAR DE LA ESTIMACIÓN 496

13.5 COEFICIENTEDEDETERMINACIÓN 499 Relación entre el valor de r y de r2 501

13.6 HIPÓTESIS PARA LA PENDIENTE DEL MODELO DE REGRESIÓN Y DEL MODELO GENERAL 502

Prueba de la pendiente 502 Prueba del modelo general 505

13.7 ESTIMACIÓN 506 Intervalos de confianza para estimar la media condicional de y:µJ'lx 507 Intervalos de predicción para estimar un solo valor de y 507

13.8 INTERPRETACIÓN DE LA SALIDA 510 Resumen 514 Términos clave 514 Fórmulas 514 Problemas complementarios 515 Análisis de Ja base de datos 518 Caso: Delta Wire usa capacitación como arma 519 Uso de la computadora 521

••

Page 14: libro.pdf

CONTENIDO XV

14 Análisis de regresión múltiple 522 Dilema de decisión: ¿Va usted a odiar su nuevo trabajo? 523

14.1 EL MODELO DE REGRESIÓN MÜLTIPLE 524 Modelo de regresión múltiple con dos variables independientes (primer orden) 525 Determinación de la ecuación de regresión múltiple 526 Modelo de regresión múltiple 527

14.2 PRUEBAS DE SIGNIFICANCIA DEL MODELO DE REGRESIÓN Y SUS COEFICIENTES 532

Prueba del modelo general 532 Pruebas de significancia de los coeficientes de regresión 533

143 RESIDUALES, ERROR ESTÁNDAR DE LA ESTIMACIÓN Y R2 536 Residuales 536 SSE y error estándar de la estimación 537 Coeficiente de determinación múltiple (R2) 538 R2 ajustada 539

14.4 INTERPRETACIÓN DE UNA SALIDA COMPUTARIZADA DE REGRESIÓN MÜLTIPLE 541

Un nuevo examen de la salida de regresión múltiple 541 Resumen 546 Términos clave 546 Fórmulas 546 Problemas complementarios 547 Análisis de la base de datos 549 Caso: Starbucks introduce tarjeta de débito 550 Uso de la computadora 551

15 Construcción de modelos de regresión múltiple 552

Dilema de decisión: Determinación de compensación para directores generales 553 15.1 MODELOS NO LINEALES: TRANSFORMACIÓN MATEMÁTICA 554

Regresión polinomial 555 Escalera de transformaciones de Tukey 557 Modelos de regresión con interacción 559 Transformación de un modelo 561

15.2 VARIABLES INDICADORAS (FALSAS) 567 15.3 CONSTRUCCIÓN DE MODELOS: PROCEDIMIENTOS

DE BÚSQUEDA 573 Procedimientos de búsqueda 575 Todas las regresiones posibles 575 Regresión por pasos 576 Selección de avance 579 Eliminación inversa 580

15.4 MULTICOLINEALIDAD 583 Resumen 589 Términos clave 590

Page 15: libro.pdf

xvi ESTADISTICA EN LOS NEGOCIOS

Fórmulas 590 Problemas complementarios 590 Análisis de la base de datos 594 Caso: Virginia Semiconductor 594 Uso de la computadora 597

16 Pronóstico de series de tiempo y números índice 598

Dilema de decisión: Pronóstico de la contaminación del aire 599

16.1 INTRODUCCIÓN AL PRONÓSTICO 600 Componentes de series de tiempo .600 La medida de error de pronóstico 601 Error 602 Desviación media absoluta (MAD) 602 Error medio cuadrático (MSE) 602

16.2 T:eCNICAS DE SUAVIZAMIENTO 604 Modelos ingenuos de pronóstico 604 Modelos de promedio 605 Promedios simples 605 Promedios móviles 607 Promedios móviles ponderados 608 Suavizamiento exponencial 610

16.3 ANÁLISIS DE TENDENCIAS 616 Análisis de tendencia de regresión lineal 616 Análisis de tendencia de regresión usando modelos cuadráticos 618 Método de suavizamiento exponencial de dos parámetros de Holt 621

16.4 EFECTOS ESTACIONALES 623 Descomposición 623 Búsqueda de efectos estacionales con la computadora 626 Método de suavizamiento exponencial de tres parámetros de \V"LDt<n 626

16.5 AUTOCORRELACIÚN Y AUTORREGRESIÓN 629 Autocorrelación 629 Formas de superar el problema de autocorrelación 632 Adición de variables independientes 632 Transformación de variables 632 Autorregresión 632

16.6 NÜMEROS DE ÍNDICE 636 Números Indice sencillos e Indices de precio agregados no ponderados 636 Números Indice de precios agregados y no ponderados 637 Números índice de precios agregados ponderados 638 Indice de precios Laspeyres 638 Indice de precios Paasche 639

Resumen 645 Términos clave 646 Fórmulas 646 Problemas complementarios 647 Análisis de la base de datos 652

Page 16: libro.pdf

Caso: Debourgh Manufacturing Company 652 Uso de la computadora 654

17 Estadísticas no paramétricas 656

Dilema de decisión: ¿Cómo está el negocio de las donas? 657 17.1 PRUEBADECORRIDAS 659

Prueba de corridas de muestra pequeña 660 Prueba de corridas de muestra grande 661

17.2 PRUEBA UDEMANN-WHITNEY 663 Caso de muestra pequeña 664 Caso de muestra grande 666

17.3 PRUEBA DE RANGO CON SIGNO DE PARES RELACIONADOS DE WILCOXON 671

Caso de muestra pequeña (n $ 15) 672 Caso de muestra grande (n > 15) 673

17.4 PRUEBADEKRUSKAL-WALLIS 679 17.5 PRUEBADEFRIEDMAN 685

17.6 CORRELACIÓN DE RANGO DE SPEARMAN/COEFICIENTE DE SPEARMAN 690

Resumen 695 Términos clave 696 Fórmulas 696 Problemas complementarios 697 Análisis de bases de datos 701 Caso: Schwinn 702 Uso de la computadora 703

l 8 Control estadístico de calidad 704 Dilema de decisión: Control de calidad en Xerox 705

18.1 INTRODUCCIÓN AL CONTROL DE CALIDAD 706 ¿Qué es el control de calidad? 707 Administración de calidad total 708 Algunos conceptos importantes sobre la calidad 709 Estándar de referencia 709 Sistemas de inventario justo a tiempo 709 Reingenierfa 710 Six Sigma 711 Formación de equipos 712

18.2 ANÁLISIS DE PROCESOS 712 Diagramas de flujo 713 Análisis de Pareto 715 Diagramas de causa y efecto (espinazo de pescado) 715 Gráficas de control 716

Page 17: libro.pdf

18.3 GRÁFICAS DE CONTROL 718 Variación 718 Tipos de gráficas de control 718 Gráfica x 719 Gráficas R 722 Gráficas p 724 Gráficas e 726 Interpretación de gráficas de control 728

18.4 MUESTREO DE ACEPTACIÓN 733 Plan de una sola muestra 733 Plan de dos muestras 734 Plan de muestras múltiples 734 Determinación de curvas de error y características de operación 735

Resumen 740 Términos clave 741 Fórmulas 742 Problemas complementarios 743 Análisis de fa base de datos 746 Caso: Robotron 747 Uso de la computadora 749

xviii ESTADISTICA EN LOS NEGOCIOS

Apéndice A: Tablas 751 Apéndice B: Respuestas a problemas cuantitativos nones seleccionados 793 Glosario 803 Índice 815

En el CD adjunto

19 Análisis de decisión CI9-2

Dilema de decisión: Toma de decisiones a nivel del director Ci9-3 19.1 LA MESA DE DECISIÓN Y LA TOMA DE DECISIONES BAJO

INCERTIDUMBRE CI9-4 Mesa de decisión CI9-S Toma de decisiones bajo incertidumbre Cl9-6

19.2 TOMA DE DECISIONES BAJO INCERTIDUMBRE CI9-6 Criterio max.imax Ci9-6 Criterio max.irnin Ci9-7 Criterio de Hurwicz CI9-7 Pérdida minimax CI9-9

19.3 TOMA DE DECISIONES BAJO RIESGO CI9-14 Arboles de decisión Cl9-14 Valor monetario esperado (EMV) CI9-14 Valor esperado de información perfecta Ci9-18 Utilidad CI9-19

Page 18: libro.pdf

COITTENIDO xix

19.4 REVISIÓN DE PROBABILIDADES EN VISTA DE LA INFORMACIÓN MUESTRAL Cl9-22

Valor esperado de información muestral Cl9-25 Resumen Cl9-33 Términos clave CI9-33 Fórmula CI 9-34 Problemas complementarios Cl9-34 Análisis de las bases de datos Cl9-36 Caso: Fletcher-Terry: en riesgo Cl9-36

Suplemento 1: notación de suma Sl-1

Suplemento 2: Deducción de fórmulas de regresión simple para pendiente y punto de cruce con el eje y S2-1

Suplemento 3: Suavizamiento exponencial avanzado S3-1

SUAVIZAMIENTO EXPONENCIAL CON EFECTOS DE TENDENCIA: MÉTODO DEHOLT 53-1

SUAVIZAMIENTO EXPONENCIAL CON TENDENCIA Y ESTACIONALIDAD: MÉTODO DE WINTER 53-2

Algunos problemas de práctica 53-5

Page 19: libro.pdf

PREFACIO

La cuarta edición de Estadística en los negocios para la toma de decisiones, si bien sigue reteniendo la pe­ dagogía clara y directa de ediciones anteriores, agrega nuevos artículos y un interés todavia más inten­ so a la estadística aplicada, práctica, que mejora la posición del texto como líder en la presentación de estadísticas de negocios en una situación de toma de decisiones.

Esta edición está escrita y diseñada para un curso de introducción de dos semestres para estudian­ tes de estadísticas de negocios o un curso de introducción al nivel de Master en administración de em­ presas. Además, con 18 capítulos, se adapta muy bien a un curso de un semestre de estadísticas de negocios. El texto está escrito con la suposición de que el estudiante ya ha cursado álgebra universita­ ria. No se emplea cálculo en la presentación de material en el texto.

El enfoque filosófico básico de este texto es que toda herramienta estadfstica presentada tiene al­ guna aplicación en negocios. Mientras que el texto contiene rigor estadfstico, está escrito de modo que el estudiante pueda fácilmente entender que la correcta aplicación de la estadística en el mundo de los negocios va de la mano con la buena toma de decisiones. En esta edición se presenta la estadística co­ mo medio para convertir datos en información útil para que Jos directores tomen las decisiones me­ jor pensadas y con base en información. Por tanto, el texto contiene estadísticas de negocios como herramientas de "valor agregado" en el proceso de convertir datos en información útil.

CAMBIOS PARA LA CUARTA EDICIÓN

Dilema de decisión y en respuesta Los artículos de Dilema de decisión y En respuesta que gozaron de tanta preferencia en la segunda edi­ ción pero que se pasaron al CD-ROM en la tercera edición, aparecen de nuevo en el texto de la cuarta edición. El dilema de decisión es una viñeta real de negocios con que se inicia cada uno de los capítu­ los. Establece el tono para el capitulo al presentar un dilema de negocios o industria y formular varias preguntas gerenciales o estadísticas, la solución de las cuales requiere el uso de técnicas presentadas en el capitulo. Crea una situación para que las estadísticas de negocios se presenten en el capítulo. AJ fina­ lizar cada capitulo se encuentra el artículo En respuesta, el cual analiza y contesta preguntas gerenciales y estadísticas puestas en el Dilema de decisión con el uso de técnicas del capítulo, Uevando así al cierre del mismo. En la cuarta edición, se agregaron siete nuevos Dilemas de decisión y En respuesta desde que el artículo apareció por última vez en la segunda edición, y prácticamente todos los otros artículos se actualizaron. Los nuevos Dilemas de decisión incluyen: 1) Estadísticas de lavanderías; 2)Pronóstico de Contaminación del Aire; 3) ¿Cómo está el negocio de las donas? (participa Krispy Kreme); 4) Es­ tado de manufactura de autos; 5) Comparación de estadísticas internacionales de trabajo; 6) Predicción del volumen anual de ventas de empresas de corretaje de bienes rafees por el precio promedio de las ventas; y 7} ¡Va a cambiar de trabajo?

Como ejemplo, el Dilema de decisión del capítulo 17, ¡Cómo está el negocio de las donas? Presen­ ta a Krispy Kreme como una compañia especializada en donas en rápido crecimiento. La compañia, es­ tablecida en 1937 por Vernon Rudolph, empezó como un pequeño fabricante y proveedor de donas a tiendas de abarrotes de la localidad en Winston-Salem, Carolina del Norte, y se expandió rápidamente a localidades fuera del sureste en la década de 1990, y está creciendo internacionalmente en el siglo xxr, Con esta rápida expansión, un problema podría ser la consistencia en el tamaño de las donas. El Dile­ ma de decisión presenta una situación en la que el personal de administración de calidad en Krispy

Page 20: libro.pdf

PREFAOO Di

Kreme ha realizado un experimento para comparar los tamaños de donas, en donas producidas por cuatro máquinas diferentes. Las donas producidas por cada máquina se seleccionan al azar y se prue­ ban para determinar si hay una diferencia de importancia en el tamaño de las donas hecbas a máqui­ na. Desafortunadamente, las suposiciones subyacentes al uso de una ANOVA unidireccional no se pueden satisfacer. El dilema es cómo analizar los datos en estas condiciones. El capítulo 17 trata de es­ tadísticas no pararnétricas. El articulo En respuesta, al final del capítulo, muestra al estudiante la forma en que el dilema se puede resolver mediante el uso de una prueba de Kruskal-Wallis. Los otros dos dile­ mas se presentan en este Dilema de decisión y se responden en el articulo En respuesta con el uso de la prue­ ba t de rango con signo pareado de Wilcoxon y la correlación de rango de Spearman. Una de estas pruebas se ocupa de analizar datos de ventas antes y después de una campaña de ventas y la otra trata de determi­ nar la fuerza de relación entre las ventas de una rienda y su tamaño con el uso de datos de rango.

Casos Prácticamente todos los casos se han actualizado para esta edición y se han escrito tres nuevos casos pa­ ra la cuarta edición, usando para ello compañías contemporáneas: 1) Foot Locker en la fabricación de calzado, capítulo 12 (Análisis de datos categóricos); 2) Starbucks introduce la tarjeta de débito, capítulo 14 {Introducción a la regresión múltiple); y 3) Schwinn, capitulo 17 (Estadísticas no paramétricas). El caso de Starbucks presenta uno de los relatos de éxito contemporáneo de un negocio ya que la compa­ ñia ha crecido de una cafeterfa en 1971 a más de 5 000 en la actualidad. En noviembre de 2001, Starbucks trató de poner en práctica un nuevo concepto al lanzar su tarjeta Starbuck prepagada (de débito). La tar­ jeta fue tan bien aceptada cuando fue anunciada que a muchas tiendas se les agotó la existencia. Para me­ diados del año 2002, Starbucks había activado más de 5 millones de estas tarjetas. Se piensa que la tarjeta constituye una gran parte del aumento de 7% en ventas en la misma tienda a principios de 2002 y que es la razón por la que se atrajeron numerosos nuevos dientes a la tienda. En este caso, unos estu­ diantes exploran formas de pronosticar la cantidad gastada en las tarjetas de débito mediante el uso de metodología de regresión y variables demográficas. Además, se utiliza regresión múltiple para crear nuevos modelos para pronosticar los ingresos de ventas de una tienda. En el segundo nuevo caso par­ ticipa Foot Locker, el distribuidor número uno del mundo de calzado y ropa deportivos, con aproxi­ madamente 3600 tiendas de ventas al menudeo ubicadas en 14 diferentes compañías en Estados Unidos, Europa y Australia. En este caso, presentado en el nuevo capitulo de análisis categórico (ji cua­ drada), las distribuciones de ventas en varios niveles de precios se comparan de un año al siguiente en un esfuerzo por determinar si cambian los modelos de compras. Los análisis de tabulación cruzada se llevan a cabo para estudiar la relación entre el sexo de compradores y la geografia y para examinar su parte del mercado por localidad. En el tercer nuevo caso participa Schwinn, compañia de venta de bi­ cicletas de estilo antiguo que con una larga historia de innovación. En la actualidad, la compañia tiene un gran éxito en el mercado de bicicletas para montaña como primer productor de bicicletas. En este caso, contenido en el capitulo no paramétrico, se pide a estudiantes aplicar técnicas estadísticas no pa­ ramétricas para analizar preguntas de control de calidad acerca de la diferencia en proveedores y la alea­ toriedad de fallas de pintura. Además, el caso incluye un estudio entre las diferencias de edad de las compradoras en dos ciudades.

Estadística en los negocios de hoy Al igual que en ediciones anteriores, la cuarta edición incluye un articulo acerca de la estadística en cada capitulo. Este articulo presenta un ejemplo real de la manera en que las estadísticas presentadas en ese capítulo se aplican en el mundo actual de los negocios. Cinco capitulos de la cuarta edición tie­ nen nuevos artículos a cerca de estadísticas en negocios: l) Crece el uso del U.S. Wireless, capitulo l , Introducción a la estadística; 2) Estadísticas de trabajo por computadora, capitulo 3, Estadistica des­ criptiva; 3) Pronóstico del precio de un SUV, capítulo 13, Análisis de regresión simple; 4) Pronóstico de intensidad de exportación de empresas manufactureras chinas con el uso de análisis de regresión múl­ tiple, capitulo 15, Construcción de modelos de regresión múltiple; y 5) Perfilar usuarios en linea, capí­ tulo 17, Estadisticas no paramétricas.

Como ejemplo, de Estadísticas de trabajo por computadora, un estudio realizado por Telework America mostró que 28 millones de estadounidenses trabajan por computadora. Se estima que para fi­ nales de 2004 habrá casi 30 millones de teletrabajadores regulares en Estados Unidos. El teletrabajador típico vive en el oeste o el noroeste, es hombre, tiene educación universitaria, tiene entre 35 y 44 años de edad, casado, y gana por lo menos $40 000 por año. El ingreso medio de teletrabajadores es de

Page 21: libro.pdf

XXÜ ESTADISTICA EN LOS NEGOCIOS

$44 000. Casi todos trabajan en impuestos (IT), bienes raíces o administración de empresas. Por lo ge­ neral, estos teletrabajadores viajan en auto unos 30 km para trabajar y se ahorran casi 53 minutos de tiempo de viaje diarios, están relativamente satisfechos con su trabajo. Setenta y cinco por ciento de quienes trabajan en casa reportaron un aumento cuantificable en productividad y calidad de trabajo cuando cambiaron de trabajos tradicionales a ser teletrabajadores. Dos tercios de teletrabajadores ex­ presaron mayor satisfacción en su trabajo y dicen que trabajan más horas que los no teletrabajadores pero que su trabajos interfieren menos con sus vidas personales.

Cambios de temas Para dar mayor claridad y destacar temas más importantes, la cuarta edición contiene dos nuevos ca­ pítulos: 1) el capitulo 15, Construcción de modelos de regresión múltiple, un segundo capítulo sobre regresión múltiple y 2) el capítulo 12, Análisis de datos categóricos, capitulo sobre pruebas de ji cua­ drada de datos categóricos. Separar la presentación de regresión múltiple en dos capítulos permite al instructor la opción de limitar la exposición del estudiante a regresión múltiple, al usar sólo una intro­ ducción (capítulo 14) o explorar más a fondo y con mayor detalle el análisis de regresión múltiple me­ diante el uso de técnicas de modelación como es la regresión por pasos y modelos curvilíneos (capitulo 15). Las pruebas de ji cuadrada se han extra ido del capítulo de estadísticas no paramétricas (17), y se les considera independientes desde el principio de la cuarta edición (capitulo 12) por su uso más am­ plio en campos como el mercadeo. Además, para dar más tiempo para temas clave, un capítulo de la tercera edición, Números índice, se ha reducido a una sección en la cuarta edición (capítulo 16, Pro­ nóstico de series de tiempo y números indice). Otras modificaciones en esta edición incluyen cambiar las gráficas de Pareto y gráficas de dispersión al capitulo 2 (Tablas y gráficas), cambiar las medidas de asociación (coeficiente de correlación) al Capítulo 3 (Estadística descriptiva), e introducir el sistema HTAB en el capítulo 9 (Prueba de hipótesis).

Sistema HTAB y prueba de hipótesis Para adelantar la noción de estadística de negocios en un escenario de toma de decisiones, la cuarta edi­ ción introduce, por primera vez, el sistema HTAB. Mientras que la mayor parte de textos se limitan a presentar el importante proceso de prueba de hipótesis como un método de ocho pasos, el sistema HTAB reorganiza el procedimiento de prueba de hipótesis en cuatro trabajos principales, dando espe­ cial interés en la toma de decisiones en negocios. Las Implicaciones en negocios por acción de prueba de hipótesis (HTAB, por sus siglas en inglés), Uevan al estudiante por cuatro distintas fases que culmi­ nan en una decisión de negocios. El sistema HTAB pone interés en determinar qué implicaciones de negocios, si las hay, resultan de la prueba de hipótesis. Para recalcar más el interés en la toma de deci­ siones, la cuarta edición contiene una presentación de hipótesis sustantivas dentro de un contexto de hipótesis de investigación y estadisticas. Al examinar hipótesis sustantivas, el estudiante aprende a dife­ renciar entre significancia estadística e importancia en negocios.

Problemas nuevos Todos los problemas de la tercera edición se examinaron respecto a si son oportunos, apropiados, cla­ ros y lógicos antes de incluirlos en la cuarta edición. Los que no cumplieron estos requisitos fueron sus­ tituidos o presentados de otra forma. Se elaboraron diferentes problemas nuevos en un esfuerzo por maximizar el aprendizaje de los estudiantes. Se actualizó la mayor parte de problemas que tienen va­ lores con base en el tiempo; mientras que el número total de problemas del texto es todavfa alrededor de 950, se ha hecho un esfuerzo concertado para incluir sólo problemas que hacen una aportación im­ portante al proceso de enseñanza.

Todos los problemas de demostración, así como los problemas de ejemplo, se revisaron en su totali­ dad y se editaron para mayor eficiencia. Un problema de demostración es un ejemplo extra que contiene algún problema y su solución y se utiliza como herramienta pedagógica adicional para complementar explicaciones y ejemplos de los capítulos. Prácticamente todos los problemas de ejemplo y demostra­ ción de la cuarta edición están orientados a los negocios y contienen la información disponible más ac­ tualizada de que se dispone.

Al igual que con la edición anterior, aparecen problemas al final de casi todas las secciones de los capítulos. Se incluyen numerosos problemas adicionales en la sección de Problemas complementarios.

Page 22: libro.pdf

PREFAOO xxili

Los Problemas complementarios son ejercicios "revueltos" que utilizan las diversas técnicas descritas en el capítulo, de modo que el estudiante pueda probarse a st mismo su capacidad para discriminar y dis­ tinguir ideas y conceptos.

CARACTERÍSTICAS Y BENEFICIOS Cada capítulo de la cuarta edición contiene: Objetivos de aprendizaje, un Dilema de decisión, Proble­ mas de demostración, problemas de sección, Estadísticas en los negocios de hoy, una sección En res­ puesta, y un Resumen del capítulo, Términos clave, Fórmulas, Consideraciones éticas, Problemas complementarios, Análisis de bases de datos, un caso, Uso de la computadora y Salida de computadora de Excel 2000 y MlNITAB versión 13.

• Objetivos de aprendizaje. Cada capítulo inicia con un enunciado de los principales objetivos de aprendizaje del mismo. Éste enunciado provee al lector de una lista de temas clave que se es­ tudiarán y las metas establecidas por el estudio del capítulo.

• Dilema de decisión. Al inicio de cada capítulo, un caso breve describe una situación real de alguna compañía o negocio en la que surgen preguntas gerenciales y estadísticas, En la mayor parte de Dilemas de decisión, se proporcionan datos reales y se pide al estudiante que considere la forma en que los datos pueden analizarse para contestar las preguntas.

• Problemas de demostración. Prácticamente toda sección de cada capítulo de la cuarta edición contiene problemas de demostración. Un problema de demostración contiene cierto problema de ejemplo y su solución, y se utiliza como herramienta pedagógica adicional para complemen­ tar explicaciones y ejemplos.

• Problemas de sección. Hay más de 950 problemas en el texto. Se encuentran problemas de práctica al final de casi cada sección del texto. La mayor parte de problemas utilizan datos rea­ les reunidos de gran variedad de fuentes. Se incluyen aquí algunos extractos de problemas reales en el texto: "El Wall Street [ournal reportó que 40% de todos los trabajadores dicen que cambia­ rían de trabajo por un 'sueldo ligeramente más alto'. Además, 88% de las compañlas dicen que escasean de candidatos calificados para el trabajo" "En un estudio realizado por Peter D. Hart Research Associates para el Nasdaq Stock Market, se determinó que 20% de todos los inversio­ nistas en acciones son personas jubiladas. Además, 40% de los adultos en Estados Unidos han invertido en fondos mutuos" "Un estudio dirigido por la Northwestern Nacional Life lnsurance Company deja ver que 70% de trabajadores estadounidenses dicen que el estrés les causa fre­ cuentes problemas de salud". De acuerdo con Padgett Business Services, 20% de todos los pequeños propietarios de negocios dicen que el consejo más importante para iniciar un nego­ cio es prepararse para largas horas y trabajo duro. Veinticinco por ciento dicen que el consejo más importante es tener listo un buen financiamiento." "De acuerdo con un estudio realizado por Gateway Computers, 59% de hombres y 70% de mujeres dicen que el peso es un factor ex­ tremadamente/(muy) importante en la compra de una computadora portátil".

• Estadísticas en los negocios de hoy. Cada capítulo de la cuarta edición contiene un articulo de Estadísticas en los negocios de hoy. Éstos se concentran en cajas que contienen una interesante aplicación con respecto a la manera en que las técnicas de ese capítulo en particular se emplean en el mundo de los negocios de hoy. Suelen estar basadas en compañías reales, estudios o inves­ tigación publicada.

• En respuesta. Situado al final del capítulo, el artículo En respuesta dirige las preguntas geren­ ciales y estadísticas que aparecen en el Dilema de decisión. Los datos dados en el Dilema de de­ cisión son analizados por computadora con el uso de técnicas presentadas en el capítulo. Se llega a las respuestas de las preguntas gerenciales y estadísticas del Dilema de decisión al aplicar conceptos del capítulo, con lo cual se cierra.

• Resumen del capítulo. Cada capitulo concluye con un resumen de los conceptos, ideas y técni­ cas importantes del mismo. Este artículo puede servir como vista previa del capítulo así como de repaso.

• Términos clave. Los términos importantes se escriben en negritas y sus definiciones en cursi­ vas en todo el texto, cuando se citan. Al final de cada capítulo se presenta una lista de los térmi­ nos clave. Además, éstos aparecen con sus definiciones en un glosario incluido al final del libro.

Page 23: libro.pdf

xx:iv ESTADISTICA EN LOS NEGOCIOS

• Fórmulas. Las fórmulas importantes del texto se resaltan para facilitar su lectura, y al final de cada capítulo la mayor parte de ellas se ponen en lista como práctica consulta.

• Consideraciones éticas. Cada capitulo contiene un articulo de Consideraciones éticas que es oportuno dada la gran brecha existente entre ética y falta de liderazgo moral de algunos ejecu­ tivos de negocios en meses recientes. Con la abundancia de datos estadísticos y análisis, existe considerable potencial para el mal uso de estadísticas en tratos de negocios. Este articulo recalca el potencial mal uso al analizar temas como mentir con estadísticas, no satisfacer suposiciones estadísticas, no incluir información pertinente para quienes toman decisiones, y otros temas de principios. Mediante este artículo, los maestros pueden iniciar por integrar el tema de ética con aplicaciones de estadísticas en negocios. He aquí algunos cuantos extractos de artículos de Con­ sideraciones éticas: "No es profesional ni ético sacar conclusiones de causa y efecto sólo porque dos variables están correlacionadas". "El investigador de negocios necesita dirigir el experimento en un entorno tal que muchas variables concomitantes sean controladas cuanto sea posible. En la medida que esto se realice, el investigador tiene una responsabilidad ética de reportar ese hecho en sus hallazgos." "Se advierte al lector que el valor de lambda se supone constante en un experimento de distribución de Poisson. Los investigadores de negocios pueden producir resul­ tados falsos si el valor de lambda se usa en todo un estudio; pero como el estudio es dirigido du­ rante diferentes periodos, el valor de lambda está cambiando en realidad." "Al describir un cuerpo de datos a una audiencia, es mejor usar cualesquiera medidas estadísticas que sean ne­ cesarias para presentar una imagen 'completa' de los datos. Al limitar las medidas descriptivas empleadas, el investigador de negocios puede dar a la audiencia sólo parte de la imagen y ses­ gar la forma en que el receptor comprenda los datos."

• Problemas complementarios. Al final de cada capítulo está un extenso conjunto de problemas adicionales, los cuales están divididos en tres grupos: Cálculo de estadísticas, problemas estric­ tamente de computación; Pruebe su comprensión, problemas para aplicación y comprensión; e Interpretación de la salida, que son problemas que requieren la interpretación y análisis de las respuestas del software de computadora.

• Análisis de la base de datos. Hay siete bases de datos principales en el CD-ROM que acompa­ ña a la cuarta edición. Esta sección, que aparece al final de capítulo, contiene varias preguntas/ problemas que requieren la aplicación de técnicas del capitulo a datos en las variables de las bases de datos. Se supone que Ja mayor parte de estas preguntas/problemas se resuelven con el uso de una computadora.

• Caso. Cada caso de fin de capítulo está basado en una compañia real. Estos casos dan al estu­ diante una oportunidad de usar conceptos y técnicas estadísticos presentados en el capítulo pa­ ra resolver un dilema de negocios. En algunos casos aparecen compañías muy grandes, por ejemplo: la Shell Oil, Coca-Cola o Colgate-Palmolive. Otros se refieren a pequeños negocios, co­ mo Thermatrix, Robotron o DeBourgh, las cuales han superado obstáculos para continuar en operación y desarrollo. La mayor parte de casos incluyen datos brutos (que también se encuen­ tran en el CD-ROM) para análisis y preguntas que estimulan al estudiante a usar diversas téc­ nicas presentadas en el capitulo. En muchos casos, el estudiante debe analizar las respuestas y software de computadora para llegar a conclusiones o tomar decisiones.

• Uso de la computadora. La sección Uso de la computadora contiene instrucciones para produ­ cir la salida de software de Excel 2000 y MlNITAB versión 13, que se presenta en el capítulo. Se da por hecho que los estudiantes tienen una comprensión general de un entorno Microsoft• Windows. Las instrucciones incluyen notas especificas acerca de las barras de menú, menús des­ cendentes y cajas de diálogo. No se estudian todos los detalles de cada caja de diálogo; la inten­ ción es dar suficiente información para que el estudiante produzca la misma salida estadística analizada y estudiada en el capítulo.

• Presentación de la salida del programa Microsoft" Excel y MJNITAB. La cuarta edición tiene un fuerte enfoque en los paquetes de software Excel y M!NITAB. Se presentan más de 250 sali­ das de Excel 2000 y M1NITAB versión 13, generadas por computadora. Excel, debido a que es parte de Microsoft Office, se ha instalado en millones de computadoras en todo el mundo. Ca­ si todos Jos estudiantes tienen acceso a Excel en su casa, escuela o trabajo. Por la gran capacidad de la herramienta de Análisis de datos y la función Paste (pegar), Excel tiene considerable capa­ cidad estadfstica. MINITAB también es importante porque ha realizado un excelente trabajo para mantener el paso con los continuos cambios y demandas de la estadística en negocios.

Page 24: libro.pdf

PREFAOO XD'

MINlTAB versión 13, que aparece en este texto, cuenta con técnicas para analizar proporcio­

nes, mayores capacidades de administración de datos y archivos que incluyen hojas de cálculo múltiples, la capacidad de ejecutar regresión de polinomios, así como presentación más clara y reforzada de herramientas de calidad. Además, es más fácil usar la hoja de cálculo MINITAB.

• Bases de datos. Esta edición contiene siete bases de datos, las cuales están en formato Excel y MlNlTAB listas para usarse. Una base de datos de manufactura, una base de datos financiera, una base de datos de mercado accionario, una base de datos de empleo internacional, una base de datos de energía, una base de datos de salud pública y una base de datos de negocios agríco­ las dan más de 8350 observaciones y 56 variables. Todos los datos son reales y de fuentes con­ fiables que los usuarios reconocerán; la U.S. Bureau of Labor Statistics, la Casa de Bolsa de Nueva York, el U.S. Department of Agriculrure, Moody's Handbook of Common Stocks, la American Hospital Association, y la U.S. Bureau of the Census. Cuatro de las siete bases de datos incluyen datos de series de tiempo; una contiene 168 meses de datos de series de tiempo para de­ mostración y análisis de técnicas de pronóstico de descomposición.

MATERIALES AUXILIARES PARA ENSEÑANZA Y APRENDIZAJE

CD-ROM para estudiantes Cada ejemplar de la cuarta edición viene con un CD-ROM para estudiantes. El CD-ROM contiene to­ das las bases de datos en formatos Excel y MTNITAB para fácil acceso y uso. El CD-ROM también con­ tiene archivos de datos Excel y MINITAB de todos los problemas del texto y todos los casos. Los maestros y estudiantes ahora tienen la opción de analizar cualquiera de los conjuntos de datos utilizan­ do la computadora. El CD-ROM contiene una versión completa y actualizada del capitulo 19, Análisis de decisión, en formato pdf Esto permite al maestro abarcar el material de este capitulo de la manera acostumbrada, al mismo tiempo que mantiene el texto manejable en tamaño y duración. Además, el CD-ROM contiene una sección a cerca de Técnicas avanzadas de suavizamiento exponencial (del capi­ tulo 16) que ofrece al maestro una oportunidad para ahondar en el suavizamiento exponencial, si así lo desea. La deducción de las fórmulas de pendiente e intersección del capitulo 13 también se incluyen en el CD-ROM, junto con teoría didáctica sobre sumas.

Material de recursos para el maestro Todo el material de apoyo para el maestro se incluye en un CD-ROM. En este práctico formato está in­ cluido:

• Manual del maestro: preparado por Ken Black, este manual contiene las soluciones a práctica­ mente todos los problemas del texto. Además, este manual contiene objetivos de capítulo, com­ pendios de capítulo, estrategias de enseñanza de capítulo y soluciones a los casos.

• Transparencias de presentación PowerPoint™: las transparencias de presentación contienen gráficas para ayudar al maestro a crear clases interesantes. Las transparencias PowerPoint 2000 se pueden adaptar con el uso del programa PowerPoint para facilitar su uso en clase.

• Banco de pruebas: preparado por Aarón Brown de la Arkansas State University, el Banco de Pruebas incluye preguntas de opción múltiple para cada capítulo. El Banco de pruebas se pre­ senta en formato Microsoft" Word.

RECONOCIMIENTOS /ohn Wiley & Sons, Leyh Publishing, y yo agradecemos a los revisores y asesores que se ocuparon en darnos su excelente consejo e ideas, que empleamos para dar forma y moldear el texto en la cuarta edi­ ción. Estos colegas incluyen a;

Thomas McCullough, University of California-Berkeley Tade O. Okediji, University of Oklahoma Michael Panik, Univesity of Hartford

Page 25: libro.pdf

xxvi ESTADÍSTICA EN LOS NEGOCIOS

Randall K. Russell, Yavapai College Daniel Shimshak, University of Massachusetts-Boston Abbas A. Taheri, University of Wisconsin, Fox Valley Michael Walcott, Faulkner University

Nuestro agradecimiento especial a Aaron Brown, Arkansas State University, quien de nuevo prepa­ ró el Banco de pruebas para la cuarta edición. Como siempre, deseo dar mi reconocimiento a mis co­ legas en la University of Houston-Clear Lake por su continuo interés y apoyo en este proyecto. En particular, desea agradecer a William Staples, director; Jim Hays, director y Ted Cumrnings, decano de la School of Business and Public Administration, por su particular interés en el libro y su apoyo admi­ nistrativo. Tres miembros de facultad de la School of Business and Public Administration en la UHCL que me han dado especialmente su ayuda y estímulo en este proyecto son Mike Hanna, Vanee Etnyre y Lee Revere.

Hay varias personas dentro del grupo John Wiley & Sonsa quienes me gustarla dar gracias por su invaluable ayuda en este proyecto. Ellos son: Gitti Lindner, gerente de mercadotecnia; Beth Golub, edi­ tora ejecutiva; y Susan Elbe, editora de publicaciones. También me gustaría dar gracias a Rick Leyh, di­ rector de Leyh Publishing, quien visualizó el potencial para este proyecto y ha dado continuo apoyo y motivación. También de Leyh Publishing, me gustarla agradecer a Lari Bishop por su sostenido esfuer­ zo a nombre de este libro, Benjamin Reece por su diaria ayuda en asuntos detallados, y Michele Chan­ cellor y Jennifer Fisher por su fuerte trabajo de producción.

Deseo expresar especial agradecimiento a mi esposa de 34 años, Carolyn, quien es el amor de mi vida y sigue dándome su apoyo profesional y personal en mi escrito. Gracias también a mis hijas, Wen­ di y Caycee, por su paciencia, amor y apoyo.

Ken Black

Page 26: libro.pdf

ACERCA DEL AUTOR

Ken Black es actualmente maestro en Ciencias de decisión en la Escuela de Negocios y Administración Pública de la University of Houston-Clear Lake. Nació en Cambridge, Massachussets y fue criado en Missouri, obtuvo su titulo de licenciatura en matemáticas del Graceland College, titulo de Master en matemáticas de la University ofTexas en El Paso, un Ph.D. en administración de negocios y ciencia ad­ ministrativa, y un Ph.D en investigación educacional de la University of North Texas.

Desde que se unió a la facultad en 1979, el Profesor Black ha dado clases en todos los niveles de cursos de estadística, pronósticos, ciencia administrativa, investigación de mercado y administración de producción/operaciones. Ha publicado quince artículos y más de veinte ensayos profesionales, asi como dos textos: Estadistica en Negocios: Curso de Introducción y Estadistica de Negocios: Toma de Decisiones Contemporánea. El Profesor Black ha sido asesor para numerosas empresas, incluyendo Atenía, City of Houston, NYLCare, AT&T, Johnson Space Center, Southwest lnformation Resources, Connect Corporation y Eagle Engineering.

Ken Black y su esposa Carolyn tienen dos hijas, Caycee y Wendi. Sus pasatiempos favoritos inclu­ yen tocar guitarra, leer, viajar y participar en competencias atléticas de pista y campo para maestros así como salto de longitud.

Page 27: libro.pdf

CAPÍTULO 1

Introducción a la estadística ~ '~ ·~~ --~ .

OBJETIVOS DE APRENDIZAJE El objetivo fundamenta] del capítulo 1 es introducir al lector al mundo de la estadís- tica, con lo cual podrá: · l. Definir la estadística.

2. Estar consciente de Ja amplia gama de aplicaciones que tiene la estadística en los negocios.

3. Distinguir entre estadística descriptiva e inferencial.

4. Clasificar números por nivel de datos y comprender por qué es importante hacerlo así.

2

Page 28: libro.pdf

~¡,~: és~t;4í;tiéa de~~Hb~·. ei ·estado de los negocios ): ~en la'.zona· rural.dé ta' India ,.. ·i ~--, '.i~.- e:- __ -.; - .... ~ ~:§áili':2._~-~" - ----~~- . - - ~:

La India es el segundo país más grande del mundo, con más de mil millones de habitantes. Tres cuar­ tas partes de la población vive en zonas rurales, pero aun asi el mercado rural representa sólo alrede­ dor de un tercio de las ventas totales de productos nacionales. No obstante lo anterior, debido a las reformas de mercado libre que ocurrieron en la década de 1990 y a Ja fuerte producción agrícola, el mercado rural de la India ha estado más abierto al comercio en artículos de consumo. Aun cuando el mercado urbano de la lndia parece estar saturado, los mercados en las zonas urbanas están relativa­ mente sin explotar, con lo cual ofrecen enorme potencial. Debido a estos factores, numerosas empresas estadounidenses, por ejemplo Microsoft, General Electric, Kellogg's, y otras, han entrado al mercado de la India.

En la actualidad, la India rural se puede describir como pobre y con alto índice de analfabetismo. Más de 65% de la población de las zonas rurales gana menos de $574 dólares al año, y 23% gana entre $574 y $1 146. Sesenta y seis por ciento de las mujeres son analfabetas, al igual que 38% de los hombres. Estos porcentajes son casi el doble de los de zonas urbanas. Setenta y siete por ciento de hogares de zonas rurales usan madera como combustible para cocinar, 39% tienen electricidad, 18% tienen agua potable y 7% tienen retretes con agua de descarga.

Con todo, las condiciones están cambiando y están entrando empresas en este mercado en apa­ riencia no explotado. Por ejemplo, a finales de la década de 1990, Colgate-Palmolive planeó aumentar su presupuesto de mercadeo rural a cinco veces más que en 1991. La meta de esta compañia es que más de la mitad de sus ingresos para el año 2003 provenga de la zona rural de la India, que en la actualidad constituye sólo 30% del negocio.

Las ventas en la India rural son un desafio y se requiere de métodos no tradicionales porque los porcentajes de analfabetismo son altos y sólo alrededor de un tercio de los hogares tiene televisión. Uno de estos métodos es el uso de camionetas tipo Combi, con-sistemas de video en los cuales se presentan anuncios que en zonas rurales duran media hora. Una de estas camionetas entra en un pequeño pobla­ do con altavoces que reproducen una popular melodía de cine. Cuando los pobladores se acercan al vehículo, un vendedor abre la puerta y presenta en una pantalla, un video con escenas que describen la necesidad de un determinado producto. Después de terminar el video, se distribuyen muestras gra­ tis. Hindustan Lever Ltd., la principal empresa de la India de productos de consumo, estima que el costo por contacto de este mercadeo es alrededor de cuatro veces más que el costo a quienes viven en ciuda­ des, pero el mercado rural para productos de cuidado personal está creciendo tres veces más rápido que en mercados urbanos, lo cual hace más viable estos esfuerzos de mercadeo. Otras empresas utili­ zan campañas de venta de puerta en puerta para promover productos en zonas rurales de la India. Además, el advenimiento de televisión por satélite a casas y poblaciones rurales en la India abre algu­ nos medios nuevos para hacer publicidad y mercadeo a este segmento de la población.

Las estadísticas de que se dispone de la primera mitad de la década de 1990 arrojaron alguna luz sobre el mercado potencial de la India rural. El consumo de pasta dentífrica en la India rural se dupli­ có de 8 825 toneladas métricas en 1990 a 17 023 en 1994. El consumo anual per cápita en pasta dentí­ frica es todavía de 30 gramos por persona en la India rural, en comparación con los 160 gramos en zonas urbanas de la India y 400 gramos en Estados Unidos. Por tanto, el potencial para un crecimien­ to mucho mayor ya está ahí. Las ventas para otros productos se han incrementado rápidamente en este mercado en desarrollo. Las ventas de detergente para lavanderia aumentaron de 272 540 toneladas métricas en 1990 a 422 741 toneladas métricas en 1994. El jabón de tocador aumentó de 158 919 tone­ ladas métricas en 1990 a 231 084 toneladas métricas en 1994. Las ventas de champú aumentaron a casi cuatro veces, de 497 mil litros a dos millones 116 mil litros en 1994.

La India rural es un enorme mercado que los negocios no han explotado. Algunas evidencias indi­ can que los consumidores de estas regiones de la India están comprando productos en números cre­ cientes, pero las estadísticas de ingresos muestran una limitada capacidad de compra. El dilema al que se enfrentan las empresas es entrar a este mercado y, si es así, en qué medida y en qué forma.

3

Page 29: libro.pdf

4 ESTADISTICA EN LOS NEGOCIOS

Preguntas gerenciales y estadísticas

l. ¡Qué clases de estadísticas se presentan en este reporte? 2. ¡Son exactos estos datos o estimaciones? 3. ¡Cómo saldrían los investigadores a recabar estos datos? 4. Al medir la India rural como mercado, ¡qué otras estadísticas podrlan reunirse! 5. ¡Qué niveles de medición están representados en estos datos? Si se reunieran otras estadísticas,

¡qué otros niveles de medición de datos podrían estar representados? 6. ¡Cómo podrían los gerentes usar estas estadísticas para tomar mejores decisiones acerca de

entrar a este mercado?

Futnttt adaptado de Raja Ramachandran, "Understanding the Market Envircnment oí lndia", Business Horuons. enero 2000. M1riam Jordán, "ln Rural India, Video Vans Sell Toothpaste and Shampoo~ W1dl Strttt /ournal, 10 de enero de 1996. Rinlru Pegu, "Maya Buar", Th< l\'..t, 30 de mayo, 1999. hrrp:/lwww.rhe·.....Jc.com/99may301bizHtm.

En todo momento en días hábiles, se toman decisiones en empresas en todo el mundo que determinan si las empresas serán rentables y en crecimiento o si estarán estáticas y desaparecerán. La mayor parte de estas decisiones se toman con la asistencia de información reunida acerca del mercado, el entorno económico y financiero, la fuerza laboral, la competencia y otros factores. Esta información suele llegar en forma de datos o está acompañada de ellos. Las estadísticas de negocios son la herramienta median­ te la cual estos datos se recolectan, analizan, resumen y presentan para facilitar el proceso de toma de decisiones. Por tanto, en el siglo XXI, las estadísticas de negocios desempeñan un importante papel en el presente conjunto de hechos de toma de decisión dentro del dinámico mundo de los negocios.

1.1 LA ESTADÍSTICA EN LOS NEGOCIOS

Prácticamente todos los aspectos de los negocios utilizan estadísticas en la toma de decisiones. He aquí algunos ejemplos del uso de la estadística en diversos campos de negocios.

El mejor camino al mercado Un estudio dirigido por Pitney Bowes de 302 directores y vicepresidentes de mercadeo y comunicacio­ nes de mercado, en empresas estadounidenses medianas y grandes, dejó ver que casi 35% dijeron que el correo directo y catálogos eran la forma más eficiente en costo para llegar a sus clientes. Once por ciento dijeron que Internet era el de costo más eficiente. El estudio también mostró que más de 25% dijeron que la mejor forma de aumentar la identidad de marcas era por correo directo o catálogos. ~tas y otras estadísticas reunidas y resumidas en dicho estudio pueden ayudar a quienes toman decisiones a resolver el dilema de encontrar vehiculos eficientes en costo para sus productos.

Estrés en el trabajo Si quienes toman decisiones buscan maneras de reducir gastos de servicio médico entre sus trabaja­ dores, entonces harían bien en enterarse de un estudio hecho a unos 46 mil empleados y dirigido por la Health Enhancement Research Organization. En éste, los investigadores descubrieron que la depre­ sión y el estrés parecen tener mayor impacto en gastos médicos más altos que el alto contenido de azú­ car en la sangre, obesidad o hábito de fumar. El estudio demostró que los trabajadores deprimidos tenían gastos médicos 70% más altos que los no deprimidos, y quienes los que decían estar bajo cons­ tante estrés tenían gastos 46% más altos que sus semejantes libres de él. Por otra parte, los gastos médicos para personas que sufren de alta presión sanguínea eran sólo 11 % mayores que los que no tenian esta enfermedad. Dicha información, junto con otras estadísticas reportadas en este estudio, puede ayudar a quienes toman decisiones para diseñar una estrategia y reducir gastos médicos entre trabajadores.

Page 30: libro.pdf

ce de precios msurnidor 1todoslos nes urbanos i0-2000)

CAPtruLo 1 INTRODUCCIÓN A LA ESTAD!ST!CA 5

Decisiones financieras En un estudio reportado por RHI Management Resources, a los principales oficiales financieros se les preguntó cuál de las siguientes iniciativas pondrían en espera en una economía incierta: 1) expansión, 2) fusión o adquisición, 3) lanzamiento de un nuevo producto o servicio, 4) mejora de tecnología, 5) ninguno de estos factores, y 6) otro. Treinta y dos por ciento de los encuestados indicaron que pon­ drían en espera sus planes de expansión en una economía incierta, seguida por una fusión o adquisición (23%), mejora de tecnología (18%), lanzamiento de un nuevo producto o servicio (10%), ninguno (9%) y otro (8%).

¿Cómo está la economía? Un informe del Wal/ Street loumal, publicado para ayudar a inversionistas y otras personas que toman decisiones para averiguar el estado de Ja economía, incluyó estadlsticas de negocios como son el núme­ ro de ventas de casas nuevas, un Indice de confianza del consumidor, el aumento en porcentaje en el producto interno bruto, el número de solicitudes iniciales de personas sin trabajo, y el porcentaje de desempleo. Estas estadísticas, y otras, pueden servir como indicadores de estados económicos y finan­ cieros por venir y quienes hacen pronósticos pueden usarlas cuando tratan de pronosticar futuros cli­ mas de negocios. La figura 1.1 es una gráfica producida en Excel, del Indice de precios al consumidor para todos los consumidores urbanos cada cinco años por los últimos 40 años. Los datos fueron publi­ cados por el Federal Reserve Bank en St. Louis.

El impacto de la tecnología en el trabajo Greenfield Online dirigió por Internet un estudio de 1 403 encuestados, para la Society of Financia! Service Professionals, para determinar si los usuarios de tecnología aprecian los beneficios de la tecno­ logía más en 2001 que en 1998. Ochenta y siete por ciento de los encuestados en 2001 dijo que la tec­ nología expande el conocimiento relacionado con el trabajo, en comparación con 54% en 1998. Ochenta por ciento en 2001 estuvo de acuerdo con que la tecnología aumenta la productividad durante las horas normales de trabajo, en comparación con 66% en 1998. Ochenta por ciento en 2001 respondió que la tecnología mejora la comunicación con clientes, comparada con sólo 42% en 1998. Cincuenta y cuatro por ciento en 2001 dijo que la tecnología alivia el estrés del trabajo, comparado con sólo 26% en 1998.

En este texto examinaremos diferentes tipos de gráficas para representar datos cuando estudiemos diversas maneras de ordenar o estructurar datos que sean útiles y tengan sentido para quienes toman decisiones. Aprenderemos las técnicas para que el muestreo de una población permita realizar estudios a menor costo y en forma más oportuna en el mundo de los negocios. También vamos a explorar diver­ sas maneras de pronosticar valores futuros y examinar técnicas para pronosticar tendencias. Este texto también incluye numerosas herramientas estadísticas para probar hipótesis y para estimar valores de poblaciones. Éstas y otras estadísticas interesantes, así como sus técnicas estadísticas nos esperan en nuestro viaje por la estadJstica para negocios. Empecemos.

140 ~ o 120 :s E a 100 e o V

80 -¡; o ·¡:¡ 60 ~ c. .,

40 ..., ., V :¡; 20 .s

o 1960 1965 1970 1975 1980 1985 1990 1995 2000

Año

Page 31: libro.pdf

6 ESTADISTICA EN LOS NEGOCIOS

1.2 CONCEPTOS ESTADÍSTICOS BÁSICOS

La estadística, al igual que muchos otros campos de estudio, tiene su propio lenguaje. Es importante empezar nuestro estudio con una introducción de algunos conceptos básicos para comprender el tema y comunicamos. Empecemos con un análisis de la palabra estadística, que tiene varios significados dife­ rentes en nuestra cultura. El Webster's Third New /nternational Dictionary da una definición completa de estadística como una ciencia que se refiere a la acmnulación, análisis, interpretación y presentación de datos numéricos. Vista desde esta perspectiva, la estadística incluye todos los temas presentados en este texto; también es una rama de las matemáticas y la mayor parte de la ciencia estadística está basada en pensamiento y deducción matemáticos. Muchos campos académicos, incluyendo el de negocios, ofre­ cen cursos de estadística dentro de sus propias disciplinas; sin embargo, la estadística se ba convertido en un curso de estudio por derecho propio.

Es frecuente que algunas personas se refieran a la palabra estadística como un grupo de datos. Pueden decir, por ejemplo, que han reunido estadísticas de la operación de su negocio. A lo que se refie­ ren es a datos y cantidades medidas. Los medios de comunicación usan la palabra estadística para refe­ rirse a una muerte; ser una estadística en este sentido de la palabra es obviamente indeseable.

La palabra estadística se usa en por lo menos otras dos formas importantes; primera, puede ser un conjunto de medidas descriptivas calculadas de una muestra y empleadas para hacer determinaciones acerca de una población. Este uso se estudia más adelante en este libro; segunda, pueden ser las distri­ buciones empleadas en el análisis de datos. Por ejemplo, un investigador que utiliza la distribución t para analizar datos puede referirse al empleo del estadístico tal analizar los datos.

Los siguientes son algunos de los usos comunes de la palabra estadística.

l. Ciencia que reúne, analiza, interpreta y presenta datos. 2. Rama de las matemáticas. 3. Curso de estudio. 4. Datos y cifras. 5. Una muerte. 6. Medición de muestra. 7. Tipo de distribución empleada para analizar datos.

El estudio de la estadística se puede organizar en diversas formas. Una de las principales es subdi­ vidirla en dos ramas: estadística descriptiva y estadística inferencia!. Para comprender la diferencia entre estadística descriptiva e inferencia!, son útiles las definiciones de población y de muestra. El Webster's Third New Intemational Dicrionary define población como 1111 conjunto de personas; objetos o artículos de interés. La población puede ser una categoría ampliamente definida, por ejemplo "todos los automóviles" o puede ser estrechamente definida, como "todos los autos Ford Mustang producidos de 1998 a 2002". Una población puede ser un grupo de personas, por ejemplo "todos los trabajadores actualmente empleados por Microsoft", o puede ser un conjunto de objetos, como "todas las lavadoras producidas el 3 de febrero de 2003, por la General Electríc Company en la planta de Louisville". El investigador define a la población como cualquier cosa que estudie. Cuando los investigadores reú11en datos de toda la població11 para una medida de interés determinada, la Uaman censo. Casi todos estamos familiarizados con el censo de Estados Unidos. Cada 10 años, el gobierno trata de medir toda la pobla­ ción que vive en este país. Si un investigador está interesado en averiguar las calificaciones de la Scholastic Aptitude Test (SAT) de todos los estudiantes de la University of Arizona, una forma de hacer­ lo es llevar a cabo un censo de todos los estudiantes que en la actualidad se encuentren inscritos en esa universidad.

Una muestra es una parce del conjunto y, si se toma adecuadamente, es representativa del conjun­ to. Por varias razones (que se explican en el capítulo 7), los investigadores a veces prefieren trabajar con una muestra de la población en lugar de toda la población. Por ejemplo, al realizar experimentos de control de calidad para determinar el promedio de vida útil de bombillas eléctricas, un fabricante de bombillas podría muestrear al azar sólo 75 bombillas durante un lote de producción. Debido a limi­ taciones de tiempo y dinero, un gerente de recursos humanos podría tomar una muestra al azar de 40 empicados en lugar de usar un censo para medir el estado de ánimo de la compañía.

Si un analista de negocios 11tiliw los datos que retí11e 1m grnpo para describir o llegar a condusiones acerca de ese mismo grupo, la estadística se llama estadística descriptiva. Por ejemplo, si un maestro

Page 32: libro.pdf

CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 7

produce estadísticas para resumir el esfuerzo de examen de un grupo y las emplea para llegar a con­ clusiones acerca de sólo ese grupo, las estadísticas son descriptivas. El maestro puede usar estas esta­ dísticas para analizar el promedio del grupo, hablar acerca de los márgenes de calificaciones del grupo, o presentar cualesquiera otras medidas de datos para el grupo con base en la prueba.

La mayor parte de estadísticas deportivas, por ejemplo promedio de bateo, rebotes y primer down son estadísticas descriptivas porque se usan para describir el esfuerzo de un individuo o de un equipo. Muchos de los datos estadísticos generados por negocios son descriptivos. Podrían incluir el número de empleados en vacaciones durante el mes de junio, el promedio de salario en la oficina de Denver, ventas corporativas para 2002, promedio de calificación de satisfacción gerencial sobre un censo de las actitudes de los empleados en la compañía y el promedio de rendimientos sobre inversión para la Lofton Company entre 1988 y 2002.

Otro tipo de estadlstica se denomina estadística inferencial. Si un investigador reúne datos de 11na muestra y utiliza la estadística generada para llegar a conclusiones acerca de la población de la cual se toma la muestra, la estadística es inferencial. Los datos reunidos se emplean para inferir algo acerca de un grupo más grande. Las estadísticas inferenciales se conocen a veces como estadísticas inductivas. El uso e importancia de la estadística inferencia! continúa en crecimiento.

Una aplicación de estadística inferencia! es en investigación farmacéutica. La producción de algu­ nos medicamentos nuevos es costosa para producirlos, por tanto las pruebas deben estar limitadas a muestras pequeñas de pacientes. Con el uso de La estadística inferencial, los investigadores pueden dise­ ñar experimentos con pequeñas muestras de pacientes seleccionadas al azar y tratar de llegar a conclu­ siones y hacer inferencias acerca de la población.

Los investigadores de mercados utilizan estadistica inferencia! para estudiar el impacto de la publi­ cidad en diferentes segmentos del mercado. Supongamos que una empresa fabricante de bebidas gaseo­ sas crea un anuncio publicitario que representa una máquina despachadora que habla al comprador y los investigadores de mercado desean medir el impacto del nuevo anuncio en varios grupos de edades. El investigador podría estratificar la población en categorías de edades que van de jóvenes a viejos, muestrear al azar cada estrato y usar estadística inferencial, para determinar la efectividad del anuncio para los diversos grupos de edades de la población. La ventaja de usar estadística inferencia! es que hace posible que el investigador estudie efectivamente una amplia gama de fenómenos sin tener que lle­ var a cabo un censo. La mayor parte de los temas estudiados en este texto pertenecen a estadística in­ ferencial,

Una medida descriptiva de la población se denomina parámetro. Por lo general los parámetros se denotan con letras griegas. Ejemplos de parámetros son media poblacional (µ.), varianza poblacional (cr2), y desviación estándar de población (o), Una medida descriptiva de una muestra se llama estadís­ tico y suelen denotarse con letras romanas, como la media muestra! (X), varianza muestra! (s2), y des­ viación estándar muestra! (s).

La diferenciación entre los términos parámetro y estadístico es importante sólo con el uso de la estadística inferencial. Un investigador de negocios a veces desea estimar el valor de un parámetro o realizar pruebas acerca del parámetro. Sin embargo, el cálculo de parámetros por lo general es imposi­ ble o no factible debido al tiempo y dinero necesarios para llevar a cabo un censo. En tales casos, el investigador de negocios puede tomar una muestra al azar de la población, calcular un estadistico en la muestra, e inferir por estimación el valor del parámetro. La base para la estadística inferencial, enton­ ces, es la capacidad para tomar decisiones acerca de parámetros sin tener un censo completo de la ~K~ .

Por ejemplo, un fabricante de máquinas lavadoras probablemente desea determinar el número promedio de cargas que una máquina nueva puede lavar antes que necesite reparaciones. El parámetro es la media poblacional o número promedio de lavadas por máquina antes de reparaciones. Un exper­ to en estadística de una compañia toma una muestra de máquinas, calcula el número de lavadas antes de reparar por cada máquina, promedia los números y estima el valor poblacional o parámetro con el uso de la estadística, que en este caso es el promedio muestral, La figura 1.2 demuestra el proceso infe­ rencial,

Las inferencias acerca de parámetros se realizan bajo incertidumbre. A menos que los parámetros se calculen directamente de la población, el experto en estadística nunca sabe con certeza si los estima­ dos o inferencias hechos a partir de muestras son verdaderos. En un esfuerzo por estimar el nivel de confianza en el resultado del proceso, los estadísticos usan expresiones de probabilidad. Por tanto, parte de este texto está dedicado a la probabilidad (capítulo 4).

Page 33: libro.pdf

8 ESTADISTICA EN LOS NEGOCIOS

ifüil¡fli Proceso de estadística inferencia! para estimar la media poblacional (µ)

Población µ

(parámetro) Muestra

i (estadística)

Seleccionar una muestra

al azar

1.3 MEDICIÓN DE DATOS

Millones de datos numéricos se captan todos los días en negocios, los cuales representan miles de ar­ tículos. Por ejemplo, los números representan costos en dólares de artículos producidos, lugares geo­ gráficos de establecimientos de venta al menudeo, pesos de embarques y clasificaciones de subordinados en revisiones anuales. Todos estos datos no deben ser analizados de la misma manera · estadística porque las'entidades representadas por los números son diferentes. Por esta razón, el inves­ tigador de negocios necesita saber el nivel de medición de datos representado por los números que se analicen.

El uso dispar de números se puede ilustrar con los números 40 y 80, que podrian representar los pesos de dos objetos que se embarcan, las clasificaciones recibidas en una prueba al consumidor por dos productos diferentes, o los números en la camiseta de un equipo de fútbol de un defensa y un receptor abierto. Aun cuando 80 libras es el doble de 40 libras, es probable que el receptor abierto no sea del doble del tamaño del defensa. Promediar los dos pesos parece razonable pero promediar los números de las camisetas en fútbol no tiene sentido. Lo correcto del análisis de datos es que depende del nivel de medida de los datos recolectados. El fenómeno representado por los números determina el nivel de medición de datos. A continuación veamos cuatro niveles comunes de medición de datos.

l. Nominal 2. Ordinal 3. Intervalo 4. De razón

Nivel nominal El nivel más bajo de medición de datos es el nivel nominal. Los números que representan datos de nivel nominal (la palabra nivel se omite a veces) se puede usar sólo para clasificar o asignar categorías. Los números de identificación de empleados son un ejemplo de datos nominales. Los números se emplean sólo para diferenciar empleados y no para hacer una exposición del valor de ellos. Numerosas pregun­ tas demográficas de estudios resultan en datos que son nominales debido a que las preguntas se emplean sólo para clasificación. El siguiente es un ejemplo de esta pregunta que resultaría en datos nominales:

¡Cuál de las siguientes clasificaciones de empleo describe mejor su campo de trabajo? a) Educador b) Trabajador de la construcción e) Trabajador de manufacturas d) Abogado e) Doctor f) Otro

Supongamos que, para fines de cómputo, a un educador se asigna un 1, a un trabajador de la cons­ trucción un 2, a un trabajador de manufacturas un 3, y así sucesivamente. Estos números deberían

Page 34: libro.pdf

CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 9

usarse sólo para clasificar personas que respondieron la encuesta. El número J no denota la clasifica­ ción más alta. Se usa sólo para diferenciar un educador (1) de un abogado (4).

Algunos otros tipos de variables que con frecuencia producen datos de nivel nominal son el sexo, religión, grupo étnico, ubicación geográfica y lugar de nacimiento. Los números de seguro social, números telefónicos, números de identificación de empleados y números de código postal son ejem­ plos adicionales de datos nominales. Las técnicas estadísticas que son apropiadas para analizar datos nominales son limitadas, no obstante algunas de las estadísticas más empleadas, por ejemplo la esta­ dística ji cuadrada, se puede aplicar a datos nominales que producen información útil.

Nivel ordinal Una medición de datos de nivel ordinal es más alta que el nivel nominal. Además de las posibilidades del nivel nominal, la medición de nivel ordinal se puede usar para clasificar u ordenar objetos. Por ejemplo, con el uso de datos ordinales, la supervisora puede evaluar tres empleados al clasificar su pro­ ductividad con los números del J al 3. Con datos ordinales, la supervisora podria identificar al em­ pleado más productivo, al menos productivo y a quien está entre los anteriores. No obstante, el supervisor podría no usar datos ordinales para establecer que son iguales los intervalos entre los emple­ ados clasificados 1 y 2 y entre los empleados clasificados 2 y 3; esto es, ella podría no decir que las di­ ferencias en la cantidad de productividad entre los trabajadores clasificados 1, 2 y·3 son necesariamente las mismas. Con datos ordinales, las distancias o separación representadas por números consecutivos no siempre son iguales.

Algunas escalas del cuestionario tipo Likert son consideradas por muchos investigadores como de nivel ordinal. El siguiente es un ejemplo de una de estas escalas: ·

Este material didáctico de computadora es: no útil

modera­ damente

útil 3 4

poco útil

muy útil

extrema­ damente

útil 5 2

Cuando esta pregunta de estudio se codifica para la computadora, sólo permanecerán los riüme­ ros del 1 al 5, no los adjetivos. Prácticamente todos estarán de acuerdo con que 5 es más alto que 4 en esta escala y que es posible clasificar las respuestas, pero la mayoria de quienes responden a la encues­ ta no considerarlan como iguales las diferencias entre no útil, un poco útil, moderadamente útil, muy útil y extremadamente útil.

Los fondos mutuos como inversiones se clasifican a veces en términos de riesgo al usar medidas de riesgo por incumplimiento, monetario y de tasas de interés. Estas medidas de riesgo se aplican a inver­ siones cuando se clasifican como de alto, medio y bajo riesgo.

Ahora bien, si al alto riesgo se le asigna un 3 de calificación, al riesgo medio 2 y al bajo l; por otra parte, si a un fondo se le asigna 3 en lugar de 2, lleva más riesgo, y asl sucesivamente. No obstante, las diferencias en riesgo entre las categorias 1, 2 y 3 no son necesariamente iguales, por lo que estas medi­ das de riesgo son sólo medidas de nivel ordinal. Otro ejemplo del uso de números ordinales en nego­ cios es la clasificación de las 50 compañías más admiradas en la revista Fort11ne. Los números que clasifican a estas empresas son sólo ordinales en su medición. Ciertas técnicas estadísticas son especial­ mente apropiadas para datos ordinales pero otras muchas no son apropiadas para usarse en este tipo de datos.

Debido a que los datos nominales y ordinales se deducen a veces a partir de mediciones impreci­ sas, como las preguntas demográficas, la categorización de personas u objetos, o la clasificación de ar­ tículos, los datos nominale.s y ordinales son datos no métricos y a veces se conocen como datos cualitativos.

Nivel de intervalo La medición de datos de nivel de intervalo es el siguiente al nivel más alto de datos en el qut las distan­ cias entre números consecutivos tienen significado y los datos son siempre n11méricos. Las distancias repre­ sentadas por las diferencias entre números consecutivos son iguales; esto es, los datos de intervalo tienen intervalos iguales. Un ejemplo de medición de intervalo es la temperatura Fahrenheit. Coa números de temperatura Fahrenheit, las temperaturas se puedan clasificar y las cantidades de calor entre lecturas consecutivas, por ejemplo 20º, 21 °y 22º, son las mismas.

Page 35: libro.pdf

~~~~~~~----°"======================!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!m--------------~ 10 ESTADISTICA EN WS NEGOCIOS

Además, con datos de nivel de intervalo, el punto cero es un asunto de convención o conveniencia y no un punto cero natural o fijo. El cero es sólo otro punto en la escala y no significa ausencia del fenó­ meno. Por ejemplo, cero grados Fahrenheit no es la temperatura más baja posible. Algunos otros ejem­ plos de datos de nivel de intervalo son el porcentaje de cambio en empleo, el porcentaje de rendimiento de una acción financiera, y el cambio en dólares en el precio de acciones.

Con datos de nivel de intervalo, convertir las unidades de una medición a otra implica multiplicar por algún factor, a, y sumar otro factor, b, tal que y = b + ax. Como ejemplo, convertir de temperatu­ ra en centígrados a temperatura Fahrenheit hace necesaria la relación:

Fahrenheit = 32 + f centígrados

Nivel de razón La medición de datos de nivel de razón es el nivel más alto de medición de datos. Los datos de razón tie­ nen las mismas propiedades que los datos de intervalo pero los datos de razón tienen un cero absoluto y la razón entre los dos números es significativa. La noción de cero absoluto significa que cero es fijo, y el valor cero en los datos representa la ausencia de la caracterlstica en estudio. El valor de cero no se puede asignar en forma arbitraria porque representa un punto fijo. Esta definición hace posible que el experto en estadística pueda crear razones con los datos.

Ejemplos de datos de razón son la altura, peso, tiempo. volumen y la temperatura Kelvin. Con datos de razón, un investigador puede expresar que 180 libras de peso es el doble que 90 libras, o bien, en otras palabras hacen una razón de 180:90. Muchos de los datos capturados por máquinas en la industria son datos de razones.

Otros ejemplos en el mundo de los negocios, que son nivel de razón en mediciones, son el tiempo de ciclo de producción, tiempo de medición de un trabajo, millas pasajero, número de camiones ven­ didos, quejas por 1 O mil volantes, y número de empleados. Con datos de nivel de razón, no se requiere del factor b para convertir unidades de una medición a otra, esto es, y = ax. Como un ejemplo, al con­ vertir altura de yardas a pies: 1 pie = 3 · yardas.

Debido a que los datos de nivel de intervalo y de razón suelen ser capturados por instrumentos precisos que con frecuencia se emplean en procesos de producción e ingeniería, en pruebas de están­ dares nacionales, o en procedimientos estandarizados de contabilidad, se denominan datos métricos y a veces se conocen como datos cuantitativos.

Comparación de los cuatro niveles de datos La figura 1.3 muestra las relaciones del potencial de uso entre los cuatro niveles de medición de datos. Los cuadros concéntricos denotan que cada nivel más alto de datos puede ser analizado por cualquie­ ra de las técnicas empleadas en niveles inferiores de datos pero, además, puede ser utilizado en otras técnicas estadísticas. Por tanto, los datos de razón pueden ser analizados por cualquier técnica estadís­ tica aplicable a los otros tres niveles de datos más algunas otras.

Los datos nominales son los más limitados en términos de análisis estadísticos que se utilicen con ellos. Los datos ordinales permiten al investigador realizar cualquier análisis que se pueda elaborar con datos nominales y algunos análisis adicionales. Con datos de razón, es posible para un experto en

estadística hacer comparaciones de razón y apropiadamente realizar cualquier análisis posible en datos nominales, ordinales o de inter­ valo. Algunas técnicas estadísticas requieren de datos de razón y no se pueden usar para analizar otros niveles de datos.

Las técnicas estadísticas pueden separarse en dos categorías: estadisticas paramétricas y estadísticas no paramétricas. Las esta­ dísticas paramétricas requieren que los datos sean de intervalo o de razón. Si los datos son nominales u ordinales, deben usarse estadís­ ticas no paramétricas. Las estadisticas no paramétricas también se pueden usar para analizar datos de intervalo o de razón. Este texto se concentra principalmente en estadísticas paramétricas, con excepción los capitulo 12 y 17, que contienen técnicas no paramé- tricas. Por tanto, buena parte del material de este texto requiere que los datos sean datos de intervalo o de razón.

ifüii¡l·ii Uso del potencial de varios niveles de datos

De intervalo

E]

Page 36: libro.pdf

CAPITULO 1 INTRODUCCIÓN A U\ ESTAD!SnCA 11

Continúan presentándose muchos cambios en la industria de la salud. Debido a que hay mayor competencia por atender pacientes entre proveedores y la necesidad de determinar la forma en que éstos pueden servir mejor a sus clientes, administradores de hospitales a veces envían por correo una encuesta de satisfacción de calidad a sus pacientes después que éstos son dados de alta. Los siguientes tipos de preguntas se formulan a veces en las encuestas. ¿En qué nivel de medición de datos resultarán estas preguntas?

1. ¿Hace cuánto tiempo que se dio de alta del hospital? 2. ¿En qué tipo de unidad estuvo la mayor parte de su estancia?

atención coronaria cuidados intensivos maternidad unidád médica unidad pediátrica unidad de cirugía

3. Al seleccionar un hospital, ¿qué tan importante fue la ubicación del mismo? !Circule uno)

Muy Poco · No muy Nada importante importante importante importante

4. ¿Qué tan grave era su estado de salud cuando fue ingresado al hospital? _crítica _grave _moderada

5. Clasifique la capacidad de su médico: _menor

_excelente _mala _muy buena _buena _regular 6. En la siguiente escala de uno a siete, clasifique la atención de enfermeras:

Mala 1 2 3 4 5 6 7 Excelente

Soluci6n

La pregunta 1 es una medición de tiempo con cero absoluto y por tanto es una medición de nivel de razón. Una persona que ha estado fuera del hospital durante dos semanas lo ha estado el doble de tiempo que alguien que ha estado fuera sólo una semana.

La pregunta 2 rinde datos nominales porque al paciente se le pide sólo categorizar el tipo de unidad en que él o ella estuvieron. Esta pregunta no requiere jerarquía o clasificación del tipo de la unidad. Es probable que las preguntas 3, 4 y 5 resulten en datos de nivel ordinal. Suponga­ mos que se asigna un número a los descriptores en cada una de estas tres preguntas. Para la pregunta 3, a "muy importante" podría asignarse un 4, a "poco importante" un 3, a "no muy importante" un 2, y a "nada importante" un 1. Ciertamente, cuanto más alto el número, más im­ portante es la ubicación del hospital. Por tanto, estas respuestas se pueden clasificar por selec­ ción. No obstante, los aumentos en importancia de 1 a 2 a 3 a 4 no son necesariamente iguales. Esta misma lógica se aplica a los valores numéricos asignados en las preguntas 4 y 5.

La pregunta 6 muestra siete opciones numéricas con iguales distancias entre los números mostrados en la escala, y no se asignan adjetivos descriptivos a los números. Muchos investi­ gadores dirían que esto es una medición de nivel de intervalo debido a la distancia igual entre números y la ausencia de un cero verdadero en esta escala. Otros investigadores podrían argüir que por la imprecisión de la escala y lo vago de los valores de selección entre "malo" y "exce­ lente", la medición es sólo ordinal en su nivel.

Análisis estadístico usando la computadora: Excel y MINITAB El advenimiento de la computadora moderna abrió numerosas y nuevas oportunidades para el análi­ sis estadístico. La computadora permite almacenar, recuperar y transferir grandes conjuntos de datos. Además, el programa de la computadora se ha perfeccionado para analizar datos por medio de refinadas técnicas estadísticas. Algunas de las técnicas estadísticas ampliamente usadas, por ejemplo la regresión múltiple, son tan tediosas y lentas de calcular en forma manual que fueron de poco uso práctico para investigadores antes de que se perfeccionaran las computadoras.

Page 37: libro.pdf

12 ESTADISTICA EN LOS NEGOOOS

Los expertos en estadística de negocios emplean muchos de los populares paquetes de software de estadística, incluyendo el M!NJTAB, SAS y SPSS. Muchos paquetes de software de hojas de cálculo de computadora también tienen capacidad de analizar datos estadlsticamente. En este texto, la salida estadística de computadora presentada es del MIN!TAB y del software Microsoft Excel.

La estadística describe el estado de los negocios . en zonas rurales de la India

En el Dilema de decisión, muchas estadísticas se reportaron acerca de la India rural, su potencial como mercado, y de sus ventas. Se reportó el promedio anual de consumo de pasta dentífrica por persona. Se dan porcentajes que describen características demográficas de la India rural, incluyen porcentajes de analfabetismo y posesión de comodidades domésticas. Los autores de las fuentes de donde se tomaron datos del Dilema de decisión nunca expresan si las cifras son en realidad tomadas de un censo de pobla­ ción o son cálculos tomados de una muestra de estas personas. Si las cifras provienen de un censo, enton­ ces los totales, promedios y porcentajes presentados en el Dilema de decisión son parámetros. Debido a que el gobierno a veces lleva a cabo censos, estos datos podrían ser parámetros. No obstante, con más frecuencia, se recolectan datos de muestras de personas o cosas.

En muchos países, los investigadores tienen la posibilidad de reunir datos útiles y relativamente precisos al tomar una muestra bien planeada que es representativa de la población. Los datos resultan­ tes son analizados y producen estadísticas que, a su vez, se pueden usar para estimar parámetros de población. Este proceso es inferencia!. Diversas razones harían preferible el uso de un proceso inferen­ cia! a llevar a cabo un censo. En el capitulo 7 vamos a explorar el uso del muestreo con mayor detalle.

En esta situación particular, para hacer ventas en zonas rurales de la India, los investigadores po­ drlan ser enviados a regiones representativas de la India rural y realizar un estudio de consumidores acerca de su estado económico, posesiones, caracterlsticas personales y familiares, usos de consumo de productos y su voluntad para expandir sus compras. Podría reunirse una amplia variedad de estadís­ ticas que representen varios niveles de datos. Por ejemplo, podrlan obtenerse mediciones de nivel de razón de cosas como el ingreso, número de hijos, edad del padre de familia, número de cabezas de ganado, valor de su casa o tierras, y gramos de pasta dentlfrica consumida por año. En algunos ejem­ plos, se usan escalas Likert (mediciones de 1 a 5) para obtener respuestas acerca de intereses y cosas

•;m.1mw1H•·flllHiil·}l.11¡¡.1 • ._ _, Crece el uso de la comunicación inalámbrica en Estados Unidos Según un estudio semestral de la industria de comunica­ ciones de la Cellular Telecommunications & Internet Asso­ ciation, más de 11 O millones de clientes en Estados Unidos usaron teléfonos celulares en el año 2001. Esta cifra repre­ sentó un crecimiento de casi 28% desde que terminó 1999. No sólo hubo más personas que usaron aparatos inalám­ bricos, sino que también lo hicieron con más frecuencia. El promedio de duración de una U amada en 2001 fue de 3 minutos en comparación con 2 minutos y 38 segundos al término de 1999. El promedio de la cuenta mensual por el uso del inalámbrico, que refleja este aumento en uso, pasó de $41.24 a $45.27 en el mismo periodo de un año.

Los ingresos totales para empresas operadoras de ina­ lámbricos en Estados Unidos llegaron a $50 mil millones para el afio 2000. Los ingresos por roaming (unidad fuera de

área asignada) bajaron, lo cual refleja la continua expansión de la red. A medida que las empresas de telefonla expanden sus territorios cubiertos, los ingresos por roaming bajan porque los usuarios están en la red con más frecuencia.

¿Qué pasará con el uso del inalámbrico en el futuro? A medida que el mercado sea más maduro, ¿se nivelará su uso? Factores como la preocupación por la seguridad pública, leyes para conductores de vehículos, seguridad per­ sonal o los debates de etiqueta ¿podrán contener el uso de aparatos inalámbricos? Éstas y otras preguntas se pueden manejar mediante la recolección y análisis de estadísticas para negocios.

Futnt~ adaptado de "No Slump in U.S. Wireless Usage"; al/NetDil-ica, 27 April 2001, http://www.allnetdevicu.com/wirelesslnews/2001/04/27/ no_slump.html

Page 38: libro.pdf

CAPITULO 1 INTROOUCCIÓN A LA ESTADISTICA 13

CONSIDERACIONES ÉTICAS Con la abundancia y proliferación de datos estadísticos, el mal uso de la estadística en el manero de negocios es un problema. Es, en efecto, un comportamiento no ético en negocios, emplear estadlsticas fuera de contexto. Las personas no éticas en negocios podrían usar sólo datos selec­ tivos de estudios para subrayar su punto de interés, omitiendo estadísticas de los mismos estu­ dios que discuten contra su caso. Los resultados de estudios estadísticos se pueden expresar mal o exagerar para ganar un favor.

En este capitulo se hizo notar que si los datos son nominales u ordinales, entonces sólo esta­ dísticas no paramétricas son apropiadas para su análisis. El uso de estadísticas pararnétricas para analizar datos nominales y/u ordinales es erróneo y podría ser considerado bajo algunas circuns­ tancias como no ético.

En este texto, cada capítulo contiene una sección sobre ética que analiza la forma en que los negocios pueden dar mal uso a las técnicas presentadas en el capítulo en una forma no ética. Como usuarios y productores, los estudiantes de administracion de negocios necesitan estar conscientes de potenciales problemas éticos que pueden ocurrir con la estadística.

semejantes, con lo cual se produce un nivel ordinal de mediciones. Por razones de privacidad, algunos temas de preguntas como la edad o ingreso se expresan en rangos de clase que también resultan en un nivel ordinal de medición. Además, a los habitantes de zonas rurales de la India se les puede pedir que clasifiquen diversos productos en términos de cuáles serla más probable que compraran, lo que darla datos ordinales. Otras variables como son la ubicación geográfica, afiliación a un partido político, ocu­ pación y religión resultarían en datos nominales.

La decisión para entrar al mercado de la India rural no es sólo una decisión de mercadeo. Com­ prende la capacidad de producción y problemas de fechas de entrega, dificultades en transportes, compromisos financieros, crecimiento gerencial o reasignación, problemas de contabilidad (la conta­ bilidad para la lndia rural puede diferir de las técnicas empleadas en mercados tradicionales), sistemas de información y otros campos relacionados. Con tanto en la línea, quienes toman decisiones en la compañia necesitan tanta información relevante disponible como sea posible. En este Dilema de deci­ sión, es obvio para quien tome decisiones que la lndia rural es todavía muy pobre y analfabeta. Su capa­ cidad como mercado es grande. Las estadlsticas en las crecientes ventas de algunos productos de cuidado personal parecen promisorias. ¡Cuáles son los pronósticos futuros para el poder adquisitivo del pueblo en la India rural? ¡Problemas culturales importantes bloquearán la adopción de los tipos de productos que las compañías desean vender alú? Las respuestas a éstas y muchas otras interesantes y útiles preguntas se pueden obtener con el correcto uso de la estadlstica. Los 750 millones de personas que viven en la India rural representan el segundo grupo más grande de personas en el mundo. Ciertamente, es un segmento de mercado digno de más estudio.

RESUMEN

La estadística es una importante herramienta para Ja toma de decisiones en negocios y se utiliza en prácticamente todos los campos de negocios. La palabra estadlstica tiene muchas con­ notaciones. Entre los significados más comunes de la palabra están: 1) la ciencia que reúne, analiza, interpreta y presenta datos, 2) una rama de las matemáticas, 3) un curso de estudio, 4) datos y cifras, 5) una muerte, 6) medición de muestra y 7) tipo de distribución empleada para analizar datos. Las es­ tadisticas se utilizan ampliamente en negocios e incluye las disciplinas de contaduría, ciencias de toma de decisiones, eco­ nomía, finanzas, administración, sistemas de administración de información, mercadeo y producción.

El estudio de estadísticas puede subdividirse en dos cate­ gorías principales: estadística descriptiva y estadlstica i11feren­ cial. La estadística descriptiva resulta de recolectar datos de un cuerpo, grupo o población y llegar a conclusiones sólo acerca de ese grupo. La estadística inferencia! se genera a partir del proceso de recolectar datos muestrales de un grupo, cuerpo o población y llegar a conclusiones acerca del grupo más gran­ de del cual se tomó la muestra.

El tipo apropiado de análisis estadlstico depende del nivel de medición de datos, que puede ser 1) nominal, 2) ordinal, 3) i11tervalo o 4) de razón. El nominal es el nivel más bajo, que representa la clasificación de sólo datos tales como la ubica-

Page 39: libro.pdf

14 ESTADISTICA EN LOS NEGOCIOS

ción geográfica, sexo o número de seguro social. El siguiente

nivel es ordinal, que produce mediciones de ordenamiento de

rango en el que los intervalos entre números consecutivos no necesariamente representan distancias iguales. El de intervalo es el siguiente nivel más alto de medición de datos en el que las distancias representadas por números consecutivos son iguales. El nivel más alto de medición de datos es el de razón, que tiene todas las cualidades de medición de intervalo, pero los datos de razón contienen un cero absoluto y las razones entre números tienen significado. Los datos de intervalo y de

razón a veces se llaman métricos o datos cuantitativos. Los datos nominales y ordinales a veces se conocen como daros no métricos o cualitativos.

Los tipos principales de estadística inferencia! son 1) esta­ dística paramétrica y 2) estadística 110 paramétrica. El uso de estadística paramétrica requiere datos de intervalo o de razón y ciertas suposiciones acerca de la distribución de los datos. Las técnicas presentadas en este texto son principalmente paramétricas. Si los datos son sólo nominales u ordinales en nivel, deben usarse estadísticas no paramétricas.

TÉRMINOS CLAVE

censo datos de nivel ordinal estadística descriptiva estadlstica paramétrica datos a nivel de intervalo datos métricos estadística inferencia! muestra datos a nivel de razón datos no métricos estadísticos parámetro datos de nivel nominal estadístico estadística no paramétrica población

PROBLEMAS COMPLEMENTARIOS

1.1 Dé un ejemplo especifico de los datos que podrían ser reunidos de cada una de las siguientes disciplinas de negocios: contaduría, finanzas, recursos humanos. rner­ cadotecnía, sistemas de información, producción y admi­ nistración. Un ejemplo en el campo de la mercadotecnia podría ser "número de ventas por mes por cada vende­ dor".

1.2 Exprese ejemplos de datos que pueden reunirse para fines de toma de decisiones a partir de cada una de las siguien­ tes industrias: manufactura, seguros) viajes, ventas al menudeo, comunicaciones, computación, agricultura, banca y servicios de salud. Un ejemplo en la industria de viajes podría ser el costo de un viaje de negocios por dla en varias ciudades de Europa.

1.3 Dé un ejemplo de estadística descriptiva en la industria de música grabada. Dé un ejemplo de la forma en que la estadística inferencia/ podrían usarse en la industria de la música grabada. Compare estos dos ejemplos. ¡Qué hace la diferencia?

1.4 Supongamos que el estudiante es gerente de operaciones de una planta que manufactura baterías. Dé un ejemplo de cómo podría usar la estadística descriptiva para tomar mejores decisiones gerenciales. Dé un ejemplo de cómo podría usar la estadística inferencia/ para tomar mejores decisiones gerenciales.

1.5 Clasifique cada uno de los siguientes datos como nomi­ nales, ordinales, de intervalo o de razón.

a. El tiempo necesario para producir cada neumático en una linea de ensamble.

b. El número de cuarto de galón de leche que una fami- 1 ia consume en un mes.

c. La clasificación de cuatro máquinas en su planta des­ pués que se les ha designado como excelente, buena, satisfactoria y mala.

d. La clave de larga distancia automática de clientes en Estados Unidos.

e. La edad de cada uno de sus empleados.

f. Las ventas en dólares en el restaurante local de pizzas cada mes.

g. El número de identificación de un empleado.

h. El tiempo de respuesta de una unidad de emergencia

1.6 Clasifique cada uno de los siguientes datos como nomi­ nal, ordinal, de intervalo o de razón.

a. La clasificación de una compañia hecha por Fortune 500.

b. El número de billetes vendidos en un cine en una noche cualquiera.

c. El número de identificación en un cuestionario. d. Ingreso per cápita,

e. El saldo comercial en dólares. f. Clase socioeconómica (baja, media, alta). g. . Pérdidas o ganancias en dólares. h. Identificación de impuesto de una compañía i. Clasificación de bonos de la Standard & Poor's de ciu-

dades con base en las siguientes escalas:

Page 40: libro.pdf

Oasificación Calificación/tipo

Calidad más alta

Calidad alta

Calidad media alta

Calidad intermedia

Poco especulativa

Calidad baja, especulativa

Calificación baja, posible incumplimiento

Calificación baja, posible recuperación parcial

Incumplimiento, recuperación improbable

AAA

AA

A BBB BB B

ccc

ce

e

1.7 La Rathburn Manufacturing Company produce conduc­ tores eléctricos, que vende a contratistas en la industria de

CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 15

la construcción. Aproximadamente 900 contratistas eléc­ tricos compran alambre anualmente a Rathburn. El director de mercado de Rathburn desea determinar la satisfacción de estos contratistas con el alambre de Rathburn, Él elaboró un cuestionario que da una califica­ ción de satisfacción entre 1 O y 50 para participantes que respondan a esta encuesta. A una muestra aleatoria de 35 de los 900 contratistas se les pidió contestar y llenar una encuesta de satisfacción. Las calificaciones de satisfacción para los 35 participantes se promedian para obtener una calificación media de satisfacción. a. ¡Cuál es la población para este estudio? b. ¡Cuál es la muestra para este estudio? c. ¡Cuál es la estadistica para este estudio? d. ¡Cuál seria un parámetro para este estudio?

ANÁLISIS DE LA BASE DE DATOS

Se pueden usar siete bases de datos principales para aplicar las técnicas presentadas en este curso. Estas bases de datos se encuentran en el CD-ROM que acompaña a este texto, y cada una de estas bases de datos se encuentra ya sea en formato ~UNITAB o Excel para mayor comodidad. Estas siete bases de datos representan una amplia variedad de campos de acción de negocios, por ejemplo el mercado de acciones, manufactu­ ra, mano de obra internacional, finanzas, energía, atención médica y agroindustrias. En conjunto, estas bases de datos contienen 56 variables y 8 350 observaciones. Los datos se recolectan de fuentes confiables como lo es la Oficina del Trabajo, la Casa de Bolsa de Nueva York, el U.S. Department of Agriculture, el Moody's Handbook of Common Stocks, la American Hospital Association y el U.S. Census Bureau. Cuatro de las bases contienen datos de series de tiempo que pueden ser especialmente útiles para pronósticos y análisis de regresión. A continuación se encuentra una descripción de cada una de las bases, junto con información que puede ser útil al estudiante para interpretar resultados.

Base de datos del mercado de acciones

La base de datos del mercado de acciones contiene ocho varia­ bles relativas al New York Stock Exchange. Tres observaciones por mes durante nueve años da un total de 324 observacio­ nes por variable. Las variables incluyen el Composite lndex, Industrial Index, Transportation Jndex, Utility Index, Stock Volume, Reported Trades, Dollar Value y Warrants Volumen. El Dollar value (valor del dólar) se reporta en unidades de millones de dólares. Al reconocer que el tiempo del mes puede hacer una diferencia en el valor de la observación, cada varia­ ble contiene una observación del día diez de cada mes, o cerca de este día, denotado en la base de datos como 1 bajo la varia­ ble Parte del Mes, una observación del día 20 del mes denota-

do como 2, o cerca de este dia, y una observación del día 30 del mes denotado como 3. Esta base de datos fue elaborada a par­ tir de datos mostrados en el Internet por la New York Stock Exchange. Es posible tener acceso a los datos originales en Ja Data Library en http://www.nyse.com/marketinfo/marketin­ fo.html bajo el titulo NYSE Statistics Archive.

Base de datos de manufactura

Esta base de datos contiene ocho variables tomadas de 20 industrias y 140 subindustrias en Estados Unidos. La fuente de la base de datos es la 1996Annual Survey of Manufactures, que es publicado por el Census Bureau del U.S. Departrnent of Commerce. Algunas de las industrias son productos alimenti­ cios, productos textiles, muebles, productos químicos, pro­ ductos de caucho, metales primarios, maquinaria industrial y equipo de transporte. Las ocho variables son Número de empleados, Número de trabajadores de producción, Valor agregado por manufactura, Costo de materiales, Valor de em­ barques de la industria, Gastos nuevos de capital, Inventarios de fin de año, y Grupo industrial. Dos variables, Número de empleados y Número de trabajadores de producción, están en unidades de mil. Cuatro variables, Valor agregado por manu­ factura, Costo de materiales, Gastos nuevos de capital, e In­ ventario de fin de año, están en unidades de millones de dólares. La variable Grupo industrial consta de números del l al 20 para denotar el grupo industrial al cual pertenece la subindustria en particular. Valor de Embarques de Industria se ha recodificado a la siguiente escala de l a 4.

1 = $0 a $4.9 mil millones 2 = $5 mil millones a $13.9 mil millones 3 = $14 mil millones a $28.9 mil millones 4 = $29 mil millones o más

Page 41: libro.pdf

16 ESTADISTICA EN LOS NEGOCIOS

Base de datos de mano de obra internacional

Esta base de datos de series de tiempo contiene los porcenta­ jes de desempleo civil en siete paises presentados anualmente entre 1959 y 1998. Los datos son publicados por la Bureau of Labor Statistics del U.S. Department of Labor. Los paises son Estados Unidos, Canadá, Australia, Japón, Francia, Alemania e Italia.

Base de datos financiera

La base de datos financiera contiene observaciones sobre ocho variables para 100 compañías, Las variables son tipo de indus­ tria, ingresos totales ($ millones), activos totales ($ millones), rendimiento sobre acciones (%), ganancias por acción ($), promedio de rendimiento (%), dividendos por acción ($), y razón entre precio promedio por utilidades (P/E). Los datos fueron tomados del Moody's Handbook of Common Stocks (verano 1998). Las compañías representan siete tipos diferen­ tes de industrias. La variable tipo muestra el tipo de industria de una compañia como:

1 =vestido 2 = productos químicos 3 = energía eléctrica 4 = abarrotes 5 = productos para atención médica 6 =seguros 7 =petróleo

Base de datos de energía

La base de datos de energ!a consta de datos sobre siete varia­ bles de energía en un periodo de 26 años. La base de datos está adoptada del Monthly Energy Review, February 1999 (Office of Energy Markets and End Use, Energy lnformation Admi­ nistration, U.S. Departrnent ofEnergy). Las siete variables son World Crude Oil Production (millones de barriles por día), U.S. Energy Consumption (trillones de BTUs por año), U.S. Nuclear Electricity Gross Generation (miles de millones de kilowatt-horas), U.S. Coa! Production (millones de toneladas cortas), U.S. Fue! Rate for Automobiles (millas por galón) y Cost ofUnleaded (regular) Gasoline (U.S. promedio en la ciu­ dad).

Base de datos de hospital

Esta base de datos contiene observaciones para 11 variables en hospitales de Estados Unidos. Estas variables comprenden la Geographic Region, Control, Service, Number of Beds, Num­ ber of Admissions, Census, Number of Outpatients, Number of Births, Total Expenditures, Payroll Expenditures, y Person­ nel. La información para estas bases de datos se toma de la American Hospital Association Guide to the Health-Care Field, edición 1998-99, publicada en Chicago, lllinois.

La variable de región está codificada de 1 a 7, y los núme­ ros representan las siguientes regiones.

1 =Sur

2 =Noreste 3 = Medio Oeste 4 =Suroeste 5 = Montañas Rocallosas 6 = California 7 =Noroeste

El control es un tipo de propiedad. Cuatro categorlas de control están incluidas en la base de datos:

1 = gobierno, no federal 2 = no gobierno, no con fines de lucro 3 = con fines de lucro 4 = gobierno federal

El servicio es el tipo de hospital. Los dos tipos de hospita- les empleados en esta base de datos son:

1 = medicina general 2 = psiquiatría

Las variables del total de gastos y nómina están en unida­ des de $1 000.

Base de datos de series de tiempo de agroindustria

La base de datos de series de tiempo de agroindustria contie­ ne el peso mensual (en mil libras) de propiedades de almace­ namiento en frío para seis legumbres diferentes y para legumbres totalmente congeladas en un periodo de 14 años. Cada una de las siete variables representa 168 meses de datos desde 1984 a 1997. Las seis legumbres son judías verdes, bró­ coli, zanahorias, maiz, cebollas y chícharos. Los datos están publicados por la National Agricultural Statistics Service del U.S. Department of Agriculture.

Utilice la base de datos para contestar las siguientes pre­ guntas.

l. En la base de datos de manufactura, ¿cuál es el nivel de datos para cada una de las siguientes variables? a. Número de trabajadores de producción b. Costo de materiales c. Valor de embarques de la industria d. Grupo de industria

2. En la base de datos de hospital, ¿cuál es el nivel de datos para cada una de las siguientes variables? a. Región b. Control c. Número de camas d. Personal

3. En la base de datos financiera, ¿cuál es el nivel de datos para cada una de las siguientes variables? a. Tipo de industria b. Total de activos c. Razón P/E

Page 42: libro.pdf

l CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 1;

CASO: DIGIORNO PIZZA: INTRODUCCIÓN DE UNA PIZZA CONGELADA PARA COMPETIR CON LAS PIZZAS PARA LLEVAR

hlaft's DiGiorno Pizza llegó al mercado. DiGiorno gran éxito con ventas de $120 millones el primer

O. $_00 millones el siguiente. No fue suerte ni coinciden­ ª DíGíomo Pizza tuviera un éxito instantáneo. Antes de p:=.~ ~ publico Kraft llevó a cabo una extensa investiga-

& ::xrcado. Numerosas preguntas tuvieron que contes­ a:s;e &:::es que Kraft iniciara la producción. Por ejemplo, ¿por

d p6hLco consume pizzas], ¿cuándo comen pizzasi, ¿creen GCSmJUdorcs que las pizzas para llevar son siempre más

0-Alcott realizó un estudio de investigación para Kraft · ¿que enviaron 1 000 encuestas para quienes gustan de pi­

=. loo resultados indicaron que el público consume pizza ~ocasiones sociales divertidas, o en casa, cuando nadie ~ axinar. El público utilizó pizzas congeladas principal­ ~ por comodidad pero seleccionaba pizzas para llevar

nrias otras razones, incluyendo calidad y no tener que c:cmr. El Loran Marketing Group se concentró en grupos i?E2 K.~ con mujeres entre 25 y 54 años. Lo que encontraron Óis3ostró que las personas consumen pizzas congeladas por ~d pero deseaban que tuvieran el gusto de las pizzas ¡;:z::z rar, Para satisfacer estas metas aparentemente diver­ g::::es comodidad y gusto), Kraft creó la Pizza DiGiomo, la

se infla en el horno cuando se cocina. Esto impresionó a ::uanbros del grupo, y en una serie de pruebas de gusto

t ~llevada a cabo por Product Dynamics, DiGiorno Pizza ~ a todas las pizzas congeladas y terminó en segundo

_ • sólo detrás de una marca para llevar. Por medio de publicidad Kraft pudo superar dos proble­

~ qae surgieron por la investigación de mercado: el público taifa problemas para pronunciar DiGiorno y necesitaban estar

::ftllcidos de que la pizza congelada en realidad tiene buen abar. Kraft hizo repetir el nombre DiGiorno varias veces en a:::mcios para asegurarse que los consumidores podlan pro- =iar el nombre. Como subproducto, los anuncios también ~n fuerte identificación de la marca. Además, los aauncios destacaron el sabor de recién horneada y el aspecto de rosca inflada del producto, lo cual ayudó a convencer al réblico de la más alta calidad del sabor de DiGiorno.

DiGiorno Pizza, en la actualidad tiene 13% del mercado & Estados Unidos, de $2.3 mil millones de la categorfa de pi­ zzas congeladas. Es el producto Kraft de más rápida crecimien­ llD al romper la barrera de los $200 millones.

Análisis

Piense en la investigación de mercado que fue realizada por Kraft y en el hecho de que usaron diferentes compañías. Si el

lector estuviera a cargo de llevar a cabo esta investigación para ayudar a lanzar ese nuevo producto, ¿qué decisiones tomarla usted acerca de a quién entrevistar, dónde y cuándo hacer la encuesta, y qué medir?

l. ¿Cuáles son algunas de las poblaciones en las que Kraft pudo estar interesado en usar estos estudios? ¿Trató Kraft en realidad de hacer contacto con todas las poblaciones? ¿Qué muestras se tomaron? En vista de estas dos preguntas, ¡cómo es que Kraft utilizó el proceso inferencia! en su investigación de mercado? ¡Puede usted considerar otra estadística descriptiva que pudiera usar Kraft en el proceso de toma de decisión?

2. En los diversos esfuerzos de investigación de mercado por Kraft para DiGiorno, algunas de las posibles medidas apa­ recen en la lista siguiente y clasiñquelas por nivel de datos. Considere algunas otras medidas que los investigadores de Kraft pudieran usar para este trabajo de investigación y cla­ siñquelas por nivel de datos. a. Número de pizzas consumidas por semana por casa. b. Edad del comprador de pizzas. c. Código postal de quien respondió a la encuesta. d. Dólares gastados por mes en pizzas por persona. e. Tiempo entre compras de pizzas. f. Clasificación del gusto de una marca dada de pizzas en

una escala de 1 al 1 O, donde 1 es muy mal sabor y 10 es un sabor excelente.

g. Clasificación del sabor de cuatro marcas de pizzas en una prueba degustación.

h. Número que represente la ubicación geográfica de quien respondió a la encuesta

i. Clasificación de calidad de una marca de pizza como excelente, buena, promedio, abajo del promedio, mala.

j. Número que represente la marca de pizza que se evalúe. k. Sexo de quien respondió a la encuesta.

Fu<nt<: adaptado de "Upper Crusr'; Amtrican D<magraphia, mano de 1999, p. 58; Marketwatch~News That Matters sitios Web, "'What's in a Name? Brand E.xtension Pctential" y "'OiGiorno Rising Crust Delivers $200 Million .. , antes en http://www.foodexplon:r.com/BUSINESS/ProduCU/MarketAnalysi>/ PF02896b. btm, último acceso en 1999.

Page 43: libro.pdf

CAPÍTULO 2

Tablas y gráficas

18

OBJETIVOS DE APRENDIZAJE El objetivo general del capítulo 2 es que el estudiante domine varias técnicas para resumir y representar datos, con le que podrá: l. Reconocer la diferencia entre datos agrupados y no agrupados. 2. Construir una distribución de frecuencia. 3. Construir un histograma, un polígono de frecuencia, una ojiva, una gráfica de

pastel, una gráfica de tallo y hoja, una gráfica de Pareto y una gráfica de dispersión.

Page 44: libro.pdf

Estado de la manufactura de autos

Según los datos publicados por el Automotive News Data Center, General Motors Corporation es la número uno en el mundo en ventas totales de autos y camiones ligeros. Ford Motor Company es la nú­ mero dos seguida por Toyota Motor Corporation y Volkswagen, respectivamente. Entre 1999 y 2000, General Motors mantuvo su posición número uno, vendiendo casi 200 000 autos menos en todo el mundo. Durante este mismo periodo, Ford Motor aumentó ventas en más de 200 000. El crecimiento de mayor porcentaje de 1999 a 2000 fue para PSA Peugeot-Citroen, que aumentó ventas en 14.2%. A continuación veamos las cifras mundiales de ventas para los JO principales fabricantes de autos y camiones ligeros para 1999 y 2000.

Compañía 1999 2000 %de cambio

General Motor 8 786 000 8 591 327 -2.2

Ford Motor 7 148 000 7 350 495 2.8

Toyota Motor 5 359 000 5 703 446 6.4

Volkswagen 4 860203 5 161188 6.2

DaimlerChrysler 4 864 500 4 749000 -2.4

PSA Peugeot-Citroen 2 519 600 2 877 900 14.2

Fiat 2 521 000 2 646 500 5.0

Hyundai Motor 2 600 862 2 634 530 1.3 Nissan Motor 2 567 878 2 629 044 2.4

Honda Motor 2 395 000 2 540000 6.1

Preguntas gerenciales y estadísticas

Supongamos que el lector es analista de negocios para una de estas compañías. Su gerente le pide que elabore un breve reporte que muestre el estado de ventas de autos y camiones ligeros en todo el mundo. Usted debe comparar la posición de su compañía con otras empresas.

l. ¡Cuál es la mejor forma de expresar los datos de ventas en un reporte? ¡Son suficientes los datos sin procesar? ¡Puede usted en efecto exhibir la información gráficamente?

2. Supongamos que DaimlerChrysler toma al azar muestras de 40 distribuidores y descubre que los siguientes datos indican cuántos autos y camiones ligeros se vendieron en estas distribuido­ ras el mes pasado. ¡Puede usted resumir estos datos en un reporte? 34 58 40 49 49 57 44 57 69 45 64 31 47 30 44 44 SI 65 60 65 61 62 68 43 66 63 44 34 57 44 67 614767 52 34 58 59 45 33

3. ¡Cómo podría usted representar gráficamente los datos de 1999 contra los datos de 20001

F11tt1tt: adaptado de Automotivc Ncws Data Cerner, "Top 1 O Auto Manufacturers", Ad Age Almariac, 31 de diciembre de 2001, p. 23.

19

Page 45: libro.pdf

20 ESTADISTICA EN LOS NEGOCIOS

TABLA 2.1

Porcentajes de desempleo en Francia en 40 años (datos no agrupados)

1.6 2.1 4.2 8.6 9.6

1.5 2.7 4.6 JO.O 10.4 1.2 2.3 5.2 10.S 11.8 1.4 2.5 5.4 10.6 12.3 1.6 2.8 6.1 10.8 11.8 1.2 2.9 6.5 I0.3 12.5 1.6 2.8 7.6 9.6 12.4 1.6 .2.9 8.3 9.1 11.8

En los capítulos 2 y 3 se presentan diversas técnicas para reformar o reducir datos y que éstos sean más manejables y se puedan usar para ayudar de manera más eficiente a quienes toman decisiones. Dos técnicas para agrupar datos son la distribución de frecuencia y la gráfica de tallo y hoja que en este capítulo se presentan. Además, en el capítulo 2 se estu­ dian y exhiben varias herramientas gráficas para resumir y representar datos, incluyendo histogramas, polígono de frecuencia, ojiva, gráfica de pastel y gráfica de Pareto para datos de una variable, y la gráfica de dispersión para datos numéricos de dos variables. Con el uso de éstas y otras técnicas, quienes toman decisiones pueden empezar a "echar mano" de la información contenida en los datos y usar éstos para mejorar el proceso de toma de deci­ siones.

Los datos sin procesar, o datos que 110 han sido resumidos en ninguna forma, se conocen a veces como datos no agrupados. La tabla 2.1 contiene datos sin procesar de los porcen­ tajes de desempleo en Francia en más de 40 años. Los datos que se han organizado en una distribución de frecuencia se denominan datos agrupados. La tabla 2.2 presenta una distri­ bución de frecuencia para los datos mostrados en la tabla 2.1. La distinción entre datos no agrupados y agrupados es importante porque los cálculos de estadística difieren entre los dos tipos de datos. Este capitulo se concentra en organizar datos no agrupados y mostrar­ los gráficamente.

2.1 DISTRIBUCIONES DE FRECUENCIA

Una herramienta particularmente útil para agrupar datos es la distribución de frecuencia, que es un resumen de datos presentados en la forma de intervalos y frecuencias de clase. ¿Cómo se construye una distribución de frecuencia a partir de datos sin procesar? Esto es, ¿cómo se construyen distribuciones de frecuencia -<0mo la que se ilustra en la tabla 2.2- a partir de datos sin procesar como los de la tabla 2.1? Las distribuciones de frecuencia son relativamente fáciles de construir. Aun cuando algunas directrices y reglas prácticas ayudan en su construcción, las distribuciones de frecuencia varlan en su forma final y diseño, aun cuando los datos sin procesar originales sean idénticos. En cierto sentido, las distribuciones de frecuencia se construyen según el gusto individual de los investigadores de negocios.

Cuando se construya una distribución de frecuencia, el investigador de negocios debe determinar primero el rango de los datos sin procesar. El rango se define a veces como la diferencia entre los núme­ ros más grande y más pequeño. El rango de los datos de la tabla 2.1 es 11.3 (12.5-1.2).

El segundo paso en construir una distribución de frecuencia es determinar cuántas clases conten­ drá. Una regla práctica es seleccionar entre S y 15 clases. Si la distribución de frecuencia contiene muy pocas clases, el resumen de datos puede ser demasiado general para ser útil. Muchas clases pueden resultar en una distribución de frecuencias que no agrega los datos suficientes para ser útil. El número final de clases es arbitrario. El investigador de negocios llega a un número si examina el rango y deter­ mina el número de clases que abarcará el rango en forma adecuada y también que sea significativo para el usuario. Los datos de la tabla 2.1 se agruparon en seis clases para la tabla 2.2.

Después de seleccionar el número de clases, el investigador de negocios debe determi­ nar el ancho del intervalo de clase. Una aproximación del ancho de clase se puede calcular al dividir el rango entre el número de clases. Para los datos de la tabla 2.1, esta aproxima­ ción serla 11.3/6, o sea 1.9. Normalmente, el número se redondea al siguiente número ente- ro, que en este caso es 2. La distribución de frecuencia debe empezar en un valor igual a o menor al número más bajo de los datos no agrupados y terminar en un valor igual o mayor que el número más alto. El porcentaje más bajo de desempleo es 1.2 y el más alto es 12.5, de modo que el investigador de negocios inicia la distribución de frecuencias en 1 y la ter­ mina en 13. La tabla 2.2 contiene la distribución de frecuencia completada para los datos de la tabla 2.1. Los puntos finales de la clase se seleccionan de modo que ningún valor de los datos pueda caber en más de una clase. La expresión de intervalo de clase, "menor de'; en la distribución del la tabla 2.2 evita este problema.

TABLA 2.2

Distribución de frecuencia de los porcentajes de desempleo en Francia (datos agrupados)

lotttValo de clase Frecuencia

l-rnenor de 3 3-menorde 5

5-menordc 7

7-menordc9

9-menor de 11 l l-menor de 13

16 2

9

6

Marca de clase El punto medio de cada intervalo de clase se llama marca de clase y a veces se conoce como punto medio clase. Es el valor a la mitad entre ti intervalo de clase y se puede calcular

Page 46: libro.pdf

CAPITULO 2 TABLAS Y GRAFICAS 21

como el promedio de los dos puntos finales de clase. Por ejemplo, en la distribución de la tabla 2.2, el punto medio del intervalo de clase 3-menor de 5 es 4 o (3 + 5)/2. Una segunda forma de obtener la marca de clase es calcular la mitad de la distancia en el intervalo de clase (la mitad del ancho de clase) y sumarla al punto inicial de clase, como para la distribución de porcentajes de desempleo:

Punto inicial de clase = 3 Ancho de clase = 2

Marca de clase = 3 + .!.(2) = 4 2

La marca de clase es importante, porque se convierte en el valor representativo para cada clase en la mayor parte de cálculos de estadlstica de grupo. La tercera columna de la tabla 2.3 contiene las mar­ cas de clase para los datos de la tabla 2.2.

Frecuencia relativa La frecuencia relativa es la proporción de la frecuencia total que estd en cualquier intervalo de clase dado en una distribución de frecuencia. La frecuencia relativa es la frecuencia de clase individual dividida entre la frecuencia total. Por ejemplo, de la tabla 2.3, la frecuencia relativa para el intervalo de clase 5-menor de 7 es 4/40 o .10. La consideración de la frecuencia relativa es preparatoria al estudio de pro­ babilidad del capitulo 4. De hecho, si se seleccionaran valores al azar de los datos de la tabla 2·. l , la probabilidad de sacar un número que sea "5-menor de 7" serla .10, la frecuencia relativa para esa clase de intervalo. La cuarta columna de la tabla 2.3 es una lista de las frecuencias relativas para la distribu­ ción de frecuencia de la tabla 2.2.

Frecuencia acumulada La frecuencia acumulada es u11 total corriente de frecuencia por las clases de una distribución de fre­ cue11cia. La frecuencia acumulada para cada intervalo de clase es la frecuencia para ese intervalo de fre­ cuencia sumado al total acumulado precedente. En la tabla 2.3, la frecuencia acumulada para la primera clase es la misma que para la frecuencia de clase: 16. La frecuencia acumulada para el segundo interva­ lo de clase es la frecuencia de ese intervalo (2) más la frecuencia del primer intervalo ( 16), lo cual da una nueva frecuencia acumulada de 18. Este proceso continúa hasta el último intervalo, en cuyo punto el total acumulado es igual a la suma de las frecuencias ( 40). El concepto de frecuencia acumulada se emplea en muchos campos de acción, incluyendo ventas acumuladas en un año fiscal, marcador final de deportes durante un concurso (puntos acumulados), años de servicio, puntos ganados en un curso y costos por hacer negocio en un periodo. La tabla 2.3 indica frecuencias acumuladas para los datos de la tabla 2.2.

TABLA 2.3 "'untos medios de clase, ~encía relativas, y frecuencia acumuladas para datos de desempleo

~-iio F...--la 111-ia 1..-lo fNcumda dedme nlidha _....

l-menorde3 16 2 .400 16 3-mmorde5 2 4 .oso 18 5-menorde7 4 6 .100 22 7-menorde9 3 8 .075 25 9-menor de 11 9 10 .225 34

11-nwnordel3 ..i 12 ~ 40

1bliia 40 1.000

Page 47: libro.pdf

22 ESTADISTICA EN LOS NEGOCIOS

PROBLEMA DE DEMOSTRACIÓN

2.1

Los siguientes datos son el promedio de tasas semanales de interés de hipoteca para un perio­ do de 60 semanas.

7.29 7.03 7.14 6.77 6.35 6.69 7.02 7.40 7.16 6.96 6.98 7.56 6.75 6.78 7.11 7.39 7-.28 6.97 6.90 6.57 7.11 6.95 7.23 7.31 7.00 7.30 7.17 6.96 6.78 7.30 7.16 6.78 6.79 7.07 7.03 6.87 6.80 7.10 7.13 6.95 7.08 7.24 7.34 7.47 7.31 6.96 6.70 6.57 6.88 6.84 7.02 7.40 7.12 7.16 7.16 6.99 6.94 7.29 7.05 6.84

Construya una distribución de frecuencia para estos datos. Calcule y muestre los puntos medios de clase, frecuencias relativas y frecuencias acumuladas para esta distribución de fre­ cuencia.

Soluci6n

¿Cuántas clases debería contener esta distribución de frecuencia? El rango de los datos es 1.21 (7.56-6.35). Si se utilizan 13 clases, cada ancho de clase es aproximadamente:

Ancho de clase = Rango = ~ = 0.093 Número de clases 13

Si se utiliza el ancho de una clase de .1 O, es posible construir una distribución de frecuencia con puntos finales que sean de aspecto más uniforme y permitan la presentación de la infor­ mación en categorías más conocidas para usuarios de tasas de interés por hipotecas.

El primer punto final de clase debe ser 6.35 o menor, para incluir el valor más pequeño; el último punto final debe ser 7 .56 o más alto para incluir el valor más grande. En este caso la dis­ tribución de frecuencia empieza en 6.30 y termina en 7 .60. La distribución de frecuencia resul­ tante, marcas de clase, frecuencias relativas y frecuencias acumuladas aparecen listados en la siguiente tabla.

Marcas de Frecuencia Frecuencia Intervalo de clase Frecuencia clase relativa acumulada

6.30-menor de 6.40 1 6.35 .0167 6.40-menor de 6.50 o 6.45 .0000 6.50-menor de 6.60 6.55 .0333 3 6.60-menor de 6.70 6.65 .0167 4 6.70-menor de 6.80 6 6.75 .1000 10 6.80-menor de 6.90 6 6.85 .1000 16 6.90-menor de 7 .00 10 6.95 .1667 26 7.00-menor de 7.10 8 7.05 .1333 34 7.10-menor de 7.20 11 7.15 .1833 45 7 .20-menor de 7 .30 5 7.25 .0833 50 7 .30-menor de 7 .40 6 7.35 .1000 56 7 .40-menor de 7 .50 3 7.45 .0500 59 7 .SO-menor de 7 .60 _L 7.55 .0167 60

Totales 60 1.0000

Las frecuencias acumuladas y frecuencias relativas de estos datos dejan ver las clases de tasas de interés de hipotecas que es probable se presenten durante el periodo. Casi todas las tasas de interés de hipotecas (52 de las 60) están en las clases que empiezan con (6.70-menor de 6.80) y pasaa a (7.30-menor de 7.40). Las tasas con la mayor frecuencia, 11, están en la misma clase (7.10-menor de 7.20).

Page 48: libro.pdf

l.1 PROBLEMAS

CAPITUW 2 TABLAS Y GRÁFICAS 23

2.1 Los siguientes datos representan las temperaturas altas vespertinas para 50 días de construcción durante un año en St. Louis.

42 70 64 47 66 55 85 to 24 45 16 40 81 15 35 38 79 35 36 23 31 38 52 16 81 69 73 38 48 25 31 62 47 63 84 17 40 36 44 17 64 75 53 31 60 12 61 43 30 33

a. Construya una distribución de frecuencias para los datos usando cinco intervalos de clase. b. Construya una distribución de frecuencias para los datos usando JO intervalos de clase. c. Examine los resultados de (a) y (b) y comente sobre la utilidad de la distribución de frecuencias

en términos de capacidad de resumir temperaturas. 2.2 Se supone que un proceso de empaque debe llenar pequeñas cajas de pasas con aproximadamen-

te 50 pasas, de modo que cada caja pese lo mismo. No obstante, va a variar el número de pasas de cada caja. Supóngase que se muestren al azar 100 cajas de pasas, se cuentan éstas y se obtienen los siguientes datos.

57 51 53 52 50 60 51 51 52 52 44 53 45 57 39 53 58 47 51 48 49 49 44 54 46 52 55 54 47 53 49 52 49 54 57 52 52 53 49 47 51 48 55 53 55 47 53 43 48 46 54 46 51 48 53 56 48 47 49 57 55 53 50 47 57 49 43 58 52 44 46 59 57 47 61 60 49 53 41 48 59 53 45 45 56 40 46 49 50 57 47 52 48 50 45 56 47 47 48 46

Construya una distribución de frecuencias para estos datos. ¡Qué deja ver la distribución de fre­ cuencias acerca de los llenados de cajas?

2.3 El propietario de un restaurante de comida rápida averigua las edades de una muestra de clientes. A partir de estos datos, el propietario construye la distribución de frecuencias que se muestra a continuación. Para cada intervalo de clase de la distribución de frecuencias, determine la marca de clase, la frecuencia relativa y la frecuencia acumulada.

Intervalo de clase Frecuencia O-menorde5

5-menor de 10 10-menor de 15 17 15-menor de 20 23 20-menor de 25 18 25-menor de 30 10 30-menor de 35 4

¿Qué indica la frecuencia relativa al propietario del restaurante de comida rápida acerca de las eda­ des de clientes?

Page 49: libro.pdf

24 ESTADISTICA EN LOS NEGOCIOS

2.4 El gerente de recursos humanos de una gran compañia encarga un estudio en el que se examinan los registros de empleados de 500 compañías para observar el ausentismo durante el año pasado. 8 investigador de negocios que lleva a cabo el estudio organiza los datos en una distribución de frecuencias para ayudar al gerente de recursos humanos en el análisis de los datos. A continuación se muestra la distribución de frecuencias. Para cada clase de la distribución de frecuencias, deter­ mine la marca de clase, la frecuencia relativa y la frecuencia acumulada.

Intervalo de clase Frecuencia O-menor de 2 218 2-menor de 4 207 4-menor de 6 56 6-menor de 8 11 8-menor de 10 8

2.5 Liste tres usos específicos de frecuencia acumuladas en negocios.

2.2 REPRESENTACIÓN GRÁFICA DE DATOS Uno de los mecanismos más efectivos para presentar datos de manera significativa a quienes toman decisiones es una representación gráfica. Por medio de tablas y gráficas , quien tome decisiones puede con frecuencia obtener un panorama general de los datos y llegar a alguna conclusión útil con sólo estudiar la tabla o gráfica. La conversión de datos a gráficas puede ser creativa e ingeniosa. Con fre­ cuencia, el paso más dificil en este proceso es reducir datos importantes y a veces costosos a una ima­ gen gráfica que sea tanto clara como concisa, pero a la vez consistente con el mensaje de los datos originales. Uno de los usos más importantes de una representación gráfica en estadística es ayudar al investigador a determinar la forma de una distribución. A continuación se presentan seis tipos de representación gráfica: 1) histograma, 2) polígono de frecuencia, 3) ojiva, 4) gráfica de pastel, 5) gráfi­ ca de tallo y hoja, y 6) gráfica de Pareto.

Histogramas Un histograma es un tipo de gráfica de barras verticales que se utiliza para representar una distribución de frecuencias. La construcción de un histograma comprende marcar el eje x (abscisa) con los puntos finales de clase y el eje y (ordenada) con las frecuencias, trazando un segmento de recta horizontal del punto final de clase al punto final de clase en cada valor de frecuencia y conectando cada segmento de recta verticalmente desde el valor de frecuencia al eje x para formar una serie de rectángulos. La figura 2.1 es un histograma de la distribución de frecuencias de la tabla 2.2, producido con el uso del software MINITAB.

Un histograma es una herramienta útil para diferenciar las frecuencias de intervalos de clase. Una mirada rápida a un histograma deja ver qué intervalos de clase producen los totales de frecuencia más altos. La figura 2.1 muestra claramente que el intervalo de clase l-menor de 3 proporciona con mucho el conteo de frecuencia más alto (16). Un examen del histograma revela en dónde se presentan grandes aumentos o reducciones entre clases, por ejemplo de la clase í-rnenor de 3 a la clase 3-menor de 5, una reducción de 14, y de la clase 7-menor de 9 a la clase 9-menor de 11, un aumento de 6.

Nótese que las escalas empleadas a lo largo de los ejes X e y para el histograma de la figura 2.1 son casi idénticas, pero, debido a que los rangos de números significativos para las dos variables que se grafican a veces difieren considerablemente, la gráfica puede tener diferentes escalas en los dos ejes. La figura 2.2 muestra cómo se verla el histograma de los porcentajes de desempleo si la escala del eje y fuera menor que la del eje x. Nótese que la menor diferencia en la longitud de los rectángulos parece representar las frecuencias en la figura 2.2. Es importante que el usuario de la gráfica comprenda da-

Page 50: libro.pdf

Histograma MINITAB de datos oe desempleo en =rancia

CAPITULO 2 TABL'.S Y GRÁFICAS 25

15

9 11 13 Porcentajes de desempleo en Francia

Histograma MINITAB de datos de desempleo en Francia (eje y comprimido)

ramente las escalas que se emplean para los ejes de un histograma. De otra forma, el creador de una gráfica puede "mentir con la estadística" al alargar o comprimir una gráfica para formar un punto:

Uso de histogramas para obtener una visión general de los datos

Debido a la generalizada disponibilidad de computadoras y programas de estadística para investigado­ res de negocios y para quien tome decisiones, el histograma sigue siendo muy importante. A veces, a quienes toman decisiones se les presenta una gran base de datos de información y no saben por dónde empezar al tratar de entender lo que significan los datos. El análisis del histograma de estos datos puede dar información inicial acerca de la forma de la distribución de los datos, la cantidad de variabilidad de los datos, la ubicación central de los datos, y los datos de resultados aislados. Aun cuando casi todos los conceptos se presentan en el capitulo 3, aquí se presenta la noción de histograma como herramien­ ta inicial de acceso a estas caracteristicas de los datos.

Por ejemplo, una de las variables de la base de datos de Stock Market (que se ve en el CD-ROM) es el Stock Volume. La base de datos contiene 324 observaciones de volumen de acciones. Supongamos

15

" ·¡¡ ~ 10 ~ u.

5

11 13 Porcentajes de desempleo en Francia

· Debe señalarse que el paquete Excel utiliza el término histograma para referirse a una distribución de frecuencia, pero al hacer die en Chart output de la caja de diálogo de histograma Excel, también se crea un histograma grañco.

Page 51: libro.pdf

26 ESTADISTICA EN LOS NEGOCIOS

0011¡111._ Histograma de volúmenes de acciones, 1990-1998

que quien tome decisiones financieras desea usar estos datos para llegar a algunas conclusiones acerca del mercado de acciones. La figura 2.3 muestra un histograma de estos datos producido por el MINITAB. ¿Qué se puede saber a partir de este histograma? Prácticamente todos los volúmenes del mercado de acciones caen entre cero y mil millones de acciones. La distribución toma una forma que es alta en el extremo izquierdo y se hace aguda hacia la derecha. En el capítulo 3 veremos que la forma de esta dis­ tribución está sesgada hacia el extremo derecho. En estadística, a veces es útil determinar si los datos están normalmente distribuidos en forma aproximada (curva en forma de campana), como se mues­ tra en la figura 2.4. Podemos ver, al examinar el histograma de la figura 2.3, que los datos del volumen del mercado de acciones no están normalmente distribuidos. Aun cuando el centro del histograma está ubicado cerca de 500 millones de acciones, una gran parte de las observaciones del volumen de accio­ nes cae en el extremo inferior de los datos en algún punto entre 100 millones y 400 millones de acciones. Además, el histograma muestra algunos resultados aislados en el extremo superior de la distribución. Los resultados aislados son puntos de datos que aparecen fuera del cuerpo principal de observaciones y pueden representar fenómenos que difieren de los representados por otros puntos de datos. Al obser­ var el histograma, se notan algunos datos que se acercan a los mil millones. Se podría concluir que en pocos dJas del mercado de acciones, se vende un gran volumen de acciones. Se pueden captar éstas y otras nociones al examinar el histograma y mostrar que los histogramas desempeñan un papel impor­ tante en el análisis inicial de datos.

Polígonos de frecuencia Un polígono de frecuencias es una gráfica en la que segmentos de recta "que enlazan puntos" representa una distribución de frecuencias. La construcción de un polígono de frecuencias empieza, al igual con un histograma, al asignar escala a puntos finales de clase a lo largo del eje x y a los valores de frecuencia a lo largo del eje y. Se determina un punto para el valor de frecuencia en el punto medio de cada inter­ valo de clase (marca de clase). El enlace de estos puntos medios completa la gráfica. La figura 2.5 mues­ tra un polígono de frecuencias de los datos de distribución de la tabla 2.2, obtenido con el uso del programa Excel. La información captada a partir del polígono de frecuencias e histogramas es seme­ jante. Al igual que con el histograma, el cambio de escalas de los ejes puede comprimir o alargar el polí­ gono de frecuencias, lo cual afecta la impresión del usuario de lo que representa la gráfica.

Ojivas Una ojiva es un polígono de frecuencias acumuladas. AquI también se inicia la construcción al marcar el eje x con los puntos finales de clase y el eje y con las frecuencias. No obstante, el uso de valores de fre­ cuencia acumulada requiere que la escala a lo largo del eje y sea suficientemente grande para incluir el total de frecuencia. Un punto de frecuencia cero se grafica al principio de la primera clase y la cons­ trucción continúa al marcarse un punto en el extremo de cada intervalo de clase para el valor acumu­ lado. Al enlazar los puntos se completa entonces Ja ojiva. La figura 2.6 presenta una ojiva obtenida con el Excel para los datos de la tabla 2.2.

50

20

40

30

10

o 500 millones 1000 millones

Page 52: libro.pdf

CAPtruLO 2 TABLAS Y GRÁFICAS 27

RGUllA 2.4 Las ojivas son más útiles cuando quien tome decisiones desea ver totales corrientes. Por ejemplo, si un controlador está interesado en controlar costos, una ojiva podrfa represen­ tar costos acumulados de un año fiscal.

Las pendientes pronunciadas de una ojiva se pueden usar para identificar aumentos agu­ dos en frecuencia. En la figura 2.6 pueden presentarse pendientes agudas en la clase l-menor de 3 y la clase 9-menor de 11, lo cual significa grandes totales de frecuencia de clase.

:>..s:.ribución normal

Gráficas de pastel Una gráfica de pastel es una representación circular de datos donde el área de todo el pastel representa 100% de los datos en estudio y las rebanadas representan una descomposición en porcentaje de los subniveles. Las gráficas de pastel muestran las magnitudes relativas entre

partes y un todo. Se utilizan ampliamente en negocios, en particular para representar factores como por ejemplo categorías de presupuesto, porcentaje de participación en el mercado y asignaciones de tiem­ po y recursos. No obstante, el uso de gráficas de pastel es mínimo en ciencias y tecnología debido a que

1,:-1,111- 18

- -gono de 29c:uencia, 16

~en 14 :.a::el de los datos

::.esempleo 12 .. ·o e 10

;:)

~ "-

6

4

o 3 7 9 11 13

45

40

35 .. .,, 30 -3 e

~ 25

" ·o 20 e ;:)

~ 15 "-

JO

o 3 9 11 13

Puntos finales de dase

Page 53: libro.pdf

28 ESTADISTICA EN LOS NEGOCIOS

•HA·1fii!i.1¡111.¡111¡Mi[.fi.J+M •.._ _ ¿Dónde se venden bebidas gaseosas? El mercado de bebidas gaseosas (refrescos) es sumamente grande y creciente en Estados Unidos y en todo el mundo. En un año reciente, 9 600 millones de cajas de refrescos se vendieron sólo en Estados Unidos. ¿Dónde se venden bebi­ das gaseosas? Los siguientes datos de Ja investigación de Sanford C. Bernstein indican que los cuatro Jugares princi­ pales para ventas de bebidas gaseosas son supermercados, fuentes de sodas, tiendas de alimentos envasados o gasoli­ neras y máquinas despachadoras.

Lupr de wntas Pon:mtaje

« 24

Tiendas de alimentos ~dos/gasolineras

16%

Supermercado Fuente de soda. Tienda de alimentos

envasados/gasolineras M'quinas expendedoras Comerciantes Farmacias

so------------------ 16

11

-~ 30

j :=-<-=l=........:1=->-=11::....L..=_=...L...::_=-.i

Estos datos se pueden exhibir gráficamente en varias formas. Aqul se ilustra una gráfica de pastel de Excel y una gráfica de barras de MINITAB de los datos. Algunos exper­ tos en estadística prefieren el histograma o la gráfica de barras, en Jugar de la gráfica de pastel, porque piensan que es más fácil comparar categorias que son similares en tama­ ño con el histograma o Ja gráfica de barras que con la grá­ fica de pastel.

Super- Fumt< Tiendas M~. merado dr .OO.. de .!im. vende­

cnvasadosl doras guolintras

Comer· oames

Panm­ ciu

Lugardcvcnw

pueden llevar a juicios menos precisos de lo que es posible con otros tipos de gráficas." En general, para un observador es más dificil interpretar el tamaño relativo de ángulos en una gráfica de pastel que juz­ gar la longitud de rectángulos en un histograma o la distancia relativa de un punto de polígono de fre­ cuencias desde el eje x. En el artículo Statistics in Business Today, "Where Are Soft Drinks Sold?" las representaciones del porcentaje de ventas por lugar fueron mostradas tanto por una gráfica de pastel como por una gráfica de barras verticales.

En la construcción de la gráfica de pastel primero se determina la proporción entre la subunidad y el entero. La tabla 2.4 contiene cifras de ventas generadas por Information Resources, !ne., para las principales 10 marcas de pastas dentales. Primeramente, las cifras de ventas de número entero son pro­ porciones convertidas al dividir cada cantidad de ventas entre la cantidad total de ventas. Esta propor­ ción es análoga a la frecuencia relativa calculada para distribuciones de frecuencia. Debido a que el círculo contiene 360 grados, cada proporción se multiplica por 360 para obtener el número correcto de grados y representar cada artículo. Por ejemplo, las ventas de Aquafresh de $177 989 000 representan una proporción de .1319 del total de ventas {177 989 000/1349 326 000 = .1319). Multiplicar este valor por 360 resulta en 47.48º. Las ventas de Aquafresh constituyen 47.48° del pastel. La gráfica de pastel se completa entonces con el uso de un compás para trazar las rebanadas. La gráfica de pastel de la figura 2.7, construida con el uso de MINITAB, describe los datos de la tabla 2.4.

"william S. Cleveland, The El<ments of Graphmg Data {Monterey, CA: Wadsworth Advanced Books and Software, 1985).

Page 54: libro.pdf

tul.A 2.4

:mas de pasta ="lea de 10

:ic oales marcas

1;:1 .,. :O-T"ica de pastel

~AB de ventas .::e oasta dentífrica pe-. -narca

PROBLEMA DE DEMOSTRACIÓN

2.2

CAPITULO 2 TABLAS Y GRAFICAS 29

Marca Vmtu Proporción Grados Crest $370 437 000 .2745 98.82

Colgate 321084000 .2380 85.68 Aquafresh 177 989000 .1319 47.48

Mentadent 170630000 .1265 45.55

Arm &Hammer 109 512 000 .0812 29.23

Rembrandt 52 067 000 .0386 13.90

Sensodyn 50 133 000 .0372 13.39

Listerine 40 107 000 .0297 10.69

Closeup 32 009 ()()() .0237 8.53

Ultrabrite 25 358 000 .0187 ____§n_

Totales s 1 349 326 oro 1.0000 360.00

Closeup 2.4%

Sensodyn 3.7%

Listerine 3%

Según la National Retail Federation y el Center fer Retailing Education de la University of Florida, las cuatro principales fuentes de disminución de inventario son robos de empleados, robos de clientes en tiendas, errores administrativos y fraude de vendedores. la disminución estimada en cantidad anual en dólares (millones de dólares), asociada con cada una de estas fuentes, es:

Robos de empleados Robos de clientes Error administrativo Fraude de vendedor Total

$17 918.6 15191.9 7 617.6 2 553.6

$43 281.7

Construya una gráfica de pastel para representar estos datos.

Solución

Convierta cada cantidad de dólares sin procesar a una proporción al dividir cada cantidad indi­ vidual entre el total.

Robos de empleados Robos de clientes Error administrativo Fraude de vendedor Total

17 918.6/43 281.7 = .414 15191.9/43 281.7 = .351 7 617.6/43 281.7 = .176 2 553.6/43 281.7 = .059

1.000

Convierta las proporciones a grados al multiplicar cada proporción por 360º.

Page 55: libro.pdf

30 ESTADISTICA EN LOS NEGOCIOS

Robos de empleados Robos de clientes Error administrativo Fraude de vendedor Total

.414. 360° = 149.0'

.351 . 360° = 126.4° .176. 360º = 63.4° .059 . 360° = 21.2'

360.0°

Fraude de vendedor 6%

Robos de clientes 35%

Gráficas de tallo y hoja Otra forma de organizar datos sin procesar en grupos es por una gráfica de tallo y hoja. Esta técnica es sencilla y da una vista de características únicas de los datos. Una gráfica de tallo y hoja se construye al separar los dígitos de cada número de los datos en dos grupos, un tallo y una hoja. Los dígitos de la extre­ ma izquierda son el tallo y están formados por los dígitos de más alto valor. Los dígitos de la extrema derecha son las hojas y contienen los valores más bajos. Si un conjunto de datos tiene sólo dos dígitos, el tallo es el valor de la izquierda y la hoja es el valor de la derecha. Por ejemplo, si 34 es uno de los números, el tallo es 3 y la hoja es 4. Para números con más de dos dígitos, la división del tallo y hoja es cuestión de preferencia del investigador.

La tabla 2.5 contiene calificaciones de un examen sobre política y reglas de seguridad de una plan­ ta, al que se sometieron 35 estudiantes para posiciones en esa planta. En la tabla 2.6 se muestra una grá­ fica de tallo y hoja de estos datos. Una ventaja de esta distribución es que el instructor puede fácilmente ver si las calificaciones están en el extremo superior o inferior de cada corchete, así como determinar la dispersión de las calificaciones. Una segunda ventaja de las gráficas de tallo y hoja es que los valores de

TABLA 2.5

Calificaciones de examen de seguridad para estudiantes de planta

86 77 91 60 55 76 92 47 88 67 23 59 72 75 83 77 68 82 97 89 81 75 74 39 67 79 83 70 78 91 68 49 56 94 81

TABLA 2.6

Gráfica de tallo y hoja para datos de examen de seguridad de planta

Tallo Hoja 3

3 9 4 7 9

5 6 9 6 o 7 7 8 8 7 o 2 4 5 5 6 7 7 8 9 8 1 2 3 3 6 8 9 9 2 4 7

Page 56: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

2.3

CAPITULO 2 TABLAS Y GRAFICAS 31

los datos originales sin procesar se retienen (en tanto que casi todas las distribuciones de frecuencia y representaciones gráficas usan el punto medio de clase para representar los valores en una clase).

Los siguientes datos representan los costos (en dólares) de una muestra de 30 remesas posta­ les hechas por una compañía.

3.67 2.75 5.47 4.65 3.32 2.09 1.83 10.94 1.93 3.89 7.20 2.78 3.34 7.80 3.20 3.21 3.55 3.53 3.64 4.95 5.42 8.64 4.84 4.10 9.15 3.45 5.11 1.97 2.84 4.15

Con el uso de dólares como tallo y centavos como hoja, construya una gráfica de tallo y hoja de los datos.

Solución

Tallo Hoja

1 83 93 97 2 09 75 78 84 3 20 21 32 34 45 53 64 67 89 4 10 15 65 84 95 5 11 42 47 6

20 80 8 64 9 15

10 94

Gráficas de Pareto Un concepto y movimiento importantes en negocios es la Administración de Calidad Total (véase el capitulo 18}. Uno de los importantes aspectos de la administración de calidad total es la constante bús­ queda de causas de problemas en productos y procesos. Una técnica gráfica para mostrar causas de pro­ blemas es el análisis de Pareto, que es un registro cuantitativo del número y tipos de defectos que se presentan en un producto o servicio. Los analistas emplean este registro para obtener una gráfica de bamu verticales que exhiba los tipos de defectos más comunes, clasificados en el orden en que se presentan de izquierda a derecha. La gráfica de barras se llama gráfica o diagrama de Pareto,

Las gráficas de Pareto se denominan as! en honor al economista italiano Vilfredo Pareto, quien observó hace más de 100 años que casi toda la riqueza de Italia estaba controlada por unas cuantas familias que eran los principales motores detrás de la economía italiana. El experto en calidad J.M. Juran aplicó esta noción al campo de la calidad al observar que la mala calidad puede a veces resolverse al atacar algunas causas principales que resultan en casi todos los problemas. Una gráfica de Pareto hace posible que quienes tomen decisiones en control de calidad separen los defectos más importantes de los defectos triviales, para establecer prioridades en el trabajo de mejora de calidad según sea necesario.

Supongamos que el número de motores eléctricos que son rechazados por inspectores de una com­ pañía se incrementó. Los directores de la compañía examinan los registros de varios cientos de moto­ res en los que se encontró por lo menos un defecto y encuentran que 40% de los defectos son por alambres defectuosos, 30% por cortocircuito en las bobinas, 25% por clavijas defectuosas y 5% por co­ jinetes pegados. La figura 2.8 muestra una gráfica de Pareto construida a partir de esta información, en la que los principales tres problemas con motores defectuosos; es decir, alambres defectuosos, corto­ circuito en las bobinas y clavijas defectuosas, justifica 95% de los problemas. De la gráfica de Pareto, con lo cual los directores pueden formular un plan lógico para reducir el número de defectos.

Es probable que directores y trabajadores de la compañía comiencen a mejorar la calidad al exa­ minar los segmentos del proceso de producción que se relacionen con el alambrado para posterior­ mente estudiar la construcción de las bobinas y luego las clavijas y el proceso del proveedor de éstas.

Page 57: libro.pdf

32 ESV.DISTICA EN LOS NEGOCIOS

U@i1¡tt¡ .. r---l-º-º-;::==================::;---------------­ Gráfica MINITAB de Pareto para pro­ blemas de motores eléctricos

ma11i!I!: .. Gráfica de Pareto 40 para problemas de 35 motores eléctricos ..

30 § -¡; 25 -e

·*- 20 ;:

15 ~ o 10 o.

Alambre Conocimllto Clavija Cojinetes defectuoso en bobina defectuosa pegados

.. ~ so

Defecto Alambre Cortocircuito Clavija Otros defectuoso en bobina defectuosa

Cuenta 40 30 25 5 Porcentaje 40.0 30.0 25.0 5.0 %acum. 40.0 70.0 95.0 100.0

100

80

60 u . ., ;: ~ 40 .¡:

20

La figura 2.9 es una presentación MINITAB de la gráfica de Pareto. Además del análisis de la gráfi­ ca de barras, el análisis de MINITAB de Pareto contiene una gráfica de linea de porcentaje acumulado. Observe las pendientes en la gráfica de linea en la que las pendientes mayores representan los proble­ mas que se presentan con más frecuencia. Cuando las pendientes bajan, los problemas se presentan con menor frecuencia. La gráfica de línea proporciona a quien tome decisiones otra herramienta para determinar cuáles problemas resolver primero.

2.2 PROBLEMAS

2.6 Construya un histograma y un polígono de frecuencia para los siguientes datos.

Intervalo de clase Frecuencia 30-menor de 32 32-menor de 34 7 34-menor de 36 15 36-menor de 38 21 38-menor de 40 34 40-menor de 42 24 42-menor de 44 17 44-menor de 46 8

Page 58: libro.pdf

CAPITULO 2 TABLAS Y GRÁFICAS 33

2.7 Construya un histograma y un polígono de frecuencia para los siguientes datos.

Intervalo de clase Frecuencia !O-menor de 20 9 20-menor de 30 7 30-menor de 40 10 40- menor de SO 6 SO-menor de 60 13 60-menor de 70 18 70-menor de 80 IS

2.8 Construya una ojiva para los siguientes datos.

Intervalo de clase Frecuencia 3-menor de 6 2 6-menor de 9 s

9-menor de 12 10 12-menor de IS 11 IS-menor de 18 17 18-menor de 21 s

2.9 Construya una gráfica de tallo y hoja usando dos dígitos para el tallo.

212 239 240 218 222 249 26S 224 2S7 271 266 234 239 219 2SS 260 243 261 249 230 246 263 23S 229 218 238 2S4 249 2SO 263 229 221 2S3 227 270 2S7 261 238 240 239 273 220 226 239 2S8 2S9 230 262 2SS 226

2.10 A continuación aparece una lista de las compañías de contabilidad más grandes de Estados Unidos, junto con sus datos de ingresos netos para 1997 (millones de dólares), según el Public Accounting Report.

Firma Ingresos Andersen Worldwide $S44S Emst&Young 4416 Deloitte & Touche 3 600 I<PMG Peat Marwick 2 698 Coopers & Lybrand 2S04 PriceWaterhouse 2 344 Grant Tbornton 289 McGladrey & Pullen 270 BDO Seidrnan 240

Construya una gráfica de pastel para representar estos datos. Aplique leyendas a las rebanadas con los porcentajes apropiados. Comente sobre la efectividad de usar una gráfica de pastel para exhi­ bir los ingresos de estas empresas de contabilidad más importantes.

2.11 Según la Air Transport Association of América, Delta Airlines encabezó todas las líneas en cuan­ to al número de pasajeros transportados en un año reciente. Las cinco principales aerolíneas fue­ ron Delta, United, American, U.S. Airways y Southwest. A continuación aparece el número de pasajeros transportados (en miles) por cada una de estas aerolíneas:

Page 59: libro.pdf

34 ESTADISTICA EN LOS NEGOCIOS

TABLA 2.7

Valor de construcciones nuevas en un periodo de 35 años

Residmcial No residencial 169635 96497

155113 115372

149410 96407

175822 129275

162706 140569

134605 145054

195028 131289

231396 155261

234955 178925

266481 163740

267063 160363

263385 164191

252745 169173

228943 167896

197526 135389

232134 120921

249757 122222

274956 127593

251937 139711

281229 153866

280748 166754

297886 177639

315757 175048

Fuente: U.S. Census Bureau, Current Construction Reports (en millones de dólares estables).

Aerolínea Pasajeros

Delta 103133

United 84 203

American 81 083 US Airways 58 659 Southwest 55 946

2.12 Information Resources, Inc. reporta que, en un año reciente, Huggies fue la marca de pañales de mayor venta en Estados Unidos con 41.3% de la participación en el mer­ cado. Otras marcas que destacan son Pampers, con 25.6%, Luvs con 12.1 %, Drypers con 3.3%, Fitti con 0.9%, y marcas libres con 15.8%. Utilice esta información para construir una gráfica de pastel de la participación en el mercado de pañales.

2.13 Los siguientes datos representan el número de pasajeros por vuelo en una muestra de 50 vuelos procedentes de Wichita, Kansas, a Kansas City, Missouri. 23 46 66 67 13 58 19 17 65 17 25 20 47 28 16 38 44 29 48 29

69 34 35 60 37 52 80 59 51 33 48 46 23 38 52 so 17 57 41 77 45 47 49 19 32 64 27 61 70 19

Construya una gráfica de tallo y hoja para estos datos. ¿Qué nos dice la gráfica de tallo · y hoja acerca del número de pasajeros por vuelo?

2.14 Una aerolínea utiliza un banco central telefónico y un proceso semiautomático tele­ fónico para tomar reservaciones. Ha estado recibiendo un número anormalmente alto de quejas de clientes acerca de este sistema de reservaciones. La compañia llevó a cabo un estudio de clientes, en el cual preguntaron si habían tenido cualesquiera de los siguientes problemas al hacer reservaciones: tono de ocupado, desconexión, mala conexión, demasiado tiempo en espera para hablar con alguien, no comunicarse con un agente, conectado a extensión equivocada. Supongamos que el estudio de 744 dientes quejosos resultó en el siguiente total de frecuencia.

Número de quejas Queja

184 Demasiado tiempo en espera 10 Transferido a extensión equivocada

85 No comunicarse con un agente 37 Desconexión

420 Tono de ocupado

8 Mala conexión

Construya un diagrama de Pareto, a partir de esta información, para mostrar los dife­ rentes problemas encontrados al hacer reservaciones.

2.3 DESCRIPCIÓN GRÁFICA DE DATOS NUMÉRICOS DE DOS VARIABLES: GRÁFICAS DE DISPERSIÓN

En investigaciones de negocios, muchas veces es importante explorar la relación entre dos variables numéricas. En los capítulos 3 y 13 se exponen métodos estadísticos más detallados, pero aquí presen­ tamos un mecanismo gráfico para examinar la relación entre dos variables numéricas: la gráfica de dis­ persión (o diagrama de dispersión). Una gráfica de dispersión es una gráfica en dos dimensiones donde las parejas de los puntos son dos variables numéricas.

Como ejemplo de dos variables numéricas, considere los datos del la tabla 2. 7 donde aparecen los valores de construcciones residenciales nuevas y no residenciales nuevas en Estados Unidos para varios

Page 60: libro.pdf

CAPITULO 2 TABLAS Y GRÁFICAS 35

h~11i' 111·• 180000

Gráfica MINITAB oe dispersión de 160000 construcción -esidencial y ~ 140000 -o residenciet 5 .

-e . ueva ·~ 120000

o z 100000

80000 120000 220000 320000

Residencial

años en un periodo de más de 35 años. ¡Tienen alguna relación estas dos variables numéricas? Podría parecer lógico, cuando hay auge de construcciones que al mismo tiempo hubiera auge en construccio­ nes residenciales y no residenciales; sin embargo, la gráfica de dispersión MINITAB de estos datos que se ve en la figura 2.10 muestra resultados mixtos. La aparente tendencia es que hay más construcción de edificios residenciales nuevos cuando tiene lugar más construcción de no residenciales y menos construcción de residenciales nuevos cuando está a menores niveles la construcción de no residencia­ les. La gráfica de dispersión también muestra que en algunos años hubo más construcción de residen­ ciales nuevos y menos construcción de no residenciales al mismo tiempo y viceversa.

2.3 PROBLEMAS

2.15 La U.S. National Oceanic and Atmospheric Administration, National Marine Fisheries Service, publica datos sobre la cantidad y valor de pesca nacional en Estados Unidos. A continuación apa­ rece la cantidad (en millones de libras) de peces capturados y empleados para consumo humano y productos industriales (aceite, carnada, alimento para animales, etc.) en más de una década. ¡Es una relación evidente entre la cantidad empleada para consumo humano y la usada para pro­ ductos industriales para un año dado? Construya una gráfica de dispersión de los datos. Examine la gráfica y discuta la intensidad de Ja relación de las dos variables.

Alimento humano Productos industriales 3 654 2 828 3 547 2 430 3 285 3 082 3 238 3 201

3 320 3 118 3 294 2 964 3 393 2 638

3 946 2 950 4 588 2 604 6 204 2 259

2.16 ¡Existe relación entre el dinero invertido en publicidad por una compañia y los ingresos totales por ventas? Los siguientes datos representan el dinero invertido en publicidad y los ingresos por ventas para varias compañías en una industria dada durante un año reciente. Construya una grá­ fica de dispersión de los datos a partir de las dos variables y comente la relación entre las dos variables.

Page 61: libro.pdf

36 ESTADISTICA EN LOS NEGOCIOS

Publicidad (en millones de dólares)

Vontas (en millones do dólares)

4.2 1.6 6.3 2.7

10.4 7.1 5.5 8.3

155.7 87.3

135.6 99.0

168.2 136.9 101.4 158.2

Estado de la manufactura de autos

Debido a que los datos sin procesar del Dilema de decisión están en millones, es ventajoso representar gráficamente los datos para el lector o el oyente. Como ejemplos de lo que se puede hacer gráficamen­ te, en la figura 2.11 se ilustran los datos de participación en el mercado para 1999 en una gráfica de pas­ tel de MINITAB; los datos para 2000 se muestran en un histograma Excel en la figura 2.12.

Los datos de distribuidoras se pueden resumir si se usa una distribución de frecuencia o una grá­ fica de tallo y hoja. La siguiente distribución de frecuencia de los datos muestra que los intervalos de los datos son 69 - 30 = 39. Si los anchos de clase son 5 y la distribución de frecuencia empieza en 30, se necesita de 8 clases. • 30-menor de 35 6 35-menor de 40 o 40-menor de 45 45-menor de 50 6 50-menor de 55 2 55-menor de 60 6 60-menor de 65 6 65-menor de 70 7

CONSIDERACIONES ÉTICAS Las consideraciones éticas para las técnicas aprendidas en el capitulo 2 empiezan con los datos escogidos para la representación. Con la abundancia de datos disponibles en negocios, la perso­ na que construya el resumen de datos debe ser selectiva al escoger las variables reportadas. El potencial es grande para el analista que seleccionará las variables o incluso datos dentro de las variables que sean favorables para su propia situación o que se perciba sean bien recibidos por el oyente.

La sección 2.1 hizo notar que el número de clases y el tamaño de los intervalos en distribu­ ciones de frecuencia por lo general son seleccionados por el investigador, quien debe ser cuida­ doso para seleccionar valores y tamaños que sean un reflejo honesto y exacto de la situación y no un caso sesgado, exagerado o subestimado. •

En las secciones 2.2 y 2.3 estudiamos cómo construir cuadros y gráficas señalando que en muchos casos tiene sentido usar escalas desiguales en los ejes. No obstante, hacer esto último abre la posibilidad de "engallar con la estadística" al alargar o comprimir los ejes para recalcar el punto de vista del analista o investigador. Es imperativo que las distribuciones de frecuencia, asi como tablas y gráficas, se construyan de modo que reflejen datos reales y no simplemente la propia observación del investigador.

Page 62: libro.pdf

---•--11• .. • ~~oastel _:::;a.z.....:. a

Una gráfica de tallo y hoja de estos datos aparecería como se ve a continuación.

CAPITULO 2 TABLAS Y GRÁFICAS 37

Tallo Hoja 013444

4 0344444557799 5 12777889 6 o 112345567789

Es posible emplear una gráfica de dispersión para examinar la relación entre los datos de 1999 y 2000. En la figura 2.13 aparece una gráfica Excel de estas dos variables numéricas.

Honda Motor (5.5%)

Hyundai Motor (6.0%)

DaimlerChrysler (ll.2%)

Toyota motor (12.3%)

cz::s oe ventas 2 :ompañía

10000000

9000000

8000000

¡¡ 7000000 -;:¡ 'Q 6000000 e e 5000000 !! 4000000 e -!t 3000000

2000000

1000000 o--'-'~-+-~1---+~+---+~+-__,f---+-~+---i

Page 63: libro.pdf

38 ESTADISTICA EN LOS NEGOCIOS

ma11¡!·111• 10000000

Gráfica de 9000000 dispersión de 8000000 una compañía 7000000 de ventas. Los 6000000 o • datos son de 1999 o 5000000 • y 2000

o • "' 4000000 3000000 ,, 2000000 1000000

• •

RESUMEN

Los dos tipos de datos son agrupados y no agrupados. Casi rectas verticales enlazan este segmento de recta hasta el eje x, todo el análisis de estadística se realiza con datos no agrupa- formando así un rectángulo. Los histogramas están tomando dos, es decir, sin procesar. Los datos agrupados son datos orga- una creciente importancia como herramienta inicial de análi­ nizados en una distribución de frecuencia. Es importante sis. El experto en estadística puede saber mucho acerca de la distinguir entre datos agrupados y no agrupados, porque las forma de la distribución, y otras importantes características operaciones estadísticas en los dos tipos se calculan de modos de los datos, si examina un histograma de los datos. Un polí­ diferentes. gono de frecuencia se construye al graficar un punto con la

La construcción de una distribución de frecuencia exige marca de cada intervalo de clase por el valor de cada frecuen­ varios pasos, el primero de los cuales es determinar el rango cía y luego enlazar los puntos. Las ojivas son polígonos de fre­ de los datos, que es la diferencia entre el valor más grande y el cuenda acumulada. Los puntos en una ojiva se grafican en los valor más pequeño y, a continuación, se determina el número puntos extremos de clase. La gráfica de ojiva se inicia en el de clases, que es una selección arbitraria del investigador. No comienzo del primer intervalo de clase con un valor de cero y obstante, pocas clases agregan en exceso los datos en categorías continúa por los valores de las frecuencias acumuladas hasta sin sentido y muchas clases no resumen los datos lo suficiente los puntos extremos de clase. para que sean útiles. El tercer paso en la construcción de una Una gráfica de pastel es una representación circular de distribución de frecuencia es determinar el ancho del interva- datos. La cantidad de cada categoría se representa como una lo de clase. La división del rango de valores entre el número de rebanada del pastel proporcional al total. Las rebanadas se clases da el ancho aproximado del intervalo de clase. determinan al multiplicar por 360º la proporción de cada

La marca de clase es el punto medio de un intervalo de categoría, para calcular el número de grados del circulo asig­ clase. Es el promedio de los puntos finales de clase y represen- nados a cada categoría El investigador debe tener cuidado con ta el punto a la mitad del intervalo de clase. La frecuencia rela- el uso de gráficas de pastel, porque a veces es difícil distinguir tiva es un valor calculado al dividir una frecuencia individual los tamaños relativos de las rebanadas. Las gráficas de tallo y entre la suma de las frecuencias. La frecuencia relativa repre- hoja son otra forma de organizar datos. Los números se divi­ senta la proporción de valores totales que está en un intervalo den en dos partes, un tallo y una hoja. Los tallos son los dígi­ de clase dado. Es análoga a la probabilidad de sacar al azar, de tos de la extrema izquierda de los números y las hojas son todos los valores, un valor de un intervalo de clase dado. La los dígitos de la extrema derecha. El investigador de negocios frecuencia acumulada es una cuenta corriente de frecuencia determina cómo dividir los dígitos en tallos y hojas. Los tallos se total que se inicia con el primer valor de frecuencia y suma ponen en lista individualmente, con todos los valores de hoja cada frecuencia resultante al total. correspondientes a cada tallo mostrado junto a ese tallo.

Los tipos de representaciones gráficas presentadas en este Una gráfica de Pareto es una gráfica de barras verticales capitulo son histogramas, polígonos de frecuencia, ojivas, grá- que se utiliza en Administración Total de la Calidad paramos­ ficas de pastel, gráficas de tallo y hoja, gráficas de Pareto y trar gráficamente la causa de problemas en orden descenden­ gráficas de dispersión, La representación gráfica de datos es-' te para ayudar a quien tome decisiones a priorizarlas. La especialmente útil para ayudar a expertos en estadística a gráfica de dispersión tiene dos dimensiones en parejas de determinar la forma de distribuciones. Un histograma es una puntos que provienen de dos variables numéricas y se utilizan gráfica de barras verticales en donde un segmento de recta para determinar si existe cualquier aparente relación entre las enlaza puntos finales de clase en el valor de la frecuencia. Dos dos variables.

Page 64: libro.pdf

CAPITULO 2 TABLAS Y GRÁFICAS 39

[ TÉIHINOS CLAVE

z¡;rupados no agrupados

=i..."'Jáón de frecuencias '=IXDÓa acumulada

frecuencia relativa gráfica de dispersión gráfica de Pareto gráfica de pastel

gráfica de tallo y hoja histograma marca de ciase ojiva

polígono de frecuencias punto medio de clase rango

PltOBLEMAS COMPLEMENTARIOS

de estadísticas

:_1- Para los siguientes datos, construya una distribución de frecuencia con seis clases.

57 23 35 18 21 26 51 47 29 21 46 43 29 23 39 50 41 19 36 28 31 42 52 29 18 28 46 33 28 20

u Para cada intervalo de clase de la distribución de fre- cuencia dada, determine la marca de clase, la frecuencia relativa y la frecuencia acumulada.

Intervalo de clase Frecuencia 20-menor de 25 17 25-menor de 30 20 30-menor de 35 16 35-menor de 40 15 40-menor de 45 8 45-menor de 50 6

!..19 Construya un histograma, un polígono de frecuencia, y una ojiva para la siguiente distribución de frecuencia.

Intervalo de clase Frecuencia SO-menor de 60 13 60-menor de 70 27 70- menor de 80 43 80-menor de 90 31

90-menor de 100 9

~O Construya una gráfica de pastel a partir de los siguientes datos.

Leyenda Valor

A B e D

55 121 83 46

2.21 Construya una gráfica de tallo y hoja para los siguientes datos. Haga que la hoja contenga un dígito.

312 324 289 335 298 314 309 294 "s26 317 290 311 317 301 316 306 286 308 284 324

2.22 Un examen de rechazos muestra por lo menos 1 O pro­ blemas. A continuación veamos un total de frecuencia de los problemas. Construya una gráfica de Pareto para estos datos.

Problema Frecuencia 1 673 2 29

108 4 379 5 73 6 564 7 12 8 402 9 54 10 202

2.23 Construya una gráfica de dispersión para las siguientes dos variables numéricas.

s.:». 12 17 3 9 10 6 15

10 8 14 9 8

Pruebe sus conocimientos

2.24 La Whitcomb Company fabrica un anillo metálico para motores industriales que por lo general pesa 50 onzas. Una muestra aleatoria de 50 de estos anillos metálicos produjo los siguientes pesos (en onzas). 51 53 56 50 44 47 53 53 42 57 46 55 41 44 52 44 46 41 57 51 54 47 52 53 51 38 49

56 50 52 69 63 42 46 36 50 62

57 53 47 58 39

44 55 43 52 43 42 57 49 Construya una distribución de frecuencias p:tra estos datos usando ocho clases. ¿Qué puede usted observar acerca de los datos a partir de la distribución de fre­ cuencias?

Page 65: libro.pdf

40 ESTADISTICA EN LOS NEGOCIOS

2.25 Una compañía de distribución ubicada en el noroeste de Estados Unidos hizo una encuesta a 53 de sus gerentes de nivel medio. La encuesta obtuvo las edades de estos gerentes, los cuales posteriormente fueron organizadas en la distribución de frecuencia que se muestra a continua­ ción. Determine la marca de clase, frecuencia relativa y frecuencia acumulada para estos datos.

Intervalo de clase Frecuencia 20-menor de 25 8 25-menor de 30 6 30-menor de 35 5 35-menor de 40 12 40-menor de 45 15 45-menor de 50 7

2.26 A los siguientes datos se les ha dado aproximadamente la forma de una distribución normal (véase el capítulo 6).

61.4 27.3 26.4 37.4 30.4 47.5 63.9 46.8 67.9 19.1 81.6 47.9 73.4 54.6 65.1 53.3 71.6 58.6 57.3 87.8 71.1 74.1 48.9 60.2 54.8 60.5 32.5 61.7 55.1 48.2 56.8 60.1 52.9 60.5 55.6 38.1 76.4 46.8 19.9 27.3 77.4 58.1 32.1 54.9 32.7 40.1 52.7 32.5 35.3 39.1 Construya una distribución de frecuencias que inicie con 10 como el punto más bajo de clase y utilice un ancho de clase de 10. Construya un histograma y un polígono de frecuencias para esta distribución de frecuencias y obser­ ve la forma de una distribución normal. Con base en los resultados que obtenga de estas gráficas, ¿qué aspecto tiene la distribución normal?

2.27 Utilice los datos del problema 2.25. a. Construya un histograma y un polígono de frecuencias. b. Construya una ojiva.

2.28 En una ciudad del sur de tamaño medio, 86 casas están en venta, cada una de unos 2 000 pies cuadrados de cons­ trucción. Los precios de ellas varían. La distribución de frecuencias que se ilustra contiene las categorías de pre­ cios para las 86 casas. Construya un histograma, un polí­ gono de frecuencias y una ojiva a partir de estos datos.

Precio pedido Frecuencia

$ 60 000-menor de S 70 000 21 70 000-menor de 80000 27 80 000-menor de 90000 18 90 000-menor de 100 000 11

100 000-menor de 110000 6 110 000-menor de 120000 3

2.29 Una atención prenatal buena y de costo relativamente bajo puede evitar toda una vida de gastos debidos a complicaciones que resultan del bajo peso de nacimien­ to de un bebé. En un estudio muestra al azar se pidió a 57 madres primerizas que calcularan cuánto gastan en atención prenatal. El investigador totalizó los resultados

y los presentó en la distribución de frecuencias que se ve a continuación. Utilice estos datos para construir un his­ tograma, un polígono de frecuencias y una ojiva.

Cantidad gastada en Frecuencia de atención prenatal madres primerizas $ O-menor de $100 3

100-menor de 200 6 200-menor de 300 12 300-menor de 400 19 400- menor de 500 JI 500-menor de 600 6

2.30 Un grupo de consumidores hizo una encuesta de precios de alimentos en 87 tiendas de la costa atlántica; entre los precios de alimentos medidos estaba el azúcar. De los datos recolectados, el grupo construyó la distribución de frecuencias de los precios de cinco libras del azúcar marca Dominó en las tiendas encuestadas. Calcule un histograma, un poligono de frecuencia y una ojiva para los siguientes datos.

Precio Frecuencia $1.75-menor de $1.90 9

1.90-menor de 2.05 14 2.05-menor de 2.20 17 2.20-menor de 2.35 16 2.35-menor de 2.50 18 2.50-menor de 2.65 8 2.65 menor de 2.80

2.31 Los diez principales géneros musicales, según Sound­ Sean para un año reciente, son R&B, alternativa (rock), rap y música country. A continuación aparecen éstos y otros géneros musicales, junto con el número de álbu­ mes vendidos de cada uno (en millones).

Género Álbumes vendidos R&B 146.4 Alternativa 102.6 Rap 73.7 Country 64.5 Pista 56.4 Metal 26.6 Clásica 14.8 Latina 14.5

Construya una gráfica de pastel para estos datos, que muestre el porcentaje del total que representa cada uno de estos géneros.

2.32 Las siguientes cifras de importaciones en Estados Unidos de productos agrícolas y artículos manufactura­ dos se tomaron de años seleccionados entre 1970 y 2000 (en miles de millones de dólares). La fuente de los datos es la U.S. lnternational Trade Administration. Construya una gráfica de dispersión para estos datos y determine cualquier relación evidente entre importaciones de pro­ ductos agrícolas e importaciones de articulos manufac­ turados durante este periodo.

Page 66: libro.pdf

..,..._ lfODC»las Articulas manufacturados :..! 27.3 93 54.0

[l.A 133.0 19.5 257.5 ~.3 388.8 ?9.3 629.7

~ aparece una lista de industrias con el i;Zs ~e de descarga de productos químicos = 199 , según la U.S. Environmental Protection

fl!CI..--.;. Construya una gráfica de pastel para represen- 7 tOS:& míonnación.

......,. Descarga total (libras)

i!'!cdla:ms quunicos 737 100 000 ~primarios 566 400 000

~ 229 900 000

F.is:Xm y caucho 109 700000 ~ & transporte 102 500 000 ~ 89 300 000 ~&bñcados 85 900 000 ~ 63 300 000 ~d«trico 29 100 000

::3J =rafila manufacturera produce botellas de plás- pzn b industria lechera. Algunas de las botellas son

=r'iazadas por su mala calidad. Las causas de botellas de a!idad incluyen plástico defectuoso, etiquetas

=atas. decoloración, grosor incorrecto, agarradera = .- erres, Los siguientes datos para 500 botellas de ~que fueron rechazadas incluyen los problemas y ,;a. ~cia de los problemas. Utilice estos datos para = una gráfica de Pareto. Analice las implicacio­ 'XI de la gráfica.

Problema Númuo

Dtco&oraáón 32 Gn>:.or 117 A?rradera rota 86 ñlla en plástico 221 Etiqueta 44

::.:!> E:i d censo de 2000, una organización de investigación seleccionó 50 poblaciones de Estados Unidos de entre .f oon v 6 000 habitantes como muestra para representar ~os poblados para fines de estudio. A continua- 3)o, los habitantes de estos pueblos.

+L"'ll 5221 4299 5831 5750 504~ 5556 4361 5737 4654 .f.653 5338 4512 4388 5923 4730 4963 5090 4822 4304 -4;58 5366 5431 5291 5254 4866 5858 4346 4734 5919 -4116 4328 4459 5832 5873 525¡ 5048 4232 4878 5166 53o6 4212 5669 4224 4440 -4199 5263 4339 4834 5478

CAPfTUW 2 TABLAS Y GRÁFICAS 41

Construya una gráfica de tallo y hoja para los datos, donde cada hoja contenga dos dígitos.

2.36 A continuación aparece una lista de 30 diferentes pro- medios de acciones del Dow Jones industrial.

2656 2301 2975 3002 2468 2742 2830 2405 2677 2990 2200 2764 2337 2961 3010 2976 2375 2602 2670 2922 2344 2760 2555 2524 2814 2996 2437 2268 2448 2460

Construya una gráfica de tallo y hoja para estos 30 valo­ res, donde el tallo contenga dos dígitos .

Interpretación de salida de computadora

2.37 Suponga que son entrevistados 150 compradores en una zona comercial de nivel económico elevado, donde una de las preguntas es el nivel de ingresos de la familia. Estudie el histograma MTNITAB de los siguientes datos y discuta qué se puede deducir acerca de los compradores.

30

·O 20 e " " ~ u. 10

50 000 100 000 150 000 Ingresos de la familia en dólares

2.38 A continuación se ilustra una gráfica de pastel producida en Excel, que representa especialidades médicas. ¿Qué dice esta gráfica acerca de las diversas especialidades?

Especialidades médicas Psiquiatrla Anestesiología

Pediatrla Medicina familiar

Cirugía general

2.39 Supongamos que se hace un estudio a 100 empresas de contadores públicos titulados, para determinar cuántas auditorias realizan en un cierto tiempo. Los datos están resumidos con el uso de la gráfica MINITAB de tallo y hoja

Page 67: libro.pdf

42 ESTADISTICA EN LOS NEGOCIOS

que se ilustra. ¡Qué se puede saber acerca del número de auditorías realizadas por estas empresas en la gráfica?

Números en tallo y hoja

TaUo y boja de número de auditorias N = 100 Unidad de boja = 1.0

9 1 222333333

2.40 La siguiente ojiva Excel muestra ventas de juguetes por una compañía en un periodo de 12 meses. ¡A qué con­ clusiones puede llegarse acerca de las ventas de juguetes en esta compañía!

16 4445555 ~ 100

26 6666667777 e ~

35 1 888899999 E 80 e

39 2 0001 !! " 60

44 2 22333 ¡',, 49 2 55555 =- " 40

"' (9) 2 677777777 3 42 2 888889

e 20 '!t 35 3 000111 29 3 223333 Mar. May. Jul. Sep. Nov. 23 3 44455555 F<b. Abril Jun. Agos, Oct. Dic.

15 3 67777 M<S

10 3 889 7 4 0011 3 4 222

ANÁLISIS DE LA BASE DE DATOS

l. Con el uso de la base de datos de manufactura, construya una distribución de frecuencia para Ja variable, número de trabajadores de producción en todas las industrias. En Excel la distribución de frecuencias se refiere a un histo­ grama. En MINITAB, produce una distribución de fre­ cuencias al construir un histograma que verifica Frecuencia bajo Opciones y hacer clic en Mostrar Leyendas de Datos bajo Anotación, con lo cual deja ver las cuentas de frecuencia de clase. ¡Qué revela la distribución de frecuencia acerca del número de trabajadores de producción?

2. Con el uso de la base de datos de mercado, construya un histograma para la variable, Reported Trades. ¡Qué forma tiene el histograma? ¡Es alto en la parte media o cerca de uno o ambos puntos extremos? ¡Es relativamente constan-

te en tamailo en las clases (uniforme) o parece no tener forma? ¡Parece estar normalmente distribuida?

3. Construya una ojiva para la variable, Type, en la base de datos financiera. Las 100 compañías de esta base de datos están cada una clasificada en uno de siete tipos de cornpa­ ñías, Estos tipos aparecen en lista al final del capítulo l. Construya una gráfica de pastel de estos tipos y comente la salida. Por ejemplo, ¡qué tipo es más prevaleciente en la base de datos y cuál es el que menos se ve?

4. Con el uso de la base de datos de desempleo internacional, construya una gráfica de tallo y hoja para Italia. ¡Qué muestra la gráfica acerca del desempleo para Italia en los últimos 40 años? ¡Qué es lo que no muestra la gráfica?

CASO: LAS JABONERAS PRESENTAN BATALLAS Procter & Gamble ha sido la principal fabricante de jabón en Estados Unidos desde 1879, cuando introdujo el jabón Ivory (Marfil). No obstante, a finales de 1991 su principal rival, Lever Bros. (Unilever), la rebasó al alcanzar 31.5% del mer­ cado de jabón personal con ventas de $1 600 millones, del cual Procter & Gamble tuvo una participación de 30.5%. Lever Bros habla estado detrás de Procter & Gamble desde que entró al mercado de jabones con Lifebuoy en 1895. En 1990 Lever Bros. introdujo un nuevo jabón, el Lever 2000, en sus productos como jabón para toda la familia. Se creó un

nicho para este jabón por la segmentación del mercado de jabones en jabones especialmente para niños, mujeres y hombres. Lever Bros. tuvo la idea de vender un jabón para toda la familia y la respuesta del consumidor fue sólida; Lever 2000 vendió $113 millones en 1991, poniendo a Lever Bros. delante de Procter & Gamble por primera vez en la competencia de ingresos por venta de jabón personal. Procter & Gamble todavía vende más jabón, pero las marcas de Lever cuestan más, con lo cual resulta en ventas más altas en general.

Page 68: libro.pdf

:;a pa ~ decir que Procter & Gamble fue rápida tma respuesta al éxito del Lever 2000. Procter &

nrias estrategias posibles, incluyendo el repo­ _, ¿ Safeguard, el cual se ha visto como jabón para

A i:nal de cuentas, Procter & Gamble respondió al ~su jabón para baño humectante Oil of Olay.

ziio de distribución nacional, este producto fue -.-a::a:o por un esfuerzo publicitario que costó $24 millo­

j:abón tuvo gran éxito y Procter & Gamble vol- -=z sa participación en el mercado. ~representa las cantidades más recientes de los

"Wm::z;:¡ks ptx>nes para uso personal en Estados Unidos, con .._:eccmus ventas, Cada uno de estos jabones es produci­

d.e cuatro fabricantes de jabones: Unilever, Procter DW y Colgate-Palmolive.

Ventas .... Fabricante ($en millones)

D.:w Unilever 271 [h! Dial 193

~~ Unilever 138

->pring Colgate-Palmol.ive 121

Los: Procter & Gamble 115

~ Procter & Gamble 94

e.res. Unilever 93

Ctrv Procter & Gamble 69 Sépw"d Procter & Gamble 48

..::.:zs: Dial 44

, la participación del mercado de jabón fue para G3:nble con 37.1 %, Lever Bros. (Unilever) con 24%, l:' Colgate-Palmolive con 6.5% y los demás con

!'L"ll 1991, las participaciones del mercado de jabón ~ Bros. (Unilever) con 31.5%, Procter & Gamble

Dial con 19%, Colgate-Palmolive con 8% y los .:IXl l l por ciento.

~os que el estudiante está haciendo un reporte := Procter & Gamble que muestre su participación en el -m:::::adc Junto con la participación de otras compañías ~ ia; años 1983, 1991 y las últimas cantidades. Con el

n sea de Excel o de MTNITAB, trace gráficas de las par­ ~mes del mercado de jabón personal para cada uno .% ~ años. Para los datos de las últimas cantidades, ~ que el total de "los demás" es de $119 millones.

observa sobre las participaciones del mercado de las ~ compañías al estudiar las gráficas? En particular,

está Procter & Gamble respecto a años anteriores?

~os que Procter & Gamble vende unos 20 millo­ = de iabones por semana, pero la demanda no es cons­ = y .a gerencia de producción desea conocer cuál es la

CAP!TUW 2 TABLAS Y GRÁFICAS 43

mejor manera en que se distribuyen en todo el año. Las siguientes cantidades en ventas, dadas en millones de jabo­ nes, representan las ventas de jabones por semana en todo un año. Construya un histograma que represente estos datos. ¡Qué ve usted en la gráfica que pudiera ser útil para el personal de producción (y ventas)?

17.1 19.6 15.4 17.4 IS.O 18.5 20.6 18.4 20.0 20.9 19.3 18.2 14.7 17.1 12.2 19.9

20.3 20.4 15.4 18.7 20.4 20.3 17.5

22.5 21.4 26.3 23.9 26.6 24.3

15.5 16.8 19.1 18.3 13.6 39.8 23.1 22.8 21.4 25.2 26.2 26.9 23.8

17.0

23.4 30.6 26.2

20.7 21.3 24.0 25.2 32.8 26.3

Construya una gráfica de tallo y hoja con el uso de números enteros como los tallos. ¡Qué ventajas ofrece la gráfica de tallo y hoja de estas cantidades de ventas sobre el histogra­ ma? ¡Cuáles son algunas desventajas? ¡Cuál usaría usted en reuniones de trabajo con personal de producción y por qué?

3. Se prueba la calidad de una muestra aleatoria de jabones terminados y en sus envolturas. Se examinan las causas de problemas de todos los jabones defectuosos. Entre los pro­ blemas encontrados están: envoltura inapropiada, etiquetas erróneas, sello defectuoso, forma errónea del jabón, super­ ficie estropeada del jabón, color erróneo en el jabón, fra­ gancia impropia, mala consistencia del jabón, entre otros. Aquí se proporcionan algunas de las principales causas de problemas y el número de ellas. Utilice una gráfica de Pareto para analizar estas causas de problemas. Con base en sus hallazgos, ¿qué recomendaría usted a la compañia?

Causa del problema Frecuencia

Superficie del jabón 89 Color 17 Fragancia 2 Etiqueta 32 Forma 8 Sello 47 Etiquetado 5 Consistencia del jabón 3

Fuente: adaptado de Valcric Reitman, '"Buoyant Sales of Lever 2000 Soap Bring Sinking Sensation to Prceter & Gamble': Wall Strttt }01m1al1 19 marzo, 1992, p. 81. Reimpreso con premiso de The Wall Street Joumal, 1992, Dow Iones & Company, lng. Todos los derechos reservados en el mundo; Pam Weisz, "$40 M Extends 1.<0V<r 2000 Family~ Bmndwuk, vol. 36, num. 32 (21 de agosto de 1995), p. 6; Laurie Freernan, "P&G Pushes Back •?mSl Unilever in Soap", Ad..,.,ismg Age, vol. 65, numero 41 (28 de septiembre ,1994), p. 21; Ieanne Whalen and Pat Sloan, "tntros Help Boost Soap Coupons"; Adwrtismg Age, vol. 65, núm. 19 (2 de mayo de 1994), p. 30; y "P&G Places Coast Soap Up for Sale", The Post, World Wide Web Edition of The Ci11dnnati Post, 2 de febrero de 1999, http://www.cincypost.com.business/pg022599.html.

Page 69: libro.pdf

44 ESTADISTICA EN LOS NEGOCIOS

EXCEL USO DE LA COMPUTADORA

Con el Chart wizard, Excel ofrece la capacidad de producir muchas de las tablas y gráficas presentadas en este capitulo. Además, Excel puede generar distribuciones de frecuencia e histogramas con el uso de D.ata analysis.

Muchas de las técnicas de este curso se puede realizar en Excel con el uso de una herramienta llamada .[!ata analysis. Para tener acceso a Ja función D.ata analysis, seleccione Iools en la barra de menús. D.ata analysis está ubicado en el fondo del menú de despliegue descendente. Si .[!ata analysis no apa­ rece en este menú, debe agregarse. Este agregado o módulo sólo se hace una vez. Para agregar .[!ata analysis, seleccione Add-jns en el menú Iools. En la caja de diálogo Add-jns que aparece, haga clic en Analysis ToolPak (no Analysis Too!Pak­ VBAJ. Haga clic en OK (aceptar) y Analysis Too!Pak quedará agregado a la capacidad de Iools.

Excel se refiere a las distribuciones de frecuencia como histogramas. En Excel las clases se llaman bins (directorios). Si el usuario no especifica bins, Excel automáticamente determi­ na el número de bins. Si el usuario desea especificar los bins, cargue los puntos finales de clase en una columna. Para calcu­ lar la distribución de frecuencia, seleccione Iools en la barra de menús de Excel. Seleccione Uata analysis del menú des­ cendente Iools y seleccione Histogram de la caja de diálogo .[!ata Analysis. Ponga la ubicación de los valores sin procesar de datos en Input Range. Si desea especificar los puntos fina­ les de clase, ponga la ubicación de los puntos finales en .Rin Range. Si desea que Excel automáticamente determine los bins, deje esto en blanco. Si tiene etiquetas, entonces haga clic en Labels. Si desea una gráfica de histograma, haga clic en .Chart Output en la parte baja de la caja de diálogo. Si desea una ojiva, seleccione Curnulative Percentage junto con .Chart Output, y Excel producirá una gráfica de histograma con una ojiva sobrepuesta en la misma. Seleccione una de las opciones de salida. Después de hacer clic en OK se obtiene una distri­ bución de frecuencia como salida con bins y frecuencia junto con una gráfica de histograma.

Después de construir una distribución de frecuencia, el usuario puede construir histogramas, polígonos de frecuencia y ojivas con la función Chart Wizard. Para tener acceso a Chart Wizard seleccione Insert en la barra de menú. Del menú descendente seleccione .Chart Aquí se dispone de varias tablas y gráficas. La primera se llama Column, con la que es posible construir una del tipo histograma. Estas tablas de columna son en realidad gráficas de barras verticales con espacios entre las clases. Seleccione Column, y luego avance por las cuatro cajas de diálogo que siguen, llenando la infor­ mación apropiada. En la caja de rango de datos ponga la ubi­ cación de los bins y las frecuencias de la distribución de frecuencia. En el Chart Wizard es posible modificar los títu­ los, ejes, leyendas y ubicación de la salida según se desee. Para convertir una gráfica de barras verticales en un histograma al eliminar la brecha entre barras, haga clic con el botón derecho del ratón sobre una de las barras de la gráfica. Del menú que aparece, seleccione FQrmat Data Series. De la caja de diálogo

que aparece, seleccione Options. En el espacio junto a Gap IDdth, ponga un cero o reduzca el número a cero. Haga clic en OK, con Jo cual desaparece la brecha.

Es posible construir un polígono de frecuencias polígono de frecuencia al seleccionar Line en el Chart Wizard. Los pasos son prácticamente los mismos para la gráfica Line (ren­ glón) que para la gráfica Column.

Para construir una ojiva, los datos deben ser acumulados primero cuando la distribución de frecuencia se esté constru­ yendo al hacer clic en Cumulative Percentage en la caja de diálogo Histogram. El Chart W1Z8rd se puede usar entonces para construir la ojiva al seleccionar gráfica Line. Las cajas de diálogo de cuatro pasos son prácticamente las mismas que las empleadas para construir gráficas de barras verticales y polí­ gonos de frecuencia, excepto que en el paso 2 se debe seleccio­ nar la ficha Series. Bajo Series, seleccione Frequency y seleccione l!,emove, que deja al usuario con precisamente los porcentajes acumulativos o una ojiva.

Para construir una gráfica de pastel en Excel, cargue las etiquetas (compañia, persona, etc.) en una columna y los valo-· res (frecuencia, valor en dólares, porcentaje, etc.) en otra columna. Seleccione [nsert de la barra de menús, luego selec­ cione Chart del menú descendente. Seleccione Pie de este menú y siga las instrucciones en los cuatro pasos. El usuario tiene la opción de incluir una leyenda, determinar qué etique­ tas de datos usar, si as! lo desea, y determinar la ubicación final de la gráfica de pastel.

Para construir una gráfica de dispersión en Excel, cargue los datos para cada variable en una columna separada. Seleccione lnsert de la barra de menú, luego seleccione Chart del menú descendente. Seleccione XY (ScatterJ de este menú y siga las instrucciones en los cuatro pasos. El usuario tiene la opción de incluir una leyenda, determinar qué etiquetas usar, si as! lo desea y determinar la ubicación final de la gráfica de dispersión.

MINITAB

MINITAB tiene la capacidad de construir histogramas, polígo­ nos de frecuencia, ojivas, gráficas de pastel, gráficas de tallo y hoja, gráficas de Pareto y gráficas de dispersión junto con lo necesario para construir una distribución de frecuencias. Con excepción de las gráficas de Pareto, a las que se tiene acceso mediante el S.tat, a todas estas tablas y gráficas se tiene acceso al seleccionar !iraph en la barra de menús.

Histogramas, polígonos de frecuencia y ojivas se constru­ yen en el MINITAB con el uso de la opción Histogram del menú descendente !lraph. Para empezar, inserte la ubicación de columna de los datos sin procesar en el primer renglón bajo !lraph variables de la caja de diálogo Histogram. Es posible hacer múltiples gráficas al insertar ubicaciones en diversos renglones bajo !lraph variables. En .[!ata display, seleccione el tipo de gráfica deseada. Utilice Bar para un histograma y Connect para un polígono de frecuencias o una ojiva. Existen diferentes opciones en esta caja de diálogo para establecer el número de clases, dando a la gráfica un titulo, modificar los

Page 70: libro.pdf

ejes, etc. La caja de diálogo {}¡!tions es especialmente impor­ tante para modificar el número de clases, determinar el tipo de intervalos empleados y construir una ojiva. Para construir una ojiva, seleccione Cumulative Frequency de la caja de diá­ logo {}¡!tions. Para construir un pollgono de frecuencias, un histograma o para determinar frecuencia para una distribu­ ción de frecuencia, seleccione frequency. Casi todo lo esencial de una distribución de frecuencia se puede obtener al cons­ truir un histograma, al seleccionar Annotation de la caja de diálogo Histograrn y luego seleccionar Qata labeJs. En la caja de diálogo Qata labels, haga clic en Show data labels. Esta opción agregará frecuencia a la gráfica. A partir de estas fre­ cuencia y los puntos finales de clases mostrados en la gráfica, se puede construir una distribución de frecuencias.

Las gráficas de pastel se construyen al seleccionar Pi~ Chart del menú descendente Y.raph. En la caja de diálogo Pi~ Chart, las dos principales opciones son !;hart data in y Cbart table. Utilice la opción !;hart data in si los valores a usar al construir la gráfica de pastel están en una sola colum­ na. Utilice la opción Chart table si las categorlas están en una columna y los valores de frecuencia están en otra columna. Existen otras opciones, por ejemplo para ordenar las rebana­ das de pastel, explorar rebanadas, colores o leyendas.

Las gráficas de tallo y boja se construyen al seleccionar Stem-and-leaf ... del menú descendente !l_raph. En la caja de diálogo Stem-and-leaf ... escriba la ubicación de los datos y haga clic en OK. La salida contiene tallos y hojas pero además

CAPITULO 2 TABLAS Y GRÁFICAS 45

da una cuenta de frecuencia acumulada arriba y abajo del valor medio (que se muestra a la izquierda de la salida).

Para construir una gráfica de Pareto, empiece por selec­ cionar Stat de la barra de menús. Del menú descendente que aparece, seleccione Quality Tools. Del menú descendente Quality Tools seleccione fareto Chart. De la caja de diálogo fareto Chart seleccione Chart defects table si usted tiene un resumen de los defectos con las razones (Labels) en una co­ lumna y la frecuencia de ocurrencia (.Erequencies) en otra columna. Escriba la ubicación de las razones en 1abels y la ubicación de las frecuencias en .Erequencies. Si tiene datos sin resumir, puede seleccionar !;hart defects data in. En el espa­ cio que aparece, dé la ubicación de la columna con todos los defectos que se presentaron. Es posible tener los defectos ya sea por nombre o con algún código. Si usted desea tener las etiquetas en una columna y los defectos en otra, entonces seleccione BY variables in y ponga ahí la ubicación de las etiquetas.

Para construir una gráfica de dispersión, seleccione !l_raph, luego seleccione flot En la caja de diálogo flot bajo Graph va­ riables, ponga la ubicación de la variable y en el primer espa­ cio bajo Y y la ubicación de la variable x en el segundo espacio bajo X Es posible crear múltiples gráficas al llenar los espa­ cios junto a Graph 2, Graph 3, etc. Para obtener una gráfica de dispersión (en lugar de gráfica de línea, etc.), seleccione Symbol bajo Display en la porción Data display de la caja de diálogo.

Page 71: libro.pdf

CAPÍTULO 3

Estadística descriptiva

46

OBJETIVOS DE APRENDIZAJE El capítulo 3 se centra en el uso de técnicas estadísticas para describir datos, con lo cual el estudiante puede: l. Distinguir entre medidas de tendencia central, medidas de variabilidad, medidas

de forma y medidas de asociación. 2. Comprender los significados de media, mediana, moda, cuartil, percentil y rango. 3. Calcular media, mediana, moda, percentil, cuartil, rango, varianza, desviación

estándar y desviación media absoluta en datos no agrupados. 4. Diferenciar entre muestra y varianza de población y desviación estándar. S. Comprender el significado de desviación estándar como es aplicado al usar la regla

empírica y el teorema de Chebyshev. 6. Calcular la media, moda, desviación estándar y varianza en datos agrupados. 7. Entender el sesgo, curtosis y gráficas de caja y bigote. 8. Calcular el coeficiente de correlación e interpretarlo.

Page 72: libro.pdf

Estadísticas de lavanderías

Según Procter & Gamble, 35 mil millones de cargas de lavandería se ejecutan en Estados Unidos cada aiio. Cada segundo se inician 1100 cargas. Las estadísticas demuestran que una persona en Estados Unidos genera un cuarto de tonelada de ropa sucia cada año. Los estadounidenses parecen estar pasando más tiempo lavando de lo que pasaban hace 40 años. Hoy día, el promedio de mujeres estadouniden­ ses pasa de siete a nueve horas a la semana en una lavandería, pero una investigación de esa industria muestra que el resultado es que hay ropa más sucia que en otros países desarrollados. Diversas compa­ ñías venden versiones nuevas y mejoradas de lavadoras y detergentes y, con todo, los estadounidenses parecen resistirse a innovaciones de fabricantes de este equipo. En Estados Unidos, el promedio de máquina lavadora emplea unos 16.galones de agua; en Europa esta cifra es de sólo 4 galones. El pro­ medio de ciclo de lavado de una máquina hecha en Estados Unidos es de unos 35 minutos, compara­ do con 90 en Europa. Los estadounidenses prefieren máquinas que se cargan desde arriba porque no tienen que inclinarse, y estas últimas máquinas son más grandes. Los europeos emplean máquinas más pequeñas que se cargan por el frente porque tienen espacios de vivienda más reducidos.

Preguntas gerenciales y estadísticas Prácticamente todas las estadísticas citadas aquí se obtienen de estudios o encuestas.

l. Supongamos que se lleva a cabo un estudio de uso de lavanderías en 50 casas en Estados Unidos equipadas con lavadoras y secadoras. Se toman mediciones de agua en cuanto al número de galones usados por cada lavadora en un ciclo. Los siguientes datos son el número de galones empleados por cada lavadora durante el ciclo de lavado. Resuma los datos para que sea posible reportar resultados de este e~tudio. 15 17 16 15 16 17 18 15 14 15 16 16 17 16 15 15 17 14 15 16 16 17 14 15 12 15 16 14 14 16 15 13 16 17 17 15 16 16 16 14 17 16 17 14 16 13 16 15 16 15

2. El promedio de ciclo de lavado para una máquina hecha en Estados Unidos es de 35 minutos. Supongamos que la desviación estándar de un ciclo de lavado para una máquina de este tipo es de 5 minutos. ¡Dentro de qué rango de tiempo caen la mayor parte de ciclos de lavado de una de estas máquinas?

3. La cantidad de lavandería hecha al año en una casa, ¡está relacionada de alguna manera con el ingreso familiar? Supongamos que ocho familias de dos adultos y dos niiios se eligen al azar para un estudio. En un periodo de un año, se lleva registro del peso de la ropa lavada por cada familia, y se averigua su ingreso anual. De los siguientes datos de estudio, determine si existe relación entre el ingreso de esa familia y la cantidad de lavanderfa hecha (en peso).

Cantidad de lavandería Ingreso familiar (peso en libras) (en miles de dólares)

1210 42 875 31

l 890 1450 2 040 1 330

660 1490 1950

60 68

110 45 56 72 93

Fuente: adaptado de Emily Nelson, "In Doing l.aundry, Americans Cling to Outmoded Ways", Wall Srreet fournal, 16 de mayo de 2002, pp. Al & AIO.

47

Page 73: libro.pdf

C z

48 ESTADISTICA EN LOS NEGOCIOS

El capítuloZ describe técnicas gráficas para organizar y presentar datos. Por ejemplo, tratamos de resu­ mir 40 años de porcentajes de desempleo para Francia con una distribución de frecuencias, un histo­ grama, un polígono de frecuencias y una ojiva. Aun cuando estas gráficas permiten que el investigador haga algunas observaciones generales acerca de la forma y dispersión de los datos, es posible obtener una comprensión más completa de ellos si se resumen mediante el uso de estadísticas. Este capítulo presenta medidas estadísticas, que incluyen medidas de tendencia central, de variabilidad y de forma. El cálculo de estas medidas es diferente para datos no agrupados y agrupados. En consecuencia, pre­ sentamos algunas medidas para datos no agrupados y agrupados. Además, se puede usar una de las estadísticas presentadas para calcular la correlación y relación entre dos variables numéricas.

3.1 MEDIDAS DE TENDENCIA CENTRAL: DATOS NO AGRUPADOS

Un tipo de medida que se utiliza para describir un conjunto de datos es la medida de tendencia cen­ tral. Las medidas de tendencia central dan información acerca de la parte central, o media, de un grupo de números. La tabla 3.1 muestra precios ofrecidos para las 20 ofertas públicas iniciales más grandes en Estados Unidos en un año reciente, seiún Securities Data. Para estos datos, las medidas de tendencia central pueden dar información como Jo es el promedio de precio ofrecido, el precio medio ofrecido y el precio ofrecido que se presenta con más frecuencia. Las medidas de tendencia central no se concen­ tran en el intervalo del conjunto de datos o en qué tan lejos están los valores desde los números del cen­ tro. Las medidas de tendencia central presentadas aquí para datos no agrupados son la moda, la mediana, la media, percentiles y cuartiles.

Moda La moda es el valor que se presenta con más frecuencia en un conjunto de datos. Para los datos de la tabla 3.1, la moda es $19.00 porque el precio ofrecido que se presentó más veces (4) fue $19.00. La organiza­ ción de los datos en un conjunto ordenado (ordenación de los números de menor a mayor) ayuda a localizar la moda. El siguiente es un conjunto ordenado de valores de la tabla 3.1.

7.00 11.00 14.25 15.00 21.00 22.00 23.00 24.00

15.00 25.00

15.50 27.00

19.00 27.00

19.00 28.00

19.00 34.22

19.00 43.25

Esta agrupación hace más fácil ver que 19.00 es el número que se presenta con más frecuencia. En el caso de empate para el valor que se presenta con más frecuencia, se hace una lista de dos

modas. Luego entonces se dice que los datos son bimodales. Si un conjunto de datos no es exactamen­ te birnodal pero contiene dos valores que son más dominantes que otros, algunos investigadores se toman Ja libertad de denominar al conjunto de datos como birnodal incluso sin un empate exacto para la moda. Los conjuntos de datos con más de dos modas se conocen como multimodales.

En el mundo de los negocios, el concepto de moda se usa con frecuencia al determinar medidas. Por ejemplo, fabricantes de zapatos podrían producir zapatos de bajo costo en sólo tres anchos: peque­ ño, mediano y grande. Cada medida de ancho representa un ancho modal de pies. Al reducir el núme-

. ro de medidas a unas cuantas medidas modales, las compañías pueden reducir costos totales del producto al limitar costos de preparación de máquinas. Del mismo modo, la industria del vestido produce camisas, vestidos, trajes y muchos otros productos de vestido en tallas modales. Por ejemplo, todas las camisas talla M en un lote dado se producen en Ja misma talla ", Esta talla es alguna medida modal para hombres de tamaño medio.

La moda es una medida apropiada de tendencia central para datos de nivel nominal. La moda se puede usar para determinar qué categoría se presenta con más frecuencia.

TABLA 3.1

Precios de oferta para las 20 más grandes ofertas públicas iniciales eri un año reciente

Mediana $14.25 $19.00 $11.00 $28.00

24.00 23.00 43.25 19.00

27.00 25.00 15.00 7.00 34.22 15.50 15.00 22.00

19.00 19.00 27.00 21.00

La mediana es el valor medio de un conjunto ordenado de números. Para un conjunto con un número impar de términos, la mediana es el número de en medio. Para un conjunto con un número par de términos, la mediana es el promedio de los dos números de en medio.

Page 74: libro.pdf

CAPITUW 3 ESTADISTICA DESCRIPTIVA 49

PASO l. Acomodar las observaciones en un conjunto ordenado de datos. PASO 2. Para un número impar de términos, hallar el término de en medio del conjunto ordenado. Éste es la mediana. PASO 3. Para un número par de términos, hallar el promedio de los dos términos de en medio. Este pro­ medio es la mediana.

Supongamos que un investigador desea determinar la mediana para los siguientes números.

15 11 14 3 21 17 22 16 19 16 5 7 19 8 9 20 4

El investigador acomoda los números en un conjunto ordenado.

3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22

Como el conjunto contiene J 7 términos (número impar de términos), la mediana es el número de en medio, o sea 15.

Si se eliminara el número 22 'de la lista, el conjunto tendría sólo 16 términos.

3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21

Ahora, para un número par de términos, el experto en estadística determina la mediana al pro­ mediar los dos valores de en.medio, 14 y 15. El valor resultante de mediana es 14.5.

Otra forma de localizar la mediana es hallar el término (n + 1 )/2 en un conjunto ordenado. Por ejemplo, si un conjunto de datos contiene 77 términos, la mediana es el término 39. Esto es:

n + 1 77 + 1 78 , . -- = -- = - = terrruno 39 2 2 2

Esta fórmula es útil cuando deba manipularse un gran número de términos. Considere los datos de precio ofrecido en la tabla 3.1. Debido a que este conjunto de datos contie­

ne 20 valores o n = 20, la mediana para estos datos se localiza como (20 + 1)/2 o sea el término 10.5. Esta ecuación indica que la mediana está situada a la mitad entre los términos 10 y 11, o sea el prome­ dio de 19.00 y 21.00. Así, el precio ofrecido mediano para las 20 más grandes ofertas públicas iniciales en Estados Unidos es $20.00.

La mediana no resulta afectada por la magnitud de los valores extremos. Esta característica es una ventaja, porque valores grandes y pequei\os no influyen en forma desproporcionada en la mediana. Por esta razón, la mediana es a veces la mejor medida de ubicación a usar en el análisis de variables como son costos de casas, ingreso y edad. Supongamos, por ejemplo, que un corredor de bienes ralees desea determinar la mediana del precio de venta de JO casas que aparecen con los siguientes precios:

$67 000 91 000 95000

$105 000 116 000 122 000

$148 000 167 000 189 000

$5 250 000

La mediana es el promedio de los dos términos medios, $116 000 y $122 000, o sea $119 000. Este precio es una representación razonable de los precios de las 10 casas. Nótese que la que tiene un precio de $5 250 000 no entró en el análisis como no sea para contar como una de las 10 casas. Si el precio de la décima casa fuera $200 000, los resultados serían los mismos. No obstante, si los precios de todas se promediaran, el precio promedio resultante de las 1 O casas originales serla de $635 000, más alto que nueve de los 10 precios originales.

Una desventaja de la mediana es que no usa toda la información de los números. Por ejemplo, la información acerca del precio especifico que se pide de la casa más costosa no entra realmente en el cálculo de la mediana. El nivel de medida de datos debe ser por lo menos ordinal para que una media­ na tenga sentido.

Media La media aritmética es el promedio de un grupo de números; se calcula al sumar todos los números y dividirlos entre el total de ellos. Debido a que la media aritmética tiene tanto uso, casi todos los exper­ tos en estadística la Uaman simplemente media.

La media poblacional se representa con Ja letra griega mu(µ.). La media muestra! se representa con x. Las fórmulas para calcular la media poblacional y Ja media muestra! se dan en los recuadros que siguen:

Page 75: libro.pdf

ff

50 ESTADISTICA EN LOS NEGOCIOS

1

MEDIA POBLACIONAL

1

MEDIA . MUESTRAL 11 11

PROBLEMA DE DEMOSTRACIÓN

3.1

La letra sigma mayúscula griega (I,) se utiliza por lo común en matemáticas para representar una suma de todos los números de una agrupación." De igual modo, N es el número de términos de la población 11 es el número de términos de la muestra. El algoritmo para calcular una media es sumar todos los números de la población o muestra y dividir entre el número de términos.

Una definición más formal de la media es: N ¿x;

r=J µ,=-- N

Sin embargo, para los fines de este texto:

N Ex denota l:x;

i=I

Es incorrecto usar la media para analizar datos que no sean por lo menos del nivel de intervalo en una medición.

Supongamos que una compañía tiene cinco departamentos con 24, 13, 19, 26 y 11 trabajadores cada una. El número de trabajadores de la media poblacional en cada departamento es 18.6 trabajado­ res. A continuación veamos el cálculo.

24 13 19 26 ll

Ex= 93

y Ex 93

µ=-=-=18.6 11 5

El cálculo de una media muestra! utiliza el mismo algoritmo que para una media poblacional y producirá la misma respuesta si se calcula con los mismos datos. No obstante, es incorrecto calcular una media muestra! para una población o una media poblacional para una muestra. Debido a que pobla­ ciones y muestras son importantes en estadística, es necesario el uso de un slmbolo por separado para la media poblacional y para la media muestra!.

A continuación aparece el número de autos en servicio en las principales compañías de renta de autos de Estados Unidos en un año reciente, según Auto Renta/ News.

Compañía Enterprise Hertz ANC Rental Group Avis Budget Dollar Thrifty U-Save Toyota Rent-a-Wreck Advantage Payless ACE

Número da autos en servicio 460 000 350 000 322 000 220 000 146 000

78 000 51 000 15 000 12 000 12 000 12 000 B 000 8 000

• La matemática de las sumas no se estudia aqui. En el CD~ROM se incluye una explicación más detallada.

Page 76: libro.pdf

CAPITULO 3 ESTADISTICA DESCRIPTI\">. 51

Calcule la moda, la mediana y la media.

Solucl6n

Moda: 12 000 Mediana: Con 13 diferentes compañías en este grupo, n = 13. la mediana está situada en la

posición (13 + 1)/2 = 7a. Como los datos ya están ordenados, el séptimo término es 51 000, que es la mediana.

Media: El número total de autos en servicio es 1 694 000 = Ix

µ,=Ex= 1694000=130 307.7 n 13

La media es afectada por todos y cada uno de los valores, que es una ventaja. La media utiliza todos los datos y cada renglón de ellos influye en la media. También es una desventaja, porque valores extre­ madamente grandes o pequeños pueden dirigir la media hacia el valor extremo. Recuerde el análisis precedente de los precios de 1 O casas. Si la media se calcula para las 1 O casas, el precio medio es más alto que nueve de las casas porque la de $5 250 000 está incluido en el cálculo. El precio total de las 10 casas es $6 350 000 y el precio medio es $635 000.

La media es la medida de ubicación más comúnmente empleada porque utiliza cada renglón de datos en su cálculo, es una medida conocida y tiene propiedades matemáticas que la hacen atractiva para usarla en análisis estadístico inferencial.

Percentiles Los percentiles son medidas de tendencia central que dividen tm grupo de datos en 100 partes. Hay 99 percentiles, porque se requiere de 99 divisores para separar un grupo de datos en 100 partes. El n-ésimo percentil es el valor tal que al menos 11 por ciento de los datos están bajo ese valor y a lo sumo (100 - n) por ciento están arriba de ese valor. Específicamente, el percentil 87 es un valor tal que al menos 87% de los datos están abajo del valor y no más de 13% están arriba del valor. Los percentiles son valores en escalón, como se ve en la figura 3.1, porque el percentil 87 y el percentil 88 no tienen percentil entre ellos. Si el operador de una planta toma un examen de seguridad y 87.6% de las calificaciones del exa­ men de seguridad están abajo de la calificación de esa persona, él o ella todavía califican con sólo el per­ centil 87, aun cuando más de 87% de las calificaciones son menores.

Los percentiles se utilizan ampliamente para reportar resultados de pruebas. Casi todos los estu­ diantes de facultades o universidad han tomado el examen SAT, ACT, GRE o GMAT. En la mayor parte de los casos, los resultados de estos exámenes se reportan en forma de percentil y también como califi­ caciones sin procesar. A continuación se muestra un resumen de los pasos empleados para determinar la ubicación de un percentil.

Pasos para determinar la ubicación de un percentil

l. Organizar los números en un conjunto de orden ascendente. 2. Calcular la ubicación del percentil (í) con:

i=....!:_(n) 100

donde: P = el percentil de interés i = ubicación de percentil

n = número del conjunto de datos

lj@'l;!Jl .. 1-----------------------Íl;¡¡¡ijiiiiiiii~-;pe:r:c.:n:til~· ~s8;- Percentiles en 1 escalera 1 1 1 • percentil 87

percentil 86

Page 77: libro.pdf

52 ESTADISTICA EN LOS NEGOCIOS

PROBLEMA DE DEMOSTRACIÓN

3.2

O@i1¡tt1 .. Cuartiles

3. Determine la ubicación de (a) o de (b).

a. Si i es un número entero, el P-ésimo percentil es el promedio del valor en la i-ésima ubica­ ción y el valor en la (i + !)•va ubicación.

b. Si i no es un número entero, el valor del P-ésimo percentil está ubicado en la parte del núme­ ro entero i + l.

Por ejemplo, supongamos que el estudiante desea determinar el percentil 80 de 1240 miembros. P es 80 y n es 1240. Primero, ordene los números de menor a mayor. A continuación, calcule la ubicación del percentil 80.

j = ~(1240) = 992 100

Como i = 992 es un número entero, siga las instrucciones del paso 3(a). El percentil 80 es el pro­ medio del número 992 y el número 993.

p _ (992 número + 993 número) 80 - 2

Determine el percentil 30 de los siguientes ocho números: 14, 12, 19, 23, 5, 13, 28, 17:

Soluci6n

Para estos ocho números, deseamos hallar el valor del percentil 30, de modo que n = 8 y P = 30. Primero, organizamos los datos en orden ascendente:

5 12 13 14 17 19 23 28 A continuación, calculamos el valor de i.

i=~(8)=2.4 100

Como i no es un número entero, debe usarse el paso 3(b). El valor de i + 1 es 2.4 + 1, o sea 3.4. La parte del número entero de 3.4 es 3. El percentil 30 está ubicado en el tercer valor. El ter­ cer valor es 13, de modo que 13 es el percentil 30. Nótese que un percentil puede o no puede ser uno de los valores de datos.

Cuartiles Los cuartiles son medidas de tendencia central que dividen un grupo de datos en cuatro subgrupos o par­ tes. Los tres cuartiles están denotados como 01, 02 y 03• El primer cuartil, 01, separa el primer, o más bajo, cuarto de los datos de los tres cuartos más altos y es igual al percentil 25. El segundo cuartil, 02, separa el segundo cuarto de los datos del tercer cuarto. 02 está ubicado en el percentil 50 y es igual a la mediana de los datos. El tercer cuartil, 03, divide los primeros tres cuartos de los datos del último cuar­ to y es igual al valor del percentil 75. Estos tres cuartiles se muestran en la figura 3.2.

Suponga que desearnos determinar los valores de 01, 02 y Q3 para los siguientes números.

106 116 122 109 114 121 125 129

primer un cuarto

primeros dos cuartos

primeros tres cuartos

Page 78: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

3.3

CAPITULO 3 ESTADISTICA DESCRIPTIVA 53

El valor de Q1 se encuentra en el percentil 25, P25, con:

paran =B, i=~(8)=2 100

Como i es un número entero, Pis se encuentra como el promedio de los números segundo y tercero,

(109+ 114) = 111.5 2

El valor de Q1 es Pis= 111.5. Nótese que un cuarto, o dos, de los valores (106 y 109) son menores a 1115. El valor de Q2 es igual a la mediana. Como el conjunto contiene un número par de términos, la

mediana es el promedio de los dos términos de en medio.

Q2 =mediana= (1 l6+121) 118.5 2

Nótese que exactamente la mitad de los términos son menores a Q2 y la mitad son mayores a Q2• El valor de Q3 se determina con P75 como sigue:

i=~(8)=6 100

Como i es número entero, P75 es el promedio de los números sexto y séptimo.

F¡5 = (122+125) 123.5 2

El valor de Q3 es P75 = 123.5. Nótese que tres cuartos, o seis, de los valores son menores a 123.5 y dos de los valores son mayores a 123.5.

Lo siguiente muestra ingresos de las principales organizaciones de publicidad del mundo, según Advertising Age. Determine el primero, segundo y tercer cuartiles para estos datos.

Ingreso bruto en el mundo Organizeción publicitllri• Oficln• matriz (Smillonff)

WPP Group Londres 8 165 lnterpublic Group of Cos. Nueva York 7 981 Omnicom Group Nueva York 7 404 Publicis Communication París 4 770 Dentsu Tokio 2796 Havas Adversiting París 2733 Grey Adversiting Nueva York 1 864 Cordination Communications Group Londres 1 175 Hakuhodo Tokio 874 Asatsu Tokio 396 TMP Worldwide Nueva York 359 Carlson Marketing Group Minneápolis 356 lncepta Group Londres 248 OigitasA Boston 236 Tokyu Agency Tokio 204 Daiko Adversiting Tokio 203

Solución

Para 16 organizaciones publicitarias, n = 16. 01 = P25 se encuentra con:

i=~(16)= 4 100

Page 79: libro.pdf

54 ESTADISTICA EN LOS NEGOCIOS

Como i es número entero, 01 es el promedio de los valores cuarto y quinto desde abajo.

01 = 248 + 356 302 2

02 = P50 = mediana; con 16 términos, la mediana es el promedio de los términos octavo y noveno.

02=874+1175=1 024.5 2

~ = P75 se resuelve con:

r=~(16l=12 100

~se encuentra al promediar los términos doceavo y treceavo.

o - 2 796+4 770 3 783 3- 2

3.1 PROBLEMAS

3.1 Determine la moda para los siguientes números:

2 4 8 4 6 2 7 8 4 3 8 9 4 3 5

3.2 Determinar la mediana para los números del problema 3.1. 3.3 Determinar la mediana para los siguientes números:

213 345 609 073 167 243 444 524 199 682

3.4 Calcular la media para los siguientes números:

17.3 44.5 31.6 40.0 52.8 38.8 30.1 78.5

3.5 Calcular la media para los siguientes números:

7 -2 5 9 o -3 -6 -7 -4 -5 2 -8

3.6 Calcular el percentil 35, el percentil 55, Q¡, Q2 y Q3 para los siguientes datos:

16 28 29 13 17 20 11 34 32 27 25 30 19 18 33

3.7 Calcular P20, P47, P83, Q1, Q2 y Q3 para los siguientes datos:

120

138 162

105

118

119 150

128

144

145 80

171

172

139 143

116

138

107 127

116

97

94 112

142

3.8 Los siguientes datos muestran el número de autos y camiones ligeros en un año reciente entre los principales fabricantes de autos en el mundo, reportados por AutoFacts, unidad de Coopers & Lybrand Consulting. Calcular la media y mediana. ¿Cuál de estas medidas es la más apropiada para resumir los datos y por qué? ¿Cuál es el valor de Q2? Determine el percentil 63 para los datos. Determine el percentil 29 para los datos.

Page 80: libro.pdf

CAPITUlo3 ESTADISTICA DESCRIPTIVA 55

Pabricante Producción (en miles) General Motors 7 880 Ford Motors 6 359 Toyota 4 580 Volkswagen 4161 Chrysler 2 968 Nissan 2646 Honda 2 436 Fiat 2 264 Peugeot 1 767 Renault 1 567 Mitsubishi 1 535 Hyundai 1 434 BMW 1 341 Daimler-Benz 1 227 Daewoo 898

3_9 La siguiente es una lista de los principales bancos del mundo clasificados por activos según American Banker. Calcular la mediana, Q3, P20• P60, Pso y P93.

Activos (miles de Banco millones de dólares) Citigroup (Nueva York) 902 Deutsche Bank (Frankfort) 873 Bank of Tokio-Mitsubishi 721 J. P. Morgan Chase (Nueva York) 715

UBS (Zurich) 674 HSBC Holdings (Londres) 673 BHV AG (Munich) 654 BNP-SG-Paribas (París) 652 BankAmerica (Charlorte) 642 ING NV (Amsterdam) 613

3.10 La siguiente es una lista del número de accidentes mortales por aerolínea comercial de vuelos regulares en un periodo de 17 años, según la Air Transportation Association of America. Con estos datos, calcular la media, la mediana y la moda. ¿Cuál es el valor del tercer cuartil? Determine P11, P35, Pss Y P61· 4 4 4 4 2 4 3 8 6 4 4 4 2 3 3

3.2 MEDIDAS DE VARIABILIDAD: DATOS NO AGRUPADOS

Las medidas de tendencia central dan información acerca de puntos particulares de un conjunto de datos. No obstante, investigadores de negocios pueden usar otro grupo de herramientas anahticas para describir un conjunto de datos. Estas herramientas son medidas de variabilidad, que describa: la 1fü­ persión de un conjunto de datos. Con el uso de medidas de variabilidad en conjunción con medidas de tendencia central es posible obtener una descripción numérica más completa de los datos.

Por ejemplo, una compañía tiene 25 vendedores en el campo y la mediana anual de Ymtb ?4r.l estas personas es de $1.2 millones. ¿Tienen o no tienen éxito estos vendedores como grup:Y. La media­ na da información acerca de las ventas de la persona del medio, pero ¿qué hav de !0$ ouos ftnciedcres~ ¿Todos venden $1.2 millones anualmente o varían mucho estas cifras, con una persona qne .-mde $5 millones al año y otra sólo $150 000 al año? Las medidas de variabilidad proporcionan la información adicional necesaria para contestar esa pregunta.

Page 81: libro.pdf

56 ESTADISTICA EN WS NEGOCIOS

La figura 3.3 muestra estas tres distribuciones en las que la media de cada distribución es la misma (µ. = SO) pero las variabilidades difieren. La observación de estas distribuciones muestra que una medi­ da de variabilidad es necesaria para complementar el valor medio al describir los datos. Los métodos de las medidas de variabilidad de cálculo difieren para datos no agrupados y agrupados. Esta sección se concentra en siete medidas de variabilidad para datos no agrupados: rango, rango intercuartil, desvia­ ción media absoluta, varianza, desviación estándar, valor de Z y coeficiente de variación.

Rango El rango es la diferencia entre el valor más grande de un conjunto de datos y el valor más pequeño. Aun cuando por lo general es un solo valor numérico, algunos investigadores de negocios definen el rango como el par ordenado de números más grande y más pequeño (más pequeño, más grande). Es una medida burda de variabilidad que describe la distancia a los límites exteriores del conjunto de datos. Refleja esos valores extremos porque se construye a partir de ellos. Una ventaja del rango es su facili­ dad de cálculo. Un uso importante del rango es en aseguramiento de la calidad, donde el rango se emplea para construir gráficas de control. Una desventaja del rango es que, como se calcula con los valores que están en los extremos de los datos, éstos son afectados por los valores extremos. Por tanto, su aplicación como medida de variabilidad es limitada.

Los datos del la tabla 3.1 representan los precios ofrecidos para las 20 principales ofertas públicas iniciales de Estados Unidos en un año reciente. El precio más bajo de oferta es de $7.00 y el más alto de $43.25. El rango de los precios ofrecidos se puede calcular como la diferencia de los valores más alto y más bajo:

Rango = Más alto - Más bajo = $43.25 - $7.00 = $36.25

Rango intercuartil Otra medida de variabilidad es el rango intercuartil. El rango intercuartil es el rango de valores entre el primero y tercer cuartiles. En esencia, es el rango de 50% central de los datos y se determina al calcular el valor de <2J - Q1• El rango intercuartil es especialmente útil en situaciones donde los usuarios de datos están más interesados en valores hacia el medio y menos interesados en los extremos. Al descri­ bir un mercado de viviendas, los corredores de bienes raíces podrían usar el rango intercuartil como medida de precios de viviendas cuando describan la mitad media del mercado a compradores intere­ sados en casas con valores de rango medios. Además, el rango intercuartil se utiliza en la construcción de gráficas de caja y bigote.

RANGO INTERCUARTII.

Los siguientes datos indican los 15 principales socios de Estados Unidos por exportaciones de ese país a otros países en un año reciente, según la U.S. Census Bureau.

Exportaciones País ($miles de millones) Canadá $151.8 México 71.4 Japón 65.S Reino Unido 36.4 Corea del Sur 25.0 Alemania 24.S Taiwán 20.4 Países Bajos 19.8 Singapur 17.7 Francia 16.0 Brasil 15.9 Hong Kong 15.1 Bélgica 13.4 China 12.9 Australia 12.1

Page 82: libro.pdf

Tres distribuciones con la misma media pero diferentes dispersiones.

µ, = 50

CAPITULO 3 ESTADISTICA DE.SOUl"Il\ \ 5"i

¡Cuál es el rango intercuartil para estos datos? El proceso empieza al calcular los cuartiles primero y ter­ cero como sigue:

Despejando Q1 = P25 cuando n = 15: 25 .

i=-(15)=3.75 100

Como i no es un número entero, entonces P25 es el cuarto término desde abajo.

Al despejar Q3 = P75:

Q¡ = P2s = 15.1

i=~(l5)=11.25 100

Como i no es un número entero, se encuentra que P75 es el término 12 desde abajo.

El rango intercuartil es:

Q3 - Q¡ = 36.4 - 15.I = 21.3

El 50% medio de exportaciones de los 15 principales socios comerciales de Estados Unidos abarca un rango de 21.3 ($miles de millones) .

.. Jid.!(ii[!.ijll"fjliJ+Ii!.il·li!!.t .. _ Estaclfsticas de telecomunicaciones Un estudio realizado ,por Telework America patrocinado por AT&T en 2001 reveló que 28 millones de estadouni­ denses trabajan por computadora a distancia (teletrabajo). De éstos, 24.1% trabajan de viaje, 21.7% trabajan fuera de sus casas, 7.5% trabaja en centros de trabajo a distancia y 4.2% trabajan en oficinas por satélite. Más de 40% de estas personas trabajan en más de un lugar. Se estima que 30 millones de teletrabajadores estarán laborando en Estados Unidos para finales de 2004.

El teletrabajador típico vive en el Oeste o el Noreste, es hombre, tiene educación universitaria, tiene entre 35 y 44 años de edad, es casado y gana por lo menos $40 mil al año. El ingreso medio para teletrabajadores es de S44 mil. La mayoría de ellos trabajan en impuestos {IT), bienes ralees o administración de empresas. Los teletrabajadores, por lo general, viajan en automóvil unas 18 millas al trabajo y ahorran casi 53 minutos de tiempo de viaje cada día de tra­ bajo hábil en que laboran a distancia. En promedio, traba­ jan uno o dos dlas por semana fuera de casa.

Los teletrabajadores están relativamente satisfechos con su trabajo. Setenta y cinco por ciento de quienes traba-

jan en casa reportaron un ingreso cuantificable, en produc­ tividad y calidad de trabajo, cuando cambiaron de trabajos tradicionales en oficinas a trabajar a distancia. Dos tercios de teletrabajadores expresaron más satisfacción en su tra­ bajo y dicen que lo hacen más horas que quienes no traba­ jan a distancia, pero que sus trabajos interfieren menos con sus vidas personales.

Trabajar a distancia puede ahorrar costos para las empresas debido a que no hay ausentismo, disminución de costos en bienes ralees y que el trabajo se con sen-a por máS tiempo. Se estima que empicados que trabajan a dístaDcia pueden ahorrar a sus empleadores un promedio de SIO cada uno al disminuir el ausentismo y cansen-ar más txm po el trabajo. Los costos de bienes raíces se pueden reduru de 25 a 90%. AT&T ahorra $3 mil anualmente por trXa3- bajador y $25 millones al año en costos de bienes r2icrS por empleados que son de tiempo completo.

,,...,.te; adaptado de YouCanWorkfromAn)~ a>m ......,. ycwfa.comñnfoccntcrrfacts.htm; Ioni Kislntt "A=w! Sar....... ~ Dcbunk Telework Mvths~ Na. l\\rrm :!9 do< oad!re do< _ 1 m http://www.nwfusion.c~m/nct.worhr rolummsul!OC ~h!ml.

Page 83: libro.pdf

r 58 ESTADISTICA EN LOS NEGOCIOS

Desviación media absoluta, varianza y desviación estándar

T~BLA 3.2

Desviaciones de· la media para producción de computadoras

Distancias geométricas desde la media (de la tabla 3.2)

Otras tres medidas de variabilidad son la varianza, la desviación estándar y la desviación media abso­ luta. Se obtienen por medio de procesos similares y, por tanto, se presentan juntas. Estas medidas no tienen sentido a menos que los datos sean por lo menos de nivel de intervalo. La varianza y desviación estándar se utilizan ampliamente en estadística. Aun cuando la desviación estándar tiene un potencial independiente, lo importante de la varianza y la desviación estándar está principalmente en su papel como herramientas empleadas junto con otros procedimientos estadísticos.

Supongamos que una pequeña empresa inició una línea de ensamble para fabricar computadoras. Durante las primeras cinco semanas de trabajo, la producción es 5, 19, 16, 17 y 18 computadoras, res­ pectivamente. ¡Qué estadística descriptiva podrla usar el propietario para medir el primer avance de producción? En un intento por resumir estas cantidades, el propietario podrla calcular una media.

X

Ex=65

5 9 16 17 18

Ex 65 tt=-¡¡=5=13 ¡Cuál es la variabilidad en estas cinco semanas de datos? Una forma en la que el propietario

comience a ver la dispersión de los datos es restando la media de cada uno de los datos. Restar la media a cada valor de datos da la desviación respecto a la media (x - µ,). La tabla 3.2 muestra estas desvia­ ciones para la producción de computadoras. Nótese que algunas desviaciones respecto a la media son positivas y algunas son negativas. La figura 3.4 muestra que geométricamente estas desviaciones nega­ tivas representan valores que están abajo (a la izquierda) de la media y las desviaciones positivas repre­ sentan valores que están arriba (a la derecha) de la media.

Un examen de desviaciones respecto a la media puede revelar información sobre la variabilidad de datos. No obstante, las desviaciones se utilizan casi siempre como herramienta para calcular otras me­ didas de variabilidad. Nótese que en la tabla 3.2 y en la figura 3.4, el total de estas desviaciones es cero. Este fenómeno se aplica a todos los casos. Para un conjunto de datos dado, la suma de todas las desvia­ ciones respecto a la media aritmética es siempre cero.

Nthncro(x) Dlrrild6e ele la media (X - fa) s 5-13 = -8 9 9-13 = -4

16 16-13•+3 17 17-13 = +4

1! 18-13=+5 l:x = 65 I.(x- µ)=O

-8

~

-4

5 9 13 16 17 18 µ.

Page 84: libro.pdf

CAPITULO 3 ESTADISTICA DESCRIPTI\ 59

LA SUMA DE DESVIACIONES RESPECTO A LA MEDIA ARITMETICA ES SIEMPRE CERO

I(x- µ)=o

Esta propiedad exige considerar los modos alternativos para obtener medidas de variabilidad. Una forma obvia para forzar la suma de desviaciones para que tenga un total diferente de cero es

tomar el valor absoluto de cada desviación alrededor de la media, con lo cual es posible despejar la des­ viación media absoluta.

Desviación media absoluta La desviación media absoluta (MAD) es el promedio de los valores absol11tos de las desviaciones alrede­ dor de la media para un conjunto de números. i DESVIACIÓN MEDIA

ABSOLUTA MAD = Elx - µI

N

Con el uso de los datos de la tabla 3.2, el propietario de la compañia de computadoras puede calcu­ lar una desviación media absoluta al tomar los valores absolutos de las desviaciones y prornediarlos, como se muestra en la tabla 3.3. La desviación media absoluta para los datos de producción de compu­ tadoras es 4.8.

Debido a que se calcula con el uso de valores absolutos, la desviación media absoluta es menos útil en estadística que otras medidas de dispersión. No obstante, en el campo de pronósticos, se usa oca­ sionalmente como medida de error.

Varianza Como los valores absolutos no conducen a una manipulación fácil, expertos en matemáticas crearon un mecanismo alternativo para superar la propiedad de sumacero de desviaciones desde la media. Este método utiliza el cuadrado de las desviaciones a partir de la media. El resultado es la varianza. una importante medida de variabilidad.

La varianza es el promedio del cuadrado de desviaciones alrededor de la media aritmética para un conjunto de números. La varianza de población está denotada por u2.

1 VARIANZA POBLACIONAL 2 E(x-¡1)2 u=---- N

TABLA 3.3

Desviación de media absoluta (MAD) para datos de producción de computadoras

La tabla 3.4 muestra los números de producción original para la compañía de computadoras, las desviaciones desde la media y el cuadrado de desviaciones desde la media.

La sama del cuadrado de las desviaciones alrededor de la media de un conjunto de valores -Ilamada suma de cuadrados de x y a veces abreviada como SS,,- tiene amplio uso en estadfstica. Para la com­ pañía de computadoras, este valor es 130. Al dividirlo entre el número de valores de datos (5 semanas) se obtiene la varianza para la producción de computadoras.

u2 =~= 26.0 5

%-p. j%-I'! -8 +8 -4 +4 +3 +3 +4 +4

s 9

16 17

!§ +S +5 l:x - 65 I(x - µ) = o Ijx- µj = 24

MAD = ~= 24 = 4.8 n 5

Page 85: libro.pdf

60 ESfADISTICA EN LOS NEGOCIOS

Debido a que la varianza se calcula desde el cuadrado de desviaciones, el resultado final se expre sa en términos de unidades de medida cuadradas. Es problemático interpretar la estadística con medí das en unidades cuadradas; considere, por ejemplo, a Mattel Toys tratando de interpretar costos de producción en términos de dólares al cuadrado o medir la variación de producción de Troy-Bilt en tér­ minos del cuadrado de podadoras de pasto. Por tanto, cuando se usa como medida descriptiva, l. varianza puede ser considerada como un cálculo intermedio en el proceso de obtener la desviación estándar muestral.

Desviación estándar La desviación estándar es la una medida de variabilidad preferida. Se utiliza como entidad separada v como parte de otros análisis, por ejemplo para calcular intervalos de confianza y en pruebas de hipó­ tesis (véanse los capítulos 8, 9 y 10).

DESVIACIÓN ESTÁNDAR POBLACIONAL

a=~E(x~µ)z

TABLA 3.4

Cálculo de la varianza y la desviación estándar de los datos de producción de computadoras

La desviación estándar es la raíz cuadrada de la varianza. La desviación estándar poblacional se denota con u.

Al igual que la varianza, la desviación estándar utiliza la suma del cuadrado de desviaciones alre­ dedor de la media (SSxl· Se calcula al promediar este cuadrado de desviaciones (SS,/N) y tomar la raif cuadrada de ese promedio. Una característica de la desviación estándar que la distingue de una varian­ za es que la desviación estándar se expresa en las mismas unidades que los datos sin procesar, mientras que la varianza se expresa en el cuadrado de esas unidades. La tabla 3.4 muestra la desviación estándar para la compañia que produce computadoras: v'26 o 5.1.

¿Qué significa la desviación estándar de 5.1? El significado de desviación estándar se entiende más fácilmente por su uso, que se explora en la siguiente sección. Cuando la desviación estándar y la varian­ za están estrechamente relacionadas y se pueden calcular entre si, distinguirlas es importante porque ambas tienen amplio uso en estadística.

Significado de desviación estándar

¿Qué es una desviación estándar? ¿Qué hace y qué significa lo que hace? La manera más precisa de defi­ nir una desviación estándar es al detallar la fórmula empleada para calcularla. Con todo, es posible entender la noción del concepto de desviación estándar al ver la manera en que se aplica. Dos modos de aplicar la desviación estándar son la regla empirica y el teorema de Chebysbev.

X " - " lx- "' s -8 64 9 -4 16

16 +3 9

17 +4 16

!! +5 ~ I.x = 65 !(x- µ)=O !(x - µ)2 = 130

SSx-= !(x - µ)2 = 130

varianza=u2=ss" =!(x-µ)2 =~=26.0 N N 5

Page 86: libro.pdf

=ieg1a empírica :iara una y dos iJeSViaciones estándar de precios oe gasolina

-- CAPtruW 3 ESTADISTICA t>ESCKJPin:\ 61

68% -la +la

Sl.34 Sl.42 $1.50 µ.=$1.42 a =$0.08

$1.42 µ.=$1.42 u =S0.08

$1.26

A B

Regla empírica

La regla empírica es una importante regla práctica que se usa para expresar el porcentaje aproximado que está dentro de un número dado de desviaciones estándar desde la media de un conjunto de datos, si los datos están distribuidos normalmente.

La regla emp[rica se usa sólo para tres veces la desviación estándar: lo, 20' y 30'. En el capítulo 6 se presenta un análisis detallado de otros números de valores cr, también en el capitulo 6 se estudia con mayor detalle la distribución normal, distribución simétrica unimodal que tiene forma de campana (o montlculo). El requisito de que los datos estén normalmente distribuidos tiene alguna tolerancia y la regla empírica por lo general aplica mientras los datos tengan forma aproximada de montículo.

REGIA EMPlR.JCA

Distancia desde la media Valores dentro de la distancia µ:!::la 68% µ :!:: 20' 95% µ :!:: 30' 99.7%

.. Con base en la suposición de que los datos están aproximada­ mente distribuidos de manera aproximada.

Si un conjunto de datos está normalmente distribuido, o tiene forma de campana, cerca de 68'!1. de los valores de datos están dentro de una desviación estándar de la media, 95% están dentro de dos de5'713- ciones estándar, y casi 100% están dentro de tres desviaciones estándar.

Supongamos que un informe reciente expresa que, para California, el precio promedio a nivel $a­

tal de un galón de gasolina de tipo regular es de $1.42. Supongamos también que los precios de gasoli­ na regular variaron en el estado con una desviación estándar de $0.08 y estuvieron norrnalmente distribuidos. Según la regla empírica, alrededor de 68% de los precios deber[an caer dentro deµ = 1:, o $1.42 :!: 1($0.08). Más o menos 68% de los precios estarían entre $1.34 y $1.50, como se ve en b ~ 3.SA. Alrededor de 95% debería caer dentro deµ. :!: 20' o $1.42 :!: 2($0.08) = $1.42 = S0.16, o sea= $1.26 y $1.58, como observa en la figura 3.58. Casi todos los precios de gasolina regular (99.# )dme­ rían caer entre $1.16 y $1.66 (µ. :!: 3u).

Nótese que 68% de los precios de gasolina caen dentro de una desviación estándar~ de la media, alrededor de 32% están fuera de este rango. Como la distribución normal es símEtria, ~::'. puede dividirse a la mitad de la moda que 16% se encuentre en cada cola de la <furriboción. Ezr..onco, alrededor de 16% de los precios de gasolina deben ser menores a $1.34 y más o menos 169& de los pre­ cios deben ser mayores a $1.50.

Normalmente, numerosos fenómenos están distribuidos en forma de campana. ~ la ma­ yorfa de las características humanas como son la estatura y el peso; por tanto, la regla empírica se aplica en muchas situaciones y se usa ampliamente.

Page 87: libro.pdf

r 62 ESTADISTICA EN LOS NEGOCIOS

PROBLEMA DE DEMOSTRACIÓN

3.4

Una compañía produce una válvula ligera que está especificada para pesar 1365 gramos. Por desgracia, debido a imperfecciones en el proceso de manufactura, no todas las válvulas produ­ cidas tienen un peso exacto de 1365 gramos. De hecho, los pesos de las válvulas producidas están normalmente distribuidos con un peso medio de 1365 gramos y una desviación estándar de 294 gramos. ¿Dentro de qué rango caerían alrededor de 95% de los pesos de válvulas? Aproximadamente 16% de los pesos ¿serían mayores que cuál valor? Aproximadamente 0.15% de los pesos ¿serían menores a qué valor?

Soluci6n

Debido a que los pesos de las válvulas están normalmente distribuidos, aplica la regla empírica. Según ésta, casi 95% de los pesos caerían dentro deµ.± 2u = 1365 ± 2(294)= 1365 ± 588. Así, casi 95% deberían caer entre 777 y 1953. Aproximadamente 68% de los pesos deberían caer den­ tro deµ.± 1uy 32% debería caerfuera de este intervalo. Debido a que la distribución normal es simétrica, cerca de 16% debería estar arriba deµ.± 1u =1365 + 294 = 1659. Casi 99.7% de los pesos deberían caer dentro deµ.± 3u y 0.3% deberían caer fuera de este intervalo. La mitad de esto último; es decir, 0.15%, debería estar abajo deµ. - 3u = 1365 - 3(294)= 1365 - 882 = 483.

Teorema de Chebyshev

La regla empírica aplica sólo cuando se sabe que los datos están normalmente distribuidos de manera aproximada. ¿Qué utilizan los investigadores cuando los datos no están normalmente distribuidos o la forma de la distribución es desconocida? El teorema de Chebyshev aplica a todas las distribucio­ nes cualquiera que sea su forma y por tanto se puede usar siempre que la forma de la distribución de datos sea desconocida o sea anormal. Aun cuando el teorema de Chebyshev puede en teoría aplicarse a datos que están normalmente distribuidos, la regla empírica es más conocida y se prefiere siem­ pre que sea apropiado. El teorema de Chebyshev no es una regla práctica, como es la regla empírica, sino que más bien se presenta en formato de fórmula y, por tanto, se puede aplicar con más amplitud. El teorema de Chebyshcv expresa que por menos 1 - lfk2 valores caerán dentro de ::!:k desviaciones estándar de la media, cualquiera que sea la forma de la distribución.

TEOREMA DE CHEBYSHEV

Dentro de k desviaciones estándar de la media, µ. ::!: ka, existe por lo menos:

1 - _!_ v proporción de valores. Suposición: k > 1

Aplicación del teorema de Chebyshev 'para dos desviaciones estándar

Específicamente, el teorema de Chebyshev dice que al menos 75% de todos los valores están den­ tro de ::!:2a de la media, cualquiera que sea la forma de una distribución, porque si k = 2 entonces 1 - lfk2 = 1 - 1/22 = 3/4 = .75. La figura 3.6 da una ilustración gráfica. En contraste, la regla empírica expresa que si los datos están normalmente distribuidos 95% de todos los valores están dentro deµ, ::!: 2a. De acuerdo con el teorema de Chebyshev, el porcentaje de valores dentro de tres desviaciones están­ dar de la media es por lo menos 89%, en contraste con 99.7% para la regla empírica. Como se usa una fórmula para calcular proporciones con el teorema de Chebyshev, se puede usar cualquier valor de k mayor a 1 (k > 1). Por ejemplo, si k = 2.5, al menos 0.84 de todos los valores están dentro deµ,::!: 2.5a, porque 1 - l/k2 = J - 1/(2.5)2 = 0.84.

µ.

Page 88: libro.pdf

PROBLEMA DE IOEMQSTRACIÓN

3.5

CAPITULO 3 ESTADISTICA DESCRIPTIVA 63

En la industria de la computación, la edad promedio de empleados profesionales tiende a ser más joven que en muchas otras profesiones de negocios. Supongamos que el promedio de edad de un profesional empleado por una compañía de computadoras en particular es de 28, con una des­ viación estándar de cinco años. Un histograma de edades de empleados profesionales con esta firma revela que los datos no están normalmente distribuidos sino que están amasados en los veintes y que pocos trabajadores tienen más de 40 años. Aplique el teorema de Chebyshev para determinar dentro de qué rango de edades caería al menos 85% de las edades de trabajadores.

Solución

Como las edades no están normalmente distribuidas, no es correcto aplicar la regla empírica y por tanto el teorema de Chebyshev debe aplicarse para contestar la pregunta.

El teorema de Chebyshev expresa que al menos una proporción de 1 - 1/k2 de los valores está dentro de µ ± ka. Como 85% de los valores están dentro de este rango, sea:

1 1 -1(2 = .85

Al despejar k se obtiene: 1

.15 = k2 k2 = 6.667 k = 2.58

El teorema de Chebyshev dice que al menos 0.85 de los valores están dentro de ±2.58ude la media. Para µ = 28 y u = 5, al menos 0.85 o sea 85% de los valores están dentro de 28 ± 2.58(5) = 28 ± 12.9 años de edad o entre 15.1 y 40.9 años.

Población contra varianza muestra! y desviación estándar

La varianza muestra! se denota por s2 y la desviación estándar muestra! por s. El principal uso para varianzas rnuestrales y desviaciones estándar son como estimadores de varianzas poblacionales y des­ viaciones estándar. Debido a esto, el cálculo de la varianza muestra! y desviación estándar difiere lige­ ramente del cálculo de la varianza poblacional y la desviación estándar. La varianza muestra! y la desviación estándar muestra! utilizan n - 1 en el denominador en lugar de n, porque usar n en el denominador de la varianza muestra! resulta una estadística que tiende a subestimar la varianza de población. Si bien el estudio de las propiedades de buenos estimadores está fuera del alcance de este texto, una de las propiedades de un buen estimador es ser no sesga¡io. Mientras que usar n en el deno­ minador de la varianza muestra! lo hace un estimador sesgado, usar n - 1 le permite ser un estimador no sesgado, que es una propiedad deseable en estadística inferencia!.

VARIANZA MUESTRAL 2 E(x-x)2

s =---- n-1

DESVIACIÓN ESTÁNDAR MUESTRAL

s= ~E(x-~)2 n-1

A continuación aparece una muestra de seis de los principales despachos de contadores en Es:aOas Unidos y el número de socios relacionados con cada empresa, según reporta el Pubtu: .'\ll==~ Repon. Empresa Número de socios PriccWaterhouse 1062 McGladrey & Pullcn 381 Dcloitte & Touche 1 719 Andcrscn Worlwide 1673 Coopers & Lybrand 1 277 800 Seidrnan 217

La varianza muestra! y desviación estándar muestrales se pueden calcular cae:

Page 89: libro.pdf

64 ESTADISTICA EN LOS NEGOCIOS

X (x-x)2 1062 51.41

381 454 046.87 1719 441 121.79 1673 382 134.15 1277 49 359.51 217 701959.11

Ex= 6329 E(x-x)2 = 2 028 672.84

FORMULA COMPUTACIONAL PARA VARIANZA Y DESV1ACI0N ESTANDAR

x = 6 329 = 1 054.83 6

2 E(x - x)2 2 028 672.84 s =---= 405 734.57 n-1 5

s = .f1 = .J405 734.57 = 636.97

La varianza muestra! es 405 734.57 y la desviación estándar muestra! es 636.97.

Fórmulas de cálculo breve para varianza y desviación estándar

Existe un método alternativo para calcular varianza y desviación estándar, que a veces se conoce como método de cálculo breve o método breve. Algebraicamente:

E(x- µ)2 = Ex2 - (Ex)2 N

y

Al sustituir de estas expresiones equivalentes, en las fórmulas originales para varianza y desviación estándar, obtenemos las siguientes fórmulas de cálculo breve.

Ex2- (Ex)2 <12= N

N

<1= ,¡;;¡ FORMULA COMPlITACIONAL PARA VARIANZA MUESTRALY DESV1ACI0N ESTANDAR

Ex2 - (Ex)2 52 = n

n-1

s=f1

Estas fórmulas de cálculo breve utilizan la suma de los valores x y la suma de los valores x2 en lugar de la diferencia entre la media y cada valor y desviaciones calculadas. Antes de que se usaran las calcu­ ladoras, este método por lo general era más rápido y fácil que usar las fórmulas originales.

Para situaciones en las que la media ya está calculada o se da, las formas alternativas de estas fórmulas son:

(12 Ex2-Nµ2 N

s2 Ex2 -n(x)2 n-1

Page 90: libro.pdf

TABLA 3.5

Calculos de fórmula de cálculo breve de varianza y desviación estándar para datos de producción de computadoras

PROBLEMA DE DEMOSTRACIÓN

3.6

CAPITULO 3 ESTADISllCA DESCIUP'T1\:\ 65

• r 5 25 9 81

16 256 17 289

!! 324 "Ix= 65 ~ .. 975

975 (65)l "2 = 5 "" 975-845 = !!!. = 26

5 5 5 u=v'Í6 .. 5.1

Con el uso del método de cálculo breve, el propietario de la compañia que inicia la producción de computadoras puede calcular una varianza poblacional y desviación estándar para los d tos de pro­ ducción, como se ve en la tabla 3.5. (Compare estos resultados con los de la tabla 3.4.)

Es posible medir la efectividad del fiscal de un distrito judicial por medio de varias vari bles, inclu­ yendo el número sentencias por mes, el número de casos manejados por mes y el úmero total de años de sentencias por mes. Una investigadora utiliza una muestra de cinco fisc es de distrito en una ciudad y determina el número total de años de sentencia que cada fiscal g ó contra acu­ sados durante el mes pasado, como se reporta en la primera columna de las siguientes tablas. Calcule la desviación media absoluta, la varianza y la desviación estándar para estas cifras.

Solud6n

La investigadora calcula la desviación media absoluta, la varianza y la desviación estándar para estos datos en la forma siguiente:

X

55 100 125 140

___§Q. I:x=480

lx-Xj 41

4 29 44

~ I:lx-Xj = 154

(x-x)2 1 681

16 841

1 936 1 296

I:(x-x )2 = 5 770

x= I:x = 48º =96 n 5 MAD = 154 = 30.8

5

s2 = 5 :10 = 1 442.5 y s = ~ = 37.98

A continuación, utiliza fórmulas de cálculo breve para despejar 52 y s para comparar los resul!Mb..

X x'- 55 3 025

100 10 000 125 15 625 140 19 600 60 3 600

Ex=480 Ex2 = 51 850

(480)2 2 51 05o--- 51 850-46 080 5 770 s = = =--=1442.5 4 4 4

. s = ,/1 442.5 = 37.98

Page 91: libro.pdf

66 ESTADISTICA EN LOS NEGOCIOS

Los resultados son los mismos. La desviación estándar muestra! obtenida por ambos métodos es 37 .98 o sea 38 años.

Valores z Representan el número de desviaciones estándar que un valor (x) está arriba o abajo de la media de un conjunto de números cuando los datos están normalmente distribuidos. Al utilizar el valor z es posible transformar la distancia bruta de un valor de la media en unidades de desviación estándar.

1 VAWRESz z=x-µ a

Para muestras: x-x

Z=-­ S

Si un valor z es negativo, el valor sin procesar (x) está abajo de la media. Si el valor z es positivo, el valor sin procesar (x) está arriba de la media.

Por ejemplo, para un conjunto de datos que está normalmente distribuido con una media de 50 y una desviación estándar de 10, supongamos que un experto en estadística desea determinar el valor z para uno de 70, el cual seria (x = 70) que está 20 unidades arriba de la media, de modo que el valor zes:

z= 70-50 =+2.00 10

Este valor z significa que 70 está dos desviaciones estándar arriba de la media. ¡Cómo se interpre­ ta el valor z? La regla empírica expresa que 95% de todos los valores están dentro de dos desviaciones estándar desde la media si los datos son aproximados y distribuidos en forma normal. La figura 3.7 muestra cómo el valor de 70 está dos desviaciones estándar arriba de la media (z = +2.00) 95% de los valores están entre 70 y el valor (x = 30), que está dos desviaciones estándar abajo de la media o = = (30-50)/10 = -2.00. Como 5% de los valores están fuera del rango de dos desviaciones estándar desde la media y la distribución normal es simétrica, 21/2% {1/2 del 5%) están abajo del valor de 30. Entonces 9"'1/1% de los valores están abajo del valor de 70. Como el valor z indica el número de des­ viaciones estándar que tiene un valor individual de datos respecto a la media, la regla empírica se puede expresar también en términos del valor z.

Entre z = -1.00 y z = + 1.00 son aproximadamente 68% de los valores. Entre z = -2.00 y z = +2.00 son aproximadamente 95% de los valores. Entre z = - 3.00 y z = + 3.00 son aproximadamente 99.7% de los valores.

El tema de los valores z se estudian con más detalle en el capítulo 6.

Coeficiente de variación El coeficiente de variación es un estadístico dado por la razón entre la desviación estándar y la media expresada en porcentaje y se denota como CV.

COEFICIENTE DE VARIACIÓN CV=~(lOO)

µ

El coeficiente de variación esencialmente es una comparación relativa de una desviación estándar con su media. El coeficiente de variación puede ser útil al comparar desviaciones estándar que han sido calculadas a partir de datos con diferentes medias.

Supongamos que cinco semanas de precios promedio para la acción A son 57, 68, 64, 71y62. Para calcular un coeficiente de variación para estos precios, primero determinarnos la media y desviación estándar: u. = 64.40 y a = 4.84. El coeficiente de variación es:

aA 4.84 CVA =-(100)=--(I00)=.075=7.5%

µA 64.40

Page 92: libro.pdf

!1@1!¡1-ii .. Porcentaje de descomposición de estadísticas. Dos desviaciones estándar desde la media

CAPITULO 3 ESTADISTICA DESCltlP'Il\'A 61

X =30 z =-2.00

µ. =50 z =O

X =70 z = +2.00

La desviación estándar es 7 .5% a partir de la media. A veces los investigadores financieros utilizan el coeficiente de variación, la desviación estándar o

ambos, como medidas de riesgo. Imaginemos una acción con un precio que nunca cambia; por tanto, un inversionista no corre el riesgo de perder dinero porque el precio bajó, ya que no hay variabilidad en el precio. Supongamos, en contraste, que el precio de la acción fluctúa en forma desordenada. Un inversionista que compre a precio bajo y vende a precio alto puede obtener una buena ganancia, pero si el precio cae por abajo de lo que el inversionista compra, el propietario de la acción tendría una pér­ dida potencial. Cuanto mayor sea la variabilidad es mayor el potencial de pérdida. Por esta razón, los inversionistas utilizan medidas de variabilidad como la desviación estándar o el coeficiente de variación para determinar el riesgo de una acción. ¿Qué puede prevenir el coeficiente de variación sobre el ries­ go de una acción, que no hace la desviación estándar?

Supongamos que los precios promedio de una segunda acción, B, sobre estas mismas cinco sema­ nas son de 12, 17, 8, 15 y 13. La media de la acción Bes 13.00 con una desviación estándar de 3.03. El coeficiente de variación se puede calcular para la acción B como:

CV8 = us (100) = 3·º3 (100) = .233 = 23.3% P.B 13

La desviación estándar para la acción B es 23.3% a partir de la media. Con la desviación estándar como la medida de riesgo, la acción A es más riesgosa sobre este perio­

do porque tiene mayor desviación estándar. No obstante, el precio promedio de la acción A es casi cinco veces más que el de la acción B. Por otra parte, la cantidad invertida en la acción A alcanza la desvia­ ción estándar de $4.84 que podría no representar tanto riesgo como la desviación estándar de $3.03 para la acción B, la cual tiene un precio promedio de sólo $13.00. El coeficiente de variación deja ver el riesgo de una acción en términos del tamaño de la desviación estándar con respecto al tamaño de la media (en porcentaje). La acción B tiene un coeficiente de variación que es casi tres veces el coeficien­ te de variación para la acción A; es decir, que el uso del coeficiente de variación como medida de ries­ go indica que la acción B es más riesgosa.

La opción de usar el coeficiente de variación o la desviación estándar para comparar desviacioaes estándar múltiples es cuestión de preferencia. El coeficiente de variación da un método opcional de interpretar el valor de la desviación estándar.

3.2 PROBLEMAS

3.11 Un conjunto de datos contiene los siguientes siete valores: 6 2 9 4 3 5 a. Encuentre el rango. b. Encuentre la desviación media absoluta. c. Encuentre la varianza poblacional. d. Encuentre la desviación estándar poblacional.

Page 93: libro.pdf

68 ESTADISTICA EN LOS NEGOCIOS

e. Encuentre el rango intercuartil f. Encuentre el valor z para cada dato

3.12 Un conjunto de datos contiene los siguientes ocho valores: 4 3 o 5 2 9 4 5 a. Encuentre el rango. b. Encuentre la desviación media absoluta. c. Encuentre la varianza muestra]. d. Encuentre la desviación estándar muestral. e. Encuentre el rango intercuartil.

3.13 Un conjunto de datos contiene los siguientes seis valores:

12 23 19 26 24 23 a. Encuentre la desviación estándar poblacional con el uso de la fórmula que contenga la media

(la fórmula original). b. Encuentre la desviación estándar poblacional con el uso de la fórmula de cálculo breve. c. Compare los resultados. ¡Qué fórmula fue más rápida de usar? ¡Qué fórmula prefiere usted?

¡Por qué piensa usted que la fórmula de cálculo breve se conoce a veces como la fórmula de "método breve"?

3.14 Utilice su calculadora o computadora para encontrar la varianza muestral y desviación estándar muestra! de los siguientes datos:

57 88 68 43 93

63 51 37 77 83 66 60 38 52 28 34 52 60 57 29 92 37 38 17 67

3.15 Utilice su calculadora o computadora para hallar la varianza poblacional y desviación estándar poblacional para los siguientes datos:

123 090 546 378 392 280 179 601

572 953 749 075 303 468 531 646

3.16 Determine el rango intercuartil de los siguientes datos:

44 18 39 40 59 46 59 37 15 73 23 19 90 58 35 82 14 38 27 24

71 25 39 84 70

3.17 Según el teorema de Chebyshev, ¡al menos qué proporción de los datos estarán dentro deµ.:!: ka para cada valor de k? a. k = 2 b. k = 2.5 c. k = 1.6 d. k = 3.2

3.18 Compare la variabilidad de los siguientes dos conjuntos de datos al usar tanto la desviación estándar como el coeficiente de variación:

Conjunto 1 de datos Conjunto 2 de datos

49

82 77 54

159

121 138 152

Page 94: libro.pdf

CAPl11JLO 3 ESTADISTICA DESCllIPTIU S

3.19 Una muestra de 12 pequeños despachos de contadores deja ver los siguientes números de profe­ sionales por oficina: 7 10 9 14 ti 8 5 12 8 3 13 6 a. Determinar la desviación media absoluta. b. Determinar la varianza. c. Determinar la desviación estándar. d. Determinar el rango intercuartil. e. ¡Cuál es el valor z para la empresa que tiene seis profesionales? f. ¡Cuál es el coeficiente de variación para esta muestra?

3.20 La siguiente, proporcionada por Marketing lntelligence Service, es una lista de las compañías con los más nuevos productos en un año reciente.

Compañia Número de nuevos productos Avon Products 768 L'Oreal 429 Unilever U.S. 323 Revlon 306 Garden Botanika 286 Philip Morris 262 Procter & Gamble 215 Nestlé 172 Paradiso 162 Tsumura lnternational 148 Grand Metropolitan 145

a. Encuentre el rango. b. Encuentre la desviación media absoluta. c. Encuentre la varianza poblacional. d. Encuentre la desviación estándar poblacional. e. Encuentre el rango intercuartil. f. Encuentre el valor z para Nestlé. g. Encuentre el coeficiente de variación.

3.21 Una distribución de números tiene aproximadamente la forma de una campana. Si la media de los números es 125 y la desviación estándar es 12, ¡entre cuáles dos números caería aproximada­ mente 68% de los valores? ¡Entre cuáles dos números caería 95% de los valores? ¡Entre cuáles dos valores caería 99.7% de los valores?

3.22 Algunos números no están normalmente distribuidos. Si la media de los números es 38 y la des­ viación estándar es 6, ¡qué proporción de valores caería entre 26 y 50? ¡Qué proporción devalo­ res caería entre 14 y 62? ¡Entre cuáles dos valores caería 89% de los valores?

3.23 Según el teorema de Chebyshev, ¡cuántas desviaciones estándar desde la media incluirían pw lo menos 80% de los valores

3.24 El tiempo necesario para ensamblar una pieza particular de mueble con experiencia = DIX­

malmente distribuida con un tiempo medio de 43 minutos. Si 68% de los tiempos de~ están entre 40 y 46 minutos, ¡cuál es el valor de la desviación estándar? Suponga que 99.IS de b tiempos de ensamble están entre 35 y 51 minutos y la media es todavía de 43 =~~sena ahora el valor de la desviación estándar? Suponga que el tiempo necesario para ~ o=-a pieza de mueble no está normalmente distribuida y que el tiempo medio de ~ es :.S minutos. ¡Cuál es la desviación estándar si al menos 77% de los tiempos de ~ csún = 24 y 32 minutos?

Page 95: libro.pdf

70 ESTADISTICA EN LOS NEGOCIOS

3.25 Los ambientalistas están preocupados por las emisiones de dióxido de azufre a la atmósfera. El número promedio de dlas por año en el que los niveles de dióxido de azufre excede de 150 mili­ gramos por metro cúbico en Milán, Italia, es 29. El número de dias por año en que se exceden los limites de emisión está normalmente distribuido con una desviación estándar de 4.0 ellas. ¿Qué porcentaje de los años promediaría entre 21 y 37 dias de exceso de emisiones de dióxido de azu­ fre? ¿Qué porcentaje de los años excederla de 37 dias? ¿Qué porcentaje de los años excederla de 41 dias? ¿En qué porcentaje de los años habría menos de 25 días con exceso de emisiones de dióxido de azufre

3.26 La Runzheimer Cuide publica una lista de las ciudades menos costosas en el mundo para agentes viajeros. A continuación aparece una lista de las 10 ciudades menos costosas con sus respectivos costos de gastos de viaje. Utilice esta lista para calcular el valor z para Bordeaux, Montreal, Edmonton y Hamilton. Trate esta lista como una muestra.

Ciudad Gastos de viaje ($)

Hamilton, Ontario 97 London, Ontario 109 Emonton, Alberta 111

Jakarta, Indonesia 118

Ouawa 120

Montreal 130 Halifax, Nova Scotia 132 Winnipeg. Manitoba 133 Bordeaux, Francia 137

Bangkok, Thailand 137

3.3 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD: DATOS AGRUPADOS

Los datos agrupados no dan información acerca de valores individuales. Por tanto, las medidas de ten­ dencia central y variabilidad para datos agrupados deben calcularse de la moda diferente a las de datos no agrupados o sin procesar. ·

Medidas de tendencia central Aqui se presentan dos medidas de tendencia para datos agrupados: la media y la moda.

Media

Para datos no agrupados, la media se calcula al sumar los valores de datos y dividir entre el número de valores. Con datos agrupados, los valores especificas son desconocidos. ¿Qué se puede usar para repre­ sentar los valores de datos? El punto medio de cada intervalo de marca de clase se utiliza para re­ presentar todos los valores en un intervalo de clase. Este punto medio es valorado por la frecuencia de valores en ese intervalo de clase. La media para datos agrupados se calcula entonces al sumar los pro­ ductos del punto medio de clase y la frecuencia para cada clase y dividir esa suma entre el número total de frecuencias. A continuación aparece la fórmula para la media de datos agrupados.

MEDIA DE DATOS AGRUPADOS

donde: i = el número de clases f = frecuencia de clase

N = total de frecuencias

Page 96: libro.pdf

CAP!TuLo 3 ESTADlsnCA DESCIJPiI\'.:\ i l

TABLA 3.6

Intervalo de clase Frecuencia

La tabla 3.6 proporciona la distribución de frecuencias de los porcentajes de desem­ pleo de Francia de la tabla 2.2. Para hallar la media de estos datos, necesitamos !._(y !.~f. El valor de 'if se puede determinar al sumar los valores de la columna de frecuencia.. Para calcular 'ifM, debemos determinar primero los valores de M, o la marca de clase. A conti­ nuación multiplicamos cada una de estas marcas de clase por la frecuencia en ese interva­ lo de clase, f, resultando en JM. Sumar estos valores de fM da el valor de 'ifM.

La tabla 3.7 contiene los cálculos necesarios para determinar la media de grupo. La media de grupo para los datos de desempleo es 6.25. Recuerde que como cada intervalo de clase fue representado por la marca de clase en lugar de los valores reales, la media de grupo es sólo aproximada .

Distribución de frecuencias de os porcentajes de desempleo

en Francia

I-rncnor de 3

3-menor de 5

s-menor de 7 --menor de9

9-menor de 11 Ll-menor de 13

16

4

3

9 6

Moda

La moda para datos agrupados es la marca de clase de la clase modal. La clase modal es el intervalo de clase con la frecuencia más grande. Con el uso de los datos del cuadro 3.7,

el intervalo de clase 1-menor de 3 contiene la frecuencia más grande, 16. Entonces, la clase modal es 1-menor de 3. La marca de clase de esta clase modal es 2. Por tanto, la moda para la distribución de frecuencias mostrada en la tabla 3.7 es 2. El porcentaje de desempleo modal es 2 por ciento.

Medidas de variabilidad Aquí se presentan dos medidas de variabilidad para datos agrupados: la varianza y la desviación están­

. dar. De nueva cuenta, la desviación estándar es la raíz cuadrada de la varianza. Ambas medidas tienen fórmulas originales y de cálculo breve.

FORMULAS PARA VARIANZA POBLACIONAL Y DESVIACIÓN ESTÁNDAR DE DATOS AGRUPADOS

Fórmula original \(ersión de cálculo breve

2 L,f(M-µ)2 a------ N

a=,W N

donde: f = frecuencia

M = punto medio de clase N = 'if o frecuencias totales de la población µ. = media agrupada para la población

TABLA 3.7

Cálculo de media agrupada

Intervalo de clase Frecuencia (!) Marca de clase (M) fM 1- menor de 3 16 32 3- menor de 5 4

5- menor de 7 4 6 24 7- menor de 9 8 24 9- menor de 11 9 10 90

11- menor de 13 ..i 12 ..11. ~f= N= 40 !./M = 250

'2:.JM 250 µ=--=-=6.25 '2:.¡ 40

Page 97: libro.pdf

r=---

1

72 ESTADISTICA EN LOS NEGOCIOS

TABLA 3.8 Cálculo de varianza agrupada y desviación estándar con la fórmula original

TABLA 3.9

Intern1o de da.e I M /M M-p (M-p)'A /(11-1'>1 l-menorde3 16 2 32 -4.25 18.063 289.00S 3-menorrkS 2 4 8 -2.25 S.063 10.126

S-menorde7 4 6 24 -0.lS 0.063 0.252

7-meoordc9 3 8 24 1.75 3.063 9.189

9- menor de 11 9 10 90 3.75 14.063 126.567

11-menor de 13 ..! 12 .n 5.75 33J>63 .!2!:m.. If-N= 40 IJM= 250 I/(M - µ)l = 633.520

~ 250 µ= =-=6.25 'i.f 4Q

,, = 'i. JCM -e>2 = ~ = 15.838 N 40

"= Vl5.838 = 3.980

. f

Cálculo de varianza l-menorde316 agrupada y 3-menordrS 2 4 desviación 5-menorde7 4 6 estándar con la fórmula de cálculo 7- meoorde9 3 8 breve 9-mmorde 11 9 10

11- menor de 13 6 12

f=N= 40

fJl fMZ 2 32 64

8 32 24 . 144

24 192

90 900 72 864

fM= 250 fW = 2196

'i./M2-('i.fM)2 u =----~n~-

2 2196- (Z50) --~40~ = 2196-1562.5 = 633.5 = 15.838

40 40 40 n u= \ 15.838 = 3.980

FÓRMULAS PARA VARIANZA MUESTRALY DESVIACIÓN ESTÁNDAR DE DATOS AGRUPADOS

Fórmula original Versión de cálculo breve

2 E/(M-x)2 s =

n-1

s=N donde:

f = frecuencia M = punto medio de clase N = I.f o total de frecuencias de la población µ. = media agrupada para la muestra

Por ejemplo, calculemos la varianza y desviación estándar de los datos agrupados de desempleo en Francia como una distribución de frecuencias en la tabla 3.6. Si los datos se tratan como población, los cálculos son como sigue:

Para la fórmula original, los cákulos se muestran en la tabla 3.8. El método para determinar a2 y u al usar la fórmula de cálculo breve se muestra en la tabla 3.9. En cualquier caso, la varianza de los datos de desempleo es de 15.838 (cuadrado de porcentaje) y la desviación estándar es de 3.98%. Al igual

Page 98: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

3.7

CAPITULO 3 ESTADISTICA DESCRIPII\':\. '3

que con el cálculo de la media agrupada, la marca de clase se utiliza para representar todos los valores en un intervalo de clase. Este método puede o no ser aproximado, dependiendo de si el valor prome­ dio en una clase está en el punto medio. Si esta situación no ocurre, entonces la varianza y desviación estándar son sólo aproximaciones. Debido a que la estadística agrupada se calcula por lo general sin conocer los datos reales, este cálculo es sólo aproximado. •

Calcule la media, moda, varianza y desviación estándar en los siguientes datos muestrales:

Intervalo de clase Frecuencia

10- menor de 15 6 15- menor de 20 22 20- menor de 25 35 25- menor de 30 29 30- menor de 35 16 35- menor de 40 8 40- menor de 45 4 45- menor de 50 2

Soluci6n

La media se calcula como sigue:

Clase M

10- menor de 15 6 12.5 15- menor de 20 22 17.5 20- menor de 25 35 22.5 25- menor de 30 29 27.5 30- menor de 35 16 32.5 35- menor de 40 8 37.5 40- menor de 45 4 42.5 45- menor de 50 2 47.5

fM

75.0 385.0 787.5 797.5 520.0 300.0 170.0 95.0

H=n= 122 HM=3130.0

X= EfM = 3130 = 25.66 Ef 122

La media agrupada es 25.66. La moda agrupada se puede determinar si se encuentra la marca de clase del intervalo de

clase con la frecuencia más grande. La clase con la frecuencia más grande es 20-menor de 2.5 con una frecuencia de 35. La marca de clase en este caso es de 22.5, que es fa moda agrupaaa.

La varianza y desviación estándar se pueden encontrar como se muestra a continuacio.- - Primero, usamos la fórmula original

Clase M M-x (M-X)2 f(M-Xl2

10- menor de 15 6 12.5 -13.16 173.19 1 039.14 15- menor de 20 22 17.5 -8.16 66.59 1 464.98 20- menor de 25 35 22.5 -3.16 9.99 349.65 25- menor de 30 29 27.5 1.84 3.39 98.3. 30- menor de 35 16 32.5 6.84 46.79 7~ 35- menor de 40 8 37.5 11.84 140.19 1121..::: 40- menor de 45 4 42.5 16.84 283.59 1 13.!3': 45- menor de 50 2 47.5 21.84 476.99 =-=- =::

U= n·= 122 :H(M-W= :: :L:iii!

52 = Ef(M-x)2 6910.58 =57.11 n-1 121

s = .Js1.11=7.56

Page 99: libro.pdf

74 ESTADISTICA EN LOS NEGOCIOS

A continuación, usamos la fórmula de cálculo breve.

Clase M fM fM2

10- menor de 15 6 12.5 75.0 937.50 15- menor de 20 22 17.5 385.0 6 737.50 20- menor de 25 35 22.5 787.5 17 718.75 25- menor de 30 29 27.5 797.5 21 931.25 30- menor de 35 16 32.5 520.0 16 900.00 35- menor de 40 8 37.5 300.0 11 250.00 40- menor de 45 4 42.5 170.0 7 225.00 45- menor de 50 2 47.5 95.0 4 512.50

U= n = 122 IfM= 3130.0 IfM2 = 87 212.50

¿; fM2 _ (E fM)2 87 212.5- (3 130l2 6 910.04 = 57.11 s2 = n 122

n-1 121 121 5 = ,/57 .11 = 7 .56

La varianza muestra! es 57 .11 y la desviación estándar es 7 .56.

3.3 PROBLEMAS

3.27 Calcule la media y la moda para los siguientes datos:

Clase f O- menor de 2 39 2- menor de 4 27 4- menor de 6 16 6- menor de 8 IS 8- menor de JO 10 JO- menor de 12 8 12- menor de 14 6

3.28 Calcule la media y la moda para los siguientes datos:

Clase f 1.2- menor de 1.6 220 1.6- menor de 2.0 ISO 2.0- menor de 2.4 90 2.4- menor de 2.8 110

2.8- menor de 3.2 280

3.29 Determine la varianza poblacional y desviación estándar para los siguientes datos con el uso de la fórmula original:

Clase f 20- menor de 30 7 30- menor de 40 11 40- menor de SO 18 SO- menor de 60 13 60- menor de 70 6

70- menor de 80 4

Page 100: libro.pdf

CAPITULO 3 ESTADISTICA DESOUl"rro rs

3.30 Determine la varianza muestra! y desviación estándar para los siguientes datos coa el uso de b fórmula de cálculo breve.

Clase f 5-menor de 9 20 9-menor de 13 18 13-menor de 17 8 17-menor de 21 6 21-menor de 25

3.31 Una muestra aleatoria de votantes ea Nashville, Tennessee, está clasificada por grupo de edad, como se ve en los siguientes datos:

Gru~deedad Frecuencia 18-menor de 24 17 24--menor de 30 22 30-menor de 36 26 36-menor de 42 35 42-menor de 48 33 48-mcnor de 54 30 54--menor de 60 32 60-menor de 66 21 66-menor de 72 15

a. Calcule la media de los datos.

b. Calcule la moda.

c. Calcule la varianza.

d. Calcule la desviación estándar.

3.32 Los siguientes datos representan el número de citas de negocios hechos por intervalo de 15 minu­ tos, por solicitud telefónica, para una compañia de jardinería:

Número frecuencia de citas con que ocurren O-menor de 1 31 !-menor de 2 57 2-menor de 3 26 3-menor de 4 14 4--menor de 5 6 5-menor de 6 3

a. Calcule la media de los datos.

b. Calcule la moda.

c. Calcule Ja varianza.

d. Calcule la desviación estándar.

Page 101: libro.pdf

76 ESTADISTICA EN LOS NEGOCIOS

3.33 La Air Transport Association of Arnerica publica datos sobre los aeropuertos de mayor movi­ miento en Estados Unidos. La siguiente distribución de frecuencias se elaboró a partir de estos datos para un año reciente:

Número de pasajeros que llegan y salen Número de (millones) aeropuertos 20-menor de 30 8 30-menor de 40 7 40-menor de 50 1 50-meoor de 60 O 60-menor de 70 3 70-menor de 80

a. Calcule la media de los datos. b. Calcule la moda. c. Calcule la varianza. d. Calcule la desviación estándar.

3.34 La distribución de frecuencias que se muestra representa el número de granjas por estado para 49 de los 50 estados, con base en información del US Departrnent of Agriculture. Determine el número promedio de granjas por estado a partir de estos datos. La media calculada desde los datos originales no agrupados es de 37 816 y la desviación estándar es de 29 341. ¿Cómo se com­ para la respuesta con estos datos agrupados? ¿Por qué podrlan ser diferentes?

Número de granjas por estado f O-menor de 20 000 16 20 000-menor de 40 000 II

40 000-menor de 60 000 10 60 000-menor de 80 000 6 80 000-menor de 100 000 5 100 000-menor de 120 000

3.4 MEDIDAS DE FORMA

Las medidas de forma son herramientas que se pueden usar para describir la forma de una distribución de datos. En esta sección, examinamos dos medidas de forma, sesgo y curtosis; además, examinamos las gráficas de caja y bigote.

Sesgo Una distribución de datos en los que la mitad derecha es una imagen reflejada de la mitad izquierda es simétrica. Un ejemplo de una distribución simétrica es la distribución normal o curva de campana, la cual se presenta con más detalle en el capitulo 6.

El sesgo se presenta cuando una distribución es asimétrica o carece de simetria. La distribución en la figura 3.8 no tiene sesgo porque es simétrica. La figura 3.9 muestra una distribución que está sesga­ da a la izquierda o negativamente sesgada y la figura 3.10 muestra una distribución que está sesgada a la derecha o positivamente sesgada.

La parte sesgada es la parte larga y delgada de la curva. Muchos investigadores usan distribución sesgada para denotar que los datos están dispersos en un extremo de la distribución y acumulados en el otro extremo. En ocasiones los maestros universitarios se refieren a una distribución de calificacio­ nes como sesgada, con lo cual quieren decir que pocos estudiantes calificaron en un extremo de la escala de calificaciones muchos calificaron en el otro extremo.

Page 102: libro.pdf

CAPITULO 3 ESTADlsnCA DESCIUPll\:\

~bución simétrica Distribución sesgada a la derecha o sesgada positivamente

1 i @¡!fil• ~elación de media, "lediana y moda

Distribución sesgada a la izquierda o sesgada negativamente

~=® Mediana Mediana

Moda Mediana

(a) Distribución simétrica

(no hay sesgo)

(b) Negativamente

sesgada

(e) Positivamente

sesgada

Sesgo y la relación de la media, mediana y moda

El concepto de sesgo permite entender la relación de la media, mediana y moda. En una distribución unimodal (distribución con un solo pico o moda) que esté sesgada, la moda es el vértice (punto más alto) de la curva y la mediana es el valor del medio. La media tiende a estar ubicada hacia la cola de la distribución, porque la media es afectada por todos los valores, incluyendo los extremos. Una distribu­ ción en forma de campana o normal con la media, mediana y moda, todos en el centro de la distri­ bución, no tiene sesgo. La figura 3.11 muestra la relación de la media, mecliana y moda para diferentes tipos de sesgo.

Coeficiente de sesgo

Al experto en estadística Karl Pearson se le da el crédito de idear por lo menos dos coeficientes de sesgo que se pueden usar para determinar el grado de sesgo en una clistribución. Aquí presentamos uno de estos coeficientes, conocido como coeficiente de sesgo o de Pearson, el cual compara la media y media­ na en vista de la magnitud de la desviación estándar. Nótese que si la distribución es simétrica, la media y la mediana son del mismo valor y por tanto el coeficiente de sesgo es igual a cero.

COEFICIENTE DE SESGO O DE PEARSON

donde: Sk = coeficiente de sesgo

Md =mediana

Supongamos, por ejemplo, que una distribución tiene una media de 29, una mediana de 2" rm;.a desviación estándar de 12.3. El coeficiente de sesgo se calcula como:

sk = 3(29- 26) = +o.73 12.3

Como el valor de Sk es positivo, la distribución es positivamente sesgada. Si d valor de S¡ fuera negativo, la distribución sería negativamente sesgada. Cuanto mayor sea la magnitud de S¡. más sesgada será la distribución,

Page 103: libro.pdf

78 ESTADISTICA EN LOS NEGOCIOS

Tipos de curtosis

FIGURA 3.12

Distribución leptocúrtica

Distribución platicúrtica

Curtos is La curtosis describe la cantidad de apuntamiento de una distribución. Las distribuciones que son altas y delgadas se conocen como distribuciones leptocúrticas; las que son planas y dis­ persas como distribuciones platicúrticas. Entre estos dos tipos hay distribuciones que son más "normales" en su forma como las mesocúrticas. Estos tres tipos de curtosis se ilustran en la figura 3.12.

Gráficas de caja y bigote Otra forma de describir una distribución de datos es mediante el uso de una gráfica de caja y bigote. Una gráfica de caja y bigote, a veces llamada gráfica de caja, es un diagrama que utiliza los cuartiles superior e inferior junto con la mediana y los dos valores más extremos para describir gráficamente una distribución. La gráfica se construye con el uso de una caja para encerrar la mediana. Esta caja se extiende hacia fuera desde la mediana a lo largo de un continuo hasta los cuartiles inferior y superior, encerrando asl no sólo la mediana sino también 50% de los datos. Desde los cuartiles inferior y superior, unas rectas conocidas como bigotes se prolongan desde la caja hacia los valores de datos extremos. La gráfica de caja y bigote se determina a partir de cinco números específicos.

l. La mediana (Q2).

2. El cuartil inferior ( Q1).

3. El cuartil superior ( Q3)

4. El valor más pequeño de la distribución. 5. El valor más grande de la distribución.

La caja de la gráfica se determina al localizar la mediana y los cuartiles inferior y supe­ rior en un continuo. La caja se traza alrededor de la mediana con los cuartiles inferior y superior ( Q1 y Q3) como los puntos extremos de la caja. Estos puntos extremos de caja ( Q1

y Q3) se conocen como las bisagras de la caja. A continuación, el valor del rango intercuartil (IQR) se calcula con Q3 - Q1• El rango

intercuartil incluye 50% de los datos y debe ser igual a la longitud de la caja. No obstante, aquí, el rango intercuartil se utiliza también fuera de la caja. A una distancia de l.5 · IQR hacia afuera desde los cuar­ tiles inferior y superior están lo que se conoce como cercas interiores. Un bigote, o segmento de recta, se traza desde la bisagra inferior de la caja hacia afuera del valor de los datos más pequeño. Un segun­ do bigote se traza desde la bisagra superior de la caja hacia afuera del valor de datos más grande. Las cercas interiores se establecen como sigue:

Distribución mesocurtica

Q1 - 1.5 · IQR Q3 + 1.5 · IQR

Si los datos caen más allá de las cercas interiores, entonces pueden construirse cercas exteriores: Q1 - 3.0 · IQR Q3 + 3.0 · IQR

La figura 3.13 muestra las características de una gráfica de caja y bigote. Los valores de datos fuera de la corriente principal de valores en una distribución se ven como

resultados aislados. Los resultados aislados pueden ser simplemente los valores más extremos de un con­ junto de datos, pero a veces se presentan debido a errores de medición o registro. Otras veces son valo­ res tan diferentes de otros valores que no deberían ser considerados en el mismo análisis como el resto de la distribución. Los valores de la distribución de datos que estén fuera de las cercas interiores pero den-

UM'1¡t+HF• Gráfica de caja y bigote

ll1sagra Bisagra

l.S•IQR\ i.: 3.0·IQR 3.0•JQR

Q1 Mediana Q3

Page 104: libro.pdf

CAPITULO 3 ESTADISTICA DESCRIPm ;11

tro de las cercas exteriores se conocen como resultados aislados leves. Los valores que estén fuera ~ bs cercas exteriores se conocen como resultados aislados extremos. As], uno de los principales usos de ar.a gráfica de caja y bigote es identificar resultados aislados. En algunas gráficas de caja y bigote generadas por computadora, los bigotes se trazan a los valores de datos más grandes y más pequeños dentro de las cercas interiores. Un asterisco se imprime entonces para cada valor de datos ubicado entre las cer­ cas interior y exterior para indicar un resultado aislado leve. Los valores fuera de las cercas exteriores se indican con un cero en la gr:lfica. Estos valores son resultados aislados extremos.

Otro uso de las gráficas de caja y bigote es determinar si una distribución es sesgada. La ubicación de la mediana en la caja puede relacionar información acerca del sesgo de 50% de los datos. Si la media­ na está ubicada en el lado derecho de la caja, entonces el 50% medio está sesgado a la izquierda. Si la mediana está ubicada en el lado izquierdo de la caja, entonces el 50% medio está sesgado a la derecha. Al examinar la longitud de los bigotes a cada lado de la caja, un investigador de negocios puede hacer un juicio acerca del sesgo de los valores exteriores. Si el bigote más largo está a la derecha de la caja, entonces los datos exteriores están sesgados a la derecha y viceversa. Vamos a utilizar los datos la tabla del cuadro 3.10 para construir una gráfica de caja y bigote.

Una vez organizados los datos en un conjunto ordenado, como se muestra en la tabla 3.11, es rela­ tivamente fácil determinar los valores del cuartil inferior (Q1), la mediana y el cuartil superior (Q3). A partir de éstos, el valor del rango intercuartil se puede calcular.

Las bisagras de la caja están situadas en los cuartiles inferior y superior, 69 y 80.5. La mediana está situada dentro de la caja a distancias de 4 desde el cuartil inferior y 6.5 desde el cuartil superior. La dis­ tribución de 50% de los datos está sesgado a la derecha, porque la mediana está más cerca de la bisagra inferior o izquierda. La cerca inferior se construye con:

Q1 - 1.5 · IQR = 69 - 1.5(11.5) = 69 - 17.25 = 51.75

y Q3 + 1.5 · IQR = 80.5 + 1.5(11.5) = 80.5 + 17.25 = 97.75

Los bigotes se construyen al trazar un segmento de recta desde la bisagra inferior hacia afuera del valor de datos más pequeño y un segmento de recta desde la bisagra superior hacia afuera del valor de datos más grande. Un examen de los datos muestra que ninguno de los valores de datos de este con­ junto de números está afuera de la cerca interior. Los bigotes se construyen hacia afuera del valor más bajo, que es 62 y del valor más alto, que es 87.

Para construir una cerca exterior, calculamos Q1 - 3 · IQR y Q3 + 3 · IQR, como sigue:

Q1 - 3 · IQR = 69 - 3(11.5) = 69 - 34.5 = 34.5 Q3 + 3 · lQR = 80.5 + 3(11.5) = 80.5 + 34.5 = 115.0

TABLA 3.IO La figura 3.14 es la salida impresa MINITAB de una computadora para esta

gráfica de caja y bigote. Datos para gráfica de caja y bigote 71 87 82 64 72 75 81 69

76 79 65 68 80 73 85 71 70 79 63 62 81 84 n 73 82 74 74 73 84 72 81 65 74 62 64 68 73 82 69 71 FIGURA 3.14

Gráfica MINITAB de caja y bigote TABLA 3.11

Datos en conjunto ordenado con cuartiles y mediana 8i 85 84 84 82 82 82 81 81 81 80 79 79 77 76 75 74 74 74 73 73 73 73 72 72 71 71 71 70 69 69 68 68 65 65 64 64 63 62 62

Q, =69 Qz = mediana = 73 OJ = 80.5 60 ro 50 90 IQR = Q3 - Q1 = 80.5 - 69 = 11.5

Datos de tibia

Page 105: libro.pdf

3.4 PROBLEMAS

80 ESTADISTICA EN LOS NEGOCIOS

3.35 En cierto dJa el promedio de precios al cierre de un grupo de acciones en la bolsa de Nueva York es $35 (al dólar más cercano). Si el valor de mediana es $33 y la moda es $21, ¡está sesgada la dis­ tribución de estos precios de acciones? Si es así, ¿cómo?

3.36 Un hotel local ofrece bailes de salón los viernes por la noche. Un investigador observa a los clien­ tes y estima sus edades. Analice el sesgo de la distribución de edades si la edad media es 51, la edad mediana es 54 y la edad modal es 59.

3.37 Los volúmenes de ventas de las principales empresas de corretaje de bienes rafees en Estados Unidos, para un afio reciente, se analizaron con el uso de estadística descriptiva. El volumen medio anual en dólares para estas empresas es de 5 millones 510 mil dólares, la mediana es de 3 millones 190 mil dólares y la desviación estándar es de 9 millones 590 dólares. Calcule el valor del coeficiente de Pearson y estudie su significado. ¿Está sesgada la distribución? Si es así, ¿en qué medida?

3.38 Supongamos que los siguientes datos son las edades de usuarios de Internet obtenidas de una muestra. Utilice estos datos para calcular un coeficiente de Pearson. ¡Cuál es el significado del coeficiente?

41 15 31 25 24

23 21 22 22 18

30 20 19 19 16

23 27 38 34 24

19 20 29 17 23

3.39 Construya una gráfica de caja y bigote con los siguientes datos y conteste si, ¡estos datos contie- nen resultados aislados? Y si, ¡está sesgada la distribución de datos?

540 690 503 558 490 609

379 601 559 495 562 580

510 623 477 574 588 497

527 570 495 590 602 541

3.40 Suponga que le pide a un grupo de 18 consumidores que conserven una bitácora de sus prácticas de compra y que los siguientes datos representan el número de cupones empleados por cada uno en el periodo anual. Use los datos para construir una gráfica de caja y bigote. Haga una lista de la mediana, Q1, Q3, los puntos extremos para las cercas interiores y los puntos finales para las cercas exteriores. Analice el sesgo de la distribución de estos datos y señale cualquier resultado aislado.

81 68 70 100 94 47 66 70 82

110 105 60 21 70 66 90 78 85

3.5 MEDIDAS DE ASOCIACIÓN

Las medidas de asociación son estadísticas que proporcionan información respecto a la relación de variables numéricas. En este capitulo analizamos sólo una medida de asociación, la correlación y lo hacemos así sólo para dos variables numéricas.

Correlación La correlación es una medida del grado de relación de variables. Puede ayudar a que un investigador de negocios determine, por ejemplo, si las acciones de dos lineas aéreas suben y bajan de una manera rela­ cionada. Lógicamente, los precios de dos acciones de la misma industria deben estar relacionados. Para una muestra de pares de datos, el análisis de correlación puede proporcionar un valor numérico que represente el grado de relación de los dos precios de acciones en el tiempo. En la industria del trans­ porte, ¡hay una correlación evidente entre el precio del transporte y el peso del objeto que se envía?; ¡el

Page 106: libro.pdf

CAPITULO 3 ESTADISTICA DESCmP'I1U

'.latos para el ejemplo de Economics

TABLA 3.12 precio y la distancia muestran alguna relación?; ¿qué tan fuertes son las correlaciones.' U:s decisiones de precios pueden estar basadas, en parte, en los costos de embarque que esúA correlacionados con otras variables. En economía y finanzas, ¿qué tan fuerte es la correla­ ción entre el índice de precios al productor y el porcentaje de desempleo? En ventas al menudeo, ¿qué variables están relacionadas a las ventas de una tienda en particular?; ¿están las ventas relacionadas a la densidad de población, número de competidores, tamaño de la tienda, cantidad de publicidad, u otras variables?

Existen diferentes medidas de correlación, la selección de las cuales depende principal­ mente del nivel de datos que se analice. En el ideal, a los investigadores les gusta despejar p, el coeficiente poblacional de correlación, pero como prácticamente siempre manejan datos muestrales, esta sección introduce un coeficiente de correlación muestra! r, de amplio uso. Esta medida es aplicable sólo si ambas variables analizadas tienen al menos un nivel de intervalo de datos. El capítulo 17 presenta una medida de correlación que se puede usar cuando los datos son ordinales.

El estadístico r es el coeficiente de correlación de Pearson, nombre que recibe 'en honor a Karl Pearson (1857-1936), estadístico inglés que ideó varios coeficientes de corre­ lación junto con otros importantes conceptos de estadística. El término res una medida de la correlacián lineal entre dos variables. Es un número que varia de -1 a + 1, que repre­ senta la fuera de la relación entre las variables. Un valor r de + l denota una perfecta rela­ ción positiva entre dos conjuntos de números. Un valor r de - 1 denota una perfecta correlación negativa, lo cual indica una relación inversa entre dos variables: cuando una se

hace más grande, la otra se hace más pequeña. Un valor r de O significa que no existe relación lineal entre dos variables.

7.43 221 7.48 222

4 8.00 7.75 7.flJ 7.63 7.68 7.67 7.59 8.07 8.03 8.00

5

6

8

9

10 11 12

226 225 224 223

223 226 226 235 233 241

COEFICIENTE DE CORRELACIÓN DEPEARSON

L:(x - x)(y- y)

TABLA 3.13

La figura 3.15 representa cinco diferentes grados de correlación: a) representa fuerte correlación negativa, b) representa moderada correlación negativa, e) representa moderada correlación positiva, d) representa fuerte correlación positiva (e) no contiene correlación. ....... ,...._ lndlice

s T 1112 r "T 7.43 221 55.205 48841 1642.03 7.48 222 55.590 49284 1660.56 8.00 226 64.000 51076 1808.00 7.75 225 60.063 50625 1 743.75 7.60 224 57.760 50176 1 702.40 7.63 223 58.217 49n9 1 701.49 7.68 223 58.982 49729 1 712.64 7.67 226 58.829 51076 1 733.42 7.59 226 57.608 51076 1 715.34 8.07 235 65.125 55225 1896.45 8.03 233 64.481 54289 1870.99 a.oo 241 64.000 58081 1928.00

Ix• 92.93 I1•2ns ~-720.220 I,.Z= 619207 Ixy =21 115.07

(21 115.07)- (92.93)(2n5)

r= l = .815 2~ 2' (720.22)- (92.93) (619.207) - (2725)

12 12 l

Cálculo de r para el Dla ejemplo de ----------------------------- Economics

2 3 4 5 6 7 8 9

10 11 12

Page 107: libro.pdf

82 ESTADISTICA EN LOS NEGOCIOS

a) Fuerte correlación negativa (r = -0.933)

U@l¡fii@. Cinco correlaciones

:· .. . . . . . ~ : . . .. . . . . . . . , . .. ·: .. : .. . .. . . · . . . . . . .: .· . .. , · . ..

•'. . ,. 1 • • • • ·. . ,

; s : ••• • I• .• • . . .

: .·. . . . . . . . - . . .. . : ·. .. . . . . e) Moderada correlación positiva (r= .518)

b) Moderada correlación negativa (r = -0.674)

.. . .

·.· .. .... .. . . .. . .. .. •. . ·' . . . . . . .-.· . .. ... " ,, .. . , . . · ... d) Fuerte correlación positiva (r = .909)

.... . . · ... . ·,~··· . , - ... i: :·. _, .. . . . .. . ·' ..... ,,. •• 'f . .. . . ·:. ;., . . ... : . . ..

e) Prácticamente no hay correlación (r = -0.004)

.. .. .. ~-:. ,· ..

. . ' . . . . . · ... ·.

. ..

. ·.

·. • . . '

: .·

h'fll!;Mi.. Salida Excel

Salida Excel y MINITAB para el ejemplo de Economics

A B e 1 lntarast Rata Futuras lndex

2 lnterest Rata 1

3 Futuras lndex 0.815 1

Salida MINITAB Correlaciones: TASA DE INTE~, INDICE FUTUROS Pearson correlation of INTEREST RATE and FUTURES INDEX z 0.815

Page 108: libro.pdf

CAPITUW 3 ESTADISnCA DE.Sall"m \ 13

¡Cuál es la medida de correlación entre la tasa de interés de fondos federales y el índice de futuros de mercancías o productos? Con datos como los que se muestran en la tabla 3.12 y que representan b valores de tasas de interés de fondos federales e índices de futuros de mercancías o productos para una muestra de 12 días, es posible calcular un coeficiente r.

El examen de la fórmula para calcular un coeficiente de correlación de Pearson deja ver que los siguientes valores deben obtenerse para calcular r: Ix, lx2, ly, Iy2, Ixy y n. En análisis de correlación, no importa cuál variable se designe x y cuál se designe y. Para este ejemplo, el coeficiente de correla­ ción se calcula como se ve en la tabla 3.13. El valor r obtenido (r = 0.815) representa una relación posi­ tiva relativamente fuerte entre tasas de interés e índice de futuros de mercancias o productos en un periodo de 12 dias.

La figura 3.16 muestra salidas de Excel y MINITAB para este problema.

3.5 PROBLEMAS 3.41 Determine el valor del coeficiente de correlación, r, para los siguientes datos:

X 4 6 7 11 14 17 21 y 18 12 13 8 7 7

3.42 Determine el valor de r para Jos siguientes datos:

X 158 296 87 110 436 y 349 510 301 322 550

3.43 En un esfuerzo por determinar si existe alguna correlación entre el precio de acciones de aerolí­ neas, un analista muestreó seis dias de actividad del mercado accionario. Con el uso de los siguientes precios de la acción Delta y la acción Southwest, calcule el coeficiente de correlación. Para mayor comodidad, los precios de acciones se han redondeado al décimo más cercano:

Delta Southwest 47.6 15.l 46.3 15.4 50.6 15.9 52.6 15.6 52.4 16.4 52.7 18.1

3.44 Los siguientes datos son las reclamaciones (en millones de dólares) por prestaciones de BlueCross BlueShield para nueve estados, junto con el sobrante (en millones de dólares) que la compañía tenla en activos en esos estados:

Estado Reclamación Sobrante Alabama $1425 $277

Colorado 273 100 Florida 915 120 !llinois l 687 259 Maine 234 40 Montana 142 25 Dakota del Norte 259 57 Oklahoma 258 31 Texas 894 141

Utilice los datos para calcular un coeficiente de correlación r, para determinar la cornbción entre reclamaciones y sobrantes.

3.45 El National Safety Council publicó los siguientes datos sobre porcentaies de inci<lmc:ía. por lesio­ nes mortales o que hacen perder tiempo de trabajo, por 100 empleados de varias industrias en tres años recientes.

Page 109: libro.pdf

CAPITUW 3 ESTADISnCA DE.Sall"m \ 13

¡Cuál es la medida de correlación entre la tasa de interés de fondos federales y el índice de futuros de mercancías o productos? Con datos como los que se muestran en la tabla 3.12 y que representan b valores de tasas de interés de fondos federales e índices de futuros de mercancías o productos para una muestra de 12 días, es posible calcular un coeficiente r.

El examen de la fórmula para calcular un coeficiente de correlación de Pearson deja ver que los siguientes valores deben obtenerse para calcular r: Ix, lx2, ly, Iy2, Ixy y n. En análisis de correlación, no importa cuál variable se designe x y cuál se designe y. Para este ejemplo, el coeficiente de correla­ ción se calcula como se ve en la tabla 3.13. El valor r obtenido (r = 0.815) representa una relación posi­ tiva relativamente fuerte entre tasas de interés e índice de futuros de mercancias o productos en un periodo de 12 dias.

La figura 3.16 muestra salidas de Excel y MINITAB para este problema.

3.5 PROBLEMAS 3.41 Determine el valor del coeficiente de correlación, r, para los siguientes datos:

X 4 6 7 11 14 17 21 y 18 12 13 8 7 7

3.42 Determine el valor de r para Jos siguientes datos:

X 158 296 87 110 436 y 349 510 301 322 550

3.43 En un esfuerzo por determinar si existe alguna correlación entre el precio de acciones de aerolí­ neas, un analista muestreó seis dias de actividad del mercado accionario. Con el uso de los siguientes precios de la acción Delta y la acción Southwest, calcule el coeficiente de correlación. Para mayor comodidad, los precios de acciones se han redondeado al décimo más cercano:

Delta Southwest 47.6 15.l 46.3 15.4 50.6 15.9 52.6 15.6 52.4 16.4 52.7 18.1

3.44 Los siguientes datos son las reclamaciones (en millones de dólares) por prestaciones de BlueCross BlueShield para nueve estados, junto con el sobrante (en millones de dólares) que la compañía tenla en activos en esos estados:

Estado Reclamación Sobrante Alabama $1425 $277

Colorado 273 100 Florida 915 120 !llinois l 687 259 Maine 234 40 Montana 142 25 Dakota del Norte 259 57 Oklahoma 258 31 Texas 894 141

Utilice los datos para calcular un coeficiente de correlación r, para determinar la cornbción entre reclamaciones y sobrantes.

3.45 El National Safety Council publicó los siguientes datos sobre porcentaies de inci<lmc:ía. por lesio­ nes mortales o que hacen perder tiempo de trabajo, por 100 empleados de varias industrias en tres años recientes.

Page 110: libro.pdf

r 84 ESTADISTICA EN LOS NEGOCIOS

Industria Año! Año2 Año3

Textil .46 .48 .69

Química .52 .62 .63

Comunicaciones .90 .72 .81 Maquinaria 1.50 1.74 2.10

Servicios 2.89 2.03 2.46

Metales no ferrosos 1.80 1.92 2.00

Alimentos 3.29 3.18 3.17

Gobierno 5.73 4.43 4.00

Calcule r por cada par de años y determine cuáles años tienen mayor correlación.

3.6 ESTADÍSTICA DESCRIPTIVA EN LA COMPUTADORA

Tanto MINITAB como Excel dan extensas estadísticas descriptivas. Aun cuando cada paquete de cómputo puede calcular estadísticas individuales como lo es una media o una desviación estándar, tam­ bién pueden producir estadísticas descriptivas múltiples. La figura 3.17 muestra una salida MINITAB para las estadísticas asociadas con los datos de producción de computadoras presentados anterior­ mente en esta sección. La salida MINITAB contiene, entre otras cosas, la media, la mediana, la desvia­ ción estándar rnuestral, el mínimo y máximo (que se pueden usar para calcular el rango), y Q1 y Q3 (de los cuales se puede calcular el rango intercuartil). La salida de estadísticas descriptivas de Excel para los mismos datos de producción de computadoras se ve en la figura 3.18. La salida de Excel contiene la media, la mediana, la moda, la desviación estándar muestral, la varianza muestral y el rango. La fun­ ción de estadística descriptiva en cualquiera de estos paquetes de computadora proporciona mucha información útil acerca de un conjunto de datos. MINITAB y Excel también tienen la capacidad de calcular el coeficiente de correlación r.

rna11i!llE• ESTADISTICAS DESCRIPTIVAS

Salida MINITAB Variable N Mean Median TrMean stoev SE Mean

para el problema Computer 5 13.00 16.00 13.00 5.70 2.55

de producción de Variable Mini.mum. Ma.ximum Q¡ Q,

computadoras Computer 5.00 18.00 7.00 17.50

ifüll;f fM• DATOS DE PRODUCCIÓN DE COMPUTADORAS

Salida Excel para A B el problema de 1 Mean 13 producción z Standard error 2.5495 de computadoras 3 Median 16

4 Mode N/A 5 Standard devianon 5.7009 e Sample variance 32.5 7 Kurtos1s -1.7112 e Skewness -0.8096

.9 Ranga 13 10 Msn1mum 5 11 Max1mum 18

112 Sum 65 J;j Count 5

Page 111: libro.pdf

CAPfTULo 3 ESTADISTICA DESCRJPTIVA 85

Estadísticas de lavandería

Las estadisticas descriptivas presentadas en este capítulo son excelentes para resumir y presentar con­ juntos de datos en formatos más concisos. Por ejemplo, la pregunta 1 de las preguntas gerenciales y estadJsticas del Dilema de decisión reportamedidas de agua para SO casas en Estados Unidos. Con el uso de Excel y/o MINITAB, muchas de las estadJsticas descriptivas presentadas en este capítulo se pue­ den aplicar a estos datos. Los resultados se ilustran en las figuras 3.19 y 3.20.

Estas salidas de computadora muestran que el promedio de uso de agua es 15.48 galones con una desviación estándar de 1.233 galones. La media es 16 galones con un rango de 6 galones (12 a 18). El primer cuartil es 15 galones y el tercer cuartil es 16 galones. La moda es también 16 galones. La gráfica MINITAB y las medidas de sesgo muestran que los datos están ligeramente sesgados a la izquierda. La aplicación del teorema de Chebyshev a la media y desviación estándar muestra que por lo menos

88.9% de las mediciones deben caer entre 11.78 galones y 19.18 galones. Un examen de los datos y el mínimo y máximo revelan que 100% de los datos en realidad caen dentro de estos límites.

Según el Dilema de decisión, el tiempo medio de ciclo de lavado es 3S minutos con una desviación estándar de cinco minutos. Si de manera aproximada los tiempos de ciclo de lavado están normalmente distribuidos, podemos aplicar la regla empírica. Según la regla empírica, 68% de los tiempos caerían dentro de 30 y 40 minutos, 9S% de los tiempos cae­ rían dentro de 25 y 45 minutos y 99.7% de los tiempos de lavado caerían dentro de 20 Y. SO minutos. Si los datos no están normalmente distribuidos, el teorema de Chebyshev deja ver que al menos 75% de los tiempos deberían caer entre 2S y 4S minutos y 88.9% debería caer entre 20 y 50 minutos.

¿Está la cantidad (peso) de lavandería correlacionada con el ingreso familiar? Si se calcula un coeficiente de correlación sobre los datos del Dilema de decisión, se encuentra r de 0.723. Este resultado indica que es probable alguna correlación entre los dos conjuntos de datos. No obstante, no es una correlación perfecta ni es una correlación muy fuerte. La tendencia parece ser que las casas con más altos ingresos hacen cantidades de lavandería más grandes; sin embargo, en algunos casos, los hogares con menores ingresos todavía hacen cantidades relativamente grandes de lavandería y los de ingresos más altos a veces hacen menos lavandería.

Estadística descriptiva de Excel

FIGURA 3.19

USO DE AGUA

A B 1 Mean 15.48 2 Standard error 0.174 3 Median 16 4 Moda 16 5 Standard deviation 1.233 6 Sample variance 1.52 7 Kurtosis 0.264 8 Skewness '._Q,531 9 Ranga 6 10 M1nimum 12 11 Max1mum 18 12 Sum 774 13 Count 50

hfüll¡tiij1. Estadística descriptiva MINITAB

Variable: uso de agua Prueba de normalidad Anderson·Darling

A cuadrado 1.598 Valor P 0.000

Media Desviación estándar Varianza Sesgo Curtosis Variable N

15.4800 1.2329

1.52 -5.3E--01 0.263785

50

Mínimo Primer cuartil mediana Tercer cuartil máxima

12.0000 15.0000 16.0000

. 16.0000 18.0000

12 1

14 15 16 17 1 1 1

18 1

13

95% de intervalo de confianza para Mu 95% de intervalo de confianza

para Mu 15.1296 15.83G'

J 95% de intervalo de con"ianza para Sigma 1

IS.O 1

15.5 1

16.0 l.0299 1.5363

95% de intervalo de confianza para mediana

15.0000 16.0000 95% de intervalo de confianza para Mediana

Page 112: libro.pdf

CONSIDERACIONES ~TICAS

UD cuerpo ele datos a una audiencia, es mejor uaar cua&esquiera medidas que sean neceíarias para presentar una imagen "completa" de los datos. Al limitar las medidas descriptivas ~ el iimstigador de negocios puede dar a la audiencia sólo parte de la imagen y puede 8C9f la forma en que el receptor entienda los datos. Por ejemplo, si un investigador presenta sólo la media. la audiencia no tendrá nociones de la variabilidad de los datos; además, la media pocii:4• desordenadamente grande o pequeña debido a valores extremos. Del mismo modo, la~ ele la media impide una imagen que incluya estos valores. El uso de la moda puede cau­ sar qpe el receptor de la información se concentre sólo en valores que ocurren con frecuencia.

A,l menos una medida de variabilidad suele ser necesaria cuando menos con una medida de ~ central para que la audiencia comience a entender q~ aspecto tienen los datos. ~ores no éticos podrian tratar de presentar sólo la medida descriptiva que lleve la ima­ lJl!D ele los datos que desean que la audiencia vea; en cambio, los investigadores 4!ticos usarAn cual­ quiera y todos los métodos que presentan la imagen más informativa y más completa posible de los datos.

Una fuerte correlación no necesariamente indica causa y efecto. No es profaiooal ni ~ sacar conclusiones de causa y efecto sólo porque dos variables están n:lacionadas. Por ejemplo, suponga que el número de furgonetas rentadas aumenta con la temperatura. Algunos ejecuU­ podrian pensar que entre más caliente sea el día más personas las rentarén, La realidad es que lo hacen cuando los estudiantes salen de vacaciones para evitar que dejen de asistir a la escuela, ya que tienen vacaciones por lo general en verano en casi todos los paises cuando las temperaturas son mú álidas. Por tanto, puede ser que el calendario escolar sea el que provoque que las fur­ gonetas se renten, no la temperatura. Una rae.ha de calor en enero no necesariamente genera más rentas.

El ex gobernador de Colorado, Richard Lamm, se menciona como autor de la frase de "los demógrafos son académicos que pueden demostrar estadísticamente que el promedio de perso­ nas en Miami nace cubano y muere judío ... "• Es más probable que las personas lleguen a este tipo de conclusión si los investigadores dan estadísticas descriptivas incompletas o confusas.

• Ala L Ollm. "l'llople l'atleml/Odds and !!neis·. The Wall Street Journal, 29 de )UDIO de 19'12, p. B 1 Rcimprno con per­ mlle 4e 1" .. SlrM """"'1l O 1992. Dow Iones & Company, lnc. Todos los derechos reservados en el mundo.

RESUMEN

Las medidas estadísticas descriptivas incluyen medidas de ten­ dencia central, de variabilidad y medidas de forma. las medi­ das de tendencia central y medidas de variabilidad se calculan de manera diferente para datos no agrupados y agrupados. las medidas de tendencia central son útiles para describir datos porque comunican información acerca de las partes más cen­ trales de los datos. las medidas más comunes de tendencia central son las tres m: moda, mediana y media. Además, los percentiles y cuartiles son medidas de tendencia central.

la moda es el valor que se presenta con rnás frecuencia en un conjunto de datos. Si dos valores empatan para la moda, los datos son bimodales. Los conjuntos de datos pueden ser multimodales. Entre otras cosas, la moda se emplea en nego­ cios para determinar tamaños.

La mediana es el término medio de un conjunto ordena­ do de números que contienen un número impar de términos. Para un conjunto con número par de términos,la mediana es el promedio de los dos términos medios. La fórmula (n + 1)/2 especifica la ubicación de la mediana. Una mediana no resulta

afectada por la magnitud de valores extremos. Esta caracterís­ tica hace de la mediana una medida más útil y apropiada de ubicación al reportar elementos como son el ingreso, edad y precios de casas.

La media aritmética se utiliza mucho y por lo general es lo que los investigadores citan cuando usan la palabra media. La media aritmética es el promedio. La media poblacional y la media muestra] se calculan de la misma manera pero se deno­ tan con simbolos diferentes. A la media aritmética la afecta cada valor y es influenciada por valores extremos.

Los percentiles dividen un conjunto de datos en 100 gru­ pos, lo cual significa que se requiere de 99 percentiles. Los cuartiles dividen datos en cuatro grupos. Los tres cuartiles son Q1, que es el cuartil más bajo; Q2, que es el cuartil de en medio e igual a la media; y Q3, que es el cuartil superior.

Las medidas de variabilidad son herramientas estadísticas empleadas en conjunción con medidas de tendencia central para describir datos. las medidas de variabilidad dan una des­ cripción de datos que las medidas de tendencia central no

Page 113: libro.pdf

pueden dar: información acerca de la dispersión de los valores de datos. Estas medidas incluyen el rango, desviación media absoluta, varianza, desviación estándar, rango intercuartil y coeficiente de variación para datos no agrupados.

Una de las medidas más elementales de variabilidad es el rango. Es la diferencia entre los valores más grande y más pequeño. Aun cuando el rango es fácil de calcular, tiene utili­ dad limitada. El rango intercuartil es la diferencia entre los cuartiles tercero y primero. Es igual al rango de 50% de los datos.

La desviación media absoluta (MAD) se calcula al pro­ mediar los valores absolutos de las desviaciones desde la media. La desviación media absoluta da la magnitud de la desviación promedio pero sin especificar su dirección. La des­ +iación media absoluta tiene uso limitado en estadística, pero hav creciente interés para el uso de MAD en el campo de pro­ nósticos.

La varianza se utiliza ampliamente como herramienta en estadística pero se emplea poco como medida independiente de variabilidad. La varianza es el promedio del cuadrado de desviaciones alrededor de la media.

La raíz cuadrada de la varianza es la desviación estándar. También es una herramienta muy usada en estadística. Se emplea con mayor frecuencia que la varianza como medida independiente. La desviación estándar se comprende mejor al examinar sus aplicaciones para determinar en dónde están los datos en relación con la media. La regla empírica y el teorema de Chebyshev son enunciados acerca de las proporciones de valores de datos que están dentro de varias veces la desviación estándar desde la media.

La regla empírica revela el porcentaje de valores que están dentro de una, dos o tres desviaciones estándar de la media para un conjunto de datos. La regla empírica aplica sólo si los datos son una distribución en forma de campana. De acuerdo con la regla empírica, aproximadamente 68% de todos los valores de una distribución normal están dentro de más o menos una desviación estándar de la media. Noventa y cinco por ciento de todos los valores están dentro de dos desviacio­ nes estándar a cualquier lado de la media, y prácticamente todos los valores están dentro de tres desviaciones estándar de la media.

CAPITULO 3 ESTADISTICA DESCRIPTIVA 87

El teorema de Chebyshev también delinea la proporción de valores que están dentro de un número dado de desviacio­ nes estándar desde la media; sin embargo, aplica a cualquier distribución. Según el teorema de Chebyshev, al menos 1 - 1 / k2 valores están dentro de k desviaciones estándar de la media. El valor z representa el número de desviaciones están­ dar que un valor está desde la media para datos normalmente distribuidos.

El coeficiente de variación es una razón entre una desvía­ ción estándar y su media, dado como porcentaje. Es especial­ mente útil para comparar desviaciones estándar o varianzas que representan datos con medias diferentes.

Algunas medidas de tendencia central y algunas medidas de variabilidad se presentan para datos agrupados. Estas medidas incluyen la media, moda, varianza y desviación estándar. En general, estas medidas son sólo aproximadas para datos agrupados porque los valores de los datos reales sin pro­ cesar son desconocidos.

Dos medidas de forma son el sesgo y la curtosis. El sesgo es la falta de simetría en una distribución. Si una distribución está sesgada, está alargada en una dirección o la otra. La parte sesgada de la gráfica es su parte larga y delgada. Una medida de sesgo es el coeficiente de Pearson.

La curtosis es el grado de apuntamiento de una distri­ bución. Una distribución alta y delgada se conoce como lep­ tocúrtica. Una distribución plana es platicúrtica, y una distribución con un apuntamiento más normal se dice que es mesocúrtica.

Una gráfica de caja y bigote es una representación gráfica de una distribución. La gráfica se construye al usar la media­ na, el cuartil inferior y el cuartil superior. Puede dar informa­ ción acerca del sesgo y resultados aislados.

La correlación bivariada puede lograrse con varias medi­ das diferentes. En este capítulo se presenta sólo un coeficiente de correlación: el coeficiente de correlación, r, de Pearson. Este valor va de -1 a +l. Un valor r de + 1 es una correlación posi­ tiva perfecta y un valor r de - 1 es una correlación negativa perfecta. La correlación negativa significa que a medida que una variable aumenta en valor, la otra variable tiende a de­ crecer. Para valores r cercanos a cero, existe poca o ninguna correlación.

TÉRMINOS CLAVE

birnodal desviación estándar medidas de tendencia central rango intercuartil

coeficiente de correlación ( r) desviación media absoluta medidas de variabilidad regla empírica

coeficiente de sesgo (MAD) mesocúrtica sesgo

coeficiente de variación ( CV) gráfica de caja y bigote moda suma de cuadrados de x

correlación leptocúrtica multimodal teorema de Chevyshev

cuartiles media aritmética percentiles valor z

curtosis mediana platicúrtica varianza desviación desde la media medidas de forma rango

Page 114: libro.pdf

88 ESTADISTICA EN LOS NEGOCIOS

FÓRMULAS

Media poblacional (no agrupada) Ex 11=-¡:¡

Media muestra] (no agrupada)

- Ex x=- 11

Desviación media absoluta

MAD= Elx-µI N

Varianza poblacional (no agrupada}

u2 E(x-µ)2

N

Ex2_ (Ex)2 u2 N

Desviación estándar muestra!

Ex2- (Ex)2 11 5=

Ex2-11(x)2 11-I

11-I

5=

Teorema de Chebyshev

1 l--

k2 N

Ex2 -Nµ2

N

Valoresz

Desviación estándar poblacional (no agrupada)

a=J;;l

x-µ z=-­ u

Coeficiente de variación

a=~

Lx2 - (Ex)2 N

CV=~(IOO) µ

N

Rango intercuartil

!QR = Q3-Q1 a

u=~

Media agrupada E/M

11agrupada = N Varianza poblacional (agrupada)

EJM2 - (EJM)2 2 Ef(M-µ)2 N

a =

Varianza muestra] (agrupada)

Ef(M-x)2 n-1 n-1

Desviación estándar muestra! (agrupada)

EJM2 - (E/M)2 Ef(M-x)2 = 11

n-1 N N 5=

n-1 Desviación estándar poblacional (agrupada)

E/M2 - (E/M)2 N

Coeficiente de Pearson

N

Varianza muestra!

52 = E(x-x)2

Coeficiente de correlación de Pearson

n-l r = L:(x-x)(y-y) JE(x-xh:.(y-y)2

(L:xL:y) L:xy---- 11

Lx2 - (Ex)2 52 = 11

n-1

2 Ex2 -11(x)2 5 =

11-I

Page 115: libro.pdf

CAPITULO 3 ESTADISTICA DESCRIPTIVA 89

ROBLEMAS COMPLEMENTARIOS

aleulo de estadísticas

-16 En el censo de Estados Unidos en 2000 se pidió a cada familia informar respecto a las personas que vivían en cada hogar. Suponga que para una muestra de 30 hoga­ res seleccionados, el número de personas en cada una se reportó como sigue:

2 3 3

2 2 3

2 6 4 2 2 2 4 2

5 3 2 3 2 8 3 2

Calcule la media, mediana, moda, rango, cuartiles infe­ rior y superior y rango intercuartil para estos datos.

.47 En el censo de Estados Unidos en 2000 se pidió la edad de cada persona. Supongamos que una muestra de 40 familias mostró la edad de la primera persona registra­ da en la siguiente forma:

42 29 3( 38 55 27 28 33 49 70 25 21 38 47 63 22 38 52 50 41 19 22 29 81 52 26 35 38 29 31 48 26 33 42 58 40 32 24 34 25

Calcule P10,Pso' Q¡, Q3, el rango intercuartil y el rango para estos datos.

l8 Según la National Association of Investment Clubs PepsiCo es la acción más cotizada en los clubes de inver­ sión, ya que cuenta con l 388 clubes que poseen acciones de PepsiCo. Intel es un cercano segundo lugar, seguido de Motorola. Para la siguiente lista de las acciones más coti­ zadas en clubes de inversión, calcule la media, mediana, P30, P60, P90, Q,, Q3, rango y rango intercuartil.

Número de clubes que poseen acciones Compañía

PepsiCo Intel Moto rola Tricon Global Restaurants Merk &Co. AFLAC Diebold McDonald's Coca-Cola Lucent Technologies Home Depot Clayton Homes RPM Cisco Systerns

11 388 11 019 9 863 9 168 8 687 6 796 6 552 6 498 6101 5 563 5 414 5 390 5 033 4 541

3.49 Editor & Publisher lntemational Yearbook publicó una lista de los principales 10 periódicos de Estados Unidos, como se muestra aqui. Utilice estos datos poblacionales para calcular la media y la desviación estándar. Las cifras son los promedios de circulación diaria de lunes a vier­ nes. Como los números son grandes, puede ahorrarse trabajo si se modifican los datos moviendo el punto de­ cimal seis lugares a la izquierda (por ejemplo, 1 --¡ 4 880 se convierte en 1.77488). Si el lector modifica los datos en esta forma, la media y desviación estándar resul­ tantes serán correctas para los datos modificados. Para reescribir las respuestas y que sean correctas para los datos originales, de nuevo mueva el punto decimal a la derecha seis lugares en las respuestas.

Periódico Promedio de circulación

diaria Wall Street Journal USA Today New York Times Los Angeles Times Washington Post (New York) Daily News Chicago Tribune Long lsland Newsday Houston Chronicle Dallas Morning News

1 762 751 1692666 1 097 180 1 033 399

762 009 704 463 661 699 576 345 546 799 495 597

3.50 Mostramos las compañías con mayor capacidad de refi­ nación de petróleo en el mundo, según el Petroleum Intelligence Weekly. Utilice estos datos poblacionales y conteste las preguntas.

Compañía Capacidad

(miles de barriles pordia)

ExxonMobil Royal Dutch/Shell China Petrochemical Petroleos de Venezuela Saudi Arabian Oil BP Amoco Chevron Petrobas Texaco Petroleos Mexicanos(Pemex) National lranian Oil

6 300 3 791 2 867 2 437 1 970 1 965 1661 1 540 1 532 1 520 1 091

a. ¿Cuáles son los valores de la media v la ~ Compare las respuestas y exprese cuál 'prefiere como medida de situación para estos datos y por qué.

Page 116: libro.pdf

90 ESTADISTICA EN LOS NEGOCIOS

e. Calcule el coeficiente de Pearson y comente sobre el sesgo de esta distribución.

3.51 El U.S. Department of the Interior publica cifras sobre producción de minerales. A continuación aparecen los 10 principales estados de producción mineral no com­ bustible en Estados Unidos.

Estado Valor (millones de dólares)

California 3 350 Nevada 2 800 Ar izo na 2 550 Texas 2 050 Florida 1 920 Michigan 1 670 Georgia 1 660 Minnesota 1 570 Utha 1 420 Missouri 1 320

a. Calcule la media, mediana y moda. b. Calcule el rango, rango intercuartil, desviación media

absoluta, varianza muestra! y desviación muestra! estándar.

c. Calcule el coeficiente de sesgo de Pearson para estos datos.

d. Dibuje una gráfica de caja y bigotes.

3.52 El mercado para quienes escuchan música por la radio es diverso. Los formatos para el radioescucha incluyen música contemporánea para adultos, álbumes de rock, las mejores 40, antiguas, rap, country y western, clásica y jazz. Al estudiar audiencias, los investigadores de merca­ do necesitan concentrarse en las edades de los radioes­ cuchas atraídos a formatos particulares. Supongamos que un investigador de mercado estudió una muestra de 170 radioescuchas y estaciones de música antigua y obtuvo la siguiente distribución de edades.

Edad Frecuencia

15- menor de 20 9 2~ menor de 25 16 25- menor de 30 27 3~ menor de 35 44 35- menor de 40 42 4~ menor de 45 23 45- menor de 50 7 5~ menor de 55 2

a. ¿Cuáles son la media y edades modales de radioescu­ chas de mayor edad?

b. ¿Cuáles son la varianza y desviación estándar de las edades de radioescuchas de mayor edad?

3.53 Una agencia de investigación realiza un estudio demo­ gráfico a 90 compañías de ventas por televisión para determinar el tamaño de sus operaciones. Cuando se pidió informar cuántos empleados trabajan ahora en su operación de ventas por televisión, las compañías dieron respuestas que variaban de 1 a 100. El analista de la agen­ cia organiza las cifras en una distribución de frecuencias.

Número de empleados que trabajan en ventas por televisión

Número de compañias

~menorde20 2~ menor de 40 4~ menor de 60 6~ menor de 80 8~ menor de 100

32 16 13 10 19

a. Calcule la media y moda para esta distribución. b. Calcule la desviación estándar para estos datos.

3.54 Determine el coeficiente de correlación de Pearson para los siguientes datos.

X 1 10 9 6 5 3 2 Y84 457 9

Pruebe sus conocimientos

3.55 Los analistas financieros gustan de usar la desviación estándar como medida de riesgo para una acción. Cuanto más grande es la desviación en el precio de una acción con el tiempo, mayor es el riego de invertir en la ac­ ción. No obstante, los precios promedio de algunas acciones son considerablemente más altos que el precio promedio de otras, considerando el potencial de una ma­ yor desviación estándar de precio. Por ejemplo, una desviación estándar de $5.00 en una acción de $10.00 es considerablemente diferente que una desviación están­ dar de $5.00 en una acción de $40.00. En esta situación, un coeficiente de variación podría dar intuición sobre el riesgo. Supongamos que la acción x cuesta un promedio de $32.00 por acción y mostró una desviación estándar de $3.45 en los últimos 60 días. Supongamos que la acción Y cuesta un promedio de $84.00 por acción y mostró una desviación estándar de $5.40 en los últimos 60 días. Utilice el coeficiente de variación para determinar la variabilidad para cada acción

3.56 La Polk Company reportó que el tiempo promedio de un auto en las carreteras de Estados Unidos reciente­ mente es de 7 .5 años. Supongamos que la distribución de tiempo de los autos en las carreteras es aproximada­ mente en forma de campana. Si 99.7% de los tiempos son entre 1 y 14 años, ¿cuál es la desviación estándar de tiempos? Suponga que la desviación estándar es 1.7 años y la media es 7.5 años. ¿Entre cuáles valores caerían 95% de los tiempos ?

3.57 Según un informe de Human Resources, un trabajador en los paises industrializados pasa un promedio de 419 minutos al día en el trabajo. Suponga que la desviación estándar de tiempo empleado en el trabajo es 27 minutos.

a. Si la distribución de tiempo empleado en el trabajo tiene aproximadamente la forma de una campana, ¿entre cuáles tiempos estarían 68, 95 y 99.7% de las cifras?

b, Si la forma de la distribución de tiempos se descono­ ce, ¿aproximadamente cuál porcentaje de los tiempos estaría entre 359 y 479 minutos?

Page 117: libro.pdf

c. Suponga que un trabajador pasa 400 minutos en el trabajo. ¡Cuál seria el valor Z y qué le dirfa al inves­ tigador?

l.58 Durante la década de 1990, se esperaba que los negocios mostraran mucho interés en paises de Europa central y oriental. Cuando empezaron a abrirse nuevos mercados, empresarios estadounidenses necesitaban una mejor idea del mercado potencial de esa región. Las siguientes son cifras de PIB per cápita para ocho de estos países europeos, publicadas por el World Almanac:

Pals PIB per calpita (USS) Albania 1 650 Bulgaria 4300 Croacia 5 100 Alemania 22 700 Hungría 7 800 Polonia 7 200 Rumania 3900 Bosnia y Herzegovina 1 770

a. Calcule la media y desviación estándar para Albania, Bulgaria, Croacia y Alemania.

b. Calcule la media y desviación estándar para Hungria, Polonia, Rumania y Bosnia y Herzegovina.

c. Utilice un coeficiente de variación para comparar las dos desviaciones estándar. Trate los datos como pobla­ cionales.

3.59 Según la Bureau of Labor Statistics, el salario promedio anual de un trabajador en Detroit, Michigan, es $35 748. Suponga que la mediana del salario anual para un traba­ jador de este grupo es $31 369 y la moda es $29 500. ¡Está sesgada la distribución de salarios para este grupo? Si es así, ¡cuánto y por qué? ¡Cuál de estas medidas de ten­ dencia central utilizaría usted para describir estos datos? ¡Por qué?

3.60 ¡Qué tan fuerte es la correlación entre la tasa de infla­ ción y los rendimientos de bonos a 30 años de la tesore­ rla? Los siguientes datos publicados por Fuji Securities se dan como pares de tasas de inflación y rendimientos de bonos de la tesorería para años seleccionados en un periodo de 35 años:

Rendimiento de bonos Tasa de inflación a 30 años 1.57% 3.05% 2.23 3.93 2.17 4.68 4.53 6.57 7.25 8.27 9.25 12.01 5.00 10.27 4.62 8.45

Calcule el coeficiente de correlación de Pearson para determinar la intensidad de la correlación entre estas dos variables. Comente sobre la intensidad y dirección de la correlación.

CAP(TUW J ESTADISTICA DESCRIPTIVA 91

3.61 De acuerdo con el US Army Corps of Engineers, los 20 principales puertos de Estados Unidos, clasificados por tonelaje total (en millones de toneladas) fueron como sigue:

Puerto Total de toneladas Lousiana del Sur, LA 214.2 Houston, TX 158.8 Nueva York, NY y NJ 133.7 Nueva Orleáns, LA 87.5 Corpus Christi, TX 78.0 Beamount, TX 69.4 Ba ton Rouge, LA 63.7 Puerto de Plaguemines, LA 62.5 Long Beach, CA 60.9 Valdez,AK 53.4 Pitsburgh, PA 52.9 Tampa, FI 51.5 Lake Chales, LA 50.7 Ciudad de Texas, TX 49.5 Mobile,AL 45.4 Duluth-Superior, MN y WI 42.3 Los Angeles, CA 42.3 Norfolk Harbor, VA 40.8 Filadelfia, PA 39.3 Baltimore, MD 37.3

a. Construya una gráfica de caja y bigote para estos datos.

b. Estudie la forma de la distribución desde la gráfica. c. ¡Hay resultados aislados? d. ¡Cuáles son ellos y por qué piensa usted que son

resultados aislados?

3.62 Runzheimer International publica datos sobre costos de viaje de negocios en el extranjero. Estos datos reportan que el promedio de viáticos diarios para un agente via­ jero en París, Francia, es $349. Suponga que se descono­ ce la forma de la distribución de los costos de viáticos diarios de un agente viajero en París, pero que 53% de las cantidades por viáticos están entre $317 y $381. ¡Cuál es el valor de la desviación estándar? El promedio de viáticos en total para un agente viajero en Moscú es $415. Si se desconoce la forma de la distribución de cos­ tos de viáticos de un agente viajero en Moscú y si 83%

. de los costos de viáticos en Moscú están entre S3íl y $459, ¡cuál es la desviación estándar?

Interpretación de salida

3.63 American Banker compiló una lista de las principales 100 compañías banqueras del mundo según el total de sus activos. Encabeza la lista el Bank of Toho-Mi15U­ bishi, seguido por el Deutsche Bank. El resul~do de la estadística descriptiva de Excel es una lista dd total de activos variables (millones de dólares] para estos 100 bancos, analícelos y describa con sus propias palabras lo que puede deducir de los activos.

Page 118: libro.pdf

1

1 400000

1 1 9 10 1 1

1

92 ESTADISTICA E.-.: lOS l'-'EGOCIOS

A 1 1 , TopWootdBenb 2 Mean 2134oon 3 Standard error 12972 00 .. Med:an 1&CS73 5 Mode NIA • Standafd dovia:'°" 129720 7 ~VIN!IC:e 16827278273 • KurtOS13 105 8 Skewness 118

10 Ranoe 615029 11 Mnrnum 76891 12 Maxmum E!l1920 13 Sum 21349677 ,.. Count 100

l.64 Hispanic Business; lnc.; compiló una lista de los princi­ palc:s anunciantes que cuhivan d mercado hispmo. Estos datos (míllonn di.' dóbm) K' introdujm>n en una hoja de alkulo Ml~ITAB y K' analiuron mediante b función de t'Swlistica dcsaipm-a grifica. Estudie los re­ sultados y describa Jos pstos di.' t'StOS ~ anun­ dantes del mercado hts¡WtO.

\"ariahk:~ al~

Media 7 S60 Dnviación~ 5.8S60 \'uunz.1 :U.64SS Scsp> ).6214 Cunas.is 17.1851 N 50 Mlnimo .t2S PrimaawtiJ 4.50 median.a S.75 Tn= .:u.anil 8.625 múimo 40.00 9~ ck intcn'IJo ck confimu pan IA 6.1!132 9.5288

s 15 25 35

1 s 1

1 7 1

1 8 1

1 6 1

).65 En ti mundo I<' encuentran numerosas y grandes com­ par.las. El número de empleados rara .f6 di.' los mis grandes empleadores, con oficinas matrices fucra de Estados Unido», K' anJlizó con la función de otadl$lica descriptiva de Excel, A comlnuacién apam:m estos datos, Con d estudie de los resultados realice un anili· sü con lo que ha aprendido aceres del numero de empleados p.ira estas compañlas .

A 1 • -l. ~ E"'lllOYen Oublde of the Unlted s- 2 Mean 1833271304 3 Standard enor 9480.HH:>C .. Mecloan 15767( 5 Mode 13!>Wt • Standard devlat>on 64302 COO! 7 Slmllle vanance 413481027! • Ku:IOS<S 0.825C 8 Skewness 1.2996

10 Rango 2561()j 11 Mn:mum 12589.l 12 Maiamum ;mz¡g

13 Sum 84331Ml 14 Counl 41

l.66 La Compctith"' Media Reporting and Publishm lnfor­ mation Bureau compiló una füta de 10) principales 25 anunciante.. en Estado> Unid°' p.ira un a.ilo reciente. El total de guto. de publicidad para cada compaAb (en miles de dólares) ~analizó con la función de estadisu­ eas dncriptivu numéricas de Mf:-:ITAB }"$U función de gráfica de caja; amba> K muestran a continuación. E&tudie esta d resultado y resuma los gutos de los 25 principales anuncimto, con su. propW. p¡)abr»:

ütadlttica detcriptiva

Top 2SA Vuül>k Top2H

25 712i02 6IJ82J 723681 -136067 87213 ~tinimo ~túimo QI Q2 .w59S8 22269)4 484600 ;mS6

• {[]- 1

1400000 Princi~2S~

1

2 ~DODOD

Page 119: libro.pdf

CAPmJlO J ~TA.DbTICA DESCIUl'JlH 3

ANÁLISIS DE LA BASE DE DATOS

l. Utilice la base de datos de manufactura. ¿Cuál es la medía de ?\e\\· Capital Expenditures? (Cuál es la mediana de 'ew Capital Expendilures? ¿Cuando compara la medía y la mediana cuál es su análisis!

2. Para la base de datos del mercado de acciones "describa" la variable Dollar Value. lnclu}-a medidas de tendencia cen­ tral, variabilidad y sesgo. ¿Qu~ encontró?

3. Con la base de datos financiera estudie Eamings per Share (ganancias por acción) para Tipo 2 r 7 (compañias de pro­ ductos químicos y compañia> pttroquimicas). Calcule el coeficiente de variación para cada tipo. compare l~~ dos

eoeficientes y comente. u~ la base de dato' de hospital para construir una gráfica de caja y bigote para nacimien­ tos. Pensando en instalacicne» de ho pitales y obstetricia comente por qui! la gráfica de caja y bigote puede verse corno se ve,

4. Produzca una matriz de correlación para l~ variables Beds (camas], Admj,.,jon.,, Census, Ourpatient \'isih, Births (nacimiento ), Total Expenduures (gasto• totales), Payroll Expenditures (ga•to• de nómina) y Personnel (personal) para la base de dato• del hospital. ¿Cuálc• variables tienen mayor correlación y cuáles tienen menor?

CASO: COCA-COLA SE HACE PEQUEÑA EN RUSIA la Coca-Cola Company es el vendedor número uno de bebi­ da> gaseosas en el mundo. Todos los días, un promedio de m.li de mil millones de Coca-Cola, Diet Coke, Sprite, Fanta y otro. productos de Coca-Cola se consumen en todo el mundo. la compañia tiene el sistema de producción y distribución más grande del mundo para bebida> g3SCOi3> y vende más del doble de refrescos que su m.b cercano competidor. Los producto de Coca-Cola se venden en mas de 200 patsb en el mundo.

Por varias razone>, la compañia piensa que continuará creciendo internacionalmente. Una de esta. razones es que e•tá aumentando el ingreso desechable, Otra es que fuera de E.tados Unido• y Europa. el mundo cs más joven. Además, lle· gar a mercado> mundiales o m.b f.icil a medida que caen barreras politica> y se superan dificultades de transporte. Otra ra1ón es que compartir ideas, culturas y noticias alrededor del mundo crea oportunidades de mercado. Parte de la 11U>ión de la compañía o para que Coca-Cola mantenga la marca m.li poderosa y efectivamente utilice el •ÍStcma de distribución mas eficaz y penetrante del mundo.

F.o junio de 1999 Coca-Cola Rusia introduio una botella de Coca-Cola de 200 mi (unas 6.8 onzas) en \'olgogrado, Rusia, en una campaña para vender Coca-Cola a sus clientes más pobres. Esta estrategia fue exitoq para Coca-Cola en otros paí~. India por ejemplo. La botella ..e vende en 12 cen­ uvos, que la hace accesible a casi todo>. En 2001, Coca-Cola empicó 25~ de crecimiento por volumen en Rusia. incluyen· do un aumento de 18% en ventas de caj.u de Coca-Cola.

Análisis

l. Debido a la variabilidad de maquinaria para embotellar es probable que cada botella de 200 mi de Coca-Cola no con-

Estadlsticas descriptivas: llenado de botellas

Variable ::-\ Botella F 150

Variable Bottlla F

Mtnimo 19.920

tenga exactameme 200 mi de liquido. Algunas botella) pue­ den contener mb liquido )'otras menos. Como los llena· dos de la. botella son poco comunes, un ingeniero de producción desea probar alguna> de la\ botellas de lo> pri­ meros lotes de producción para determinar qué tan cerca e>t.in de la especificación de 200 mililitro>. Suponga que los siguientes datos son las mediciones de llenado de una muestra al var de SO botellas. Utilice las t«nica> presenta· da,~ en este capitulo para describir la muestra. Considere medidas de tendencia central, variabilidad y sesgo. Con base en este analisis, ¡cómo cst.i trabajando el proceso de embotellado?

200.I 199.9 200.2 200.2 200.0 200.1 200.9 200.1 200.3 200.S 199.7 200.4 200.3 199.8 199.3 200.I 199.4 199.6 199.2 200.2 200.4 199.8 199.9 200.2 199.6 199.6 200 . .f 200.4 200.6 200.6 200.1 200.8 199.9 200.0 199.9 200.3 200.5 199.9 201.I 199.7 200.2 200.5 200.2 199.7 200.9 200.2 199.5 200.6 200.3 199.8

2. Suponga que otra planta de Coca-Cola e<;t.i llenando hoce- Uas tradicionales de 20 onzas de líquido. Cn labon:onci.al azar, muestrea 1 SO botellas y las pruebas en cua::::o ~ volumen de limado. Los multado. de las estad &s. cripti''ll> se obtuvieron en MTNlTAB y Exccl EsaCa breve resumen para los supervisores acerca dd

Media 20.003

Desvíadén cstáncW 0.02;

Mediana 20.005

TrMtdia 20.003

~táximo 20.090

Q. 19.985

Page 120: libro.pdf

95% de intervalo de conl11ni1 per1 Mu

19 9985 20.0071

95"'- de intervalo de confi1nz1 pera Sigma

00239 0.0300 1 95% de 1ntervalo de confianza 20.010 per1 Mediana

19.9977 200091

199! 1

IY9S 1

20.01 1

IY.98 1

20.C>l 1

1 !0.000 ' 20.005

-.~de lntm-.Jo & <.:uní,.nz.a ~ ~lcdWia

S.Wda de Eiicd A 1 , .... :

1 Bottle ñlls 2 Mean 20003 3 SW>dlrd error 0002 .. Med'8ll 20005 5 Mode 20 004 6 StandarO devia:ion 0027 7 :>ama& vanance 0001 8 Kuttosos 1.015 9 Sl:ewroess -0085 10 Ranos o 170 11 M.nornum 1992 12 MalOITIUITl 20090 13 Sum 3000416 14 Coon: 150

Variable: llenado de botellas Pruebl de normelidad Anderaon·01rling

A cuadrado 0.588 V1lor P O 123

Medi1 O..Viaclón mandar V1ríena Sesgo Curtosis V1ri1ble N

200028 0.0268

7.09E-O• -8.6E-02

1.01598 150

199200 19.9851 20.00•8 20.0208 200898

Minlmo Primer cuertil medi1n1 Tercer cuartil m6ximo

Fuente; adaptado dr "Cokr. Avis Adjun 111 Ruui.", Adwrr111n1 Aft, S de julio de 1999. p. !S; s11ío \\<b Coca·Cola a1 bnpJ/www. eo<a·<Ola.romlhom<.hunl El inform< anual 2001 dt Tbe <:oa·Cola Company w ....,...,,,. a1 hU¡rJi-..-2.coa-<Ola.<oml imaton/onnualttpottl!OOlfmda.html.

EXCEL

USO DE LA COMPUTADORA De-criptive Smi>ti~. Comience por seleccionar Jools de la barra de menús Excel, En el menú descendente seleccione J2ata A.nalysis. En la aia de diálogo de anafüjj de datos selec­ cione la opción Descriptive St1tistics lnrroduzca el rango de lo> dato> a describir, Haga clic '' lo dato> 50n agrupado> por columna o fila. Haga clic para leyendas en la primera fila. ~ importante hacer clic en la caja de Summary Stltistics que e>t~ en la parte inferior izquierda para que Excel mdu)'a un amplio rango de medidas descriptivas.

Excel puede analiur dato> al usar varia. de la. ttcnia> pre­ sentadav en este capuulo. Tiene un comando particularmente poderoso que genera muchas C">tadí.>tiou descriptivas.

Est•disticu dncriptivas Excd puede tener acceso a '"ria. de la. cstad1sti~ descripti­ ''OI> presentadas en este capuulo mediante el uso del comando

Page 121: libro.pdf

El resultado incluye media, mediana, moda, desviación ~y varianza maestral: ademas, una medida de curtosis, i::ia de -esgo, rango, mínimo, maximo, suma y cuenta. IR.ango y pereentil ú.:d tiene un comando Uamado Rank and Percennle que ordena los dato,, lei, asigna rangos y da salida a lo. percenules. Para tener acceso a este comando, seleccione Iools de la barra de menú de Excel, En el menú descendente que aparece, )CICC· cione Data Analysis. Aparece la caja de diálogo de an.ífui> de dato.>. Seleccione Rank and Pereenríle. Aparece una caja de diá­ logo de rango y percennl. lnrroduzca el rango de dato.. Haga die ~i los datos están en columna. o fil.u y para lcycn~ en la primera fila.

MINITAB

Ml~ITAB \\'indo-., es capaz de ejecutar mucha. de la. tarra• presentadas en este capitulo, incluyendo e.tad1stica. descripri­ n., y gráfica. de caja. E.stadfsticas descriptivas Mtdiantc el U\O del comando Descripnve Statistics, ~11:-=tTAB da un numero considerable de las técnicas cstadistica.s men ''"nadas en este capitulo. El proceso se inicia con la selección Je .Stat en la barra de menús.

Dd menú descendente, seleccione Basic Stati5tics Del menú descendente de estadísticas básicas. seleccione Display Descriptive Statistics y aparece una caja de diálogo. lntro­ duzca el número de columnas que de-ea anali7ar. Si usted hace die en QK, entonces el resultado incluirá el tamano muestral, media, mediana, desviación estándar, mínimo, maxímo, el primer y el tercer cuartil, Sin embargo. si usted selecciona la opción Graph ... , tendrá varias opciones más de salida que relativamente se explican por si solas. Las opciones incluyen Histogram of data, Histogram of data with .oormal curve, Dotplot of data, Boxplot of data y Graphical swnmary. Si

CAPtn!IO) [' TADISTICA DESCRIPTT\'A 9S

usted selecciona ~raphical summary, obtendrá una ..alida como la que se muNra en el caso de C:O.-a Cola \Obre ti llena­ do de botella. ~ta ..alida incluye ta, funciones bajo QJida tabu­ lar más un histograma con datos sobrepuestos ron una curva normal, una gráfica de caja otra salida que se explicará m.h adelante en el texto. Estadisticas de columna

Las cstadisticas de columna se pueden obtener al sel~ciorur el comando Cale en la barra de menú> ~11!\'TTAB \1 Del menú descendente, seleccione el comando !:olumn Sta· tistics. Aparece la caja de diálogo column stausucs, 1 . e de eliminar la estadistica que usted desea calcular Introduzca la columna con los datos. F.I resaltado incluir.i los elementos que solicite.

& posible encontrar un elemento Row S1atisLÍC> m el menú descendente Cale. úselo si su. daros esl.in ul 1,-ad~ en una fila. Obtendrá una caja de diálogo de t>tad1>lic:u vln pro­ cesar que es prácticamente idéntica a la caja de diálogo de c.1adística. en columna. Siga los mismos pasos que los emplea­ do. con e•tadi>1icas en columna para obtener una ~id.i de dato• sin procesar, Grifica de caja y bigo1e ~ povible producir una gráfica de caja y bigote si se seleccio­ na Graph en la barra de menús. En ti menú descendente que aparece, seleccione Boxplot del menú )' aparecerá una caja de dialogo de boxplot (gráfica de caja. Introduzca la ubicación de variable en Y. Seleccione IQRange Box bajo Oispla)'. \'ariu opcicnes gráficas, por ejemplo agregar un mulo. ~ dan en la caja de diálogo del fondo. Una opción particularmente útil es trasponer la gráfica dela moda que los bigotes queden parale­ los al eje X. Para hacer este, seleccione 011tions en la parte inferior de la caja de di.i.logo. Tendrá entonces la oportunidad de hacer clic en una caja que desea trasponer hacia X y l'. La salida resultante es una gráfica de caja y bigote con un asterisco que representa resuhados aislado>.

Page 122: libro.pdf

CAPÍTULO 4

Probabilidad

OBJETIVOS DE APRENDIZAJE El principal objetivo del capítulo 4 es ayudar al estudiante a entender los principios básicos de probabilidad, con lo cual podrá: 1. Comprender las diferentes formas de asignar probabilidades. 2. Comprender y aplicar probabilidades marginales, de unión, conjuntas y condicio­

nales, 3. Seleccionar la ley de probabilidades apropiada para usar en la resolución de pro­

blemas. 4. Resolver problemas con el uso de leyes de probabilidades, incluyendo Ja ley de Ja

suma, la ley de la multiplicación y la ley de probabilidad condicional. 5. Revisar probabilidades con la regla de Bayes.

96

Page 123: libro.pdf

Igualdad de género en el lugar de trabajo

La Ley de Derechos Civiles fue firmada y oficializada en las leyt) de Estado Unido> en 1964 por el presideme Lyndon Johnson. E.ta ley, que fue enmendada en 1972, resultó en vañ0> "utulos" que abor­ daron la discriminación en la sociedad estadounidense a varios niveles. Uno de ello es el Titulo VII, que está relacionado e pecíficamenre con la discriminación del empleo.Aplica a todos la. empleadores con más de 15 empleados. junto con otras instituciones. Una de las disposiciones del Titulo VII hace ilegal el rechazo a contratar una persona con base en el género de e;a persona.

Hoy dla, los procedimiento de contratación de una compañia deben e-otar dentro de la previsión y estructura de los lineamiento. de la Equal Employmenl Opportunity Commission (EEOC) y el Titulo Vil. ¿Cómo defiende una compal\.la sus prácticas de contratación de personal o cómo sabe cuándo están dentro de limites aceptables? '¿Cómo pueden "probar" su caso individuos o grupos que sienten que hao sido victimas de prácticas ilegales de contratación? ¿Cómo puede un grupo demostrar que sus miembros han sido "adversamente impactados" por prácticas discriminatorias de conrratacién de una compañia?

Las estadísticas tienen uso generalizado en acciones de discriminación de empleo y por compailias que tratan de satisfacer lo. lineamiento de la EEOC. Cantidades importantes de dato> de recursos humanos se anotan y analiu.n diariamente Se reunió una pequeña parte de 10> da10> de recursos huma· no> de una compañia cliente.

DATOS DE RECURSOS HUMANOS DE UNA COMPAÑÍA CLIENTE, POR GENERO

Cimero

Tipo de posición Masculino Fmimino Total

G<rcnaal 8 3 11

Proíc.ional 31 13 4-4

ncníco S2 17 69

Oficini>u 9 22 31

Total 100 SS ISS

Preguntas gerenciales y estadísticas 1. Suponga que se ha expresado alguna preocupacién 1(831 porque un número desproporcionado

de per-onal gerencial de una compañia cliente son hombre>. Si de una compañía diente >< selec­ ciona al azar un 1rabaiador, ¿cu.ti es la probabilidad de que el trabajador sea mujer? Si 1 per· sona gerencial se selecciona al azar, ¿cu.íl e la probabilidad de que C$3 persona sea rm er ,Qut factores podrían entrar en la aparente discrepancia entre probabilidades!

2. Suponga que a una persona del área técnica se le otorga un bono especial este año. Si el bono se concede al azar, ¿c:WJ es la probabilidad de que \'il)'il a una mujer dado que ese traba~r es dd área tknica? ¿Es esta discriminación contra trabajadores técnico hombre>' ¿Qu~ úctorcs podrían entrar en la concesión del bono que no sea la selección al aur?

3. Suponga que en una fiesta anual feriada el nombre de un empleado de la compa!tia dit'lltt se sacara al azar para ganar un viaie a Hawai, ¿Cuál es la probabilidad de que una pcnom profe­ sional sea la ganadora?

4. ¿Cual es la probabilidad de que el ganador <ea un hombre o una oficmista' (Cuil es b probabi· lídad de que el ganador sea una mujer y en administración? Supon? que d ?Dador es hom· bre. ¿Cu.íl es la probabilidad de que sea del grupo técnico]

l'Ucntt:: mlorlN(i6n de la UOC aoh¡uda de Riclunl O. A~ y Roben 11. Foky. Faírnns.., Sd«b:¡ ~ oqundo cd... dcln. ( Rtaclin¡. MA. Adcbso11· \\<dty l'llblishing Company, 1992).

97

Page 124: libro.pdf

98 e.TADISTICA e: l05 SEGOCIOS

En negocio>. la mayor parte de la toma de decisiones involucra la incertidumbre. Por t;emplo, un gerente de operaciones no sabe si una \'álvula de la planta va a funcionar mal o continuar funcionan­ do. o bien. •i continúa, durante qué tiempo. ¿Cuándo debe cambiarse! ¿Cu.il o la probabilidad de que b válvula funcione mal dentro de la semana siguiente? .En la industria de la banca. ¿cuále) son lo. pro)­ j,ec1os del nuevo presidente para hacer que funcione bien un departamento! w rnpuot3) a o~ pre­ gunw son inciertas.

En el caso de un edificio alto, ¿cu.il es la probabilidad de que un sistema contra incendios funcio­ ne cuando sea necesario, si tiene instalado equipo superfluo? Quienes se ocupan de negocio) deben manejar a diario ~tas)' milo de preguntas semejantes. Como gran parte de olas pregunta) no timen respuestas definidas, la toma de decisícnes se basa en la incertidumbre. En muchas de estas suuaciones, se puede asignar una probabilidad a la posibilidad de un resultado . .Este capitulo trata de aprender cómo determinar o asignar probabilidades.

4.1 INTRODUCCIÓN A LA PROBABILIDAD

l@il,1,18 .. Probabilidad en el proceso de estadística inferencial

En el capitulo 1 vuno) la diferencia entre otadistica descriptiva e inferencial, Buena parte del anáfuü csta®tico n infcrencial, r la probabilidad o la base para la cstadi)tka inferencial, Recordemos que la 01a­ dis1ica inferencial comprende; tomar una muotra de una población, calcular una ti.tadistica 'Obre la muestra e inferir, a pan ir del valor estadistico, del parámetro correspondiente de la población. La razón para hacerle a)í es que el valor del parámetro e) desconocido: debido a que es desconocido, el anafüta realiza el proceso inferencial bajo incertidumbre pero, al aplicar reglas y lcyc>. puede con frecuencia a,i¡mar una probabilidad de obtener lo) resultados. La figura 4.1 representa ole proceso.

Supongamos que un inspector de control de calidad selecciona al azar una mue tra de 40 bombi · llas déctric3) de una población de bombillas de marca X y calcula el numero promedio de horas que ilumman las bombilla) de muestra. Con el u-o de las técnicas que )C verán m.l) adelante en este texto, el espe."ialista estimad número promedio de hora) que iluminan a la poblaá6n de bombillas eléctri(3) de marca X a partir de: esta información muestral, Como la) bombillas que M! analiun son sólo una muestra de la población. el numero promedio de horas que iluminan las 40 bombillas puede o no esti­ mar con predsién d promedio para todas 13) bombillas de la población. Los resultados son dudosos. Al aplicar las k)n presentadas en este capítulo, el inspector puede asignar un valor de probabilidad a este estimado.

Adcmú, bs probabilidades se usan directamente en arnas indu.triL' y aplicacione industriales. Por ejemplo, la industria de seguros utiliza probabilidades en cuadro. actuariales para determinar la probabilidad de cienos resultados rara ntablc.:n tarifas especíñcas y coberturas, l.a industria de lo. jucgoo emplea valores de probabilidad para esubleeer .::argos y pagos.. t:na manera de determinar si las práctica) de contratación de una rompa.tifa satisfacen los lineamientos de la EEOC del gobierno, mencio­ nado. en el Dilema de decisión o comparar varios desgloses de sus empicados (por e1ni.b, género. edad, entre otros) a las proporciones de la población general de la cual se contratan empicados. Al comparar las cifras de la compañia con la> de la población general, los juzgados podrían estudiar la, probabilida­ do de una compañia que al azar contrata cieno perfil de empicados de una población dada. En otras industrias, por ejemplo la manufactura y la aeroespacial, es importante conocer la vida de una parte mecanizada r la probabilidad de que pueda fallar durante cualquier tiempo para proteger a la compa­ ñia de fallas mayores.

Par!m<tro ..unud<• (Oll <1tadiitM

«rrobabdidaJ de confianza • ~1unmul1"'°1

Page 125: libro.pdf

42 MÉTODOS PARA ASIGNAR PROBABILIDADES

CAPITULO 4 PROl!ABIUIW) 99

l.()) tres métodos de asignar probabilidades son l) el método clásico, 2) el método de frecuencia relati­ va, y 3) probabilidado subietiva<

Método clásico de asignar probabilidades Cuando se asignan probabilidades con base en leya y reglas, el método se conoce como método clási­ co de asignar probabilidades Este método comprende un experimento, que es 1111 pro.:ao qut produc« rcs11/111dos, y un evento, que c. un resuhado de un experimento.

Cuando asignamos probabilidades con el uso del método clasico, la probabilidad de que ocurra un evento se determina como la razón entre el numero de elementos de una población que contengan el evento (11,) y el número de elementos de la población (N). Esto es P(E) = n,J.\'. Por ejemplo, si una eornpañta tiene 200 trabajadores y iO son muieres, la probabilidad de seleccionar al az.ar una muieres 70/200 = .35.

MtTOOO CUSICODE A~IG~ PROBABILIDADES

P(E)= 11, N

donde N • número total posibte de resultado. de un experimento 11, • el número de re ultados en los que el evento ocurre de .V re uhado

Por ejemplo. en una planta en particular, tres maquinas fabrican un determinado producto. La m.iquina A siempre produce 40% del numero total de este producto. Diez por ciento de los aruculos producidos por la maquina A son defectuoses. Si los productos terminado> se mezclan bien respecto a cuál máquina los produjo y <i uno de esto• producto> se selecciona al azar, el método clasico de asignar probabilidades nos dice que la probabilidad de que la pieza ha1-a sido producida por la maquina A y este defectuosa es 0.04. Esta probabilidad se puede determinar incluso antes que la pieza ~ muestre­ ada porque, con el metodo clásico, las probabilidades se pueden determinar a priori. esto es.se putdtn determinar ante» dtl experimento.

Como 11, nunca puede ser mayor que 1' (no m.t> de N resultado> de la población podnan po-ible­ mente tener atributo t), el valor m.h alto de cualquier probabilidad es l. Si la probabilidad de que ocurra un resultado es 1. e. seguro que el evento ocurra. La probabilidad m.t> pequeña posible es O. Si ninguno de lo. resultados de las.\" posibilidades tiene la característica deseada, e, la probabilidad" a \ O. y es -eguro que el evento no ocurra.

RA.'iGOOE PROBABWDADES o ::5 P\El ::5 1

Entonces, la~ probabilidades son fraccione. propias no negativas o valores decimales no nrptm>5 menores o iguale> a 1.

Lo. valores de probabilidad se pueden convenir en porcentajes <i se multiplican por 1 l.m meteorólogos reportan a \'CCe~ probabilidades del clima en forma de porcentaje. Por e¡rmplo. a:a=xlo pronostican 60% de probabilidad de Uu\·ia para matlana, están diciendo que la probabilidad de para mañana e' .60.

Frecuencia relativa El método de frecuencia rclaLi~-. para asignar probabilidade. se ba,,;i en datos hmóricos acure:cbdos. Con este método, la probabi/.,1,uf de qut ooum 1111 event» o ig1111/ al 11úmco dr •-rus que- n't!:t:l oaun6 tn ti pasado di1·idido entre el 11úmm1 rora/ de oportunidades para qut ocu"ª·

Page 126: libro.pdf

100 ESTADISTICA EN LO) l'EGOCIOS

PROBABWDAD POR FR.ECUEl\ClA IWATIVAOE OCUJl.REl\CIA

Número de veces que ocurrió un evento Número total de cponunidades para que ocurra el evento

La frecuencia relativa no c.tá basada en reglas o leyes sino en qué ha ocurrido en el pasado. Por ejemplo. una compañía desea determinar la probabilidad de que •m inspectores \'ayaD a rechazar el siguiente lote de materias primas de un proveedor. Les datos reunido. en lo libro. de registros de la compañta mue tran que en el pasado el proveedor em·ió a 13 compal'lla 90 lores y lo. inspectores recha­ zaron 1 O de ellos. Por el método de la frecuencia relativa de ocurrencia, la probabilidad de que los ins­ peetores rechacen el siguiente lote c. 10190 o Sta .11 Si el siguiente c. rcchaz.ido. la probabilidad por frecuencia relativa para el embarque posterior cambiarla a 11/91 • .12.

Probabilidad subjetiva El ., ·rodo s11bjtllll() dt asignar probabilidad ará basado en la imprtsi6n o inruiciJn de la person« que drtmnma la probabilidad. La probabilidad subjetiva proviene de la intuición o razonamiento de la perso­ na. Aun cuando no c. un método científico aplícado a la probabilidad. el método subjetivo e>tá basado en oca,,ione. en la acumulación de conocimiento. comprensión y experiencia almacenada y procesada en b mente humana. A veces es ~lo una suposición, pero en otras la probabilidad <ubjeti\-a puede poten­ cialmcnte dar probabilidades pre<:1>as. La probabilidad subjetiva se puede us.1r para capitalizar con base en los antecedente de rrabajadore, y gerente. experimentados en la toma de decisiones.

Supongamos que a un director de transporte de una companta petrolera se le pide la probabilidad de obtener un embarque de petróleo de Arabia Saudita a Estados Unidos en ~lo tres semanas, Un director que ha programado muchos de estos embarque. tiene conocimiento de la política árabe. y ade­ má> c.tá consciente de que las condiciones climatológicas y económicas actuales pueden dar una pro· babilid.td precisa de que el embarque se pueda hacer a tiempo.

La probabilidad subjetiva también puede ser una forma potencialmente útil de aprovechar la expe­ rienda. conocimiento e intuición de una persona y usar todo esto para pronosticar la ocurrencia de algún evento, Un mecánico experimentado de una aerolínea puede, por lo general, asignar una proba· bilídad lógica de que un avión en panicular tendrá cieno tipo de dificultad mecánica. A vece. los médi­ cos a.ignan probabilidades subjetivas a la esperanza de vida de personas que padecen cáncer,

4.3 ESTRUCTURA DE LA PROBABILIDAD

En el e tud10 de probabilidad o útil crear un lenguaje de término y simbolos, La estructura de la pro· babilidad proporciona un marco común dentro del cual se pueden explorar los temu de probabilidad.

Experimento Como ya ~ diio antes. un ~rimcnto es 11n proctse q11t produo: m11/1ados. Ejemplos de experimen­ tos orientados a negocios, con resultado. que pueden ser analizado. estadísticameme, podrían incluir lo siguiente:

• Entrevistar a 20 consumidores seleccionados al azar y preguntarlo qué marca de aparato elec­ trodomésnco prefieren.

• Muestrear una de cada 200 botellas de salsa de 1omate de cierta linea de producción )'pe.ar el contenido.

• Probar nuevos medicamento> en muestras de paciente. con cáncer y medir su mejoría. • Auditar una de cada 10 cuenta. para detectar cualquier error • Registrar el promedio industrial Dow lenes el primer tune. de cad.t mes durante 10 anos.

Page 127: libro.pdf

CAPft'UUH PROllAllILID...0 101

Evento Debido a que un evento es un rc.sultaJo de un expenmento, el experimento define I~ posibilidades del evento, Si d experimento e muestrear cinco boteilas que salgan de una linea de producción, un even­ to podria ser obtener una botella defectuosa )' cuatro buenas. En un experimento de tirar dado>. un evento podria ser tirar un número par y otro evento podria ser tirar un número mayor de dos. lo> even­ to> se denotan con letras mayúsculas; las letras imyú>CUias cursivas (por ejemplo, A )' E1, E2, ••• ) repre­ senran el caso general o absrracto y las ma)'Ú~uW tipo Romanredondas (por ejemplo, H y T para cabezas y colas [cara o cruz J) denotan C0$3) y personas específicas.

Eventos simples Los cn:111os qr..: ne St' puedan separar o drscompo11cr en otro» eventos se Uaman eventos simples Lo> eventos simples se denotan con letra.\ minúsculas [p. ej. c1, c2, e), ... 1. Supongamos que el ezpenmen­ to e> tirar un dado. lo> eventos <imples para este experimento son tirar un 1 o tirar un 2 o tirar un J, etcétera. Tirar un numero par o un evento, pero no e> un evento elemental porque el número par puede descomponerse en los eventos 2, 4 y 6.

En el experimento de: tirar un dado. hay~ eventos imples ( l, 2, J, .f, 5, 6}. Tirar un par de dados resulta en 36 posibles eventos simples ( resultados), Por cada uno de los seis evento> <imple> posibles al tirar un dado, hay seis posibles C:\"Cnt0> simples en el tiro del segundo dado, como se describe en el día· grama de árbol de la figura -1.2. La tabla 4.1 contiene: una lista de esto' 36 re ultados,

En el experimento de: tirar un par de: dado-, otros eventos podrían incluir resultados talo como do> números pares, una suma de: 10, una suma mayor de cinco, y otro>. l'o obstante, ninguno de estos eventos es un evento elemental porque cada uno se puede descomponer en vario> de los eventos sim­ ples mostrados en la tabla .f. l.

TABLA 4.1

Todos los posibles eventos s:mplos en el tiro de un par de é.3tos !espacio muestrall

Posibles resultados de tirar un par de dados

1.1 4,1 5;1 (6Jl (1.2) (4.2) (5,1) (6.2)

(l.J) (2,3) (4.J) 15.J) (6.))

(1,4) (2.4) (3.4) (4,4) (5,4) (6.4)

(l.S) (2.S) (3.S) (4.S) (S.S) (6.5)

(1,6) (2,6) (),6) (4,6) (S,6) (6.6)

&nito> ..un un dodo (6) 2 E...,.tos C011 un scpmdo dado J6

Page 128: libro.pdf

102 bTADhTICH.-.; LO> :-;EGOCIO)

FIGURA 4.3 Una unión

FIGURA 4.4 Una intersección

Espacio muestra! l:n t'p•cio muestral es una lina complet« dt to;loJ los evento» mnplt; para un expenmmto. La t.ibla 4.1 o un espacio muestra! para tirar un par de dados, El espacie maestral para el tiro de: un wlo dado es 11. 2. 3, 4 ,5, 6).

El espacio mue:.tral puede avudar a encontrar probabilidades, Suponga que un experimento o tirar un par de dado>. ¿Cu.il es la probabilidad de que el dado sume 71 Un examen del espacio mues­ tral que se ilu$tra en la tabla .f. l deja ver que son seis resultndos en lo> que la suma del dado ea 7-1(1,6), (2,5),(3,4),(-1,3), (5,2).16.1))-cn el total posible de J6cvcnto,s1mplc.en el espacio mues­ tral. Al usar t>ta información, podemo concluir que la probabilidad de tirar un par de dados sumen 7 o 6136, o $ta .1667. Sin embargo, el uso del esp.1C10 muesrral para determinar probabilidades es engo­ rroso y dificil de manejar cuando el espacio rnuestral e• grande. Por tanto, lo> experto> en t>tad1•tica utilizan otro' métodos m.1< dicientes para determinar probabílidade . •

Uniones e intersecciones La not•ción de conjunto , e decir, el u.'IO de llaves para agrupar numeras, se utilíu como hertamien­ ta rnnb6lica pura 11mants t inttr~11t5 en e-te capitulo. la unión de X. r se forma al romb111i1r tlt­ mentas dt ambo.1 ron¡1111tos y$(' denota X u r. IJn elemento se d.i.ifrca en la unión de x. r si C>t~ ra sea en X o en Yo tanto en X como en r. la expresión de unión X U r se puede traducir en X o r. Por ejemplo. $i:

X= (1,-1,7,91 y }' m /2.3.-1.5.6) xu r-11.2.3.4.5.6.7,91

Kóte.e que todo. lo. valores de X y todo. lo. valoro de re.un en la unión: sin embargo, ningu· no de lo> \<l10rQ aparece mh de una vez en la unión. En la figura -1.3, la región sombreada del diagra· ma de \'enn denota la unión.

Una intersección se denota X n r. Para da.;íficarsc en la intersección. un demento debe e tar tanto en X como en r. La intersección conucn« /oj elementos co1111mc.1 dt ambo; conjuntos. Por tanto, el -im­ bolo de interseccién. n, se lec a veces como y, La intersección de X. Y se lec como X y Y. Por ejem­ plo, vi:

X= ft,-1,;,91 y l' • /2,J..1.5,61 xn Y•!-11

:-:ótesc que sólo el valor de -1 es común a lo> do. conjunto X y Y. La intersección e> m.í> cxdu'i"a que la unión r por tanto es igual O (por lo general) más pequeña que la unión. los elementos deben ser carscten tico' tanto de X como de r para da)ificar. En I~ figura 4.-1, la región sombreada denota la iotcn«ción.

Eventos mutuamente excluyentes Do' o mas eventos son mutuamente excluyentes 'i la ocurrencia de un t>·tnto impide q11t ocurra ti otro evemois}. Sta característica 'itt· nifica que los eventos mutuamente excluyentes no pueden ocurrir en forma ,iJnultánca y, por tanto, no uenen intersección.

La "anablc "género" presenta do, resultados mutuamente excluyentes, masculino y femenino: un empicado seleccionado al uar para que S<"a parte de un estudio es hombre o muier, pero no puede ser ambos. Una piva manufacturada estj defectuosa o C>t! bien: la pieza no puede estar defectuosa )" bien aJ mismo tiempo porque "bien" yªdcfcctuOA· son categorías mutuamente excluyen­ tev, En una muestra de productos manufacturados, el evento de seleccionar un pieza defectuosa es mutuamente exclusiva con el evento de seleccionar una pieza no dcfectuo'-1. Suponga que un edificio de oficinas c:)t~ a la venta y dos compradores potenciales le ponen predo al edificio, !'o es posible que ambos lo compren, por lo cual el evento de que el comprador A compre el edificio es

Page 129: libro.pdf

CAPITUL04 PROBABIUD.\D 103

mutuamente excluyente con el evento de que el comprador B compre el edificio. Al tirar una moncd.J., el que caiga can o cruz es un evento mutuamente excluyente. La persona que lance al aire una mone­ da verá o cara o cruz. pero nunca ambas. En el uro de un par de dados. el evento (6, 6), mulas, es mutuamente exclusivo con el evenro ( 1, 1) ojo de víbora, Obtener mula. y ojos de \1bora en el mismo tiro de dados es imposible.

La probabilidad de que se presenten dos eventos mutuamente excluyc:ntQ al mismo tiempo es cero,

~L''TO XyY :TUAME.''TE

Dll.l1YfXTES P(Xí'I Y)• O

Eventos independientes Dos o mh eventos son eventos independientes ~¡la ocurrencia o no ocurrtnda dt 11no dt los evento» no af«ra la ocurrtnda o no ocurrtnda dtl otro n·tnto(s). Cienos experimentos, por ejemplo tirar dados, dan eventos independientes: cada dado es independiente del otro. Que )a!ga un 6 en el primer dado no inOu)e en el segundo dado. Los~ al aire de moneda. siempre son independientes entre si. El even­ to de que salga cara en el primer tiro al aire de una moneda es independiente de que salga cruz en el segundo tiro. En general se piell.\a que ciena. caracterísricas humana. son independientes de otros C\CntO•. Por ejemplo, es probable que ser zurdo sea independiente de la posesién de una tarjeta de eré· dito. E. probable que •i una pe~na u.a lentes o no. esto es independiente de la marca de leche que prefiera.

)lfuchos experimemos que utiliun selección aleatoria pueden producir evento. independientes o no independientes. En e.to• experimento>. lo• resuhados son independientes si el muestreo se hace con reemplazo; es decir. despub que cada elemento se seleccione y se determine el resultado, el elemento se reintegra a la población y la población " revuelve, En t'Sta forma, cada tiro se hace independiente del tiro prevro. Suponga que un inspector selecciona al azar tomillo. de un depósito que contiene 5% de pi~ defectuosas. Si el inspector muestrea un tomillo defectuoso y lo Tegm.1 al depósito, en el segun· do saque todavía habrá 5% de piezas defectuosas en el dcpó)ito sin considerar el hecho de que el pri­ mer resultado fueran sido pieza defectuosa. Sí el inspector no regresa la pieza en el primer saque, la segunda pina no es independiente de la primera; en este caso. quedan menos de 5% de piezas defec­ tuo~ en la población. Por tanto. la probabilidad del segundo resultado o dependiente del primero.

Si X e Y son independientes, se utiliza la siguiente notación.

PIX)Y) • PIXJ y PO'IX) • P(Y)

P(X)}') denota la probabilidad de que X ocurra dado que Y ha ocurrido. Si X y Y son indepen­ dientes, entonces la probabilidad de que X ocurra dado que Y ha ocurrido e. exactamente la proN!li­ lidad de que X ocurra. Saber que Y ha ocurrido no afecta la probabilidad de que ocurra X porque X Y son independientes. Por ejemplo, PI prefiera Pep>ilpcrwna co derecha l • P( prefiere Pepsí) porqut g

una persona co derecha o es zurda es independiente de la preferencia de la marca.

Eventos colectivamente exhaustivos Una li ta de "en tos colectivamente exhaustivos contiene todos los posibltS tltrnmtos sunpla - experimento, En consecuencia, todos los espacios muestrales son listas colectivamente ~La ti.ta de posibles resultados por tirar un par de dados, contenida en la tabla 4.1, es una bu cXJl~:q.. mente exhaustiva, El espacio muestra! para un experimento se puede describir como um to> que son mutuamente excluyente. y colectivamente exhaustivos, Los eventos de espKJO - se traslapan o intersecan, y la lista está completa.

Eventos complementarios El complemento de un "coto .A se denota como A', que se Ice no A. Todos los non:::s • experimento no m A comprtndtn su complemento. Por qemplo, si al tirar un dado d ~A R doe2

Page 130: libro.pdf

l 04 ESTAD1STICA E,-.; LOS SEGOCIO~

en el número par, el complemento de A esú teniendo un número impar. Si el evento A se detiene en el número 5 al tirar el dado, el complemento de A tendría 1, 2, J, 4 o 6. El complemento de A contiene cualquier parte del espacio muestral que el evento A no contenga. como muestra el diagrama de Venn de la figura 4.5.

PROBABIUDAD DEL CO\fPl.EMENl'O DEA

P(A') = 1 - (A)

Suponga que 32% de lo$ empleados de una compaMa tienen grado universitario, Si un empleado se selecciona al azar de la c:ompailla, la probabilidad de que la persona no tenga grado universitario es 1 - .J:? • .68. Suponga que 42% de todas las piezas producidas en una planta se moldean en la maqui­ na A r J 1 % en la máquina B. Si al azar se selecciona una pieza, la probabilidad de que fuera moldeada. no por b máquina A ni por la máquina Bes de 1 - .73 • .27. (Suponga que una pieza se moldea ~lo en una máquina.)

Conteo de posibilidades En ~llc:a, es posible usar un conjunto de técnicas y reglas para contar el número de resultados que pueden ocurrir para un experimento en partic:ular. Algunas de estas reglas y técnicas pueden delinear d tamaAo del espacio muestral. AquJ se presentan ttñ de estos métodos de conteo.

La regla de conteo mn

Suponga que un cliente decide comprar un auto nuevo de cierta marca.Las opcioaes para el auto indu­ ym dos motora difercnto,cinco colores diferentes de pintura y tres paquetes del interior Si existe cada una de esus opciones con cada una de I~ otras, ¿de cuántos autos diferentes podría escoger el cliente! Para determinar C\tc número. podemos usar la regla de conteo m".

lAR.EGlADE CO~"TtO..,,

FIGURA 4.5 El complemento del evento A

Para um opaación que se puc:da hacer en m formu )' una sq¡uncb o¡><ración que se pueda hacer en n !onms. w dM operaciones pueden ocurrir, en orden, en mn form.u. bta ~la se pu~ atcnckr a ~ con ucs o más operaciones.

Con el 11$() de la regla de conteo mn podemos determinar que el comprador del auto tiene dispo­ nibk$ (2) (5)(3) ., JO diferentes combinaciones de motor, color de pintura e interiores del auto.

St:p0r.p que un investigador desea iniciar un diseüo de invotigación para estudiar le» efectos del sfncro (M, F), estado civil (soltero, divorciado, casado) y clase económica (baja, media y alta) en la fre­ cuencia de compras de boleto) de avión por año, El inve tigador iniciarla un diseño en el que se toman 1 S muestras diferentes para representar todo) los grupo) posible generados por estas caracteruticas del cliente, .

Número de grupos • (Género) (estado civil) (clase económica) • (2) (J) (J) • 18 grupo)

Muestreo de una población con reemplazo

En el segundo método de conteo, el muestreo den elemento) de una población de tammo N con reem­ plazo darla:

(N)• po$ibilídad~

A'

Donde:

N = tamallo poblacional " = tamaño mucstral

Por ejemplo, cada vez que se tire un dado que tenga seis lados los multados son independientes (con reemplazo) del tiro ante· rior, Si un dado se tira tm vece. en sucesién, ¿cuántOi resultados

Page 131: libro.pdf

CAPITIJLO 4 PROBIJ!ll.JD.U> IOS

diferentes puede ocurrir? Esto es, ¿cuil es el tanullo del espacio muestrsl para este experimento? El tamatlo de la población, N, c. 6. lo. sris lados dd dado, ~1.1mo• muestreando tres tiros de dados. n .. 3. El opado muestra! es:

(]\.')~ - (6)3 - 216

Suponga que en una lotería se ucan seis números de lo. dígitru del O al 9, con reemplazo (10) dígi­ tos $C pueden usar otra \'C7). ¿Cuántas agrupaciones diferente• de sch números se pueden ucar? N es la población de 10 números (0 al 9) y ne el tamaño rnuestral, sri$ números,

(N)• • (10)6 • 1000000

Esto o. ¡existe un millón de números de seis dig11os!

Combinaciones: muestreo ~e una población sin reemplazo El tercer mttodo de conteo ua combinaciones que muestrea n elementos de una pobladón de tamallo N sin reemplazo y se obtiene:

(,\'} NI ,.e,.= =---- • n n!(N-11)!

po.íbilidades. Por ejemplo, suponga" que una pequeñe empresa de abogado. tiene 16 empleados y tres de ellos

han de ser seleccionados al v.ar para representar la compaJ\ia en la reunión anual de la American Bar A,.(~iation. ¿Cuánta. diferentes combinaciones de abogad()) podrían set enviadas a la reunión? Esta situacién no permite muestrear con reemplazo porque tres diferente. abogado. .crán seleccionados para asistir. Este problema se resuelve con el uso de combinadones: N • 16 y n • 3, así que:

16! 111C. = 16C3 =--=560 • 3!13!

(.1 PROBLEMAS

Un total de 560 combinaciones de tres abogados podrian seleccionarse para representar la firma.

4.1 Un proveedor remitió un lote de ~is piezas a una compeñía, tres de la. cuales estaban defectuosas, Suponga que el cliente dccidíó seleccionar al azar do. pía.a) r probarla. para ver si tenían defee­ tos. ¿Qut tan grande es un c:.pado muestra! con el que esti trabajando potencialmente el cliente? Haga una li>ta del espacio. Con el uso de la lista del espacio maestral, determine la probabilidad de que el diente seleccione una muestra con exactamente un defecto.

4.2 Dado X• 11. 3, 5, 7, 8, 9). r • 12. 4, 7, 91 y Z.,. { r, 2, 3, 4, 71, resuelva lo siguiente. •· xuz-_ b. xnr-_ c. xnz•_ d. xu ruz-_ e. x n Y n z= _ c. (X u Y) n z • _ g. (Y n Z) u ex n Y) • _ h. x o r - _ i. YyX•_

4.3 Sí una población consta de lo números pares positivos hasta 30 y si A • (:Z. 6, 12, 24 • (~es A! 4.4 El 5i~tema telefónico 800 del scrvicio a clientes de una compallla est~ instalado de modo que quien

llama tiene sei.\ opciones. Cada una de estas seis opciones lleva a un menú con cuatro opaotlCl-o Para cada una de estas cuatro opciones existen tres opciones más. Para cada una de esas un opciones están presentes otras tres opciones. Si una persona llama al número 800 pidiendo IJUda, ¿cuántas opcione en total son posibles?

4.5 Un recipiente contiene seis piCU5. de la~ cuales dos están defectuosas v cuatro son acqiubles. 51 tres de ta. seis pieza. se seleccionan del recipiente. ¿qut' tan grande es el csp300 muntraP. (CWI regla de conteo utili76 usted y por qu~? Para este espacio maestral, ¿cuil es la probabilid.ld de que exactamente una de Lu tres pi~'US muestreadas sea defectuosa!

Page 132: libro.pdf

<t.6 Una compaflla coloca un nümero de serie con siete dlgito• en cada pieza que fabrica. Cada digito del numero de serie puede ser cualquier número de O a 9. U» dígit~ se pueden repetir en el núme­ ro de serie. ¿Cuántos numeres de serie diferentes son posibles!

<t.7 Una pequer\a compatl.ia nene 20 empleados, seis de los cuales serán seleccionados al azar para ser entrevístados como parte de un programa de ~tisfacción de empleado •. ¿Cuúit°' grupos diferen­ tes de seü se pueden seleccionar!

4.4 PROBABILIDADES MARGINALES, DE UNIÓN, CONJUNTAS Y CONDICIONALES

En este capitulo presentemos cuatro tipos parnculares de probabilidad; el primer tipo es el de proba· bilidad muginal que se denota P(E), donde 5 es algún evento. Por lo general una probabilidad marginal se ca!nda al divídir algún subroral entre d entero. Un ejemplo de probabilidad marginal e. la probabili­ dad de que una persona posea un auto Ford. Esta probabilidad se calcula al di,idir el número de pro· piewios de Ford entre el número total de propietarios de autos. La probabilidad de que una persona ese lentes también es una probabilidad marginal. Esta probabilidad se calcula al dividir el número de penoms que usen lentes entre el número total de personas.

Un segundo tipo de probabilidad es la unión de dos eventos. La probabilidad de unión se denota P(E1 U E2), donde E1 y E2 son dos eventos. P(E1 U E2) e> la probabilidad de que E1 ocurra o que E2 ocurra o que ocurran tanto E1 como E2• Un ejemplo de probabilidad de unión c. la probabilidad de que una persona posea un Ford o un Chevrolet. Para llenar lo. requisitos para la unión, la persona sélo debe tener al menos uno de esto auto . Otro ejemplo c. la probabilidad de que una persona use lente• o sea pdirrojo. Todas las personas que usen lentes esun incluidas en la unión, junto con todos los peli­ rrojos y todos los pelirrojo¡ que usen lentes, En una compar\Ja, la probabilidad de que una persona sea hombre u oficinista c. una probabilidad de unión. Una persona llena I°' requisitos para la unión al ser hombre o ser oficinii.ta o ser ambos (oficinista hombre).

Un tercer tipo de probabilidad es la intersección de dos eventos, o probabilidad conjunta. La pro­ babilidad conjunta de los eventos E1 y E2 se denota como P(E1 n E2). A veces P1 E1 n E2) se lee como b probabilidad de E1 y E2• Para llenar los requisito• de la intersección, deben ocurrir ambos eventos. Un ejemplo de probabilidad conjunta es la probabilidad de que una persona posea un Ford y un Chevrolct. l'osttr' UD tipo de auto no es suficiente. Un segundo ejemplo de probabilidad conjunta e. la probabilidad de que una persona sea pelirroja y use lento.

Un cuarto tipo es Ja probabilidad condicional que se denota por P( E1 1 E2 ). Esta expresión se lee: La probabilidad de que E1 ocurra, dado que E2. se sabe que ha ocurrido. Las probabilidades con·

dicionales comprenden el conocimiento de alguna información pm·ia. La información conocida o dada se escribe a la derecha de la línea vertical del enunciado de probabilidad. l.:n ejemplo de probabi­ lidad condicional es la probabilidad de que una persona posca un Chevrolet dado que ella posee un Ford. E.su probabilidad condicional C$ ~lo una medida de la proporción de propietarios Ford que ue­ nen un Olc-\-role1 -no la proporción del total de propietarios de auto que poseen un Chevroler. w probabilidades condicionales se calculan al determinar el número de elementos que tienen un resulta­ do que se obtuve de algun subtotal de la población. En el ejemplo do: propietario) de auto>, las posibi­ lidades se reducen .a los propietari~ de un Ford, y luego se determina el número de propietarios de Chevrolet fuera de propietarios de Ford. Otro ejemplo de una probabilidad condicional es la probabili­ dad de que un trabaiador de una com¡>Mlia sea un profesional dado que es hombre. De nuestros cuatro tipo> de probabilidad, ~lo la probabilidad condicional no tiene la población total como su denomina­ dor. Las probabilidades condicionales tienen un subtotal de población en el denominador. La figura 4.6 resume estos cuatro tipos de probabilidad.

4.5 LEYES DE LA ADICIÓN

Eiu:.ten varias herramientas para usar en Ja solucién de problema, de probabilidad. Esw herramientas inclu)·cn espacio muestral, di.:igranw de árbol, leyes de probabilidad, matrices de probabilidad e intui­ ción. Debido a la individualidad y variedad de problemas de probabilidad. al~nas técnicas aplican más fácilmente en cierta> •ituacionc. que m otra., .. !'\o existe el mejor método para resolver todos los pro-

Page 133: libro.pdf

conjuntas y ::::r.i:!Qonales

CAJ>tn.Jl.O 4 PROBA.BIUllt\D IOi'

Conjuui

P(,\1 P\XvY) P(Xn Y) P\Xh1

La La La La probabllidad probabilidad probabilidad probabilidad

QIXX QIXXyl" QIXXyt' QIXX ocurra ocurran ocurran ocurro

dado qlk' r ha ocurrido

Utiliza multados V1ibu rnuludos U1ilw rnulwloa U1iliu d aub1ow posibles posibln poliblcs d~lotpoubla

loulntnd IOblamd 1ocala en d rnuludo>md dtnomi-iot daiomimdor daiomllwlor dmominador

blemas de probabilidad. En algunos ejemplos, la ma1riz de probabilidad trua un problema de un modo que se puede resolver fácilmente. En otros casos, establecer la matriz de probabilidad es mas dificil que resolver el problema de otro modo. Las I~ de probabilidad casi siempre se pueden usar para resolver problemas de probabilidad. pero pan alguno. problema) la solución se puede determinar sin aplicar formalmente las leye).

Una de las herramientas ya presentadas es el espacio muestral; Otra) incluyen las leyes de probabi­ lidad. En este capnulo se presentan cuatro leyes de probabilidad. w leyes de la adición, probabilidad condicional, las leyes de la multiplicación y la regla de Ba}-es. Las ltye$ de la adición y las leyes de la mul­ tipliación tienen cada una de ellas una ley general y una ley especial. La ley general de la adición se uti­ liza para encontrar la probabilidad de la unión de dos eventos, P(X U Y). La expresión P(X U Y) denota la probabilidad de que X ocurra o que Y ocurra o que ocurran X r Y.

Ul' GE.'."tRAl. DE LA ADICJON

P(X U Y)• P(.\1 + P(Y) - P(X n Y) Donde X, Y son eventos y (X n Y) es fa intersección de X y Y.

Yankelovich Partners llevó a abo un estudio para la American Society of Interior De igners en el que se preguntó a trabajadores cu.iles eran los cambios en disd\o de oficinu que aumentarian la pro· ducuvidad. A quienes respondieren se les permitió contestar m~ de un tipo de cambio de diseño. El cambio número uno que 70% de lo¡ trabajadorts diieron aumentaría la productividad era reducir el ruido. En segundo lugar~ espacio de almacenamiento o de archive.seleccionado por 6i% de los rra­ baiadores, Si al aur 5C selecciona uno de quienes respondieron y se le pregunta qué cambio) de diseño de oficina aumentarla la productividad del trabajador, ¿cuál es la probabilidad de que esta persona seleccionaria la reducción de ruido o mú copado de almacenamiento o de archivo?

Hagam06 que N represente el evento "reducir ruido· y que S represente el evento •más espacio de almacenamiento o de archi•-o': La probabilidad de que una persona responda con N o S se puede sim­ bolizar estadísticamente como una probabilidad de unión con el uso de la ley de la adición.

P(:SUS)

Para satisfacer con éxito la búsqueda de una persona que responda con reducir el ruido o m.is ~­ cio de almacenamiento o de archivo, sólo necesuamos encontrar una persona que drsce 11/ menos aDO de estos eventos. Como 70% de los entrevistados respondieron que reducir el ruido crearla mis pre­ ductividad, P(!') ... 70. Adcm.t\, como 67% respondieron que aumentar el espacio de almacmar:llt!l­ to mejoraría la productividad. P1 S .67. Cualquiera de bto. s.atisfaria el requisito de la unión. Por tanto, la solucién del problema parece ser

P(N U SI• P(N) + PIS)• .i'O + .67 • 1.37

Page 134: libro.pdf

108 lSTAl>bTICA E." LOS NECOCIOS

,flGURA 4.7 .. ·~ Despeje de la unión en el problema de productividad en oficinas

!'o obstante, )'a establecimos que las probabilidades no pue­ den ser mis de 1.00. ¿úúl es el problema aqul1 NóttM! que todas las personas que respondieron que tanto, reducir el ruido como aumenur el espacio de almacenamiento mejoraría la productivi­ dad se incluyen en cada una de 1 .. probabilídades marginales P(N) y Pl,S1. Ciertameme una persona que responda y recomiende estas dos me;oru debe incluirse como que favorece al menos una. Sin embargo. como aún incluidas en el P\N) y el P(S), las personas que recomendaron ambas mejora se cuentan doblement«. Por esa rvón, la ley general de la adición resta la probabilidad de intersee­ ción, PIN n S).

F.n la figura 4.7, diagram.i. de Venn ilustran este análisis. Nótese que el área de interseccíén de N y S esU doblemente sombreada en el diagrama A, lo que indica que se ha contado do. veces. En el día· grama 8, el sombreado es consistente en todo N y S porque el área de intersección se ha resudo. Por Unto el diagrama 8 ilusua la apli· caci6n correcta de la ley general de la adición.

¿Entonces cual es la respuesta a la pregunta de probabilidad de unión de Yankelovich Partners! Suponga que 56% de todos los que respondieron a la encuesta habian dicho que tanto la reducción de ruido romo aumentar el espacio de almaanamiento o de archh~ mejoraría la productividad; P(N n S) 56. Entonces podríamos usar la ley general de la adición para resolver la probabilidad de que una persona responda que ya sea la reducción de ruido o aumentar espacio de almacenamiento mejorarían la pro­ ductividad.

PlN U S)"' P(N)-+ PI.Si - P\N íl SI• .70 + .. 67 - .56 • .81

Por tanto. 81 'MI de los trabajadores encuestados respondieron que ya sea la rtd11cri6n dt mido o aumentar t$pacio de almactnamicnto mejorarían la productividad.

Matrices de probabilidad Ademis de las fórmul~ otra berramiema útil al resolver problemas de probabilidad es una matriz de probabilidad. Una matriz de probabilidad; mueura las probabílídadcs malfÍnalts y las probabilidadts dt m1mccci6n dt un problema dado. Las probabilidades de unión y probabilidades condicionales deben ser calculadas desde la matriz, En general, una matriz de probabilidad se construye como un cuadro de dos dimensiones con una variable en cada lado del cuadro. Por ejemplo, en el problema del diseño de una oficina, la reducción de ruido estarla en un lado del cuadro y aumentar el espacio de almacena­ miento en el otro. En este problema, una fila Sí y una fila No se aeartan para una variable y una colum­ na Si y una columna ~o se crcarian para la otra variable, como se ve en la tabla 4.2.

Una vci creada la matriz. podemos escribir las probabilidades marginales. P(N) • .70 es la proba· bilidad margiiul de que una persona responda si a la reducción de ruido. Este valor se coloca en el mar­ gen de la fila de SI a reducción de ruido, como se ve en la tabla 4.3. Si Pt ~) • .70, entonces 30% de las personas entrcviiudas no pensaron que la reducción de ruido aumentar1.1 la productividad, Por tanto, P\no :-;") • 1 - .iO = .30. E:.te valor, también una probabilidad marginal, va en la fila indicada por No bajo reducción de ruido. En la columna bajo, Sí para aumentar espacio de almacenamiento. se registra la probabilidad marginal P(S - .67. Finalmente, la probabilidad marginal de No para aumentar espa- cio de almacenamiento. pt no S 1 -0.67 se coloca en la columna No.

TABLA 4.2

Matriz de probabilidad para el problema de disello de oficinas

Page 135: libro.pdf

CAPÍTULO 4 PROBA6lUDAD 109

"IUl.A4.3 ~ OfHldo de 41lmtiamrmiento SI No

Sl~.70

Noa.3º

.67 .33 l.00

!l&iciL de probabilidad del ~~-ma de diseño de ~.as

¡llllA 4.4 -e columna Sí para matriz de ~ idad del problema a :::!:seño de oficinas

.67

En esta matriz de probabilidad se dan las cuatro probabilidades marginales o se pueden calcular con sólo usar la probabilidad de una regla complemento, P(no S) = 1 - P(S). La intersección de reduc­ ción de ruido y aumentar espacio de almacenamiento se da como P(N n S) = 0.56. Este valor se escri­ be en la matriz de probabilidad en la celda bajo Sí Sí, como se ve en la tabla 4.3. El resto de la matriz se puede determinar al restar, de las probabilidades marginales, los valores de la celda. Por ejemplo, restar 0.56 de 0.70 y obtener 0.14 da el valor para Ja celda bajo Sí por reducción de ruido y No por aumentar espacio de almacenamiento. En otras palabras, 14% de todos los que respondieron la encuesta dijeron que la reducción de ruido mejoraría la productividad pero el aumento de espacio de almacenamiento no la mejoraría. Llenar el resto de la matriz resulta en las probabilidades que se ven en la tabla 4.3.

Ahora podemos resolver la probabilidad de unión, P(N U S), en al menos dos formas diferentes con el uso de la matriz de probabilidad. El enfoque está en la fila Sí por reducción de ruido y la colum­ na Sí por aumentar espacio de almacenamiento, como se ve en la tabla 4.4. La probabilidad de que una persona sugiera reducción de ruido o aumentar espacio de almacenamiento como solución para mejo­ rar la productividad, P(N U S), se puede determinar a partir de la matriz de probabilidad al sumar las probabilidades marginales de Sf para reducción de ruido y Sí para aumentar espacio de almacena­ miento y luego restar la celda Sí Sí, siguiendo el modelo de la ley general de probabilidades.

P(N U S) = 0.70 (dela fila Sí)+ 0.67 (de la columna SO - 0.56 (de la celda Sí Sí) = 0.81

Otra forma de despejar la probabilidad de unión de la información mostrada en Ja matriz de pro­ babilidad es sumar todas las celdas en cualquiera de las filas o columnas Sí. Observe lo siguiente de la tabla 4.4.

P(N U S) = 0.56 (de la celda Sí Sí) + 0.14 (de Sí en reducción de ruido y No en aumentar espacio de almacenamiento) + 0.11 (de No en reducción de ruido y Sí en aumentar espacio de almacenamiento)

= 0.81

PROBLEMA DE DEMOSTRACIÓN

4.1

Los datos de la compañía cliente del Dilema de decisión dejan ver que 155 empleados trabaja­ ron uno de cuatro tipos de posiciones. Aquí se muestra de nuevo la matriz de valores sin pro­ cesar (también llamada cuadro de contingencia), con las cuentas de frecuencia para cada categoría y para subtotales y totales que contengan un desglose de estos empleados por tipo de posición y por género. Si un empleado de la compañía se selecciona al azar, ¿cuál es la proba­ bilidad de que el empleado sea mujer o un trabajador profesional?

Page 136: libro.pdf

l l 0 ESTADISTICA zx LO) SEGOC"JO!>

PROBLEMA DE DEMOSTRACIÓN

4.2

DATOS OE RECURSOS HUMANOS OE COMPAMA

Hombr• Mu1er

Gerencial 11

1lpo Profesional " • po9k10n Tknlco 69

Of'ICini•ta 31

8 3

31 13

52 17

9 22

100 55 155

Sol11<ión

Denotemos por F el evento de mujer y P denota el evento de trabajador profesional. La pregunta es

PIF U PI• 7

Por la ley general de la adición,

P(F u P) • P(FI - P(P) - PIF n PI

De los 155 empleados, 55 son muieres. Por tanto, PIF) 55/155 0.355. los 155 empleados incluyen 44 profesionales. Por tanto, P(PI • 441155 • 0.284. Como 13 empleados son mujeres y profesionales, PIF n PI - 13'155 • 0.084. La probabilidad de unión se resuelve como

PIF u PI • .355 + .284 - .084 ... 555

Para resolver esta probabilidad con el uso de una matriz. se puede ya sea usar la matriz de valores sin procesar que vimos previamente, o bien, convertir la matriz de valores sin procesar a una matriz de probabilidad al dividir todos y cada uno de los valores de la matriz entre el valor de N. 155. La matriz de valor sin procesar se utiliza de un modo semejante al de la matriz de pro­ babilidad. Para calcular la probabilidad de unión de seleccionar una persona que es ya sea mujer o trabajador profesional de la matriz de valor sin procesar, se suma el número de personas de la columna Mujer !551 al número de personas del renglón Profesional 1441, luego se resta el núrne­ ro de personas en la celda de intersección de Mujer y Profesional 1131. Este paso da el valor de 55 + 44 - 13., 86. Dividir este valor (86) entre el valor de N(155) produce la probabilidad de unión.

P(F U PI • 86'155 • .555

Una segunda forma de obtener la respuesta a partir de la matriz de valor sin procesar es sumar 1odas las celdas una vez que estén ya sea en la columna Mujer o en la fila Profesional

3 + 13 + 17 + 22 + 31 - 86

y luego dividir entre el número total de empleados. N • 155 se obtiene:

P(F U PI• 861155 • .555

A con1ínuación se muestran la matriz de valores sin procesar y la correspondiente matriz de pro­ babilidad. para los resultados de un estudio nacional de 200 ejecutivos a quienes se pidió idan· tificar la ubicación geográfica de sus compaflías y el tipo de industria de las mismas. A los ejecutivos sólo se les permitió seleccionar una ubicación y un tipo de industria.

Page 137: libro.pdf

E:cnodeXo Y ~no ambos

CAPM"ULO 4 PROBABILIDAD 111

MATRIZ DE VALMES SIN PROCESAR

Reglón Noreste Sureste central Oeste

D E F G

Finanzas A 24 10 8 14

30 6 22 12

28 18 12 16

56

70 71po de Manufacturas 8 lnduUrla

Comunicacion11• C

82 200 34

MATRIZ DE l'ROBABIUDAD

Medio oeste-Región

Noreste Sureste central Oeste D E F G

Fin11n1111 A .12 .05 .04 .07

.15 .03 .11 .06

.14 .09 .06 .08

.28

.35

.37

1.00

71po de M11nuf11C1uras B lndwtrlll

Comunicacíonu C

.41 .17 .21 .21

Suponga que de estos datos se selecciona al azar uno de los que respondieron al estudio. a. ¿Cuál es la probabilidad de que quien respondió sea del Medio Oeste-Región central (Fl7 b. ¿Cuál es la probabilidad de que quien respondió sea de la industrie de comunicaciones

(CI o del noreste IDl7 c. ¿Cuál es la probabilidad de que quien respondió sea del sureste (El o de la industria de

finanzas (A17

Solucl6n

a. P(Regiónl P(F) .21 b. PIC U DI PICI • PIDI - PIC n DI• .37 + .41 - .14 .64 c. P(E U Al• PIE) • P(AI - PIE n Al• .17 + .28 - .05 .40

Al calcular la unión con el uso de la ley general de adición, la probabilidad de intersección se resta porque ya está incluida en ambas probabilidades marginales .. Esta probabilidad ajustada deja una pro­ babilidad de unión que apropiadamente incluye "atores marginales>· el valor de intersección. Si Ja proba· bilidad de interseccién -e rt>ta una segunda vez, la Intersección se elimina, dejando la probabilidad de X o Y pero no ambas.

P(X o Y) pttO no ambu • P\Xl + PO') - P(X n Y) - P!X n Y) • P(X u Y) - Pi.\' n Y\

En la figura 4.8 es el diagrama de Venn para esta probab~

La probabilidad de la unión de dos eventcs Xv r r~!'C:S(!lU b pro­ babilidad de que el resultado sea o X, o }; o amM. X r Y. La mü6n incluye todo excepto la posibilidad de que no sea ninguna (X o }'). Otra forma de expresarla es ni .\' ni r. lo cual puede csw repre-

Complemento de una unión

Page 138: libro.pdf

flGUIA 4.9

112 ESTADISTICA EN LOS NEGOCIO:.

El componente de una unión: la región nVni

sentado simbólicamente como P(no X n no Y). Como es el único caso posible que no sea la unión de X o Y, o el complemento de una unión. Dicho más formalmente,

P(ni X ni Y) = P(no X n no Y) • 1 - P(X u Y)

Examine el diagrama de Venn de la figura 4.9. Nótese que el complemento de la unión de X, Y es d área sombreada fuera de los círeulos, Esta área representa la región ni X ni Y.

En el estudio que hicimos sobre la creciente productividad de trabajadora al cambiar el disetio de oficinas, la probabilidad de que

un 1.rabajador seleccionado al aur respondiera con reduccién de ruido o mayor espacio de almacena­ miento fue determinada como:

!l:iXru Y

P(N U S) • P(N) + P(S) - P(N n S) • 70 + .67 - .56 • .81

La probabilidad de que un trabajador respondiera con ni reducción de ruido ni mayor espacio de almaccn.tmiento se calcula como el complemento de esta unión.

P(ni N ni S) • P(no N n no S) 1 - P(N U S) • 1 - .81 • .19

Entonces, 19% de los trabajadores no seleccionaron reducción de ruido ni mayor espacio de alma· cenamlemo como soluciono para aumentar la productividad. En la tabla 4.J, esta probabilidad ni/ni se encuentra en la celda No No de la matriz, 0.19.

ley especial de la adición idos e-ente» son mutuamente excluyentes, la probabilidad de la unión de los dos eventos es la pro·

babilidad dd primer evento m.u la probabilidad del segundo evento. Como los eventos mutuamente aduyente< no se intersecan, no tiene que restarse nada.

LEY ESPEClAL DEUADIOOS Si X, Y son mutuamente excluyentes, P(X U Y) • P(X) + P( Y)

La ky especial de la adíción es un caso particular de la ley general de la adición. En cierto sentido. b ky gmen1 se aiu.ta a todos lo• C&SC» pero. cuando los eventos son mutuamente excluyentes se inser­ ta WI m-o en la fórmula de la ley general para la intersección y rei.ulta la fórmula de la ley especial,

En d estudio acerca de mejorar la productividad al cambiar el diseno de oficinas, a quienes res­ pondieron se les permitió escoger más de un posible cambio de diseño de oficinas. Por tanto. es de lo r!W probabk que ninguna de las opciones de cambio fueran mutuamente excluyentes, y la ley especial de la adición no apliaria a ese ejemplo.

En otro estudio. sín embargo. a quienes respondieren se les permitió seleccionar sólo una opción para su mpucsa. lo cual hizo mutuamente exduyentes las posibles opciones. En este estudio. dirigido por \mkelovich Pvtnen para W"illíam M. ~1~r. lnc., a le» trabajadores se les prq¡untó qué entorpece su productividad y se les díeron sólo las siguientes selecciones de las que podla.n escoger sólo una respuesta.

• Falta de dittcción • Falta de apoyo • Dem~iado trabajo • Proceso ineficiente • No hay suficiente equipo o abasto • Bajo salario o pocas probabilidades de avanzar

La falta de dittcción la citaron más trabajadores (20%), seguida por falta de &po)'O ( 18%), dema­ siado 1.rabajo ( 1899), proceso ineficiente (8%), no hay suficiente equipo o abasto (799), bajo salario o pocas probabilidades de avance (#%) y otros factom agregad<» por quienes respondieron. Si un tra­ bajador que respondió a esta encuesta es seleccionado (o si el estudio en realidad refleja los puntos de vista del público trabajador y se selecciona un trabajador en general) y a ese trabajador se le pregunta cuál de las selecciones dadas entorpece su productividad, ¿cuál es la probabilidad de que el trabajador mponda que es demasiado trabajo o proceso ineficiente?

Page 139: libro.pdf

PIOBLEMA DE BEMOSTRACIÓN

4.3

1 PROBLEMA DE DEMOSTRACIÓN

4.4

Denotemos por M d evento "demasiado trabajo" y por 1 el evento "proceso intficiente': La preguna a:

P(M U 1) •?

Como el 18% de quienes contestaron dijeren •demuiado trabajo':

P(M} • .18

Como el 8% de quienes contestaron dijeron "proceso ineficiente",

P(I) • .08

Dado que no es po ible seleccionar m.b de una re puesta,

P(M n 1) ... 0000

La implementación de la ley especial de adición da

P(M U 1) • P(M) + P(I) ... 18 + .08 • .26

Si se elige a un trabajador al azar en la compallla descrita en el problema de demostración ' 1, ¿cu61 es la probabilidad de que el trabajador sea tknico u oficinista? ¿Cu61 es la probabilidad de que el trabajador sea profesional u oficinista?

Soludón

Examine la matriz de valor sin procesar de los datos de recursos humanos de la compallla que aparecen en el problema de demostración '· 1. En numerosas matrices de probabilidad y de valor sin procesar como 6sta, las filas no se traslapan ni son mutuamente excluyentes, como son las columnas. En esta matriz, un trabajador puede ser clasificado como que sólo est6 en un tipo de posición y como que es hombre o mujer, pero no ambos. Asl, las categorías de tipo de posición son mutuamente excluyentes, como son las categorías de género y la ley especial de la adición se puede aplicar a los datos de recursos humanos para determinar las probabilidades de unión.

Denotemos por Ta un t6cnico, O un oficinista y P un profesional. La probabilidad de que un trabajador sea t6cnico u oficinista es

P(T u Ol • Pm + P(Ol = ~ + .1.!.. • 100 • 645 155 155 155 . La probabilidad de que un trabajador sea profesional u oficinista es:

P(P U O) = P(Pl + P(Ol • ~ + .1.!.. '"' ~ • 484 155 155 155 .

Utilice los datos de les matrices del problema de demostración •.2. ¿Cu61 es la probabilidad de que uno de quienes contestaron, escogido al azar. sea del Sureste o del Oeste?

PIE U Gl • 7

Soludón

Debido a que la ubicación geogr6fica es mutuamente excluyente (la ubicación del trab91() • Yll sea en el Sureste o en el Oeste pero no en ambos),

PIE U Gl PIEi ..,. PIGI .17 + .21 .38

4.2 PROBLEMAS

4.8 Dado P(A) • .10, P(B) • .12, P(C} • .21, P(A n C) • .05 y P(B n C} • .03, resuelva lo siguiente.

Page 140: libro.pdf

114 FSTADISTICA ES LOS :"EGOCIOS

a. P(AUC) •_ b • .Pl'B IC) .. _ c. S1 A y B son mutuamente excluyentes. P(A U 8) =-

4.9 V« I<» valores de la matriz para resolver lu ecuaciones dadas.

D E F

B

e

s 8 12

10 6 4

g 2 s

a. P(AU D) •_

b. P(EUB) •_ c. PIDU E)•_ d. ptC UF)•_

4.10 Use lo> valore> de la matriz para resolver las ecuaciones dadas.

E F

B

e D

.10 .O)

.04 ,12

.27 .06

.)1 .07

a. P(AUF) •_ b. P(EUB)=_ c. PtBUC) • _ d. P(EU F) • _

4.11 Suponga que 47% de todos los estadounidenses han volado en avión por lo menos una vez y que 2 % de todo. los estadounidense han viajado en un tren por lo meno> una \U. ¿Cuál es la pro­ babilidad de que un estadounidense seleccionado al aur haya viajado en tren o volado en avión? ¡Plttde resolverse este problema? ¿Bajo qué condiciones puede resolverse? Si el problema no se puede resolver, ¿qué información es necesaria para que pueda resolverse!

4.12 ~ b U.S. Bureau of labor Statistic•, 75% de mujeres de 25 a 49 al'I~ de edad participan en la fueru de trabajo. Suponga que 78<\0 de las mujeres de ese grupo de edades o casada. Suponga tambitn que 61% de todas las mujeres de 25 a 49 ailos son casadas y participan en la fueru de trabajo. a. ¿Cuil es la probabilidad de que una mujer de ese grupo de edades seleccionada al aur set

casada o participe en la fuerza de trabajo? b, ¿úW e. la probabilidad de que una mujer de ese grupo de edades seleccionada al azar sea

casada o participe en la fueru de trabajo pero no en ambas? c. ¿Cuál es la probabilidad de que una mujer de ese grupo de edades seleccionada al az.ar no sea

casada ni participe en la fueru de trabajo? 4.13 Según ~iel-cn .\tedia Research, aproximadamente 67% de hogaru en Estado> Unido• con televi­

sión tienen televisión por cable. Setenta y cuatro por ciento de todos los hogares de Estados Unido .. con televisión tienen dos o más televisores. Suponga que 55% de todos los hogares de Estado~ Unidos con televisión tienen televisién por cable y dos o más televisores, Un hogar de Estad~ Unido> se selecciona al azar. a. ¿Cuál es la probabilidad de que el hogar teng.1 televisión por cable o dos o m.U televisores? b, ¿Cuál es la probabilidad de que tenga televisión por cable o dos o mi¡ televisores pero no

ambos?

Page 141: libro.pdf

c. ¿Cu.il es la probabilidad de que no tenga televisión por cable ni do. o m.is tde-."ÜOres? d. ¿Por qué la ley especial de la adición no se aplica a este problema?

4.14 Un estudio realizado por la :-:orthwc.tern University Lindquist-Endicon Repon pidió a 3~ cornpañías informaran sobre los procedimiento. que usan p.ira contratar personal, Sólo S4% de las que contestaron revisan la copia de la universidad del solicuante como parte del procese de con­ tratación, y sólo 44% considera referencias de una facultad. Suponga que e.to• porcentajes son verdaderos para la población de compañías en Estado. Unidos y que 35% de t~ ~ comp.u'lla. usan la copia de la universidad del solicitante y su• referencias de facultad. L ¿Cuál es la probabilidad de que una compatlla seleccionada al azar utilice ya sea referencias de

facultad o copia de la universidad como parte del proceso de contratación? b. ¿Cuál es la probabilidad de que una compallia seleccionada aJ azar utilice ya ~ referencias de

facultad o copia de la universidad, pero no ambas, como parte del pl'OCC)() de contratación? c. ¿Cu.il es la probabilidad de que una compall.la seleccionada aJ azar no utilice referencias de

facultad ni copia de la universidad como parte del proceso de contratación? d. Construya una matriz de probabilidad para este problema e indique las ubicadones de sus

respuestas para las panes (a), (b) y (e) en la matriz.

li LEYES DE LA MULTIPLICACIÓN ley general de la muhiplicación Como se expresó en la -ción 4.4, la probabilidad de la intersección de do. eventos (X n Y) recibe el nombre de probabilidad conjunta. La ley general de la multiplicación se usa para encontrar la proba­ bilidad conjunta:

u:r GE.'-'EVJ. MU. Mt.'U1PUCACJ0N

P(X n Y)"' Pf.X) · Pf.YIX> = Pf.Y) · Pf.XJY)

, AGUR,A 4.10 Probabilidad con1unta da qua una mujer est' en 141 fuerza laboral y tea trabajadora de tiempo parcial

La notación X n Y significa que X y\' dtbni ocurrir. La ley general de la multiplicación da la pro­ babilidad de que tanto ti evento X como ti C\·en10 Y ocurran al mismo tiempo.

Según la U.S. Bureau of Labor Stati<tic~. 46% de la fuerza de trabajo en Estados t.:nidos son muie­ res. Además, 25% de las muieres de la fuerza laboral trabajan tiempo parcial. ¿Cu.1.1 es la probabilidad de que un miembro seleccionado al azar de la fuerza laboral en 81ado. Unido. sea mujer y trabaje tiempo parcial! Esta pregunta es de probabilidad conjunta, y la ley general de la multiplicación <e puede aplicar para responderla.

Denotemos por W el evemo de que el miembro de la fuerza laboral su mujer. Denotemos por T el evento de que el miembro es trabajador tiempo parcial. La pregunta C):

ptWnT)•?

Según la ley general de muluplicación, este problema se puede resober con:

P(W n T) - Pl W) • PCTIW)

Como 46% de la fuerza laboral son muieres. P(W) • P(TJ\\') es una probabilidad condicional que se puede c:ipRSU como la probabilidad de que un trabaiador sea de tJta:?) pm:W dado que el trabajador C• mujer, E.ta condkión es b qur se dio ea el enunciado de que 25% dt las 11111pts dt la fuar;z ~ tiempo parcial. Por tanto. P(TJW) = .25. De aquí K dcduct que:

P(Wl"'IT)•.115

P(W n T) • P(W) • P(TJW) • 1.46)(.25) • .115

Se puede decir que 11.5% de la fueru labo:al en Estados Unxlos son mujeres r trabajan tiempo parcúl. El ~ de \'mn de la figura 4.10 muestra estas relaciones y b probabfficlad conjunta.

Page 142: libro.pdf

116 ESTADISTICA EN LOS l'-'EGOCIOS

TABLA 4.5

Matriz de probabilidad de datos de recursos humanos de campal'Ha

PROBLEMA DE DEMOSTRACIÓN

4.5

PROBLEMA DE DEMOSTRACIÓN

4.6

- ..., ..... - .. ,ua .... f; . .MI

.071

.214

M5

.21111

.6&5 .. 1.000

~tmninar probabilidades conjuntas a partir de valores sin procesar o de matrices de probabili­ dad es fácil porque cada celda de estas matrices es una probabilidad conjunta.De hecho, algunos exper­ tos en estadistica llaman cuadro dt probabilidad conjunta a una matriz de probabilidad.

Por ejemplo, supongamos que la matriz de valor sin procesar de datos de la compataJa diente, en el problema de demostración 4.1 y el Dilema de decisión, se conviene a matriz de probabilidad al divi­ dir entre el número total de empleados (N = 155), con lo cual resulta la ubla 4.5. Cada valor de celdas de la ubla 4.5 es una interseccién, y la ubla contiene todas las posibles interseccicnes (probabilidades conjuntas) para lo) eventos de género y tipo de posición. Por ejemplo, la probabilidad de que un tra­ bajador seleccionado al azar sea hombre y trabajador técnico, P(M n T}, es .335. La probabilidad de que un trabalador seleccionado al aur sea mujer y trabajador profesional, f'\F n P), es .084. Una''ª construida una matriz de probabilidad para un problema, por lo general la forma m.h fácil para des­ pejar la probabilidad conjunta es encontrar la celda apropiada de la mauit y seleccionar la respuesu, ~o ob)unte, debido a lo que se da en un problema, a veces el uso de la fórmula es más fácil que cons­ truir la matriz,

Una compal'lía tiene 140 empleados. de los cuales 30 son supervisores. Ochenta de los emplea­ dos son casados, y 20% de los empleados casados son supervisores. Si se selecciona al azar un em­ pleado de la compal'lla, ¿cu" es la probabilidad de que el empleado sea casado y sea supervisor1

Soluci6n

Denotemos por M a un casado y por S a un supervisor. La pregunta es:

P(M n S) 1

Primero calculamos la probabilidad marginal.

P(M) - ~ • 5714 140 •

Luego entonces, nótese que 20% de los empleados casados son supervisores, es la probabilidad condicional, P(S M) = .20. Finalmente, al aplicar la ley general de la multiplicación tendremos

P(M n S) • P(M) · P(SIMI • (.5714)(.201 = .1143

Por tanto, 11.43% de los 140 empleados son casados y son supervisores.

De los datos obtenidos de las entrevistas de 200 ejecutivos en el problema de demostración '2. encontramos:

a. P(B ()El b. P(G ()Al c. P(B n C)

Page 143: libro.pdf

C\PrTVl.O 4 PROBABIUDA.D 117

MA11bZ DE VALORES SIN PROCESAR

Región Noreste Surest« central

D E F Oeste

G

Finanzas A 24 10 8 14

30 6 22 12

28 18 12 16

56

70

Comunicacion .. e 74

82 34 42 42 200

MA11bZ DE l"ftOeAM.JDAD

Reglón Noreste Sureste central

D E F Oeste

G

FinanznA .12 .05 .04 .07

.15 .03 .11 .06

.14 .09 .06 .08

.41 17 .21

.28

.35

.37

1.00

1'1o tM Manufacturas 8 lndwrria

Comunicaciona e

.21

•· De la celda de la matriz de probabilidad, PIB n E) • 61200 • .03. Para resolver por le fórmu­ la PIB n El • PIBI PIE!BI, primero hallamos PIB):

PIBI • ~ • 35 200

La probabilidad PIEIBI de que E ocurra, dado que B ha ocurrido, se puede determinar con la matriz de probabilidad como PIEIB)• .031.35. Por tanto,

PB n El• PB • PEIB 35 (·º3) .03 35

Aun cuando la fórmula funciona, encontrar la probabilidad conjunta en la celda de 1• matriz de probabilidad es m's r'pido que usar la fórmula. Una fórmula alternativa es PIB n El• PIEi • PIB!EI. pero PIEi • 0.17. Entonces PIB El sig· nifica la probabilidad de B si se de E. Hay 0.17E en la matriz de probabilidad v 0.038 en estas E. Por tanto,

PBIEI • :~~ V PB n E •PE PBIE .17c~)- .03

b. Pare obtener PIG n Al, encuentre la celda donde se cruzan G v A en la metnz de probe­ b1lided, 0.07. o use una de las siguientes fórmulas:

PG n A • PG • PA¡G • .21(~~)- .07

o bien,

PG n A • PA · PGIA • .28 ('~~)- .07

Page 144: libro.pdf

TABLA 4.6

Table de contingencia de datos de eventos independientes

D E :~: Cm IS )4 51 85

c. Le probabilidad P(B n CI significa que uno de quienes contestaron tendría que trebejar en la industria manufacturera y en la industria de comunicaciones El estu­ dio utilizado para captar datos de los 200 ejecutivos. no obstante, requirió que cada persona que haya contestado especificara sólo un tipo de industria para su compallia. La matriz no muestra lnteraección para estos dos eventos. Por tanto, B y C son mutuamente excluyentes. Ninguno de quienes contestaron esté en manu­ factura y en comunicaciones. En consecuencia,

PIB n CI •.O

ley especial de la multiplicación Si lo.\ eventos X y Y 50n independientes, e> posible usar una ley especial de multiplicación para encontrar la intcrs«ción de X y r. futa ley especial utiliza d hecho de que cuando do. eventos, X. y son indepen­ dientes, P(X!Y) - P(.>ol y P( YIX) - PI. Y). Por tanto, la ley general de la multiplicación P(X n Y) - P(X) • P(.\1}') \C luce P(X n Y) • P(.>ol • P( Y) cuando X y Y son independiente>.

LEY ESPEClAL DEU. MUlllPUCACION

Si X. Y son independientes PIX n Y) • PtX) · P( Y)

PROBLEMA DE DEMOSTRACIÓN

4.7

Un estudio realizado por Bruskin-Goldring Research para SEIKO encontró que 28'141 de adulto. estadounidense pimsa que el cajero automático ha tenido el impacto ITW imponante en la vida diaria. Otro estudio de ~id M1cluelson & Associates para Dale Camegie & Associate. euminó lo> puntos de vista de Cll'.f'kad0$. sobre el espíritu de equipo en el lugar de trabajo. y descubrió que 72'141 de todos los empicados pimsa que trabajar como parte de un equipo reduce el estrés, Los puntos de vina de per­ sonas sobre CIJCTOS automáticos, ¿"<>n independientes de su> puntos de vista cobre el espíritu de equl­ po en d h:.-pr de trab3jo? Si son independientes, entonce> la probabilidad de que una persona ~a sdeccionada al aur, que piense que el cajero automático ha tenido un impacto importante en la vida diaria y que uabaµr como parte de un equipo reduce el estrés, se encuentra como sigue. Denotemos por A un ajm> automático y por S que el trabajo en equipo reduce el estré,.

P(A¡ - .28 P(A) • .28 P(A n S) = P(A) • PtS) = (.28l(.i2) = .2016

Por Wlto. ~.16'9 de la población piensa que el cajero autom.ttico ha tenido un impacto importante en la •ida diaria y que trabaiar como parte de un equipo reduce d c~trb.

Una empresa manufacturera produce cuadernos de papel, de los cuales 3% estén mal encua­ dernadas. Al azar, un inspector escoge dos y una a la vez. Debido al gran número de cuadernos que SI producen durante la inspección, el muestreo que SI realiza es. en esencia, con restitución. ¿Cuál es la probabilidad de que dos cuadernos seleccionados estén mal encuadernadas?

Solución

Denotemos por 1 un encuadernado incorrecto. El problema es determinar

Pll1n121•1 Le probabilidad de 1 -O .03, o 3% es que son incorrectamente encuadernadas. Como el muestreo se realiza con reemplazo. los dos eventos son independientes. Por tanto:

PU1n121 • PU11 • Pll2I • (.031(.031 • .0009 Casi todas las matrices de probabilidad contienen variables que no son independientes. Sl

una matriz de probabilidad contiene eventos independientes. la ley especial de la multiplicación

Page 145: libro.pdf

CAPITULO 4 PROBABILIDAD 119

se puede aplicar. Si no, la ley especial no se puede usar. En la sección 4.7 exploramos una téc­ nica para determinar si son eventos independientes. La tabla 4.6 contiene datos de eventos inde­ pendientes.

Utilice los datos de la tabla 4.6 y la ley especial de la multiplicación para encontrar P(B n D).

Solución

P(B n D) = P(B) · P(D) = 5o · 34 = 2353 85 85 .

Este método funciona sólo para cuadros de contingencia y matrices de probabilidad en las que la variable de un lado de la matriz es independiente de la variable del otro lado de la matriz. Nótese que la respuesta obtenida con el uso de la fórmula es la misma que la respuesta obteni­ da con el uso de la información de la celda de la tabla 4.6.

P B n D) = ~~ = .2353

U PROBLEMAS

4.15 Use los valores del cuadro de contingencia para resolver las ecuaciones dadas.

C D E F

A 11 16 8

B 7

a. P(An E)=_ b. P(DnB) =_ c. P(Dn E)=- d. P(AnB) =-

4.16 Use los valores de la matriz de probabilidad para resolver las ecuaciones dadas.

D E F A

B

e

.12 .13 .08

.18 .09 .04

.06 .24 .06

a. P(En B) =_ b. P(CnF)=_ c. P(En D) =-

4.17 a. Un lote de SO piezas contiene seis defectos. Si al azar se sacan dos piezas, una a l.1 vez y sin reemplazo, ¿cuál es la probabilidad de que ambas piezas sean defectuosas?

b. Si se repite este experimento, con sustitución, ¡cuál es la probabilidad de que ambas piezas sean defectuosas?

4.18 Según el grupo sin fines de lucro llamado Zero Population Growth (Crecimiento Cero de Población), 78% de la población de Estados Unidos vive ahora en zonas urbanas. Científicos de la Princeton University y la University of Wisconsin reportan que alrededor de 15% de todos los adultos en Estados Unidos cuidan de familiares enfermos. Suponga que 11 % de adultos que viven en zonas urbanas cuidan de familiares enfermos.

Page 146: libro.pdf

120 ESTADISTICA E..'I LO~ SEGOCIOS

a. Utilice la ley general de la muhiplicad6n pua determinar la probabilidad de seleccionar al azar un adulto de la población de E..llldos Unidos que viva en zona urbana y cuide de un fami­ liar enfermo.

b. ¿Cuál es la probabilidad de seleccionar al aur un adulto de la población de Estado> Unidos que viva en zona urbana y no cuide de un familiM enfermo?

c. Comtru)OJ una matriz de probabilidad y muestre en dónde se encuentra la rC'SpUC'Sta a este problema en la matriz.

d. De la nutriz de probabilidad, determine la probabilidad de que un adulto que vive en zona no urbana cuide de un familiar enfermo.

4.19 Un estudio de Peter D. Hart Research Asseciates para el ~asdaq Stock ~larket revelé que 43% de todos los adultos en ütadO> Unidos son accioni-w. AdenW. el estudio determinó que 75% de todos lo. acaorusus adultos de Eittados Unidos tienen algún grado de educación uni,·enitaria. Suponga que 3i% de: todo> lo> aduho> de ütado. Unido> tienen alglin grado de educación uní· versitaria, Se selecciona un ciudadano al azar. a. ¿Cuál C'S la probabilidad de que el adulto no tcn¡:a acdono? b. ¿Cuál es la probabilidad de que ti adulto posea accione y tenga algún grado de educación

UIU\°miwU? c. ¿Cuál n la probabilidad de que el aduho posea acciono o tenga algun grado de educación

unÍ\wsitaria? d. ¿Cuál es la probabilidad de que el adulto no tenga educación univcnitaria ni posea acciones! c. ¿Cuál o la probabilidad de que el adulto no posea acciones o tenga educación univer-ltaria! f. ¿Cuál es la probabilidad de que el adulto tenga alguna educación univer>itaria y no posea

acnoncs? 4.20 Según la Consumer Electronics Manufacturen As.6ociation, 10% de todas las familias en E&tados

Unidos tienen un fax y 52% tienen computadora personal. Suponga que 91% de toda¡ las fami­ lías en Estados Unido> que tienen fax también tienen computadora personal. Se selecciona al aur una familia de Estado> Unido>. a. ,Cuál es la probabilidad de que la casa tenga fu y una computadora personal! b. ¿Cuál es la probabilidad de que la casa tenga fu o una computadora personal! c. ¿Cuál es la probabilidad de que la ca>a tenga fax y no tenga una computadora personal? d. ¿Cuál es la probabilidad de que la ca>a no tenga fax ni una computadora personal! e. ¿Cuál es la probabilidad de que la casa no tenga fax pero si tenga computadora personal!

4.21 Un estudio de Becker A:1.<0eiatcs, consultor de viajes de San Diego, encontró que 30% del públi­ co \-iajm> dijo que sus selecciones de vuelo están influenciado> por percepciones de seguridad de la aerolínea, Treinta y nueve por ciento del publico \·iaiero desea saber la edad dd avión. Suponga que s;c¡¡, del público viajero que dijo que SU) selecciones de vuelo Nán influenciados por per­ cepciones de seguridad desea saber la edad del avión, a. ¿Cuál es la probabilidad de seleccicnar al azar una persona del público viajero y encontrar que

ti o ella digan que: la selección del nido ~t.i influenciada por percepciones de la seguridad de la aerolínea y no ddca conocer la edad del ª'ión?

b. (Cuál es la probabilidad de seleccionar al azar una persona del público viajero y encontrar que ti o ella digan que la selección del vuelo no ot.i influenciada por percepciones de la seguri­ dad de la acrollnca ni desea conocer la edad del avión?

c. ¿Cuál o la probabilidad de seleccionar al azar una persona del público viajero rencontrar que .!I o ella digan que la selección del vuelo no ot.i influenciada por percepciones de la seguridad de la aerolinca y desea conocer la edad del ª'ión?

4.22 El U.S. Encrgy Dtpartmmt expresa que 60% de todas !.u familW en Estados Unidos tienen venti­ ladores instalados en el techo. Además, 29% tienen parrilla para »31 al aire libre. Suponga que 1 }'MI de estas familia. tienen ventiladores de techo r parrilla para asar. Se selecciona al azar una familia. a. ¿Cuál o la probabilidad de que la familia tenga ventilador de techo o una parrilla para llS3rl b. ¿Cuál es la probabilidad de que la familia no tenga \~ntilador de techo ni una parrilla para asar?

Page 147: libro.pdf

CAPITULO 4 PROBABILIDAD 121

c. ¡Cuál es la probabilidad de que la familia no tenga ventilador de techo y tenga parrilla para asar?

d. ¡Cuál es la probabilidad de que la familia tenga ventilador de techo y no tenga parrilla para asar?

- PROBABILIDAD CONDICIONAL Las probabilidades condicionales se calculan con base en el conocimiento que un experto en estadísti­ ca tenga sobre uno de los dos eventos que estudie. Si X, Y son dos eventos, la probabilidad condicional de que X ocurra dado que Y se conoce o ha ocurrido se expresa como P(XIY) y se da en la ley de pro­ babilidad condicional:

u:"" DE ~ABlllDAD

CD !ffi!CIONAL

P(XIY)= P(XnY) = P(X)·P(YiX) P(Y) P(Y)

e::;,' 'tHI • ~bilidad -::::-<l1Cional de '1:'2'·'01 espacio de mt"'acenamiento :a:a una ~sJCCión de ruido

La probabilidad condicional de (XJ Y) es la probabilidad de que X ocurrirá dada Y. La fórmula para probabilidad condicional se deduce al dividir entre P( Y) ambos lados de la ley general de la multipli­ cación.

En el estudio de Yankelovich Partners para determinar qué cambios en el diseño de oficinas mejo­ rarían la productividad, 70% de quienes respondieron pensaron que la reducción de ruido mejoraría la productividad y 67% dijeron que aumentar el espacio de almacenamiento mejoraría la productivi­ dad. Además, suponga que 56% de quienes respondieron pensaron que la reducción de ruido y el aumento en espacio de almacenamiento mejorarían la productividad. Se seleccionó al azar un trabaja­ dor y se le pidió sobre cambios en diseño de oficina. Este trabajador piensa que la reducción de ruido mejorarla la productividad. ¡Cuál es la probabilidad de que este trabajador piense que aumentar el espacio de almacenamiento mejoraría la productividad? Esto es, ¡cuál es la probabilidad de que una persona seleccionada al azar piense que el espacio de almacenamiento mejorada la productividad dado que él o ella piensan que Ja reducción de ruido mejora la productividad? En símbolos, la pregunta es

P(SIN) =?

Nótese que parte de información dada aparece a la derecha de la línea vertical de la probabilidad condicional. La solución utilizando la fórmula es:

P(SIN)= P(SnN) P(N)

P(N)=.70 y P(SnN)=.56

P(SIN)= P(SnN) = .56 = .80 P(N) .70

Ochenta por ciento de trabajadores que piensan que la reducción de ruido mejoraria la productividad también creen que si se aumenta el espacio de almacenamiento mejoraría la produc­ tividad.

Nótese, en la figura 4.1 l, que el área para N del diagrama de Venn está sombreado por completo el área del trabajador que pien­ sa que la reducción de ruido mejoraría la producnvidad. También nótese que la intersección de N y S está más sombreada, porque esta parte de reducción de ruido incluye más espacio de almacena­ miento y es la única que aumenta en relación con la reducción

Page 148: libro.pdf

122 ESTADISTICA EN WS NEGOCIOS

de ruido y como las personas saben que favorece la reducción de ruido, es la única área de interés que incrementa el espacio de almacenamiento.

Examine la matriz de probabilidad de la tabla 4. 7 para el problema del diseño de oficina. Ninguna de las probabilidades dadas en la matriz son probabilidades condicionales. Para reiterar lo que ya se mencionó, una matriz de probabilidad contiene sólo dos tipos de probabilidad, marginal y conjunta. Los valores de celda son probabilidades conjuntas y los subtotales de los márgenes son probabilidades marginales. ¿Cómo se determinan las probabilidades condicionales desde una matriz de probabilidad? La ley de probabilidades condicionales muestra que una probabilidad condicional se calcula al dividir la probabilidad conjunta entre la probabilidad marginal Entonces, la matriz de probabilidad tiene la información necesaria para resolver una probabilidad condicional.

¿Cuál es la probabilidad para que un trabajador seleccionado al azar piense que la reducción de ruido mejoraría la productividad dado que el trabajador cree que aumentar espacio de almacenamien­ to mejoraría la productividad? Esto es:

P(noNjS) =?

La ley de probabilidad condicional expresa que:

P(no NIS) P(noNnS)

P(S)

Nótese que como S está dada, estamos interesados sólo en la columna sombreada en la tabla 4.7, que es la columna marcada con Sí para espacio aumentado de almacenamiento. La probabilidad marginal, P(S) es el total de esta columna y se encuentra en el margen al fondo de la tabla como 0.67. P(no N n S) se encuentra como la intersección de No para ruido y Si para almacenamiento. Este valor es 0.11. Por tanto, P(no N n S) es O.! l. En consecuencia:

P(no NIS) P(no NnS)

P(S) ~=.164 .67

La segunda versión de la fórmula de la ley de probabilidad condicional es:

P(XjY) = _P(_X_)· P_(Y~IX_) P(Y)

Esta versión es más compleja que la primera, P(X n Y)IP( Y). Sin embargo, a veces debe usarse la segunda versión debido a la información que se proporciona en el problema, por ejemplo, cuando se resuelva P(XjY) pero se da P(YjX). La segunda versión de la fórmula se obtiene de la primera versión al sustituir la fórmula por P(X n Y) = P(X) · P(YjX) en la primera versión.

Corno ejemplo, en la sección 4.6, se presentaron los datos que relacionan a las mujeres de la fuer­ za laboral de Estados Unidos. En esta información se incluye el dato de que 46% de la fuerza laboral de Estados Unidos son de mujeres y que 25% trabajan tiempo parcial. Además, se sabe que 17.4% traba­ jan tiempo parciaL ¿Cuál es la probabilidad de que un trabajador de Estados Unidos seleccionado al

TABLA 4.7 Aumenfor apodo de almaunmnimto Sf No

Sf~.70 IWuccl6n de ná4a No .30

.67 .33 1.00

Matriz de probabilidad para el problema de diseño de oficinas

Page 149: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

4.9

CAPfTUW 4 PROBAB!UDAD 123

azar sea mujer si se sabe que es trabajador de tiempo parcial? Denotemos por W el evento de seleccio­ nar una mujer y por T el evento de seleccionar un trabajador de tiempo parcial. En símbolos, la pre­ gunta es:

P(WIT) =?

La primera forma de la ley de probabilidades condicionales es:

P(WjT)= P(WnT) P(T)

Nótese que esta versión de la ley de probabilidades condicionales requiere el conocimiento de la probabilidad conjunta, P(W n T), que no se da aquí. Por tanto, intentamos la segunda versión de la ley de probabilidades condicionales que es:

P(WjT) =-P(_W_)·_P_(T~jW_) P(T)

Para esta versión de la fórmula, todo se da en el problema:

P(W) = .46 P(T) = .174 P(TjW) = .25

La probabilidad de que un trabajador sea mujer, dado que la persona trabaja de tiempo parcial, se puede calcular ahora:

P(WIT)= P(W)·P(TjW) P(T)

(.46)(.25) = .661 (.174)

Por tanto, 66. l % de trabajadores de tiempo parcial son mujeres. En general, es probable que esta segunda versión de la ley de probabilidades condicionales se use

cuando P(X n Y) se desconozca pero P( YjX) sea conocida.

Los datos de las entrevistas a ejecutivos dados en el problema de demostración 4.2 se repiten aquí. Utilice estos datos para encontrar:

a. P(BIFl b. P(GICl c. P((DIFl)

MATRIZ DE VALORES SIN PROCESAR

Ubicación geográfica

Región Noreste Sureste central

D E F Oeste

G

Finanzas A 24 10 8 14 J

30 6 22 12 1 28 18 12 16 74

Tipo de Industria

Manufacturas 8

56

70

Comunicaciones C

82 34 42 42 200

Page 150: libro.pdf

MATRIZ OE MOeABIUDAD

124 ESTAObTlCA E.-.: l.OS !'EGOCI05

EVE.,lOS l~OE.PEi,'DIENTES X,Y

Para determinar i X y r son eventos independientes, puede usarse la 'iguiente definición. P(..\1)'} .. P(X) y P(Yl.\1 • P(}1

PROBLEMA DE DEMOSTRACIÓN

4.10

Región Noreste Sureste central

D E F Oeste

G

.12 .05 ·º' .07

.15 .03 .11 .06

.1' .09 .06 .08

.28

.35

.37

1.00

~ tHi Manuf«:rura1 B /ndulfrl•

Comunaciofl# C

.17 .21 .21

Solución

• PIB[FI • PIB n fl • d!, • 52• PIFI .21 '

lJI determinación de probabilidades condicionales desde una matriz de probabilidad, con el uso de la formula, es un proceso relativamente fácil. En este caso, la probabilidad conjunta, PIB n FJ, aparece en una celda de la matriz 1.111; la probabilidad marginal, PIF), aparece en un margen (.211. Unir estas dos probabilidades por medio de la fórmula produce la respuesta, .111.21 • .52• Esta respuesta significa que 52.•% de los ejecutivos del Región Central (los valores fl están en manufactures (los valores B).

b. PIGIC) • PIG n CI • .08 • .216 PICI .37

Este resultado significa que 21.6% de los ejecutivos de la industria de comunicaciones que res­ pondieron, ICI son del Oeste (G).

c. PIDIF) • PID n F) • .00 • 00 PIDI .21 '

Como O y F son mutuamente excluyentes. PID n F) es cero y así es PIDJFI. La razón fundame"" tal que esta tras PIOIF) • O es que. si se da F (quien se sabe contestó que está ubicado en el Región Central), quien contestó no podría estar ubicado en O (el Noreste).

Eventos independientes

En cada ecuación, no importa que X o Y se dé porque X y Y son indtpendicnta. Cuando X y Y independientes, la probabilidad condicional se resuelve como una probabilidad marginal.

A \'CCO. es importante probar con el cuadro de contingencia de materiales sin procesar para deter­ minar ,¡ lo• eventos son independientes. Si (UQ!quitr combinación de do. eventos de lo. lados dífnm­ lQ de la matriz no pasa la prueba, P(..\1)'} • PI.X}; la matriz no contiene eventos independientes.

Pruebe con la matriz para las 200 respuestas de ejecutivos pare determinar sí el tipo de indus­ tria es independiente de la ubicación geográfica.

Page 151: libro.pdf

CAPITULO 4 PROIW!!LIDAD 125

•Hº·1H•10¡111.¡s111+Ii!.f'·11:1.t .... _ Las HMO: las probabilidades de regular y reformar El movimiento hacia las HMO (Health Management Organization) de proveedores de salud tradicionales ocu­ ció rápidamente en la década pasada. Aun cuando algunas ~nas están satisfechas con las HMO, otros piensan que estas organizaciones necesitan reformas. Un articulo publica­ do en The Wall Street fournal el 25 de junio de 1998 presenta numerosas estadísticas respecto a estadounidenses y su ser­ ñcio de salud. El articulo indica que 51 % de consumidores piensan que la aprobación de nuevas leyes sobre estas orga­ mzaciones son una buena idea, pero 32% de consumidores • ~nsan que es mala idea. Estas dos cantidades pueden verse como probabilidades marginales:

P(buena idea) = .51 y P(mala idea) = .32 El apoyo para la aprobación de este reglamento varía

segun la afiliación política de los partidos, edad y tipo de segu­ ro que se tenga. Por ejemplo, 57% de demócratas piensan que aprobar nuevos reglamentos sobre las HMO es una buena idea, pero sólo 43% de republicanos piensan lo mismo. Cincuenta y cinco por ciento de consumidores de !8 a 29 piensa que nuevos reglamentos son una buena idea, pero la cifra cae a 46% para consumidores de 65 años o más. Cuarenta y nueve por ciento de consumidores que tie­ nen Medicare/Medicaid apoyan Jos nuevos reglamentos, y 60% de consumidores que no tienen seguro apoyan los nuevos reglamentos. Estas cifras se pueden expresar como probabilidades condicionales.

P(buena ideafdemócrata) = .57 P(buena ideajrepublícano) = .43 P(buena ideaj18 a 29) = .55 P(buena ideal65 o más) = .46 P(buena ideajMedicare/Medicaid) = .49 P(buena ideajsin seguro) = .60

Además, el U.S. Census Bureau reporta que 12.6% de la población tiene por lo menos 65 años de edad y 16.1 % de Ja población de Estados Unidos no tiene seguro:

P(:2:65) = .126 y P(sin seguro) = .161

Algunas de estas probabilidades se pueden combinar para obtener probabilidades de intersección como son:

P(:2:65 n buena idea) = P(:2:65} . P(buena ideaf:2:65) = (0.126) (0.46) = 0.058

P(sin seguro n buena idea) =

P(sin seguro) · P (buena idea/sin seguro) = (0.161) (0.60) = 0.097

De acuerdo con estas cifras, 5.8% de consumidores tie­ nen por lo menos 65 años de edad y piensan que nuevos reglamentos para las organizaciones de administración de salud (HMO) son buena idea, mientras que 9.7% de con­ sumidores no tienen seguro y piensan que nuevos regla· mentos para estas HMO son una buena idea.

Con el uso de la ley de la adición, podemos también calcular las probabilidades de unión como Jo es la probabi­ lidad de que un consumidor seleccionado al azar no tenga seguro o piense que los nuevos reglamentos para las HMO son una buena idea:

P{sin seguro U buena idea) =

P(sin seguro) + P{buena idea) - P{sin seguro n buena idea)

= 0.16i + 51 - 0.097 = 0.574

MATRIZ DE VALORES SIN PROCESAR

Tipo de industria

Fi':}anzas A

Manufacturas B

Comunicaciones C

Solución

Seleccione una industria y una ubicación geográfica (por ejemplo A-Finanzas y G-Oeste•. ¿Es P(AjG) = P(A)?

Ubicación geográfica

Región Noreste Sureste central Oeste

O E F G

24 10 8 14

30 6 22 12 1

28 18 12 16

56

70

74 82 34 42 42 200

P(A!Gl = ..!± y P(AJ = ~ 42 200

Page 152: libro.pdf

126 FSTADISTICA E.-: L()<; ~"EGOCIO~

PROBLEMA DE DEMOSTRACIÓN

4.11

¿ 14142 es igual a 5612007 No, .33 .;. .28. El tipo de industria y la ubicación geográfica no son independientes porque por lo menos está presente una excepción a la prueba.

Determine si la tabla de contingencia que se muestra como tabla 4.6 y repetida aquí conuene eventos independientes.

O E

A~12 20 8 20 30 50

e s 9 15 34 51 85

Solud6n

Pruebe la primera celda de la matriz para encontrar si P!AJDI • PIAI.

PIAIDI • 38

• .2353 . 4

PIAI • !~ • .2353

El proceso de prueba debe continuar hasta que se determine que todos los eventos son inde· pendientes. En esta matriz, todas las posibilidades se comprueban. Por tanto, la tabla 4.6 con­ tiene eventos independientes.

4.4 PROBLEMAS

4.lJ L'tilice los valores de la tabla de contingencia para resolver las ecuaciones dadas.

E F G

8

15 12 8

11 17 19

21 32 2;

18 13 12

e D

a. PlGIA> • _ b, P(BJF) =- c. P(qE) = - d. P(EJG) • _

4.24 Ulilíce los valores de la tabla de contingencia para resolver las ecuaciones dadas.

C D :m •. P(CjA) - - b. PíBIDJ •_ c. P(AJB) =-

Page 153: libro.pdf

CAPITULO 4 PROBAJllUDAD 127

4.25 A continuación aparecen los resultados de un estudio que pregunta: "¿Tiene usted calculadora y/o computadora en su casa?"

Calculadora Sí No

5{~6 3 49 Computadora

No 11 15 26

57 18 75

¿Es la variable calculadora independiente de la variable computadora? ¿Por qué si o por qué no? 4.26 En 1997, las quiebras financieras en Estados Unidos llegaron a 83 384, según Dun & Bradstreet.

La industria de la construcción tuvo 10 867 de estas quiebras. Los estados del Atlántico sur tuvie­ ron 8 010 quiebras. Suponga que 1 258 de todas las quiebras fueron negocios de construcción situados en estados del Atlántico sur. Un negocio en quiebra de 1997 raras veces se muestrea al azar. a. ¿Cuál es la probabilidad de que el negocio esté situado en estados del Atlántico sur? b. ¡Cuál es la probabilidad de que el negocio sea de la industria de la construcción o esté situa­

do en estados del Atlántico sur? c. ¿Cuál es la probabilidad de que el negocio sea de la industria de la construcción si se sabe que

el negocio está situado en estados del Atlántico sur? d. ¡Cuál es la probabilidad de que el negocio no esté situado en estados del Atlántico sur si se

sabe que el negocio es de la construcción? e. Cuál es la probabilidad de que el negocio no esté situado en estados del Atlántico sur si se sabe

que no es negocio de la construcción? f. Dado que el negocio es de la construcción, ¡cuál es la probabilidad de que el negocio no esté

situado en los estados del Atlántico sur? 4.27 Arthur Andersen Enterprise Group/National Small Business United, Washington, realizó una

encuesta nacional de propietarios de pequeños negocios para determinar los desafíos de creci­ miento de sus negocios. El principal reto, seleccionado por 46% de los propietarios de pequeños negocios, era la economía. Un cercano segundo lugar fue el de trabajadores capacitados (37%). Suponga que 15% de los propietarios de pequeños negocios seleccionó tanto la economía como encontrar trabajadores capacitados como desafíos de crecimiento. El propietario de un pequeño negocio se seleccionó al azar. a. ¿Cuál es la probabilidad de que el propietario piense que la economía es un desafío de creci­

miento, si el propietario piensa que encontrar trabajadores calificados es un desafío para el crecimiento?

b. ¡Cuál es la probabilidad de que el propietario piense que encontrar trabajadores capacitados es un desafío para el crecimiento, si el propietario piensa que la economía es un desafío para el crecimiento?

c. Dado que el propietario no selecciona la economía como desafío para el crecimiento, ¿cual es la probabilidad de que el propietario piense que encontrar trabajadores capacitadas es un desafío para el crecimiento?

d. ¡Cuál es la probabilidad de que el propietario piense que ni la economía es un desafio para el crecimiento fil encontrar trabajadores capacitados es un desafío para el crecimienm?

4.28 A fines de 1998, un estudio de usuarios en línea fue realizado por Iupiter Communications para determinar por cuál tipo de compra es que un consumidor prefiere un servicio a dientes en vivo, Cuarenta y siete por ciento de los usuarios respondieron que cuando compran boletos de avión, prefieren servicio a clientes en vivo. Suponga que de quienes prefieren servicio a dientes en VÍ\'O para comprar boletos de avión, 81 % prefieren servicio a clientes en vivo para transacciones de présta­ mos. Si se selecciona al azar a un usuario en línea, determine las siguientes probabilidades:

Page 154: libro.pdf

128 ESTADISTICA tx LOS SEGOCIO~

a. El usuario en linea prefiere servido a clientes en vlvo pua comprar boletos de in;ón y pua transacción de prbtamos.

b. El usuario en linea prefiere servicio a clientes en vivo para transacción de préstamos pero no prefiere servido a dientes en \+.'O pua comprar boletos de a\ión.

c. El usuario en linea no prefiere servicio a dlentes en vi\'O para transacción de préstamos pero si para comprar boletos de avión.

4.29 Arco11111i11g To•"'Y reportó que 37% de contadores compran su hardware de computadora por pedido directo por correo y que 54% compran su software de la misma manera. Suponga que 97% de los contadores que compran su hardware por pedido directo por correo compran su software por pedido directo por correo. Si se selecciona al azar un contador, determine las siguientes probabilidades: a. El contador no compra su software por pedido directo por correo dado que no compra su

hardware de la misma manera. b. El contador compra su software por pedido directo por correo dado que no compra su hard­

ware por pedido directo por correo. c. El contador no compra su hardware por pedido directo por correo si se sabe que compra su

software por pedido directo por correo. d. El contador no compra su hardware por pedido directo por correo si se sabe que no compra

su software por pedido directo por correo.

4.8 REVISIÓN DE PROBABILIDADES: REGLA DE BAYES

Una extenslén de la ley condicional de probabilidades es la regla de Baycs, que fue aca<U por Thomas Ba)~ (1702-1761) en cU)'O honor lb-a su nombre.La regla de Bayn es unafJrmulaqucatk1ulccl uso dt 111 ley dc probabilidallts condiciona/n para permitir la rtviswn dt probabüida.lts originalts con nuC\11 informad6n.

REGU DE BAV'tS P(x >· P<YI x > P(x In- ' . i ' P(X1)·P(r!Xi)+P(X2)·PO'IX2)+ .. +P(Xn)·P(YIX,,)

R«ordcmos que la ter de probabilidad condicional para

l'(Xdl')

Es:

P( XJY) • P(X,) · P(t]X1) • íl PO')

Compare la regla de Bayes con esta regla de probabilidad condicional. Los numeradores de la regla de Bares)' la ley de rrobabili<UJ condicional son los mismos, con la interseccíén de X, y Y m0$lrada en forma de regla general de la multiplicadón. La nueva airactmstka que usa la regla de Bayes se encuen­ traen el denomlnador de la regla:

El denominador de la regla de &)n índuye una n:pmión del producto (intersccdón) pua cada partición del espacro maestral, Y, incluyendo el evento (X,) mismo. El denominador es entonces una lista cxhausth-a y colectiva Je resultados mutuamente excluyentes de Y. Este dmominador se conoce a veces como la fórmula dt probabilidad total. Representa un promedio ponderado de las probabilidades con­ didonales, con los valores de las probabilidades previas del evento correspondiente.

Page 155: libro.pdf

CAPITULO 4 PROBABIUDAI> 1 ?9

Al expresar la ley de probabilidades condicionales en esta nueva forma. la regla de Ba}~ hace posi­ ble que d experto en estadística haga nuevas y diferentes aplicaciones con el uso de probabilidades con· dicionales. En particular. lo~ estadísticos usan la regla de Bayb para revistar probabilidades en vista de que hay nueva información.

Un tipo panicular de cinta de ímpre-ora es producida por sólo dos compañías, Alamo Ribbon Compan)· y South Jeney Products. Suponga que Alamo produce 65% de w cintas y que South Jersey produce 35"<>. Ocho por ciento de las cintas producidas por Alamo son defectuow y 12% de ~ cintas de Soutb Jeney son defectuosas. Un cliente compra una cinta nueva. ¿Cuál es la probabilidad de que Alamo produjo la cinta? ¿Cuál es la probabilidad de que South Jcr¡ey produjo la cinta? La cinta se prue­ ba y multa defectuosa. Ahora, ¿cuál b la probabilidad de que Alamo produjo la cinta? ¿y de que South Jerwy produjo la cinta?

La probabilidad era .65 de que la cinta provino de Alamo y .35 de South Jersey. ~tas K llaman pro· babilidades previas porque están basadas en la información original,

La nueva información de que la cinta e) defectuosa cambia las probabilidades porque una comps­ l\fa produce un porcentaie mh aho de cintas defectuosa> que la otra compañla. ¿Cómo puede usarse esta información para actualizar o revisar las probabilidades originales? La rtgla de Bayes permite esta actualiudón. t:na forma de trazar una revisión del problema de probabilidades es usar una tabla. La tabla 4.8 muestra el análi>i) del problema de la cinta.

El proceso se inicia con las probabílidades previas: .65 Afamo y .35 South Jerwy. En.u probabili­ dades previas aparecen en la "!!Unda columna de la tabla 4.8. Debido a que el producto K encontró defectuoso deben usarse las probabilidades condicionales P(defcctuoso!Alamo) y P(deftctuosolSouth JefKY). Ocho por ciento de las cintas de Alamo son defectuosas: P(defe.:tuoso!Alamo) • .08. Doce por ciento de las cintas de South Jerser son defectuosas: P(defcctuosolSouth Jersey) • .12. ~tas dos pro· babilidades condicionales aparecen en la tercera columna. Ocho por ciento de 65% de las cinta.) de Alamo son defectuosas: (.08)(.65) = .52 o 'lea 5.2% del total. Esta cantidad aparece en la cuarta colum­ na de la tabla 4.8; es la probabilidad conjunta de obtener una cinta que fue hecha por Alamo y es defec­ tuosa, Como la cinta comprada e> defectuosa. éstas son las únicas cint.li de interés de Alamo. Doce por ciento de 35% de las cint.u de South Jersey son defectuosas. la multiplicación de estos dos porcentajes da la probabilidad conjunta de obtener una cinta de South Jef'.Cy que es defectuosa. ~ta cantidad tam­ bito aparece en la cuarta columna de la tabla 4.8: (.12)(.35) • .042 o sea '4.2% de todas las dnt.u son hechas por South Jersey y son defectuosas. 8te porcentaje incluye las únicas cintas de interés de South Jer>ey porque la cinta comprada es defectuosa,

La columna 4 se totaliza para obtener .094, que indica que 9.4% de todas las dotas son defectuo­ su (Alamo r defectuosas == .52 + South Jer-cy y defectuosas • .042). El otro 90.6% de las cintas, que $00 aceptable>. no son de interés porque la cinta comprada e> defectuosa. Para calcular esta quinta columna, las probabilidades poneríores o revisadas, implica dividir cada valor de la columna 4 entre el total de la columna 4. Para Alamo, .052 del total de cintas son Alamo y defectuosas del total de .094 que son defectuosas. Dividir .052 entre .094 da .553 como probabilidad revisada de que la cinta comprada fue hecha por Alamo. Esta probabilidad e> menor que la probabilidad previa u original de .65 porque menos de las cintas de Alamo (como porcentaje) son defectuosas que las producidas por South Jenq·. La cinta defectuosa es ahora menos probable que provenga de Alamo que antes de saber de b anta defectuosa. la probabilidad de South )er>ey se revisa al dividir la probabilidad conjunta de .042, de que la cinta t'ú hecha por South Jer\t)' y es defectuo"1, entre la probabilidad total de que la cinta o defee­ tuosa (.094 ).

.. •• 1=; e ,., ...... ProbebWdecl Pu' ·m· « ...... ·1 caajuDta .,..... IW Pfli!!¡) P(E¡ I"\ 111 .~ "' .08 .OS2 ~2 - ..55.3

.094

.3S .12 ~ P42 '"' 44~ 094

l'{~)·.094

TABLA 4.8

Tabla de Bayes para revisión de probabilidades del problema de cintas

.....

Page 156: libro.pdf

130 l:STADb°TICA L" tos NF.GOCIO:.

C:h1tHF• Diagrama de árbol para probabilidades del problema de cintas

.052]-

.094 .598

.042

.308

PROBLEMA DE DEMOSTRACIÓN

4.12

El resultado C$ .042/.094 • .447. La probabilidad de que la cinta defectuosa o de Soulh Jmey aumeruó porque un porcentaje más alto de cintas de South Jeney son defectuosas,

Los diagramas de árbol son otra forma comun de resolver problemas de la regla de Bares. La figu­ ra 4.12 muestra la solución para el problema de la cinta. Nótese que el diattrama de árbol contiene todas I~ posibilidades, incluyendo cintas defectuosas y aceptables. Cuando se da nueva información, sólo las ramas pertinentes se seleccionan y utilizan. Los valores de probabilidad conjunta al final de las rama.• apropiad.u se emplean para revisar y calcular las posibilidades pcsteríores. Usar el número total de cintas defectuosas, .052 + .042 '"' .094, el cálculo es como sigue.

Probabilidad revisada Alamo = ·09°52 • .553 . 4

Probabilidad revisada: South JeNy • ·09042 • .447 • 4

Las máquinas A, B y C producen todas las mismas dos piezas. X y Y. De todas las piezas produ­ cidn, la máquina A produce 60%, la máquina B produce 30% y la máquina C produce 10%. Ademú,

40% de las pieza hechas por la máquina A son pieza X.

50% de las pieza hechas por la máquina B son pieza X.

70% de las pieza hechas por la máquina C son pieza X.

Una pieza producida por esta compal'lla es muestreada al azar y se determina que es una pieza X. Con el conocimiento de que es una pieza X. revise las probabilidades de que la pieza pro· venga de la máquina A, B o C.

SokK'6tl

La probabilidad previa de que la pieza provenga de la máquina A es .60, porque la máquina A produce 60% de todas las piezas .. La probabilidad previa es .30 de que la pieza provenga de B y .10 de que provenga de C. Estas probabilidades previas son más pertinentes si no se sabe nada acerca de la pieza, pero se sabe que es una pieza X. Las probabilidades condicionales muestran que las diferentes máquinas producen proporciones distintas de piezas X. Por ejemplo, .40 de las piezas hechas por la máquina A son piezas X. pero .50 de las piezas hechas por la máquina By .70 de las piezas hechas por la máquina C con piezas X. Es lógico que la probabilidad de que la pieza provenga de la máquina C aumentaría y que la probabilidad de que la pieza fue hecha en la máquina A aumentaría porque la pieza es una pieza X.

La tabla siguiente muestra cómo es que las probabilidades previas. las probabilidades con­ dicionales, las probabilidades conjuntas y la probabilidad marginal, P()(), se pueden usar para revisar las probabilidades previas para obtener probabilidades posteriores.

Page 157: libro.pdf

C\PIT\Jl.04 PROBABlllDAD 131

Previa Condldonal Conjunta Evento PIE' Pl~E' P(Xn E' Posterior

A .60 .40 (.601(.40) .24 ~- 52 .46 .

B .30 .50 .15 .:.J!. - 33 .46 .

e .10 .70 .07 ~- 15 .46 • P!)() - .46

Une vez revisadas las probabilidades, es evidente que la probabilidad de que la pieza sea hecha en la máquina A disminuyeron y que las probabilidades de que le pieza fue hecha en las máqui­ nas B y C aumentaron. Un diagrame de árbol presenta otra viste de este problema.

Probabilidades revisadas: Máquina A: :!: • .52

Máquina B: :!: • .33

Máquina C· .07 .15 .46

.24

.36

.15

.15

.07

.03

"5 PROBLEMAS

4.30 En una planta manufactuma, la m.lquina A produce 10% de cieno producto. la m.lqwna 8 produ­ ce 40% de este producto. y la m.lquina e produce 50% de este producto. Cinco por ciento de !O> pro­ duetos de la m.lquina A son dcfcctuo.o..., 12% de loo. productos de la máquina B son defectuosos y 8% de loo. productos de la máquina C son defectuosos .. fJ inspector de la compaflia ha muestreado un producto de esta planta y ha encontrado que es defectuoso. Determine las probabilidJdcs misa­ das de que el producto muestreado fue producido por la m.lquina A, máquina B o máquina C.

4..31 Alex, Alicia y Juan despachan pedidos en un restaurante de comida rápida. Alcx despacha meo­ rreetamente 20% de los pedidos que toma. Alicia de.pacha incorrectamente 1:!% de los pedidos que toma. Juan despacha incorrectamente 5% de los pedidos que toma. Alcx despacha 30% de todo) lo) pedido), Alicia despacha 45% de todos los pedidos y Juan 25% de todos los pedidos. Acaba de despacharse una orden. a. ¿Cuál es la probabilidad de que Alicia despaché el pedido? b, Si el pedido fue despachado por Juan, ¿Cu.il es la probabilidad de que se haya despachado

correctamente? c. Se desconoce quién despachó el pedido, pero éste se despachó incorrectamente. ¿Ciúlcs son

las probabilidades revisadas de que Alex, Alicia o Juan despacharan el pedido? d. Se desconoce quién despachó el pedido, pero 6te se despachó correctamente. ¿Cu.lle. son ~

probabilidades revisadas de que Alo., Alicia o Juan despacharan el pedido?

Page 158: libro.pdf

4.32 En un pequeño poblado. dos companías de jardinerú fertilizan prado> durante c:I verano, Tri­ State Lawn Service tiene 72% del mercado. Trtinta por dmto de lo. prado. fcniliudo. por Tri-State podrian clasiñcarse como muy sanos un mes después del servicio, Greenchem time el otro 28% del mercado. Veinte por ciento de lo> prados ferulizados por Greenchem podrian clasificarse como muy sanos un mes después del servicio. Al azar se selecciona un prado que ha sido trata· do con fertilizantes por una de estas compañías dentro del último mes. Si el prado se clasifica como muy sano. ¿cuáles son las probabilidades de que Tn-State o Greenchem trataron el prado?

4.33 Las comparuas dan capacitación a empleado. por muchas razones diferentes, entre las que se: cuentan la lealtad del empleado. retención de éste )' calidad del trabajo. Suponga que 65% de toda. las compañías dan alguna capacitación a sus empleados pero que esta cantidad varia según el tarnatlo de la compañía. Suponga además que 18% de todas las compañías que dan capacita· ción son pequeñas r que 75% de todas las compatlla. que no dan capacitación son pequeñas, Se muestrea al azar una compatlia sin consi~erar su tamatlo. ¿Cuál es la probabilidad de que la com · pania dé capacitación? Suponga que se determina que la compatl[a seleccionada no es pequeña. ¿Cuál es la probabilidad de que la compatlia dé capacitación? ¿Qué proporción de todas las com­ paflias no o pequeña]

Igualdad de géneros en el lugar de trabajo

Los dato.' de la compatlía cliente dado. en el Dilema de decisión ~ muestran en forma de matriz de valores sin procesar. Con el uso de las técnicas presentadas en este capitulo, es posible cstad~ticamen· te responder la. pregunta. gerenciales. Si al azar <e selecciona un trabajador de lo> 155 empicados, la probabilidad de que el trabajador sea mujer, P(W), es 55/155 o sea .355. ~ta probabilidad margin.tl india que alrededor de 355% de todo. lo> empleados de la compañia cliente 50n muiere>. Dado que d empicado tiene una posicién gerencial, la probabilidad de que el empicado o;ca mujer, P( \\'IM) es 3/11 o sea .2i3. La proporción de gerente> que son mujeres en la compallia e» menor que la proporción de todos los trabajadores de c>ta compañía que son muiere •. \'arios factores podrían estar relacionados con esta discrepancia, algunos de los cuales podrlan ser justificables por la compatlia, incluyendo upe· rimcia. educación e historia previa de éxitos, pero otros factores no podrían ser justificable»,

51.-po11&3 que al azar se selecciona un empleado técnico para darle un bono. ¿Cuál o la probabilidad de que una mujer sea selecdonada, dado que el trabajador es un empicado técnico? Es decir. P\ Fff) • ? Al aplicar b ley de probabilidades condicionales a la matri1 de valore> sin procesar dada en el Dilema de decisión. P(Ffl1 = 1 i/69"' .246. Con el uso del concepto de eventos complementarios, la probabilidad de que se seleccione un hombre dado que el empleado es una persona técnica C> 1 - .246 • .754. ~ más de tres veces probable que un técnico seleccionado al azar sea hombre. Si una mujer fuera una de las escogidas para el bono, un hombre podría alegar discriminación con base meramente en lu proba· bilidades, pero quienes toman decisiones en la compañía podrían presentar entonces documentación de los criterios de seleccién basados en productividad, sugerencias técnicas, medidas de calidad y otros.

Suponga que un empleado de la compañía clieme se selecciona al azar para ganar un viaie a Hawaí, La prob.ibilidad nwginal de que el ganador sea un prefesional C$ P(P) • 4-l/155 • .284. La probabili­ dad de que el ganador se-a hombre o empleado oficinista es una probabilidad de unión. es decir:

100 31 9 122 Pl,M U C) • P(M) + P(C) - P(M n C) • - + - - - = - • .787 . 155 155 155 155

La probabilidad de que un hombre o empleado o6cinüta de la compar'tia cliente gane el viaje es .787. La probabilidad de que el ganador sea mujer )' gerente es una probabilidad conjunta. es decir,

P(F n M) • 31155 • .019

Page 159: libro.pdf

Har meno> de 2% de probabilidad que una mujer gerente sea seleccionada al azar como ~ del viaje.

¿Cuál e. la probabilidad de que d ganador sea del grupo técnico si se sabe que el empleado es hom­ bre~ Esta probabilidad condicional es como sigue:

P(T!M) "' 52/100 • .52

fa posible responder a muchas otras preguntas acerca de la 'ítuación de recursos humanos de la ccmpañía cliente que use probabilidades.

FJ método de probabilidad a un grupo de recursos humanos e• real, objeuvo y numérico para la selección de persona. sin considerar talentos individuales, conocimiento> y valor de la compal'lla. Por supuesto, cm ca.i todos los casos. muchas otra. consideraciones entran en la contratación, promoción r recompensa> de trabajadores adcmh de sacar al aur su nombre. t-:o obstante, la administración de la compaMa debería estar atenta a que a veces existen ataque. a la> prácticas de contratación. promo­ ción y recompensas con el uso de anáfoi> estadí>tk0> como los aqui presentados. Ko se argumenta aqul que la administración debe b.iwr sus decisiones meramente en l.u probabilidades dentro de categoría> particulares. En cambio, ,i está consciente de las probabilidades, la administración puede considerar su. decisiones con evidencia documentada de la productividad del trabajador)' el valor de la organización.

CONSIDERACIONES rnos

Page 160: libro.pdf

RESUMEN

El estudio de probabilidad aborda modos de asignar probabi­ lidades, tipos de probabilidade, y leye) de probabilidades. Las probabilidades apoyan la noción de estadísticas internas. El uso de datos muesrrales para estimar y probar hipótesis acer­ ca de parámetros poblacíonales se hace con incertidumbre, Si se toman muestras al 11.ar, o posible asignar probabilidades a resultados dd proceso inferencial.

Tres mttodos de asignar probabilidades son 1) el método disico, 2) d método de frecuencia relativa y 3) probabilidades sub~tivu. El método clásico puede asignar probabilidades a priori, o antes que tenga lugar el experimento, Se apoya en la~ leyn y~ de probabilidad. El método de frecuencia relati­ '~ asigna probabilidades con base en datos hi>tórico~ o datos deducidos nr.pfricammte. La.• probabilidades >ubjcti\'U est.\n basadas en los sentimientos. conocimiento )' experiencia de la persona que determine la probabilidad.

Omos bpos cspcciales de eventos necesitan correcciones a algunas de w leyes de probabilidad: eventos mutuamente OOU)'mtr5 y C"'ml0$ independientes. Los primeros IOn evcn­ tos que no pueden ocurrir al mismo tiempo. de modo que la probabt'lidad dc su inttn«eión es cero. En la determinación de b unión dc dos C'\'m!OS mutuamente excluyentes. la ley de adición SC comse al suprimir fa intersección. Con eventos indcpcndimtcs, b prcsmtación de uno no tiene impacto o influcnc:U en b presentación del otro. Ciertos experimentos, por ejemplo los de monccbs o dados. de manera natural pro·

ducen eventos independientes. Otr06 experimentos producea eventos independientes cuando el experimento se reali7~ coa reemplazo. Si lo) eventos son independientes, la probabilübc! conjunta se calcula al multiplicar las probabilidades indh..,.. duales. que o un caso especial de la ley de la multiplicación.

Tres técnica. para contar las posibilidades en un experi­ mento son la regla de conteo mn, las posibilidades Nª, y com­ binaciones. La regla de conteo mn se usa para determinar ~ cuantas formas posibles en total puede presentarse un expen- 1

mento en una serie de operaciones secuenciales. La fórmWJ ' :-in se aplica cuando se hace muestreo con reemplazo o b eventos son independientes. Se usan combinaciones pan de­ terminar las posibilidades cuando el muestreo se hace reemplazo.

Cuatro tipos de probabilid.id son probabilidad margin¡L probabilidad condicional, probabilidad conjunta y probabili­ dad de unión. La ler general de la adición se usa para calculz: la probabilidad de una unión. La ley general de la multiplica- , cíón se usa para calcular probabilidades conjuntas, La ley con­ dicional se usa para calcular probabilidades condicionales.

La regla de Bayes es un método que se puede usar ~ revisar probabilidades cuando se dispone de informació::: nueva; es una variante de la ley condicional. La regla de 8.J)u toma la. probabilidades previas de eventos que ocurran ajusta o revisa esa> probabilidades con base en lnformad acerca de lo que ocurre después,

intersección matriz de probabilidad método clásico de asignar

probabilidades notación de conjuntos probabilidad condicional probabilidad conjunu

TÉRMINOS CLAVE

a priori combinaciones complemento complemento de una unión espado muestra! evento eventos colectivamente

exhaustivos

eventos independientes eventos mutuamente cxdu}Tntc.

eventos simple, ezperimento frecuencia relativa de presentación

probabilidad de: unión probabilidad marginal probabilidad subjetiva regla d~ Baycs regla mn de conteo unión

Regla de conteo

FÓRMULAS

mn

Muestreo con reemplazo

Muc.tTeo sin reemplazo

Fórmula de combinación

(N) N! :•:Cn• n • n!(N- n)!

Lq general de adición

PC.X U Y) = P(X) + P( Y) - PIX n Y)

ley especial de adición

P(X U Y)= P(X) + P(Y)

Lq general de multiplicadón

P(X n Y).,. P(X) • P(YJX) = P(Y) • P(XJY)

ley especial de multiplicación

P{X n Y)'"' P(X) • P(Y)

Page 161: libro.pdf

de protYb1hdad condicional

P(\lY) • P(X n Y) • P(X) • P(YJ,\1 • PO') P(Y)

CAPfTUlO 4 PROIW!IUDAD t 35

Rtglade &vn

P(XAY> • P(X,) • PO'IX,) P{X1) ·P1)1X1) + P\Xi) • P\}1Xz) + ... + P\X.J ·PO'\X.J

'PROBLEMAS COMPLEMENTARIOS

Ciiculo de estadfsticq

Use los Vlllom de d cudro de contingmcia para resolver ecuaciones dadas.

D E

A 10 20

15 s 30 15

\Wiabk2 B

e

L P(E) • - b. P(BUD)•_ c. P(An E) .. _

d. P(BJEl •- e. P(AUB)•_ í. P(Bí\C) =- g. .P(DJC) =- h. P(AIB>•- L Son independientes w variables 1 y U ¿Por qué si o

por qué no?

LJ5 U~ los valores del cuadro de contingcnc~ para resolver w ecuaciones dadas.

D E F G

A

B

e

3 9 7 12

8 4 6 4

30 s 3 ;

L PIFílA)•_ b • .P(A\8) • _ c. P(B) •_ d. P(En F) •_ e. P(DJB) • _

f. P(BJD) •_ g. PIDUC)•_ h. P(F)•_

~ La siguimte matriz de probabilidad contiene un desglose cklaecbdygintrock~~m un año reciente, aegún rq><>rta b American Med1cal &sociation.

~ttDICOS DE E.U. E.'I; ~ A.'1;0 REO.EKTE Etbl (ailos)

1 .11 .20 .19 .12 .16

1 .07 .os .()4 .02 .01 ... .14

.18

.22

.17 1.00 .28 .23

L ¿Cuál o la probabilidad de que un médico seleccio­ nado al 11.ar tenga de 35 a 44 ano) de edad?

b, ¿Cuál es b prob.lbilid.1d de que un médico sdc.::don.a· do al aur 1a mujer y tmga de 45 a S4 año6 de «bd>

c. ¿Cuil es la probabilidad de que un médico seleccio­ nado al aur ~ hombre o de 35 a .¡.¡ años de edad!

d. ¿Cuál es la probabilidad de que un médico seleccio­ nado al azar tenga menos de 35 aJ\<>5 de edad o tenga de 55 a 64 aflO) de edad!

e. ¿Qdl es la proNbilidad de que un medico selecdona­ do al aur 1a mujer si tiene de 45 a 54 ail<» de edad!

f. ¿Cu.ll o la probab1lid.id de que un m~ko ~cccion.ado al azar no tea mujer ni tenga de 55 a 64 ano de edad?

Pruebe eue conOCJmlentoe

4.37 Purch.ising. U~)· preguntó a profesionales de compras qué caracterútkas de ventas I~ habían impresionado mú en un representarae de ventas, Setenta y ocho por ciento seleccionaron "minudosidad"; Cuarenta por cien- 10 respondieren que conocimiento de u "propio pro­ ducto': A los prcfesícnales de compras se les permitió dar una lma de una o m.ú aracteri>licas. Suponga que 27% de lo profesionales de compras anotaron "miau­ cxhidacl9 y"conorunim10 de su propio producto" como caractcrl.ticas de ventas que m.ú lo> impresionaron. Se seleccionó al u.ar un profe.1oo.al de compras. L ¿Cuil C5 b probabilidad de que el prottstonal selec­

donó "mmudosid.id" o "conocimiento de su propio producto"?

b. cúdl e la probabilidad de que d proft'Sional no han seleccionado ni "minuciosidad" ru "conocunimto de su propio producto"?

c. Si se sailt que d profesional scl«cionó "mmuaosid.ad":. ¿cuil ~ la probabilidad de que d pro!csiona1 han scl«cionado "conocimlento de su propio product0"1

d. cúdl es la probabilidad de que d profC'SIOn.il no 5C'lcc· cionó "minuciosidad" r $1 sdecaonó "conodmientc de su propio preducto "?

Page 162: libro.pdf

136 ESTADlmCA E.-.:~ NEGOCIOS

4.38 La U.S. Bureau of Labor Sranstics publicó datos sobre lo. pm~nes efreeidas por pequcl\as com~ias a sw empicado . Sólo 42% ofrecen planes de retiro mientra> que 61 % ofrecen seguro de vida Suponga que 33% efre­ cm planes de retiro y stgUro de vida como prestaciones Si una pequeña compallla se selecciona al azar, determi­ ne bs ~iguímtcs probabilidades: a. La compatlla ofrece un plan de retiro dado que ofre­

cen stgUro de vida. b. La compatlia ofrece seguro de vida dado que ofrecen

plan de retiro. c. La com~la ofrece seguro de \ida o un plan de rt'tÍro.

d. La com~la ofrece un plan de retiro y no ofrece seguro de vida.

e. La com~la no ofrece w-gu.ro de vida ,¡ se sabe que ofrece un plan de retire,

4.39 ~ Link Resources, 16'!9 de b población en Estado. Unido. est.í orientada a b tecnología, pero estas canti­ dades \'UÍan por rq;¡onn. Por qemplo, en el oeste la cifra es W% r m d noreste es de 1 i'lll. Veintiún por ciento de b pobbáón en EsudOl Unido. en general est.t en el oeste y ~ m d eoresre. Suponga que al azar se sd«"ciona un csudounidrnst. a. ¿Cu.ti es b probabilidad de que la pcnona vi'-a en el

ante y sea una pcnona orientada a la tecnologla? b. ¿Cm! es b probabilidad de que la persona viva en el

oorme y sea una pcnona orientada a la tecnología! c. Suponp que se~ que b persona seleccionada est.t

orimuda a b trcno1ogia. éCtúl es la probabilidad de qix b pcnona m-.a ea d oeste?

d. Suponp que se sabe que la persona seleccionada est.t orimuda a b tccnologb. ¿Cm! es la probabilidad de que b persona ,fu en d nomtc?

e. Suponp que se sabe que b penona seleccionada estJ orientada a la ucno1ogfa. ¿Cu.ti es b probabilidad de que la persona no m-a en d oeste ni el noreste?

4.40 En cierta ciudad, 30% de las úrnilias tienen tarjeta MuttrCard, 20% timen Amcrian Expreu y 25% tienen \~ISI. Ocho por ciento de las Wnilias ucnen Ma.ttrCard y American Express. Doce por ciento tienen Visa y ~la.tcrúrd. se» porcier.10 timen.~~ y\'"ia a. ¿Ctúl es la probabilidad de sdcccionar una familia

que no tenga t:irjeta \rlA ni American Exprc»? b, Si una familia tiene MMtcrCard, ¡CIW es l;a probabi­

hdad de que tenga tarjeta \"iQ? c. S1 una familia tiene tarjeta \ísa, ¿cuál es la probabdi­

dad de que tenga Ma.terard! d. La posesión de una tarjeta \risa, ¿es independiente de

poseer una ~futerCard? ¿Por qut sl o por qué no? e. La posesión de una tarjeta Amcri<:an Exp,_, (Q mutua·

mente cxdu~iva de la po ición de una tarjeta \'isa? 4.41 Hace unos cuantos anos, un estudio encargado por Tht

\\brld Almarw y Marunry .\·cws Strvicc rqionó que 51 % de quienes respondieron no creyeron que con d \isttma de

seguridad social estuviera seguro en 20 al\Ql, De los que respondieron y que tenían 45 años de edad o más, 70% pensaron que con d si>tcma estarla ~ en 20 allo~ De las personas entrevistadas, 57% tenían menos de 45 at\Ol. Se seleccionó al azar uno de IOl que respondieron. a. ¿Ctúl e> la probabilidad de que la persona tenga 45

ailO> O m;is? b. éCuál es la probabilidad de que la persona 1enga

menos de 45 al\0) y piense que con el salema de <eg11rídad social estar' stgUro en 20 allos?

c. Si la persona seleccionada piensa que el sutcma de stgUridad social estar' stgUro en 20 allos, ¿cu.ti es la probabilidad de que la persona tenga 45 o n:W at\os?

d. éCu.il es la probabilidad de que la persona tenga menos de 45 al\os o piense que el sistema de seguri­ dad social no estari stgUro en 20 al\Ql?

4.42 Una encuesta por teléfono realiuda por la compallla Maritz Mar~g Rescarcb encontró que 43'41 de n1a­ dounidenses espera ahorrar más dinero el at\o próximo que lo que ahorró el ano puado. Cuarenta y cinco por ciento de los entrevistados planea reducir su dC'Uda el at\o próximo. De quienes esperan ahorrar más dinero el allo próXImo, 81 % planea reducir su deuda el allo pró­ xilno. Se selecciona al azar un estadounidense. a. ¿Cuál es la probabilidad de que esta persona espere

ahorrar más dinero el afto próximo y planee reducir su deuda el at\O próximo?

b. éCu.il es b probabilidad de que esta penona espere ahorrar más dinero el afio próximo o planee reducir su deuda el al'lo próximo?

c. éCu.tl es la probabilidad de que esta persona no espere ahorrar más dinero el afio préximo ni planee reducir su deuda el allo próximo?

d. ¿Cu" b la probabilidad de que esca persona espere ahorrar m.ts dinero el ano próximo y no planee reducir su deuda el atlo próximo?

4.43 La Slttlcase Workplacc Inda estudió IOl tipos de activida­ des rebcionadas con el trabajo que hkieron estadounidee­ Sb que estaban de vacaciones en el \-erano. Entre otras COllS. 40% Icen maltrial rd.acionado con d trabajo. Treinu y cuatro por ciento se registraron con d jefe. A quienes rcspondicron al estudio se les permitió seleccionar ~ de una actividad. Suponga que de quienes leen maten.. relacionado con el trabajo, 78"il se registraron con el. jefe. Uno de quienes rbpondieron se seleccionó al azar. a. éCu.il es la probabilidad de que al estar de vacaciones

esta penona que respondió al es1udio se registrara con el jefe y lea el material relacionado con el trab.tjo?

b. ¿Cu.ti es la probabilidad de que al estar de vacaciones esta persona que respondió al estudio no se registre con el jefe ni lea el mattrial relacionado con el trabajo?

c. ¿Ctúl es la probabilidad de que al estar de vacaciones esta penona que respondió al estudio I~ el mate· ria! relacionado con el trabajo dado que se registró con el jefe?

Page 163: libro.pdf

d. ¿Cuál Q la probabilidad de que al estar de vacaciones Qla persona que respondió al estudio no se regisirara con el jefe dado que leyó material relacionado coo el 1rabajo?

e. ¿Cuál Q la probabilidad de que al estar de vacaciones Qla pcMna que respondió al estudio no se regímara con el jefe dado que no leyó material relacionado con el trabajo?

f. Conslru}-a una matriz de probabilidad para este pro­ blema.

4.44 Health Righ1s Hotline publicó los tt)Uhado) de un estu­ dio de 2 400 personas en el norte de California, en el que se pidió a consumidores compartir sus quejas acerca de atmción dirigida. La queja nllmero uno fue la denegación de atención, con 17% de 10) consumidores participantes que Ja seleccionaron. Varias otras quejas se observaron, incluyendo atención inapropiada ( 14%), servicio a clien­ tes ( 14%), reclamaciones con pagos ( 11%), atencién de especialidad ( 10%), demoras para obtener atención (8%) y medicamentos de recela (?'lb). Esw ca1cgor1as de quejas son mutuamente exduyentes. Suponga que lo) resultados de este e tudio pueden llevar-e a iodos los consumido­ res de atención dirigida. Si un consumidor de atención dirigida se selecciona al aur, determine las siguiemes probabilidades: L El consumidor se queja por reclamadcnes de pago o

atención de especialidad, b.. El consumidor se queja de medicamentos de recela y

servicio a clientes. c. El consumidor se queja de atención inapropiada

dado que el consumidor se queja de la atencién de especialidad,

d. El consumidor no se queja por demoras en obtener atención ni se queja por reclamaciones de pago.

c.~ ~umerosas compmias dan capacitación a empleados por díferemes razones, entre las que se incluyen la lealtad del empleado, cenificación, calidad y mejora de proce­ sos. En un estudio nacional de compañías, 81 Learning .:r\lems reportaron que 56% de las compaAias que res­ pondieron citaron la retención del empleado como razón pñncipal para la capacitación. Suponga que 36% de las compatüas respondieron que otorgan capacitación pua mejorar sus procesos y para retener el empleado. Además, suponga que de las compañías que dan capaci­ tación para mejorar sus procesos, 90% lo hacen para retener empleados. Se seleccionó al azar una compaJ\ía que da capacitación. L ¿Cuál es la probabilidad de que la compañía dé capa­

citación para retener empleados y oo para mejorar sus procesos?

b.. Si se ~be que la compallia 01orga eapacuacién para retener empleados, ¿cuál C) la probabilidad de que dé capaci1ación para mejorar sus procesos?

c. ¿Cuál es la probabilidad de que la compallla dé capa­ citación para mejorar sus procesos?

CAPITULO~ PROBABfUDAO 137

d. ¿Cuál es la probabilidad de que la compal\ia dé capa­ citación para retener empleados o para mejorar sus procesos!

e. ¿Cuál es la probabilidad de que b compal'úa no dé capacit.tción para retener empleados ni para mejo­ rar sus procesos?

f. Suponga que se sabe que la comp.il\la no da capaci­ tacién para mejorar procesos. ¿Cuál es b probabili­ dad de que la compallla dé capacitación para retener empleados?

4.46 Pimey Bowe) entrevisté a 302 directores y vicepresíden­ lQ de mercadeo de empresas estadounidenses grandes y medianas. para determinar qué era lo que pensaban es el mejor vehtculo para educar a quienes loman decisio­ nes sobre complejos problemas para vender productos )' <ervicios. El porcentaje m~ alto de compal'lias escogie­ ron la venia directa por correo o ca1álog0), seguida por venta directa o venta por representantes, La venia direc­ la por correo o por ca1álogo• fue seleccionada por 38% de las compal'lía-<, ninguna de w cuales seleccioné venia directa por correo )' catálogos o ventas directas o venta por representantes. Suponga también que 41% no seleccionó venia directa por correo o cat.tlogo) ni venia directa o por representantes. Si una de las compa­ l'llas se selecciona al aur y se en1UV1sta a su mejor ven­ dedor acerca de este asumo, determine la siguien1es probabilidades: a. El vendedor seleccionó venta directa por correo o

por catálogo) y no seleccionó venta directa o por representantes de ventas.

b. El vendedor seleccionó venta directa o venta por representantes.

c. El vendedor seleccioné venta directa o venta por representantes, dado que la persona ~leccionó \'tnta directa por correo o por catalogos.

d. El vendedor no seleccioné venta ditteta por correo o por catálogos. dado que el vendedor no seleccionó venta directa o por representantes,

4.47 Una pequeña práctica independiente de médicos time tres médicos. La doctora Sarabia atiende a 41 % de los pacientes, el doctor Tran a 32% y la doctora lackson el resto, La doctora Sarabía pide pruebas sanguíneas a 5% de sus pacientes, el doctor Tran pide pruebas sanguinas a 8% de sus pacientes y la doctora Jack.-on pide pruebas sanguíneas a 6% de sus pacientes. Un auditor sdccciona al azar un paciente de la semana ~da y descubre que la paciente se le rtalizó una prueba ~ como resultado de la visita de un médico. C.Onocimdo esu información, ¿cu.ü es la probabilidad de que d paaente viera a la doctora Sarabia? ¿Para q~ porcmtaic de todos los pacientes en ei.ta práctica se requieren pruebas san­ guineas?

4..48 Una encuesta realizada por el Anhur Andmen Enterprise Group/Na1ional Small Busine<s United ua1ó de deter­ minar cuále< son los prindpales dcsa~ para el crecí-

Page 164: libro.pdf

miento y continuación de operaciones de pequeños negocios, Aunque cuando la economía y encontrar tra­ bajadores calificadoi. fueron los principales desafíos, aparecieron ot~ en lo. resultado. del estudio incluyendo reglamentos, citado. por 30% de los negocios, y la carga impo itiva, citada por 35%. Suponga que 71 % de l<b compañlas que citan reglamentos como un desafio tam­ bién cuaron la carga Impositiva como desafio. Suponga que e to• porcentajes se cumplen para todo. lo. peque· nos negocios, Si al azar se selecciona un pequeño nego­ cio, determine las siguientes probabilidades: a. El pequeño negocio cita la carga impositiva y regla·

memo como desafio. b. El pequeño negocio cita la carga impositiva o regla­

memos como desafio. c. El pequeño negocio cita ya sea la carga impositi\-a o

reglamentos pero no ambos como desafio. d. El pequeño negocio cita reglamentos como desafio

dado que cita la carga imposiliva como desafio. e. El pequeno negocio no cita reglamentos como desa­

Ao dado que cita la carga impo iliva como desafio. f. El pequeño negocio no cita reglamentos como desa­

Ao dado que no cita la carga impositiva como desafio. 4.49 Sc!:ún la Public \'oice for Food and Heahh Policy, aire·

dedor de 1i% de todo> las ~ras en un ano reciente no contaban con etiqueta de información nutrimental. Aproximadamente 113% de carnes ~ra desayuao y m¡.

o meno. 59% de productos para ptrros a1/1011a no taban con etiqueta de información nutrimcntal. ~ que si estos tres grupo de alímemos se combí 60% serian productos de sopas, 35% ~rían ca.mtS

desayuno y 5% serian ptrroj a1/1tnta. Un in' recibe de manera oculta un producto alimenticio de de estoi. tres grupos, y se le dice que el producto no ta con etiqueta de información nutrimental, Re\ probabilidades de que el producto sea de wpa. para desayuno. y un producto de perro) cal1tntes.

4.50 Una encuesta realizada por la serie de media hora "The Great American TV Poli", de Lifetime, p estadounidenses qué es lo que consideran ~ unre en sus vidas. Veintinue\"e por ciento "buena salud", 21% respondieron que "un mat feliz" y 40% conte.tó que "fe en Dio.': Debido a q:x le. preguntó cuál de estas cosas es lo mis imporwne.. entrevistado no podía seleccionar más de una r a. ¿Cuál es la probabilidad de que una persona

diera "un matrimonio feliz" o "fe en Dios"? b. ¿Cu.ti es la probabilidad de que una perwna

ra "un matrimonio feliz" o "fe en Dío6" o "buena c. ¿Cuál ~ la probabilidad de que una persona

diera "fe en Dios"? y "buena salud"? d. ¿Cuál e. la probabilidad de que una persona

diera ni "fe en Dios" ni "buena salud" ni "un monio feliz"?

ANÁLISIS DE LA BASE DE DATOS

l. En la base <le <lato•~ manufactura). ¿cuál o la probabi­ lidad de que una industria de Código SIC seleccionada al azar este en el grupo industrial 13> ¿Cuál es la probabili· dad de que una industria de Cód1~0 SIC seleccionada al .uar tenga un valor de embarque- 1ndu..tnalo de 4? ¿cuál es la probabilidad de que una industria de Código SIC seleccionada al azar esté en el grupo industrial 13 y tenga un valor de embarque. de industria de :?? ¿Cuál es la pro· babilidad de que una industria de Código SIC selecdo­ nada al azar esté en el grupo industrial 13 o tenga un valor de embarques de industria de 2? ¿Cuál es la proba­ bilidad de que una industria de Código SIC seleccionada al azar no cst~ en el grupo industrial 13 ni tenga un valor de embarques de industria de 2?

2. Utilice la base de dato> del ho pita!. Con•tnm matriz de valores sin procesar para la ~n y para • control. El estudiante debe obtener una matriz de i Con esta matriz. conteste 13) siguientes preguca (Consulte el capitulo 1 para miembros de cat ¿Cuál es la probabilidad de que un hospital selec • al aur es1~ en el Medio Oeste si se sabe que el persigue fines de lucro? Si se sabe que el ho.p1tal cm el sur, ¿cuál e. la probabilidad de que sea un hospiu! gobierno. no federal? ¿Cuál es la probabilidad de qac ho.pital esté en la región de las Rocallosas o sea un pita! que no persiga fines de lucro ni sea del gob ¿Cuál es la probabilidad de que un hospital persiga de lucro situado en California?

CASO: COLGATE-PALMOLIVE HACE UN ESFUERZO "TOTAL" A mcdia(b de la década de 1990, Colgatc-PalmolÍ\-c perí«cionó una nueva~ dentífrica para el mercado ot3douniderue, Da· mada Colga~ Total, con un ingrediente anu"bactcriano que ya se \'m<Üa muy bien en el extranjero. No obstante. la palabra annbac­ ttri.ino no era pcmulida para eso. producto. por w ~ de la Food and Drug Adminbuation. Por tanto. Colgate-Palmol.ivc lcnla que ~ugmr otra forma de vender ésta y otras aractcrísucas de <u

nueva pasu dental 1 consumidores en Esudos l.hüdo.. ~ im gadores de mercado dijeron a Colgate· PalmolM que '°' co dores estaban cansados de tratar de dístinguir entre w difí ventajas de varias marcas de pasta dental y deseaban <implifx> ción en sus vidas al comprar. En respuesta, se dio el no "Total" al producto en Estados Unidos: esta linica palabra~ sa que la pasta dental e> el paquete "total" de varios ben

Page 165: libro.pdf

Young & Rubicam inventaron varios comerciales que iii::suan los beneficios de Total y probaron los comerciales con ?::t!pOS de enfoque. Un comercial que vende los beneficios de h:-? duración de Total tuvo especial éxito. Entre tanto, en

.:- Colgate-Palmolive recibió aprobación de la FDA para IA:x::!J. cinco años después que la compañía lo había solicitado. E: producto fue lanzado al mercado en Estados Unidos en =de 1998 con el uso de comerciales que fueron diseñados '°"'ideas más exitosas de pruebas del grupo de enfoque. Siguió =campaña de anuncios impresos.

Antes de tres meses, la Colgate-Palmolive se apoderó de Ja _¡;r:icipación número uno del mercado de pastas dentífricas. ~meses después, 21 % de todas las casas en Estados Unidos é:L::;.an comprado Total por primera vez. Durante este mismo ~o. 43% de aquellos que inicialmente probaron Total la eeeapraron de nuevo. Colgate Total habla sido exitosamente =oclucida en el mercado estadounidense.

l. ¡Qué probabilidades se dan en este caso? Utilice estas probabilidades y las leyes de probabilidad, para deter­ minar qué porcentaje de familias en Estados Unidos compró Total por lo menos dos veces en los primeros 10 meses de su anuncio.

2. ¡Es la categoría de edades independiente de la volun­ tad de probar nuevos productos? Según la U.S. Census Bureau, aproximadamente 20% de todos los estadou­ nidenses están en la categoría de edades entre 45 y 64

CAPITULO 4 PROBABILIDAD 139

años. Suponga que 24% de los consumidores que compraron Total por primera vez durante el periodo inicial de 1 O meses eran de la categoría de edades de 45 a 64 años. Utilice esta información para determinar si la edad es independiente de la compra inicial de Total durante el periodo de introducción. Explique su res­ puesta.

3. Con el uso de las probabilidades dadas en la pregunta 2, calcule la probabilidad de que un consumidor esta­ dounidense seleccionado al azar tenga edad de 45 a 64 años o compró Total durante el periodo inicial de 10 meses. ¡Cuál es la probabilidad de que una persona seleccionada al azar comprara Total en los primeros 10 meses dado que la persona está en la categoría de 45 a 64 años de edad?

4. Suponga que 32% de todos los consumidores de pasta dentífrica en Estados Unidos vio los comerciales Total. De aquellos que vieron los comerciales, 40% compra­ ron Total al menos una vez en los primeros 1 O meses de su introducción. De quienes no vieron los comer­ ciales, 12.06% compraron Total al menos una vez en los primeros 10 meses de su introducción. Suponga que al azar se selecciona un consumidor de pasta den­ tífrica y se sabe que compró Total durante los primeros 1 O meses de su introducción. Revise la probabilidad de que esta persona vio los comerciales Total y la pro­ babilidad de que la persona no vio los comerciales Total

Page 166: libro.pdf

CAPÍTULO 5

Distribuciones discretas

OBJETIVOS DE APRENDIZAJE El objetivo general de aprendizaje del capitulo 5 es ayudar al estudiante a que entien­ da una categoría de distribuciones de probabilidad que produce sólo resultados dis­ cretos, con lo cual podrá: l. Distinguir entre variables aleatorias discretas y variables aleatorias continuas. 2. Saber cómo determinar la media y varianza de una distribución discreta. 3. Identificar el tipo de experimentos estadísticos que pueden ser descritos por la dis­

tribución binomial y saber cómo resolver esos problemas. 4. Decidir cuándo usar la distribución de Poisson al analizar experimentos estadísu­

cos y saber cómo resolver esos problemas. S. Decidir cuándo es posible calcular problemas de distribución binomial por medio

de la distribución de Poisson y saber cómo resolver esos problemas. 6. Decidir cuando usar la distribución hípergeometrica y saber cómo resolver esos

problemas.

140

Page 167: libro.pdf

El bueno y el malo de la imagen pública de la industria bancaria

En años recientes, la industria bancaria se ha enfrentado a numerosos desafíos y oportunidades. Una serie de quiebras bancarias debidas a la competencia dentro de la industria, opciones alternativas de banca, asl como mala administración y pérdidas financieras por préstamos hipotecarios riesgosos y otros préstamos a finales de la década de 1980 y principios de la de 1990, resultaron en una evidente calda en la confianza del consumidor en bancos. Hoy dla algunos lideres empresariales piensan que los bancos han perdido contacto con sus clientes y ya no tienen utilidad. Otros piensan que la percepción de los consumidores respecto a la industria bancaria ha mejorado en años recientes, en particular des­ pués que la industria experimentó tres años consecutivos de ganancias récord, ¿Cómo es vista real­ mente la industria bancaria por el consumidor?

Un estudio reciente efectuado por la GaUup Organization y encargado por la American 8anken A.ssociaúon entrevistó a 1 002 consumidores que actualmente hacen negocios con un banco. Los resul­ tados del estudio fueron mixtos y variados. La buena noticia para los bancos es que 80% de los usua­ rios consideraron que un banco es su institución financiera principal y que 65'16 estaban muy satisfecho) con su institución. Setenta y nueve por ciento dijeron que los bancos eran muy ímportanr~ para la salud de la economb y 64% pensaron que los bancos son más competitivos hoy que hace cinco afto-. Ochenta y siete por ciento de los entrevistados se sienten seguros con los cajeros automaticos, En el lado negativo, 41 % de qwenes hablan solicitado un préstamo a un banco dijeron que el proceso era muy dillcil. Cincuenta y dos por ciento de consumidores pensaron que no era apropiado que lo) bsncos cobraran comisiones por sus servicios y sólo 33% estuvieron decididamente de acuerdo con que los servicios bancarios representa­ ban buen valor para el dinero. Aun cuando 87% pensaron que los banqueros deberían interesarse por sus comunidades,sólo 31% estuvieron de acuerdo con que asl lo hacen lo) bancos. Sólo 29% estuvieron de acuerdo con que lo) bancos son Oexibles para satisfacer las necesidades financieras de los consumidores,

Algunos otros datos encontrados en el estudio incluyeron lo siguiente: 39% de todos los consumi­ dores d1~ron que la comodidad es la razón más importante de mantener una ~)ación en su institución financiera principal, seguida por un servicio amable o bueno ( 19%), relación duradera (14% ), emisión de cheques ahí ( 11%), y buenas tasas de interés por préstamos ( 11 %). El mal servicio a clientes encabezó la lisia de las razones por las que el público cambió o consideró cambiar de insmuciont) financieras principales ( 19%), seguida por cambio de domicilio ( 18%), cambios en comisiones o servicios ( 18%), was de interés ( 16%) y comodidad/ubicación ( 13%).

Preguntas gerenciales y estadísticas

l. Este estudio fue efectuado en iodo el país por la Gallup Organization, En opinión del lector, ¿estos estudios son caracterísncos de su regién geoglifica, en Estados Unidos o de consumido­ res financieros de otros paises?

2. El estudio sugiere que 80% de iodos los consumidores financieros consideren u banco como b institución financiera principal. Si suponemos que el estudiante selecciona al azar 25 amsu:nído­ res financieros en su comunidad, ¿cuál es la probabilidad de que 18 o m.h de estos consu:nidorcs considere que su banco es la insutucién financiera principal s1 80% se alcanza en su cocmz::idad?

3. Segun el estudio, 65% de iodos los consumidores financieros estan mur sansf«hos con StJ ms­ mución principal. Suponga que al azar se seleccionan 15 consumidores ~con base en las cifras del estudio. ¿cuál es el número esperado de estos 15 que esún mur sausfo:hos con su institución principal?

4. Suponga que efectuamos un estudio local de 32 consumidom de instituciones bancarias y encontrarnos que 26 se sienten seguros de usar caje~ autcmáucos, Si al azar seleccionamos i de estos 32 para hacer algunas entrevistas adicionales, ¿cuil es la probabilidad de que ex.act.t­ mente 4 de los 7 se sientan seguros de usar cajeros au1omatícos?

141

Page 168: libro.pdf

S. Un banco realiza un estudio de tránsito de dientes para determinar modelos de llegadas de 10 am a 11 am en días hábiles. Los resultados muestran que, en promedio. cada dos minutos lle­ gan al banco 3.8 dientes. Con base en ola información, •uponga que al azar se selecdona uo periodo de dos minutos; ¿cuál es la probabilidad de que no lleguen clientes durante este tiem· po? ¿Cuil es la probabilidad de que más de cinco dientes lleguen en este periodo de do> minu­ tos? ¿Cuál es la probabilidad de que menos de tres dientes lleguen en un intervalo de cuatro minutos escogido al azar?

En experimentos estadtsticos que abarcan probabilidad, los resultados ocurren de manera aleato­ ria. Suponga, como ejemplo de este tipo de éxpcrimen10. que un fabricante de baterías selecciona a! azar tres baterías de un lote grande de para probar su calidad. Cada batería seleccionada ha de dasifi. carsc como buena o defectuosa. las baterías están numeradas de 1 a 3, una batería defccruosa se designa con una D. y una bateria buena se designa con una G. Todos los posibles resultados se muestran en b tabla 5.1. La expresión, Dt G2 03, denota un resultado panicular en el que la primera y tercera bateri· as son defectuosas y la segunda barería es buena. En este capitulo examinamo las probabilidades de distintos resultados que pueden ocurrir con tipos paniculares de experimentos.

5.1 DISTRIBUCIONES DISCRETAS CONTRA CONTINUAS

Una variable aleatoria e una variablt que cont1t11t los resultados dt u11 experinmuo de probabilidad. Por ejemplo. suponga que un experimento es medir las llegada• de automóviles a una caseta de autopista durante un periodo de JO segundos, W• posíbles resuhados son; O, 1, 2, ••• , n automóviles. Esto núme­ ros (O. 1, 2, .•• ,n) son los valores de una variable aleatoria. Suponga que otro experimento es medir d tiempo mire la terminación de do. 1rabaio• en una linea de producción. Los valores van a variar de O scgundos a n segundos. Esw mediciones de tiempo son los valora de otra variable aleatoria. las dos Cllttb(lrlas de \Wbks aleatorias son:

(1) variables aleatorias dismtas (2) \""Uiablcs aleatoria. continuas

Una ,-uiabJe aleatoria es una variable aleatoria discreta s1 ti conjunto dt todos los poHblts ~·alom a a lo sumo un finito o un mimtro contablememe mfimto ele posibles valora. En l:a$Í todas las 'itu~ nes csudistkas, las variables aleatorias discretas producen valores que son números enteros no negau­ '"OS· Por ejemplo. si $á5 personas se seleccionan al aur de una población y se ha de determinar cu~nw de las seb son zurdas, la variable aleatoria producida es discreta. W$ único. números posibles de zur­ do. de la muestra de seb son 0, 1, 2, 3, 4, S y 6. No puede haber 2.75 zurdo) en un grupo de se~ perso­ nas; obtener valores de números no enteros e) imposible. Otros ejemplos de experimentos que dan '-ariable$ aleato~ discretas incluyen los siguientes:

l. Seleccionar al azar 25 pc™>nas que consuman bebidas gaseosa. [refrescos) determinar cuántas prefieren bebidas de dieta.

2. Determinar el número de defecto) en un lote de SO artículos, 3. Contar el número de personas que lleguen a una'rienda durante un periodo de

TABLA 5.1

Todos los posibles resultados para el experimiento de la bate ria cinco minutos.

4. Muestrear 100 votantes registrado) y determinar cuánto. votaron por el pre.idnu en la última elección.

El experimento de la batería descrito al principio del capítulo produce una distribu­ ción que tiene resultados discretos. Cualquier intento del experimento contendrá O, I, 2 o 3 baterías defectuosas. No o posible obtener 1.58 baterías defectuosas. Podria decirse que las variables aleatorias discretas suelen generarse en experimentos en los que ta. cosa. se "cuentan", no se miden.

Las variables aleatorias continuas, toman valores t11 cada punto. t11 un íntavalo cüuh En esta forma, las variables aleatorias continuas no tienen brechas o valores no tomados..

Gi Gz G, D, Gz G, G, o, G, Gi Gz o,

°' o, G, o, Gz o, G, o, o, º• o, o,

Page 169: libro.pdf

CAPITULO S DIST!UBUQOSES DlSCRETAS 143

Podrla decirse que las variables aleatorili conunuas se generan en experimentos en lo> que I~ c~ se "miden'; no se "cuentan" Por ejemplo. si una persona otá ensamblando un componente en un produc­ to, el tiempo que tarda en lograr este objetivo podría ser cualquier valor dentro de un lapso razonable, como podría ser tres minutos 36.4218 segundos o 5 minuto> 17.5169 segundos. Una lista de medidas para las cuales se podrían generar variables aleatorias continuas incluirla el tiempo, altura, peso y volu­ men. Otros ejemplos de experímentcs que dan va!Ubles altatorias continuas incluyen lo siguiente:

l. Muestrear el volumen de nitrógeno líquido en un tanque. 2. Medir el tiempo entre llegadas de clientes a una tienda de venta al menudeo. 3. Medir las longitudes de automóviles recién diseñados, 4. Medir el peso de granos en un elevador en diferentes puntos de tiempo. Una va medidos y registrados los datos conunuos se convienen en datos discretos porque se

redondean a un numero discreto. Por tanto. en b pr4ctica casi todos los datos son discretos; sin embar­ go. el análisis de datos se facilita mucho si se usan distribuciones continuas en datos que originalrnen­ te eran continuos.

Los resultados de variables altato~ y sus probabilidades asociadas se pueden organizar en distri­ buciones. Los dos tipos de distribuciones son distribuciones discretas, construidas d« variablts a/tato· rias diserttns y distribuciones continuas. basadas en vanablts altaronas co111i1mas. Las distribuciones discretas incluyen la distribución binomial, distribución de Poi son y distribución hipergeométrica, Las distribuciones continuas incluym la distribución normal, distribución uniforme, distribución expo­ nencial, distribución r, distribución ji cuadrada y distribución F. En este capítulo vamos a explorar dís­ tribuciones discretas. El capitulo 6 aborda distribuciones continuas.

i2 DESCRIPCIÓN DE UNA DISTRIBUCIÓN DISCRETA ¿Cómo podemos describir una distribución discreta~ Una forma es construir una grtfica de la distri­ bución y estudiar la gráfica. En el capitulo 2 se realizó el análisis de algunos tipos de grtficas que podrían ser suficiente para este trabajo. incluyendo el histograma y polígono de frecuencia. El histograma, o gr4· fica de barras verticales es probablemente la forma de grtfica más común para describir una distnbu­ ción discreta. No obstante, algunas distnbuciones contienen resultados sólo para cienos puntos de dato$ y dejan un vacío entre valoro. Por tanto. el histograma que se emplea a veces contiene lmeas delgadas en lugar de barras o rectángulos.

Observe la distribución discreta de la tabla 5.2. Una ejecutiva esú considersda en un viaje de nego­ cios fuera de la ciudad para un viernes dado y reconoce que podría ocurrir al menos una crisis el dia que salga y está preocupada por esta posibilidad. En la tabla 5.2 se muestra una distribución discreta que con· tiene el número de crisis que podrían ocurrir durante el día que salga y la probabilidad de que ocurra cada número. Por ejemplo, existe 0.37 de probabilidad que no ocurra crisis, 0.31 de probabilidad que haya una, y asl sucesivamente. El hi.tograma de la figura 5.1 describe la distribución dada en la tabla 5.2. Nótese que el eje x del histograma contiene los posibles resultados del experimento (numero de cnsis que podrlan ocurrir) y que el eje y contiene las probabilidades de que éstas ocurran.

Resulta evidente en el estudio de la gráfica de la figura 5.1, que el numero mis proba· ble de crisis es de O o 1. Además. podemos ver que la distribución es discreta y qix no se muestran probabilidades para valores entre bs cruis de valoro enteros. Ull.l 5.2

Distribución discreta de sucesos Media, varianza y desviación estándar de distribuciones discretas ee crisis diarias

¿Qué otros mecanismos se pueden usar para describir distribuc._:io ... ....cm-.. ~ de describirbs grtficamente? Las medidas de tendencia central y medidas de ''ariabilicbd estu­ diadas en el capitulo 3 para les datos agrupados pueden aplicar-e a d1S1nbudon~ díscre­ tas para calcular la medía, la •-arianz.a y la des'"iación estándar. Cada una de csu. medida> descriptivas (medía, ,-añanz¡ y desviación estándar) se caJcu)¡ en dati» agru~ median· te el uso del punto medio de clase como el valor para representar 1o$ datos del intervalo de clase. Con distribuciones discretas, el uso del punto medio de clase no es necesario porque el valor discreto de un resultado (O, 1, 2, 3, ••• ) se usa para representarse a >I mismo. Por tanto, en lugar de usar el valor del punto medio de clase (,\f) para calcular ot~ medidas

.. , , .. , .37 .ll .ll .t/t ,04

.Ol

Page 170: libro.pdf

144 ESTADISTICA EX LOS NEGOCI~

Histograma MINITAB de distribución discreta de datos de crisis

TABLA 5.3 0.4 0.37

0.31 0.3

0.2 0.18

0.1 0.09

1 0.04

1 0.01 o.o 1

o 2 3 .. 5 Número de crisis

C61culo de la media de los datos de crisis

• IW •·M o .J1 JIO 1 .JI .JI 2 11 ..J6 3 • .rt 4 .M 16

' .Ol .IS Ilir JI(&)) - 115

fj• 115.W.

descnpuvas para datos agrupados, se U'.Qn los resultados (x) del experimento discreto. Al calcular e5W medidas descriptivas en datos agrupados, la frecuencia de cada inten-alo de clase se wa para valorar d punto medio de clase. Con analísis de distribución discreta, la probabilidad de cada ocurrencia se wa como el valor.

Valor medio o esperado

El valor medio o esperado de una distribución discreta es ti promedio a largo plazo dt sumos. Debemos saber que cualquier intento de usar una variable aleatoria discreta proporciona wlo un resultado; ~in embargo, si el proceso se repite suficientemente (el juego se realiza en tiempo suficiente), el promedio de los resultado es mis probable que se aproxime al promedio a largo plazo, valor esperado o valor medio. Este valor medio, o operado. se calcula como sigue:

VALOR MfDIO O ESPERADO DE USA DISTRlBUCJON DISCRETA

µ • E(x) • ![x · P(x)] donde

E(x) = promedio a largo pino x = un resultado P(x) = probabilidad de ese resultado

Como ejemplo, calculemos el valor medio o esperado de la distribución dada en la tabla 5.2. Véase en la tabla 5.3 los valores resultantes. A largo plazo, el número medio o esperado de crisis en un vier­ nes dado para esta ejecutiva es 1.15 crisis. Por supuesto, la ejecuti\-a nunca tendrá 1.15 crisis.

Varianza y desviación estándar de una distribución discreta

La varianza y desviación estándar de una distribución discreta se despejan con el uso de los resultados (x) y probabilidades de resultados [P(x)] en forma semejante a la de calcular una media. Ademú. los álculos de varianza y desviaciones estándar usan la media de la distribución discreta, Véase la fórmula para calcular la varianza.

VAJUANZA DE UNA DISTJUBUOON DISCRETA

q2 • :Wx -µ)2. P(x)] donde

x = un resultado P(x) = probabilidad de un resultado dado µ = media

Page 171: libro.pdf

tulA 5.4

de varianza V ~n estándar en datos

cnsis

CAPITULO S OISTll1Bl'CIO~E5 OLSCRETAS 14S

o (O- Ll5)2 • l.3l (1-115>2. Jl2 <2-115>2• .n (J-1 15>2. J.42 (4-1.15>2• 1.12 (5- 1.15>2. 14.12

(l.J2)(.J7) • .. (UZX.JI)• Al (G.72X lt) • u (MJ)(MJ• .JI Cl.12)(.IM) - .J2

04.12X.OU • 15 E[~ - 1'>2 • P(.)J • IAI

La wriama de r = El~·p)l · ~)J • IAI

La...,_adacllra v-JLii•l.19 aW1

2 .JI

••• 4 5 .01

La desviación estándar se calcula luego al tomar la rafz cuadrada de la varianza.

Db>1ACJON EST.o\.,'DA.R DE UNA DISTllBUClON Dt~

u= J~<x-¡1)2 • P(x)I

La varianza y desviación es1.tndar de los datos de crisis de la tabla 5.2 se calculan y muestran en la tabla 5.4. La medía de los datos de crisis es 1.15 crisis. La desviación estandar es 1.19 crisis, y la varian­ za es 1.41.

PROBLEMA DE DEMOSTRACIÓN

5.1

Durante una temporada de vacaciones, la loterfa de Texas llevó a cabo un juego llamado Stocking Stuffer. Con este juego, habla premios totales de $34.8 millones al instante en 70 millo­ nes de billetes de $1, con precios de billetes de $1 a $1 000. A continuación observe los diversos premios v la probabilidad de ganar cada uno de ellos. Utilice estos datos para calcular el valor esperado del juego, la varianza v la desviación estándar del juego.

Premio l.wl Probebllidad P(.wl $1000

100 20 10

4 2 1 o

.00002

.00063

.00400

.00601

.02403

.08877

.10479

.77176

Solud6n

La media se calcula como sigue.

Premio l.wl 1t·Pl.wl $1000

100 20 10 4 2 1 o

.00002

.00063

.00400

.00601

.02403

.08877

.10479

.77176

.02000

.06300

.08000

.06010

.09612

.17754

.10479

.00000 P(x)] • 60155 Ux

µ. - E¡x¡ • Ux· P\xJ) • 60155

La recompensa esperada por un billete de $1 en este 1uego es 60 2 centavos. Si una perso­ na juega durante largo tiempo, puede esperar un promedio de alrededor de 60 centavos en ganancias.

Page 172: libro.pdf

146 ESTADISTICA E.'\ LOS 1''EGOCI~

A largo plazo, el panicipante perderá más o menos Sl.00 - .602 • .398, o sea unos 40 centavos por juego. Desde luego, un individuo nunca ganará 60 centavos en ningún juego.

Con el uso de esta media, µ. - .60155, la varianza y desviación estándar se puede calcular como sigue.

lt ,.,.., (1t- µ12 (1t - µ.12. ,.,.., $1000 .00002 99879126190 1997595

100 .00063 9680.05186 -ó22443 20 .00400 376.29986 -1.50520 10 .00601 88.33086 --0.53067 4 .02403 11.54946 --0.2n53 2 .06877 1.95566 --0.17360 1 .10'79 o .77t76

0.15876 --0.01664 --0 27927

Dlx- 1112 • PIMll • 2898349 ~ • Dlx • µ)2 PIMll • 28.98349

"= J;r = Ju1x - µ.12 • Plxll J28.98349 = 5 38363

0.36186

5.1 PROBLEMAS

La varianza es 28.98351 (dólares)2 y la desviación estándar es $5.38.

S.l Determine la media, varianza y desviación estándar de la siguiente distribución discreta.

X P(x)

.. 238 290

3 .1;; 4 .ISS 5 .u;

5.2 Determine b media, varianza y desviación estándar de la siguiente distribución discreta.

" 1'!1tl o .IOJ

.11 2 .246 3 .229 4 .13. 5 .<194 6 .Oil i .001

S.3 Los siguientes datos son el resultado de un estudio histórico del número de defectos encontradCll en una tau de porcelana producida por una empresa fabricante. Utilice estos datos y las pro lidades asociadas para calcular el número esperado de defectos y la desviación estándar defectos.

Dd'tctos ProbebWdad o .461 1 .285 2 .129 3 .087 4 .038

Page 173: libro.pdf

CAPIT\;LO 5 DISTIUJIUOO:"-'E~ Dl~AS 147

S.4 Suponga que 20% de la población de una ciudad prefiere Pepsi-Cola como su refresco favorito. Si al azar se escoge una muestra de seis personas, el número de quienes toman Pepsi podría variar de cero a seis. A conúnuación se ven los posibles números de quienes toman Pepsi en una mues­ tra de seis personas y la probabilidad de que ese número de quienes toman Pepsi se presente en la muestra. Utilice los datos para determinar el número medio de quienes toman Pepsi en una muo· tra de seis personas de la ciudad y calcule la desviación estándar.

Númtt0 de quienes toman Pq)si Probabilicbd o 262

.393

.246

.082

.OIS

.002

.000

2 3 4 s 6

DfSTRIBUCIÓN BINOMIAL Qu1ú la más ampliamente conocida de todas las distribuciones discretas es la distribución binomial, que se ha empleado durante siglo). Vari.15 suposiciones e¡tán detrás del uso de la distribución binomial:

• El experimento comprende n pruebas idénticas, • Cada prueba tiene sólo dos posibles resultados denotado) como wto o fracaso. • Cada prueba e> independiente de las pruebas anteriores. • lo) términos p y q permanecen constantes en todo el experimento. donde el término p es

la probabilidad de obtener un éxito en cualquier prueba y el término q • ( 1 - p) es la pro· babilidad de obtener un fracaso en cualquier prueba.

Como indica la palabra binomial, cualquier prueba individual de un experimento binomial con­ tiene sólo dos po ibles resultados, que se marcan como bcito o fracaso. Por lo general, el resultado de in terés al investigador se marca como txito. Por ejemplo, si un analista de control de calidad busca pro­ duetos defectuosos, pod.ria considerar que un producto defectuoso tuviera wto aun cuando la compa­ día no considerarla como wto un producto defectuoso. Si los investigadores están estudiando personas zurdas, el multado de encontrar una en una prueba de un experimento es un mto. El otro po'ible resultado de una prueba en un experimento binomial se llama fracaso. La palabrafriicaso se 11$3 ~en oposmón a txito. En los experimentos precedentes, un fracaso pod.ria ser obtener una pieza aceptable (opuesto a una pieza defectuosa) u obtener una persona derecha (opuesto a una persona zurda). En un experimento de distribución binomial, cualquier intento puede tener sélo dos resultado) posibles, mutuamente excluyentes (derecho/zurdo. defectuoso/bueno, hombre/mujer, etcttera ).

La distribución binomial es una distribución d.íscreta. En n pruebas, sólo x bito) son po,ibJes, doode x es un número entero entre O y n. Por ejemplo, si al azar se seleccionan cinco piezas de un lote. sólo son po)ibles o. l, 2, 3, .¡o 5 piezas defectuosas en b.l muestra. En una muestra de cinco pieus. obtma 2.714 piezas defectuosas no es posible, ni lo es obtener ocho piezas defectuosas.

En un experimento binomial, las pruebas deben ser independientes. Esta restriccíén signifia qix el experimento por naturaleza produce pruebas independiente> (por ejemplo lanzar al aire monedas o tirar dados) o el experimento se realiza con restitución. El efecto del requisito de prueba indepmdlentc es que p. la probabilidad de obtener un bllo en una prueba, permanece constante de una prueba a oua. Por ejemplo. suponga que 5% de todas las piezas de un recipiente estan defectuosas, La p:obabilidad de sacar una pieza defectuosa en el primer intento es p • .OS. Si la primera pieza saada no se resntu­ ye, la ~unda pieza que ~ saque no es independiente de la primera. r el \-alor p a.mbWá para el siguiente saque. La distribución binomial no toma en cuenta p para cambiar de prueba en prueba den­ tro de un experimento. Sin embargo, si la población o grande en comp.vación ron d wna1lo mues­ tra!, el efecto de muestrear sin sustitución es mlnimo y la suposición de independencia se satisface en esencia, o decir, p permanece relativamente constante.

Page 174: libro.pdf

148 ESTADISTICA e; LOS SECOCIOS

En general, si el tamal'lo muestral, "· e menor a 5% de la población, la suposición de indepen­ dencia no e. para inquietarse. Por tanto, el tamaño muestra! aceptable para u-ar la distribución bino­ mial con muestras tomadas sin restitución es

ti< 5%.'\'

Donde: t1 • tamailo muestra! N • tamallo poblacional

Por ejemplo, suponga que 10% de la población del mundo es zurda y que al azar se selecciona una muestra de 20 personas de la población del mundo. Si la primera persona selec.cionada es zurda, y el mues­ treo se realiza sin restitución, el valor de p = .10 prácticamente no multa afectado porque la población del mundo es tan grande. Además, con muchos experimentos la población se reabastece continuamente incluso cuando se realiza el muestreo. Esta condición es a veces el caso con muestreos de control de cali­ dad de producto) de lotes grandes de producción. A continuación veamo algunos ejemplos de pro­ blemas de distribución binomial.

l. Suponga que una máquina que produce chi~ de computadora produce 6% de piezas defec­ tuosas, Si una compañía compra 30 de estos chip~ ¿cuál es la probabilidad de que ninguno ~ defectuoso!

2. Un estudio de hica sugiere que 84% de las compailías en E>tad06 Unido tienen código de ética. De una muestra tomada al azar de IS companías, ¿cu.\l e> la probabilidad de que al meno. 10 tengan un código de ética?

3. Suponga que la marca X de baterías para automóviles tiene una participación de 35% del mer­ cado. Si al azar se seleccionan 70 automóviles, ¿cu.\l es la probabilidad de que al menos 30 automóviles tengan una batería de la marca X?

4. Un estudio encontró que casi 67% de agentes de compras de una compailla dijeron que su compañia tenía programas para compradores preferidos. Si al azar se toma una muestra de SO comparuas, ¿cu'1 es la probabilidad de que 40 o más tengan compailias con programas para compradores preferidos?

Resolución de un problema binomial Un estudio de reubicación de administradores hecho por Runzheirner International permitió ver \"ari.u razones por l.u que los trabajadores se niegan a aceptar ofertas de reubicación. En la lista están incluí· das coasideraciones de familia, razone financieras y otras. de '°' cuales 4% de quienes contestaron dijeron que rechazan ofertas de reubicación porque recibían muy poca ayuda para su reubicación, Supor.p.mos que cinco trabajadom que acaban de rechazar ofertas de reubicación se seleccionan al azar y son entrevistado . Si se supone que 4% se cumple para todo lo> trabajadores a quienes se ofrece rtubicación. ¿cuál es la probabilidad de que el primer trabajador entrevistado rechace la oferta debido a la poca ayuda que recibió para su rtubicación y los siguientes cuatro trabajadores rechacen la oferta por otra> razones?

Representemo con T la poca ayuda para su reubicación y con R otras razones. La secuencia de entrevistas para este problema quedaría como sigue:

T¡. Rz, R,, ~. R~

la probabilidad para obtener esta secuencia de trabajadores se calcula con la regla especial de la multiplicación para eventos independientes ($i se supone que los trabajadores se seleccionan indepen­ dientemente de una gran población de trabajadores). Si 4% de 105 trabajadores que rechazan ofertas <k reubicación lo hacen porque reciben muy poca ayuda, entonces la probabilidad de que una persona seleccionada al azar y que rechace ofertas de reubicacién por ba razón es O.o.&, que es el valor de p. El otro 96% de lo trabajadores que rechacen ofertas de reubicación lo hacen por otras razones, Por tanto, la probabilidad de seleccionar al azar un trabajador que rechace ofenas de reubicación por otras razo­ nes quedaría entre 1 -O.o.& ... 96, que es el valor de q. la probabilidad de obtener e$la secuencia de cinco trabajadores que han rechazado ofertas de rtubicación ~ria:

P(T1 n R2 n RJ n ~ n R5> • (.o.&)(.96)(.96)(.96)(.96> = .03397

Page 175: libro.pdf

CAJ>m.11.0 S DbTIUBOOOSES DISCRETAS 149

Ob\iammte, en la sckcción al aur de trabajadores que rechazaron ofertas de reubicación, debido a que recibieron muy poca ayu~ para su reubicación podría ser el segundo trabajador o el tercero o el cuarto o el quinto. A continuación \UJnOS todas las ~iblcs secuencias para obtener un trabajador que rtdwa· ra la reubicación por la poca ayu~ que recibió y cuatro trabajadores que la rechazaron por otras razone>

T¡. R2. R3, R.. s, R¡, T2. R3, R.. Rs R¡, R2, T3, R.. Rs R1, R2. R,, T4, Rs R¡, R2, R3, R.. r,

La probabdidad de que cada una de estas secuencias se presenta se calcula como sigue: (.04)(.96)(.96)(.96)(.96) - .03397 (.96)(.04)(.96)(.96)(.96) - .03397 (.96)(.96)(.04)(.96)(.96) ... 03397 (.96)(.96)(.96)(.04)(.96) - .03397 (.96)(.96)(.96)(.96)(.04) - .03397

Nótese que en cada caso la probabilidad final es la misma. Ca~ una de las cinco secuencias tienen el producto .04 y cuatro veces .96. La propiedad conmutativa de la muluplicación toma en cuenta el reordenamiento de las cinco probabilidades individuales en cualquier secuencia. Las probabüídades en eada una de las cinco secuencias pueden reordenarse y resumirse como (.04)1(.96)•. Cada secuencia contiene las mismas cinco probabilidades, lo cual hace innecesario \'OIVl!r a calcular la probabilidad de cada secuencia. Lo que sf es imponante es determinar CIÚ!ltaS deferencias de secuencias se pueden for­ mar y multiplicar con esa cantidad por la probabilidad de que se presente una secuencia. Para las cinco secuencias de este problema, la probabilidad total de obtener exactamente un trabajador que rechace la reubicación por la poca ayu~ recibida para su reubicación, en una muestra aleatoria de cinco trabaja­ dores que rechazaron ofertas de ubicación es:

5(.04)1(.96)4 - .16985 Una forma más fácil de determinar el número de secuencias es realizar una lista con todas las posi­

bilidades y usar combinaciono para calcularlas. (El concepto de combinaciones se introdujo en el capl­ tulo 4.) Cinco trabajadores se muestrean, entonces n • 5 y el problema es obtener un trabajador que rechazó una oferta de reubicación debido a la poca ayu~ recibida para su reubicación, x • 1. Por tanto, ,.Cx dará el número de formas posibles para obtener x áitos en n intentos. Para este problema, 5C1 es el número de secuencias de posibilidades.

5! sC1 = l!(5 _ !)! = 5

Al ponerle un valor a la probabilidad de una secuencia con la combinación se obtendrá.

5C1(.04J•(.96)• = .16985

Cuando se usan combinaciones se simplifica la determinación de las secuencias que son posibles para cieno valor de x en una distribución binomial.

Ahora suponga que 70% de los estadounidenses piensan que limpiar el medio ambiente es un pro­ blema importante. ¿Cu.ti es la probabilidad de muestrear al aur cuatro estadounidense) r tener aac­ tameme dos que digan que limpiar el medio ambiente es un problema importante? Representereos por E el bito de obtener una persona que piense que limpiar el medio ambiente es un problenu in:por· tante. Para este ejemplo. p • .70. Representemos por N el fracaso de no obtener una persona q\lt piense que limpiar es un problema importante (N denota no importante). La probabilidad de obtener um & estas personas es q • .30.

Ahora veamos las diversas secuencias para obtener dos E en una muestra de cuatro.

E,, E2. N,, N4 E,, Nz, E,, N4 E,, Nz, N3, f. N1, Ez, E,, N4 N1, E2, N,, E. N1, N2, E3, f.

Page 176: libro.pdf

ISO ESTADISTICA E." ~Nl!GOCIO:.

~ ~xilO) en una muestra de cuatro pueden ocurrir en seis formas. Con el uso de combinaciones, el numero de secuencia> es

La probabilidad de seleccionar cualquier secuencia individual e :

(.70)2(.)0)2 - .04-41

Por umo, la probabilidad tolal de obtener exactamente dos personas que piensen que limpiar el ambiente es importame, de cuatro personas seleccionadas al azar, cuando 70% de los estadounidenses piensan que limpiar el ambiente es importante, seria:

4C2(.70J2(.30)2 • .2646

Si generalizarnos a panir de estos do) ejemplos obtenemos la fórmula binomial, que se puede usar para resolver problemas binomiales.

FÓRMVl.A BlNOMIAL

donde n' P(xl • ftCx· r· q"-"- --·- · r · 'l"-" xl(n - xi!

11 •número de intentos (o número que se muestrea) x • número de éxitos deseado p • probabilidad de obtener un éxito en un intento q • 1 - p • probabilidad de obtener un fracaso en un Intemo

PROBLEMA DE DEMOSTRACIÓN - ., ) ..

PROBLEMA DE DEMOSTRACIÓN

5.3

La fórmula binomial resume los pasos presentados hasta aquí para resolver problemas binomiales. La fórmula permite la solución rápida y eficiente de esto· problemas.

El estudio de Gallup analizado en el Dilema de decisión encontró que 65% de los consumidora financieros estaban muy satisfechos con su institución financiera principal. Si esta cifra todevi.¡ se cumple, suponge que al azar se muestrean •O consumidores financieros. ¿Cuál es la proba­ bilided de que exectamente 23 de los •O estén muy satisfechos con su insutución finenciera prin­ cipal?

Solud6n

El valor de pes .65 (muy satisfechos). el valor de q • 1 - p • 1 .65 .35 (no muy satisfechos!, n • •O y x 23. Con la fórmula binomial se obtiene la respuesta final:

.oC23(.65)23(.35)11 - 188732378800)(.0000'9775)(.000000018) • .078•

Si 65% de los consumidores financieros están muy satisfechos, alrededor de 7.8•% del tiempo el investigador obtendrla exactamente 23 de los •o consumidores finencieros que estan muy satisfechos con su institución financiera. Las probabilidades están contra obtener 23 de los '° consumidores financieros que al azar están muy satisfechos con su institución financiera ¿Cuántos consumidores muy satisfechos serla posible obtener en •O consumidores financieros seleccionados al azar? Si 65% de los consumidores financieros están muy satisfechos con su ins litución financiera principal, uno esperaría obtener alrededor de 65% de •O o sea (.65H•O> • O 2! consumidores financieros muy satisfechos. En cualquier muestra individual de •O consumidores financieros, el número de los que están muy satisfechos es probable que difiera de 26. En pro­ medio. el número esperado es 26. Un investigador que de '° obtenga 23 consumidores fina!\o cieros muy satisfechos puede ver este número en vista de los 26 que esperarla.

Según el U.S. Census Bureau, aproximadamente 6% de los trabajadores en Jackson, Mississippt. están desempleados. Al llevar a cabo una encuesta al azar y por te16fono en Jackson, ¿cuál es la probabilidad de obtener dos o menos trabajadores desempleados en una muestra de 207

Page 177: libro.pdf

P!OILEMA DE JIEMOSTRACIÓN

5.4

CAPITULOS OlSTlUBUOO'-"ESOl~AS 151

Soluc:l6n Este problema debe resolverse como la unión de tres problemas: 1) cero desempleados, x • O 21 un desempleado, x .. 1 31 dos desempleados, x • 2. En cada problema, p • .06, q • .94 y n • 20. De la fórmula binomial se obtiene el siguiente resultado:

x•O 20Co!.06)0(.94)20

.2901

XM1 20C1(.061º(.94) 11

.3703

x•2 20C21.06)2(.94)18

2246 - .8850 + +

+ +

Si 6% de los trabajadores de Jackson, Mississippi, est6n desempleados, el encuestador por teléfono obtendrla cero, uno o dos trabajadores desempleados 88.5% del tiempo en una mues· tra aleatoria de 20 trabajadores. El requisito para obtener dos o menos se satisface al obtener cero, uno o dos trabajadores desempleados. Entonces, este problema es la unión de tres proba· bilidades. Siempre que se use la fórmula binomial para resolver éxitos acumulativos (no un número exacto), la probabilidad de cada valor x debe resolverse y sumarse a las probabilidades. Si un estudio real produjo tal resultado, servirla para validar las cifras del censo.

Uso de la tabla binomial Cualquier persona que resuelva suficientes problemas binomiales empezará a reconocer que la proba· bilidad de obtener x '"' 5 éxitos de un tamaño muestra! den • 30 cuando p = .10 es la misma sin importar si los cinco éxitos de personas zurdas, piezas defectuosas. compradores de marca X o cual­ quier otra variable. Si la muestra comprende personas, piezas o productos no impona en términos de las probabilidades finales. La esencia del problema es la misma: n = 30, x = 5 y p = .1 O. Al reconocer este hecho, expertos matemáticos construyeron un conjunto de cuadros binomiales que contienen pro­ babilidades resueltas previamente.

Dos parámetros, n y p, describen o caracterizan una distribución binomial. Las distribuciones binomiales en realidad son una familia de distribuciones. Todo valor diferente den y/o todo valor dife· rente de p proporciona una distribución binomial diferente, y existen cuadros para varias combinacio­ nes de valores n y p. Debido a limitaciones de espacio, los cuadros binomiales presentados en este texto son limitados. La tabla A.2 del Apéndice A contiene cuadros binomiales, cuadros encabezados por un valor den. Nueve valores de p se presentan en cada con la tabla tamaño n. En la columna situada abajo de cada valor de p está la distribución binomial para esa combinación den y p. La tabla 5.5 contiene un segmento de la tabla A.2 con las probabilidades binomiales para n • 20.

Resuelva la probabilidad binomial para n 20, p • .40 y x • 10 con el uso de la tabla A.2, Apéndice A.

Solucl6n Para usar la tabla A.2. primero hallamos el valor de n. Como n • 20 para este problema se puede usar la parte de los cuadros binomiales que contienen valores para n • 20 represen-.-dü en la tabla 5.5. Una vez localizado el valor de n, busque el valor apropiado de p horilona!meme en la parte superior dla tabla. En este problema, p M .40. La columna bajo O '° contiene las proba· bilidades para la distribución binomial den - 20 y p • 40 Para obtener la probabílidad de x • 10, encuentre el valor de x en la columna de la extrema izquierda y localice la probabilidad en el eua­ dro la intersección de p • .40 y x • 10. La respuesta seria 0.117. Si se resuelve este problema con la fórmula binomial se obtiene el mismo resultado.

Page 178: libro.pdf

152 ESTADISTICA E.~ l..05 !'IE(;()(.'IOS

PROBLEMA DE DEMOSTRACIÓN

5.5

Según lnformation Resources, la cual publica datos sobre participación del mercado para varios productos, Oreos controla alrededor de 10C!I. del mercado de marcas de galletas. Suponga que de la población se seleccionan al azar 20 compradores de galletas. ¿Cu61 es la probabilidad de que menos de cuatro compradores escojan Oreos?

Soludón Para este problema. n • 20, p • .10 y x < 4. Como n • 20, la parte de los cuadros binomiales representada en la tabla 5.5 se puede usar para resolver este problema. Busque a lo largo de la fila de p valores para 0.10. Determinar la probabilidad al obtener x < 4 comprende sumar las probabilidades para x • O, 1, 2 y 3 Los valores aparecen en la columna x en la intersección de cada valor 1<Y p 10.

Velo." o 1 2 3

.122

.270

.285

.190 lx< 4) • .857

Sí 10% de todos los compradores de galletas prefieren Oreos y 20 compradores de galletas se seleccionan al azar, alrededor de ~.7% del tiempo menos de cuatro de los 20 seleccionarén Oreos.

Uso de computadora para producir una distribución binomial E.ud y MINITAB se pueden usar para producir la. probabilídado para prácucamente cualquier dis­ tribución binomial. Estos programa» de computadora ofrecen incluso otra opción para resolver pro­ blmw bínomiale», ademh de usar la fórmula binomial o los cuadros binomiales. En realidad, los paquetes de computadora en efecto imprimen lo que seria una columna de la tabla binomial. Las ven· taps de usar paquetes de cstad~tíca para este fin son la comodidad (sí no '<e dispone fácilmente de los cuadros binomiales y de una computadora) y el potencial para generar cuadro> para muchos más valo­ res que los impreso> en las cuadros binomiales.

E1<tracto de la tabla A.2, Apéndice A

TABLA 5.5 • •lO

X .1 .l .J .4 .5 " .7 .. o .122 .ou .GOi JlllO JlllO - - JIOO 1 .270 .851 - - - - .w 1 2 .215 .137 Jl2I .oos .000 - • 3 • 190 .205 m .012 .001 .. - 4 090 .218 .uo .QJ5 .G05 .000 JlllO 5 .032 .175 .179 ..,, .015 .G01 - 6 .009 .109 .192 .u. .llS7 - - 7 .002 .055 ... M6 .... Jll5 ... 8 .000 .022 .114 ••• .UD ...,, - 9 .000 .O<fl .G65 .160 .160 "11

.111 - 10 .000 .002 .oJl .U7 176 .117 ... '.'W 11 .000 .000 .ou ..,. .... ....... ~ .. 12 .000 .000 ... ... .... - ... .-.:...- u .000 .000 .001 .015 1114 ... ... ~- 14 .000 .000 - .. M!f1 .124 ... .. ., 15 .000 .000 .000 .... .115 .,, .179 * JD2 16 .000 .000 .000 ... .. .cm .1'9 .21' - 17 .000 .000 .000 ... ... .012 612 ;~ 18 .000 .000 - - JlllO - - 19 .000 .000 .. .IDO .IDO .. ., ... .Z7t 20 .000 .000 ... .IDO AllO - - .012 .m

Page 179: libro.pdf

CAPtrul.O S 015TIUBUOO!'-'I~ DISCRETAS 153

Por ejemplo, el estudio de dientes bancarios presentado en el Dilema de decisión indicó que 64% de todos los consumidores financiero» piensan que los bancos son más competitivo hoy de lo que fue. ron hace cinco aflos. Suponga que al azar se seleccionan 23 consumidores financien» y deseamos derer­ minar las probabílidades de que ocurran varios valores x. La tabla A.2 del Apéndice A no podría ~ porque esún incluidos sólo nueve valores p diferentes y p • .64 es uno de esos valores, Ademú, n = 23 no se incluye en la tabla. Sin la computadora, quedamos con la fórmula binomial como la única opción para resolver problemas binomiales para n • 23 y p • .64. Particularmente si se formulan las preguntas de probabilidad acumulativa (por ejemplo. x s 10), la fórmula binomial puede ser una forma tediosa de para resolver el problema.

En la tabla 5.6 se muestra la salida de MINJTAB para la distribución binomial den • 23 y p • .64. Con esta salida de computadora, un investigador podría obtener o calcular la pro!nbilidad de cualquier ocurrencia dentro de la distribución binomial den • 23 y p • .64. La tabla 5.7 contiene salida MJNITAB parad problema binomial en particular, P(x s 10) cuando n • 23 y p • .64, resueltos con el uso de la función de probabilidad acumulativa de MINITAB.

En la tabla 5.8 se muestra la salida Excel para todos los valores de x que timen probabilidade» mayores de .000001 para la distribución binomial analizada en el problema de dem~ción 5.3 (n • 20, p • .06) y la solución a la pregunta formulada en el mismo problema.

tllLA 5.6 ~ MINITAB para la

bución binomial de - 23. p 6'

P(S • :a) 0.0000 o ..... ...... O.tOOO 0.0000 0.0000 ....

. oo o ... 1.00 0.0031

0.0090 o.om

.oo o.otn

.oo O.OMO

.oo O.UM • oo 0.1 .. .00 0.1712 .oo 0.1512 .00 0.1114 .oo º·°"° .oo o.UOt .oo 0.0110 • 00 ..... .00 ··- .oo O.tNO

Media y desviación estándar de una distribución binomial Una distribución binomial tiene un valor esperado o un promedio de largo plazo que se denota conµ. El valor deµ se determina con t1 ·p. Por ejemplo, sin • 10 y p = .4. enton­ cesµ • t1 • p • ( 10)(.4) • 4. El promedio a largo plazo o valor esperado ~ignifica que, si se muestrean n arnculos una y otra vez durante largo tiempo y si pes la probabilidad de obte­ ncr un éxito en un intento, el número promedio de éxites por muestra ~ espera que ~ n · p. Si 40% de todos los estudiantes graduados de administración se seleccionan muchas veces, la expectativa es que, en promedio, cuatro de los 10 estudianres sean muieres.

TABLA S.7

Salida MITAB para el problema binomial, P{x! ,. 10 n 23 y p .64 maannrn •t..Cel - D • 23 f p • 0.6'0000

a •e•<• a) 11.00 0.0357

TABLA 5.8

Salida Excel para el problema de demostración 5.3 y la distribución binomial de n 20, p .06

A • e D E f , " ProblJd

l "9 o 02901 IS 1 03703 • 2 02248 • , nn<UU\

ta 4 e.ozaa l'r e; n.'\IUD ta R nnnn<>

I• 7 0.0001 l4A A """"" 1 1

'" CI """"" 1 1 12 Th• nrobabilirv x s 2 when n • 20 and a • .Ofl is: 0.8850

Page 180: libro.pdf

IS4 ESTADl$TICA EN LOS NEGOCIOS

MEDIAY DESVlAOOS EST ANDAR DE UNA DISTJUBUOOS 811'\0\11A1

Al examinar la media de una distribución binomial multa una opinión intuitiva acerca de la pro­ babilidad de un resultado dado. Por ejemplo, supongamos que lo invesugadore generalmente estil: de acuerdo con que 10% de todu IOb pe~n~ son 1urd~. t\o obstante, supongamo. que una invesu­ gadora piensa que, como ya otros lo han expresado, esta cifra es mh alta para nm<» que nacen de muje­ m de m.U de 35 allo.. En un intento por reunir cvidenciu, ella $Clccáona al uar 100 nitlo¡ que nacieron de mujeres de mú de 35 at\os y 20 de eUos multaron $Cr zurdos. ¿Es probable que eUa ebtu­ viera 20 zurdos en una muestra de 100? ¿Cu.intos debiera haber esperado obtener en una muestra clt 100? El valor medio o esperado paran • 100 y p • .10 es ( 100)(.10) • 10 zurdo . ~ 20 niflo. zurdo& de la muestra de 100, ¿ocurrieron al aur o la investigadora esú sacando dat<» de una población dife­ rente que la población general que produce 10% de zurdos? Ella puede invntigar m.b este multado examina ~ probabilidades binomiales para este problema. No obstante, la media de la distribución k da un valor esperado del cual trabajar.

SegUn un estudio, 64% de todo, los consumidores financieres piensan que los bancos son mú compcuti~ hoy de lo que fueron hace cinco atlo>. S1 al aur se seleccionan 23 coruwnidom finanános. ¿cu.ti es el numero esperado que piensan que I<» bancos son mh competitivo hoy de lo que fuerce hace cinco afio,? úte problema se puede describir por medio de una distribución binomial de n • ~ y p • .64 dada en la tabla S.6. La media de esta distribucién binomial da el valor esperado para este problema.

µ • n • p • 23(.64) • 14.72

A l;argo plazo, '' al uar se seleccionan 23 consumidores financi~ una y otra va y ,i en \'tfdad 64% de todos 105 consumidores finandero' piensan que lo' banc<» son mú competiti~ hoy, enton­ ces d experimento dcbttú promediar 14.72 consumldores de 23 que piensen que IOl bancos 10n mú compctitiVQj hoy. El lector debe darse cuenta que como la distribución binomial es una distribució!l ducrct1, nunca obtendrá en realidad 14.72 personas de 23 que piensan que lo¡ banco' son m.b com­ pet1th'O, hoy. La media de la distribución de¡a ver la relativa probabilidad de cualquier ocurrencia indl \idual. E.x&mUle la tabla S.6. Nóte$C que las mh altas probabilidades son aquellas cerca de x • 14 7?. P(x • 15) • .1712, P(x • 14) • .1605 y Ptx • 16) • .1522. Todas las otras probabilidades p.ira csu distribución son menos que estas probabilidades.

La desviación estándar de una distribución binominal se denota a y es igual a '-'" · p · q. Para e! ejemplo de zurdos. a ~ \/100(.10)(.90) • 3. La desviación est.indar para el problema de consumido­

res financien» descrito por la distribución binomial de la tabla 5.6 es

a » ~- \. 23)(.64)(.36) • 2.30 TABLA 5.9

Probabilidades para tres distribuciones binomiales n•8

, , ·a:. ,.. 1

• , ... t.·• , ... • 1671 .- ..... l ."'5 •12 ... 2 .JtJI ... •11 J .. .2117 .cmn • .... .2nl .... 5 .- .lle' .... • -· .. .JtJI 7 .. ••2 ,,., • .- .... ....

El capítulo 6 muestra que algunas dutribuciones binomiales son casi en forma de cam­ pana y puede calcularse con el u~ de la curva normal. La media y desviación esúndar de una distribución binomial son las herramientas usadas para convertir estos problemas binomiales en problemas de curva normal.

Graficación de distribuciones binomiales La gráfica de una distribución binomial se puede construir con el uso de todo> los posibles valores de x de una distribución y sus probabilidades asociadas. Lo.. \'alores x suelen gr 1:.

earse a lo largo del eje x y las probabilidades $C grafican a lo largo del eje y • la tabla S. 9 es una lista de w probabilidades para tres diferentes cfutribucioncs bino­

miales: n • 8 y p • .20, n • 8 y p • .50, y n • 8 y p ... 80. La figura S.2 muestra grif1CB Excel para cada una de estas tres distribuciones binomiales. Observe cómo es que la forma de la distribución cambia cuando el valor de p aumenta. Para p • .SO, la distribución es simétrica, Para p • .20 la distribución ~ú sc-gada a la derecha y para p • .80 la distribo­ ción esl.i sesgada a la izquierda. Esta figura es lógica porque la media de la cliwib

Page 181: libro.pdf

1.:-11.t¡¡ .. ~.:cas Excel para

distribuciones CIOOlniales con •8

Distnbución binomial: " - a y p - .20

O.JS

O.J

j 0.2S

l 0.2

ct O.IS

0.1

o.os

o 2 s 6 a 7 ) 4 Valornx

DUtnbución binomial: n • S y p • .SO

0.2S

~ - 0.2 1 O.IS

0.1

o.os o

o 2 a ) s 6 7 4 Valornx

Distribución bi.nornial: n • 8 y p • .80

O.JS

O.J

-o 0.2S

"ª 1 0.2

O.IS

0.1

o.os o

o 2 4 Valornx

) 6 ;

Page 182: libro.pdf

binomial n = 8 y p = .SO es 4, que está en el medio de la distribución. La media de la distribución n ,.. y p .20 es 1.6, que resulta en las más altas probabilidades cerca de x • 2 y x .. 1. Esta gráfica t" un pico al principio y se alarga hacia los valores más altos de x. La media de la distribución n = p e.. .80 es 6.4, que resulta en las más altas probabilidades cerca de x .. 6 y x • 7. Entonces, el pico la distribución e~tá más cerca de 8 que a O y la distribución se estira hacia x ... O.

En cualquier distribución binomial el valor más grande de x que puede ocurrir es n y el valor pequeño es cero. Por tanto, la gr.tfica de cualquier distribución binomial está restringida por cero y Si el valor p de la distribución no es .SO, esta restricción resultara en que la grafica "se apila" en un~ mo y está sesgada en el otro extremo.

156 ESTADISTICA El' LOS NEGOCIOS

PROBLEMA DE DEMOSTRACIÓN

5.6 Una compal\la fabricante produce 10 mil tarros de pléstíco por semana. Esta compallla sun.­ nistra tarros a otra compallla, que los empaca como pane de juegos para dia de campo. segunda compallla al azar muestrea 10 tarros enviados del proveedor. Si dos o menos de tarros muestreados son defectuosos, la segunda compal\ía acepta el lote. ¿Cu61 es la proba dad de que el lote sea aceptado si la compañia fabricante de tarros en realidad esté producie tarros que son 10% defectuosos? ¿y 20% defectuosos? ¿y 30% defectuosos? ¿y 40% defectu

Solución

En esta serie de problemas binomiales, n = 10, x:s 2, y pvaria de .10 a .40. De la tabla A.2 y acu lando los valores tenemos la siguiente probabilidad de x s 2 para cada valor p y el valor rado (µ • n · pi.

p Lote ec.pt.clo

P(x"' 2) Núm•o npllf8do

de defectos (µ)

.10

.20

.30

.40

.930

.677

.382

.167

1.0 2.0 3.0 4.0

Estos valores indican que si la compañia fabricante esté produciendo 10% de tarros d tuosos, la probabilidad es relativamente alta (.930) de que el lote sea aceptado por probabir Para valores més altos de o. la probabilidad de aceptación del lote por probabilidad se red Además, cuando p aumenta, el valor esperado se aleja de los valores aceptables, x s 2. movimiento reduce las probabilidades de aceptación del lote.

52 PROBLEMAS

5.5 Resuelva los siguientes problemas con el U$O de la fórmula binomial. a. Si" • 4 y p"' .10, encuentre P(x • 3). b. Sin • 7 y p = .80, encuentre P(x • 4). c. Sin -= 10 y p = .60, encuentre P(x 2 7). d. Si n ., 12 y p "" .45, encuentre P(5 :S x :S 7).

5.6 Resuelva lo) siguiente) problemas con el U$O de los cuadros binomiales (vtase la tabla A.2). a. Sin .. 20 y p = .SO, encuentre P(x"" 12). b, Si n = 20 y p ... 30, encuentre P(x > 8). c. Sin "' 20 y p = .70, encuentre P(x < 12). d. Sin = 20 y p = .90, encuentre P(x :S 16). c. Sin= 15 y p = .40, encuentre P(4 :S x :S 9). f. Si" = 10 y p = .60, encuentre P(x 2 7).

5.7 Despeje la media y desviación estándar de las siguientes distribuciones binomiales. a. n = 20 y p • .70 b. n = 70 y p • .35 c. n = 100 y p •.SO

Page 183: libro.pdf

CAPfnJlOS DlmuBUOO~CSDISCRFT...S 15i

S.8 Utilice 10$ cuadros de probabilidad de la tabla A.2 y trace la gráfica de cada wu de bs sigmmtes distribuciones binomiales. Ano1e en la grá6ca el lugar donde cae la di.nn'bución. L n • 6yp= .70 b. n•20yp•.50 c. n•8yp•.80

5.9 La revista Purchasing (Compras) reporté los resuliado. de un estudio en el que a compradores se les hace una serie de pregun1as respecto al uso de Internet. Una pregunta era de cómo uQ.ffan b Internet si pudieran resolverse la seguridad y otros problemas. Setenta y ocho por ciento dijeren que la usarfan para conocer información de precios, 75% dijo que la usarían para enviar órdenes de compra, y 70% dijeron que la usarfa para reconocimientos de órdenes de compra. Suponga que estos porcentajes se cumplen para iodos I~ compradores. Un investigador muestrea al aur 20 compradores y les pregun1a cómo usarían la Internet ~i pudieran resolverse la seguridad r otros problemas. • L ¿Cuál es la probabilidad de que exactamente 14 de estos compradores usarían la Internet para

información de precios! b. ¿Cuál es la probabilidad de que todos los compradores usarían la Internet para enviar érde­

nes de compra? c. ¿Cuí! es la probabilidad de que menos de 12 usarían la Internet para reconocimientos de érde­

nes de compra? S.10 Th« \\\:d/ Srrttr loumal reportó algunas e•tadi>liCb interesantes sobre el mercado de trabajo. Una

esiadí•tica es que 40% de iodo. los trabajadores dicen que cambiarían de 1rabajo por •una paga ligeramente más alta': Adem.h, 88% de las compañías dicen que hay escasea de candidatos califi­ cados. Suponga que 16 trabajadores se seleccionan al azar y se les pregunta si cambiarían de Ira· bajo por•una paga ligeramente más al1a': ¿Cu.il es la probabilidad de que nueve o mis di~ran que si? ¿~les la probabilidad deque tres.cuatro.cineo o seis dijeran que si? Si se consulta a 13 com­ paflias, ¿cu.ti es la probabilidad de que exactamente 1 O digan que hay escasa de candidatos cali· ficad<»? ¿Cu.ti es la probabilidad de que todas las companw digan que hay escasez de candidat0$ cali6cados? ¿Cuál es el número esperado de companias que dírlan que hay C$CUCZ de candidatos cali- 6cad~?

S.11 Un número creciente de consumidores piensan que deben estar atento en el mercado. Según un estudio realizado por la Yankelovich Partners para la revisia USA WEEKEND. 60% de todos IO$ consumidores han llamado a un número de teléfono 800 o 900 para información acerca de al~ producto. Suponga que una muestra alea1oria de 25 consumidores son entrevistados acerca de •US hábitos de compras. L ¿Cuí! es la probabilidad de que IS o más de estos consumidores hayan llamado a un numero

de teléfono 800 o 900 para información acerca de algún producto? b. ¿Cuál es la probabilidad de que m.is de 20 de estos consumidores hayan Uam.1do a un nume­

ro de teléfono 800 o 900 para información acerca de algún producto? c. ¿Cuál es la probabilidad de que menos de 10 de estos consumidores hayan llamado a e

número de teléfono 800 o 900 para información acerca de algún producto? S.12 Grafique la distribución del problema 5.11. ¿Para qué valores de x son m.ts alus las~­

des? Determine el valor esperado de esta distribución. ¿Cómo o que el valor cspendo K com­ para con los valores de x que tienen las probabilidades m.h alta>? Calcule la desviación csú::ldz:.. Determine el intervalo µ :!: 2'7 para esta distribución. ¿Entre cuáles dos valores de x esú eu íoten-alo? ¿Cuál es el porcentaje de valores dentro de este intervalo? ¿Cómo se ~ esta res­ puesta con lo que darfa el teorema de Chebyshev o la regla empírica presentada en d l?

S.13 En los pasados aftO$ recientes, realizar operaciones por comrato en el cxtran.icro se hi bccbo ~ frecuente que nunca an1e. en compañías estadounidenses, No obstante. rnbzu ~DO ot.i libre de problemas. Un estudio reciente de la revista Purdiasing {Compras m&a que 20'!& de las compailías que realizan operaciones por contrato en el extranjero ~ cc:=!:o:l'C$. Suponga que al azar se seleccionan IS compailla. que realizan operaciones por cc:::ua:c. L (Cu.ti es la probabilidad de que exactamente cinco compatlias que raliu.:1 opaaooocs por

contrato en el extranjero usen un consultor?

Page 184: libro.pdf

1 S8 ~TADlSTICA E,'1 LOS ~EGOCIOS

b. ¿Cual o la probabilidad de que nueve compai'l(a) que ittlíun operaciones por contrato en d extranjero usen un consultor?

c. ¿Cual o la probabilidad de que ninguna de las compallia) que realizan operadono por con· trato en el extranjero use un consultor?

d. ¿Cual a la probabilidad de que entre cuatro y siete (inclusive) compmías que ruliun opera· clones por contrato en el extranjero usen un consultor?

e. Construya una gráfica para esta distribución binomial. En vista de la gráfica y el valor espera· do, aplique por qué la probabilidad resulta de haber obtenido las panes (a) a la ( d t.

S.14 Según Cerulli Associates of Boston, 30% de todos lo) asesores financieros (contadores públicos titulados, CPT) tienen un promedio de tama.l\o de cliente entre S500 mil y un millón. Tienen 34911 un promedio de wnlilo de cliente entre uno y SS millones. Suponga que existe una li>u completa de todos los asesores 6nancieros (CPT) y que de la lista al azar 18 se seleccionan. L ¿Cu.ti o el numero esperado de asesores financiero. (CPT) que tienen un promedio de tama·

!lo de diento entre S500 mil y un millón? ¿Cual es el número esperado con un promedio dt tamaño de clientes entre uno y $5 millones?

b. ¿Cual es la probabilidad de que al menos ocho uaores financiero. ( CPT) tengan un prome­ dio de wnano de diente entre $500 mil y un millón?

c. ¿Cujl es la probabilidad de que dos, tres o cuatro asesores financiero) (CPT) tengan un pro­ medio de wnano de cliente entre uno y SS millones?

d. ¿Cuál es la probabilidad de que ninguno de lo) a~res financiero) tiene un promedio dt tamano de cliente entre $500 000 y SI millón? ¿Cu.ti es la probabilidad de que ninguno tenga un promedio de wnatlo de cliente entre SI millón y SS millones? ¿Cual probabilidad o mis alta y por qué!

5.4 DISTRIBUCIÓN DE POISSON

La dmnt>uaOn de Poisson es otra distribución discreta; recibe ese nombre en honor a Simeon-Dena Poisson (J; 1-1840), matemático francó que publicó I~ puntos esenciales de esta d>,tribución en un articulo técnico en 1837. La distribución de Poisson y la distribución binomial tienen algunas seme­ ja01u. pero también algunas diferencias. La distribución binomial describe una dimibución de dos posibles resultad0$ designados como éxitos o fracU06 de un número dado de imentos. La distribuáóe de PoiJM>n st concentra !()/o tri ti nunrtro dt s11cts0s discretos sobrt 11/gün inttrWllo o seri« cor111nuo. Uc experimento de Poi510n no tiene un número dado de intentos (n) como lo tiene el experimento bino­ mial. Por eiemplo, mientru que un experimento binomial podría usarse para determinar cuinto¡ autlll hecho' en &tado) Unido, e)tán en una muestra aleatoria de 20 auto., un experimento de ~wo:i podría enfocarse sobre el número de autos que al azar llegan a un taller de servicio durante un mter­ valo de 10 minutos.

La distribución de Poisson describe la ocurrencia de eventos poco comuna. De hecho, la fórmtda de Poisson se ha atado como la ley de eventos improbablts. Por ejemplo, los accidentes serios en una planta de productos qutmico) IOn poco comunes, y el número por ma podría ser descrito por la b tribución de Poisson, A veces la distribución de Poi,<on se utiliza para describir el numero de llegad¡j aleatoriu por algún intervalo, Si el numero de llegadas por intervalo ~ dema,iado frecuente, el ínter­ valo se puede reducir lo •uficiente para que se espere un número poco comun de eventos, Otro tjem-­ plo de una distribución de Poisson C) el numero de llegadas aleatorias de clientes por intervalo de ciDQI minutOJ a una pequeña boutique en las mananas de dlas hábiles.

La distribución de Poísson también tiene aplicación en el campo de ciencias admanistrati~. lci modelos empleados en la teoría de colas (teoría de lineas de espera) por lo general están basado) en supcsícién de que la distribucién de Poisson es la distribución apropiada para describir porcentaia de llegadas aleatorias en cieno periodo.

La distribución de Poisson tiene las siguiente) características: • Es una distribución discreta. • Describe eventos poco comunes.

Page 185: libro.pdf

- CAPnvLO S DlSTRlllUOO~"iS DISCRETAS 159

• Cada ocurrencia es independiente de los otros sucesos. • Describe sucesos discretas sobre una serie connnua o intervalo. • Los sucesos en cada intervalo pueden variar de cero a infinito. • El número esperado de suceso) debe mantenerse constante en todo el experimento. Ejemplos de situaciones del tipo de Poisson son los siguientes:

l. Número de llamadas telefónicas por minuto en un pequeño negocio. 2. Número de casos de una extral'la enfermedad de la sangre por 100 mil personas. 3. Número de basureros peligrosos por condado en Estados Unidos. 4. Número de derrames importantes de petróleo en b región de Nueva Inglaterra por mes. S. Número de llegadas a una caseta de cobro de autopista por minuto entre las 3 y 4 a.m. en

enero en la Kansas Tumpike. 6. Número de veces que una impresora de un afio de antigüedad se descompone por trimestre. 7. Numero de defectos de CO)tura por par de jeans durante la producción. 8. Número de veces que una llanta se revienta en un avión comercial por semana. 9. t-iúmero de manchas de pintura por automóvil nuevo.

10. Numero de defectos por pina de tela.

Cada uno de esto) ejemplos representa un suceso raro de eventos para algún intervalo. 'óte-.e que, aun cuando el tiempo es un intervalo más común para la distribución de Poissen, lo) intervalo pue­ den variar de un condado de Estado Unidos a un par de jeans, Algunos de lo) intervalos de estos ejem­ plos podrian tener cero sucesos. Además, el promedio de sucesos por intervalo para muchos de esto) ejemplos está probablemente en un digito ( 1-9).

Si se estudia un fenómeno de distribución de Poisson sobre un largo periodo. es posible determi­ nar un promtdio a largo plazo. Este promedio se denota como lambda(>.). Cada problema de Poi(son contiene un valor lambda del cual se determinan las probabilidades de sucesos paniculares. Aun cuan­ do n y p se requieren para describir una distribución binomial, una distribución de Poisson puede ser descrita por>. sola. La fórmula de Peisson se utiliza para calcular la probabilidad de sucesos en un inter­ valo para un valor dado de lambda.

FORMULA O.E POISSON

>."t >. P(x) =- x!

donde X= 0, I, 2,3, ... ). • Promedio a largo plazo t = 2.718282

Aquí, x es el número de sucesos por intervalo por el cual la probabilidad se calcula. >. es el preme­ dio a largo plazo, y t • 2.718282 es la base de logaritmos naturales.

Aqul es oponuna una palabra de advertencia acerca del uso de la distribución de PolSSOD para estudiar varios fenómenos. El valor). debe mantenerse constante en todo un experimento de PoWon.. El invesrigadcr debe ser cuidadoso y no aplicar una lambda dada a intervalo para los cuala am!:tit lambda. Por ejemplo. el número promedio de clientes que llegan a una tienda Sears durante an u::n­ vale de un minuto varía de hora en hora, dia a dla y mes a mes. Diferentes hcras dd día o scmim podrian producir lambdas diferentes. El numero de defectos por par de jcaru podrla nnar de a viernes. El investigador debe ser especifico al describir el intervalo para el cual se wa >..

Resolución de problemas de Poisson por fórmula Suponga que al aur llegan clientes de banco en la tarde de dtas habíles a un promedio de 3.2 dimin cada 4 minutos. ¿Cu.ti es la probabilidad de que exactamente cinco clientes ~ en un mtcn-alo de 4 minutos en una tarde de dla hábil? La lambda para este problema es 3.2 dientes por 4 mmutos. El valor de x es Cinco clientes por cuatro minutos. La probabilidad de que cinco dientes lleguen al azar

Page 186: libro.pdf

160 ESTADISTICA EN LO~ 1-"EGOOOS

PROBLEMA DE DEMOSTRACIÓN

5.7

PROBLEMA DE DEMOSTRACIÓN

5.8

durante un intervalo de 4 minutos, cuando el promedio de largo pluo ha sido de 3.2 clientes por .C minut~C5

(3.2S)(r-J.2) • (335.54)(.0408) "".l HI S! 120

Si un banco promedia 3.2 clientes cada 4 minutos, la probabilidad de que cinco clientes llegucc durante cualquier intervalo de 4 minutos es 0.1141.

Al azar llegan clientes a un banco en tardes de día hábil a un promedio de 3.2 clientes cada ' minutos. ¿Cu61 es la probabilidad de tener más de siete clientes en un intervalo de ' minutos en una tarde de día hábil?

>. 3.2 chentetl' minutos x > 7 clientes/' minutos

En teoría. la solución requiere obtener los valores de x • 8, 9, 10, 11, 12, 13,14, •.• "·En reali­ dad. cada valor x se determina hasta que los valores están tan lejos de >. 3.2 que las probabt­ lidades se aproximan a cero. Las probabilidades exactas se suman entonces para encontrar x > 7

Pix • 8IA • 3.2) • (3.2'lle ·3.21 • .0111 81

Pix • 9IA • 3.2) • (3.2')(e 3 21 • .0040 91

Pix a 10jA • 3.2) • 13·2'ºHe 3 21 a .0013

101

Pix .. 111A 3.2) • (3.2''ll•"32I • .0004 111

Pix,.. 12IA - 3.21•<3.2'2l<•"321 - .0001 121

Pix • 13IA 3.2l • 13·21311'"3 21 • .0000

131 P(x > 7) P(x 81 • .0169

Si el banco ha estado promediando 3.2 clientes cada' minutos en las tardes de dfas hábiles, es poco probable que mis de siete personas lleguen al azar en cualquier periodo de 4 minutos. Esta respuesta indica que más de siete personas llegarían al azar en un periodo de ' minutos sólo 1.69% del tiempo. los oficiales de banco usan estos resultados para ayudarse a tomar decisio­ nes de contratación de personal.

Un banco tiene un porcentaje promedio de llegadas aleatorias de 3.2 clientes cada ' minut05. ¿Cu61 es la probabilidad de obtener exactamente 10 clientes durante un intervalo de 8 minutos?

>. 3.2 clientes/' minutos x - 10 clientes/8 minutos

Este e1emplo es diferente de los primeros dos ejemplos de Poisson en que los mtervalos para lambda v la muestra son diferentes. los intervalos deben ser iguales para usar>. v xjuntas en

Page 187: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

5.9

CAPfTULO S 01Sl1UBUCIOSES Dl'iCRETAS 161

fórmula de probabilidad. La forma correcta de abordar este dilema es ajustar el intervalo para lambda de modo que>. y xtengan el mismo intervalo. El intervalo para xes 8 minutos, de modo que >. debe ajustarse a un intervalo de 8 minutos. Lógicamente, si el banco promedia 3.2 clien­ tes cada 4 minutos, debe promediar el doble, o sea 6.4 clientes cada 8 minutos Si xfuera para un intervalo de 2 minutos, el valor da lambda se reducirla de 3.2 a 1.6 clientes por intervalo de 2 minutos. El mlltodo erróneo para este dilema es igualar los intervalos al cambiar el valor de x. Nunca ajuste ni cambie xen un problema. Sólo porque 10 clientes lleguen en un Intervalo de 8 minutos no significa que habría necesariamente cinco clientes en un intervalo de cuatro minu­ tos. No existe garantfa de cómo tos 10 clientes se distribuyan en el intervalo de 8 minutos. Siempre ajuste el valor de lambda. Una vez ajustada lambda para un intervalo de 8 minutos. la solución es:

>. 6.4 clientes,18 minutos x 10 clientes,18 minutos

(6.4l'ºe ª' - 0528 101 •

Uso de las tablas de Poisson Todo valor de lambda determma una distribución de Poisson diferente. Cu.tlquiera que sea la natura­ leu del intervalo asociado con una lambda, la distribución de Poisson para una lambda en particular e. la misma. La tabla A.3, Aptndice A, contiene las distribuciones de Poi»son para valores selecciona­ dos de lambda. Las probabilidades se muestran en la tabla por cada valor x asociado con una lambda dada si la probabilidad tiene un valor diferente de cero a cuatro lugares decimales. La tabla 5.10 pre· senta una parte de la tabla A.3 que contiene las probabilidades de x s 9 si lambda es 1.6.

Si una oficina de bienes rafees vende 1.6 casas en un dla h6bil promedio y las ventas de casas en dias h6biles son distribuciones de Poisson, ¿cu61 es la probabilidad de vender exactamente cuatro casas en un dla? ¿Cuál es la probabilidad de no vender casas en un dfa? ¿Cu61 es la pro­ babilidad de vender más de cinco casas en un dfa? ¿Cuál es ta probabilidad de vender 10 o más casas en un dla? ¿Cu61 es ta probabilidad de vender exactamente cuatro casas en dos dias?

Soludón

>. - 1.6 casas/dfa Plx 41 >. - 1.61w1

la tabla 5.10 da tas probabilidades para >. 1.6. La columna izquierda contiene los valores x, Et renglón x 4 da ta probabilidad .0551. Si una empresa de bienes rafees ha estado prome­ diando 1.6 casas vendidas por día, sólo 5.51% de los dfas vendería exactamente cuatro casas y todavía mantendría el valor lambda. El renglón 1 de la tabla 5.10 muestra la probabilidad da no vender casas en un dfa (0.20191. Esto es, en 20.19% de los dlas, la compal'lfa no venderia ca. si tas ventas son distribuciones de Poisson con>.• 1.6 casas por dla. La tabla 5.10 no es acumitr.iva Para determinar P(x> 5), más de cinco casas, h611ense las probabilidades de x • 6. x • 7. x •a, x • 9, ••• x • 1; sin embargo, en x • 9, la probabilidad para cuatro lugares decimales es cero, y la tabla 5.10 se detiene cuando indica un valor x de cero en cuatro lugares decimales A con:r nuación veamos la respuesta para x > 5.

X Prol>M>lllded

6 .0047 7 .0011 8 .0002 9 .0000

x>5• .0060

Page 188: libro.pdf

162 ESTADISTICA EN LOS SEGOCIOS

TABLA 5.10

Tabla de Poisson para ). 1.6

• ......... o .2019 1 .32'0 2 .2514 3 • 1378

' .0551 5 .0176 6 .0047 7 .0011 8 .0002 9 .0000

¿Cuál es la probabilidad de vender 10 o más casas en un dia? Como indica la tabla en x 9, la probabilidad de x <!:: 10 es esencialmente 0.0000; es decir, si la of .. cina de bienes raíces ha estado promediando sólo 1.6 casas vendidas por dfa, 81! prácticamente imposible vender 10 o más casas en un dia. ¿Cuál es la probabilidac de vender exactamente cuatro casas en dos días? En este caso, el intervalo se ht cambiado de un dfa a dos dlas. Lambda es para un día, de modo que debe hacera un ajuste: una lambda de 1.6 para un dla se convierte en una lambda de 3.2 para dOll dias. La tabla 5.10 ya no aplica, de modo que la tabla A.3 debe usarse para resolve· este problema. La respuesta se encuentra al buscar>. 3.2 y x • ' en la tabla A.3: ,. probabilidad es 0.1781 .

Media y desviación estándar de una distribución de Poisson

El valor medio o esperado de una distribución de Poisson es>.. Es el promedio a largo plazic de sucesos para un intervalo si se toman muchas muestras aleatorias. Lambda por lo gene­ ral no es un número entero, de modo que casi siempre observar sucesos lambda en 1o;

intervalo es imposible. Por ejemplo, suponga >. • 6.5/intervalo para algún fenómeno con distribución dt

Poísson, Los números resultantes de x sucesos en 20 muestras aleatorias diferentes de um distribución de Poisson con >. • 6.5 podría ser como sigue:

6 9 7 4 8 7 6 6 10 6 5 5 8 4 5 8 5 4 9 10

El cálculo del número medio de sucesos de este grupo de 20 intervalos da 6.6. En teoría, para mues­ treo infinito el promedio a largo plazo es 6.5. De las muestras, nótese que cuando>. es 6.5, se presenur varios 5 y 6. Raras veces se presentan sucesos de 1, 2, 3, 4, 11, 12,13, ••. cuando>. • 6.5. Comprender la media de una distribución de Poisson da sentido para los sucesos reales que es probable que ocurraa,

la varianza de una distribución de Poisson también es >.. la desviación estándar es \/X. la com­ binación de la desviación estándar con el teorema de Chebyshev indica la dispersión de una distribu­ ción de Poisson. Por ejemplo, si >. = 6.5, la varianza también es 6.5 y la desviación estándar es 2.55. 8 teorema de Chebyshev expresa que al menos 1 - l//c2 valores están dentro de le desviaciones estánda: de la media. El intervaloµ :t 20' contiene al menos 1 - (12/2) • .75 de los valores. Paraµ = >. = 6.5 y O' = 2.55, 75% de los valores deberían estar dentro del rango de 6.5 :t 2(2.55) = 6.5 :t 5.1. Esto es. el rango de 1.4 a 11.6 deberla incluir al menos 75% de todos los valores. Un examen de los 20 valores generados al aza.r para una distribución de Poisson con >. = 6.5 muestra que en realidad 100% de valores están dentro de este rango.

Gráficas de distribuciones de Poisson

Lu> vaiores de la tabla A.3, Apéndice A, se pueden usar para graficar una distribución de Poisson. l.« valores x están en el eje x y las probabilidades sobre el eje y. la figura 5.3 es una gnifica M INITAB pL."1 b distribución de valoro para >. • 1.6.

la grtfic:~ revela una distribución de Poisson sesgada a la derecha. Con una medía de 1.6 y un posa.­ ble rango de x de cero al infinito, los valores obviamente se van a "apilar" en O y 1. Considere, sin embar go, la grtfica ~fl!'IITAB de la distribución de Poisson para >. .. 6.5 en la figura 5.4. Nótese que >. • 6.5, bs probabilidades son máximas para los valores de 5, 6, 7 y 8. la gráfica tiene menos porque la probabilidad de suceso de valores cercanos a cero es pequeña, como son las probabilidades de valores grandes de x.

Uso de computadora para generar distribuciones de Poisson

El uso de la fórmula de Poisson para calcular probabilidades puede ser tedioso cuando uno trabaja pre­ blernas con probabilidades acumulativas. las tablas de Poisson de la tabla A.3, Apéndice A, son más rápt. das de usar que la fórmula de Poisson: no obstante, las tablas de Poisson estan limitadas por la canti de espacio disponible, y la tabla A.3 sólo incluye valores de probabilidad para distribuciones de Po· con valores lambda a los lugares de décimas en casi todos los caso). Para investigadores que deseen usr valores de lambda con más precisión, o que tengan la impresión que la computadora es mas conveni que cuadro· de libro) de texto, los paquetes de software de estadística son una opción atractiva.

Page 189: libro.pdf

•Hf'.!f''ii'!111.¡111H·Ii1.¡1.11:i.¡•~----------------- Quejas .......... MIObneu

En - Ndenta. lol .,..;en. de~ hui Clpftlldo mucha m6I m..ailflorida por el semao 8áeo qur nunca antes. No es duo li lol ~ estú en ralidad maM» rausi«bol por - aperimcm en vuelo O IÓlo IOD U naidolol. Laa queju induJm demoru en lol YUC1o1, ~ pept cxtRYi8do,, ...... clemans en pilta con poco o ninpa mviao a bordo, welos cm amo de~.,.. oo ttduádo debido a vuelol cm mú pu11e. vuelol ance­ llcb rcm.,-- de lDll añceer. La mayorta de awiadofta •npltmmte eoartm y lOpClltlD. pero un adinero awdenlr • peujmll ..-n _..,_en el U.S. Deputmaaol TílülpOltllim.A ....... • 11cWc.llde1990,el .._.., promedio de qurju por 100 mil paajm)s de abonlo ... 0-66 En aftol lipimla. el promedio subió 1 0.74. G.16 .,

..os En un do ndente, .pu el DeplrtmeDt ol'lnlllpor·

-. SouthlllllMrlm e1--.., promedio IÚI beJO de ~ por 100 mi cm 0.25. llpida por Alub Airlincs C11111 0.54, Dlba Ü LiDa cm 0.79, US Airways CIOD O.U, r

CAP1nll.O S DlSTIUllUOO!'-'ES DISCRETAS 163

Qinriaealll cm 1.02. DmllO de 111 10 aaai- mis grmdo de &lados Uaidol, NonlMal MI> el D6mao promedio nW llmdeque,111epad8ClllcmUI qilljaapor IOOmil ~

Debido 1 qae ......... .,._dio IOll rcbtl\~ meDllr pequeftol. puege qae el ndmero mi de quqAS por 100 mil es poc:o c:am6lt y puede..- una diltrlbudón de P'oilloD. Ea esu cmo. l aepiaeala el nllmero promedio de ..,.a y el iDllerwlo es 100 mi ....-. Por tJelllplo. -1 - 1.Glqaejal (Jln-so,..111e111 .. .-.-).Ñ 1t eubew...,... 100 mi .,....oa de a bordo. la piobebilidld de ............... tltl de ellol pia:allllD .. que;. al Dtpuuneat ol TruuporUlioa poddl calaallne CllllDO

(1.08'3~ •• - .0713

¡¡., Cl, IÍ 100 mi pmljaul de. boldo fUcrlD ....... cb 11111., 7.1,,. del acmpo CDdlmallle bel bubW- 1m pltltDUdo e1 Dqatmwl ol'lblllportlDon.

MIN"ITAB producirá una <fulribudón de Poisson para prkticarnmte cualquier valor de lambda. Por ejemplo, un estudio realizado por el 'ational Center for Health Stati.ti~ indica que, en promedio, un estadounidense time 1.9 enfermedades o ksiones agu<bi por afto. Si esto casos son distribuciones de Poisson, lambda es 1.9 por ano. ¿Qué aspecto tiene la distribución de probabilidad de Poisson para esta lambda? La tabla 5.11 contiene la wida MINITAB para esta distribución,

Exul puede también generar probabilidades de dif~tcs valores de X para cualquier di>tribución de PoÍ>50n. La tabla 5.12 muesua la. probabilidado produd~ por Exul para ti problema de bienes ralees del problema de demostracién 5.9 usando una lambda de 1.6.

Cálculo de problemas binomiales por la distribución de Poisson Cierto) tipo de problemas de dumbuc:ión binorru.J se pueden calcular con el U$O de la distribucién de Poisson, Lo~ problema$ binomiales con grandes ~~ muestrales y pequeños valores de p. que enton­ ces gmeran eventos poco comuoes, son candid.it~ potmcialcs para usar la <fuanbución de Poisson. Como ttgla práctica, si n > 20 y n • p s 7, la. aproximación es suficientemente cercana para usar la dutribu­ ción de Poisson para problemas binomiales.

Gráfica MINITAB de la distribución de Poisson para>. - 1.6

0.)

1 1 1

~o:

1 0.1

o.o o ' s • •

FIGURA 5.4 • -, . .. Gr•flCI MINITAB de la distribución de Poisaon para l. • 6.5

O.IS

! 0.10

J o.os

o s 10

Page 190: libro.pdf

164 ESTADISTICA EN LOS l'o'LGOOOS

TABLA 5.11

Salida MINITAB para la distribución de Poisson A• 1.9

'pr¡f ,¡e;~ 1'K'Y1di ...__ ..... , ..... • l'(Z • .,

t.1411 O.Jtq ·~ 0.111•

TABLA 5.12

Salida Excel para la distribución de Poisson A 1.6

Si se satisfacen estas condiciones y el problema binomial es un candidato para este proceso, el pro­ cedimiento se inicia con el calculo de la media de la distribución binomial,µ • n · p. Debido a que n es el valor esperado de la binomial, se traduce al valor esperado, A, de la distribución de Poisson. U= µ como el valor A y usar el valor x del problema binomial permite el calculo de la probabilidad a par· tir de un cuadro de Poisson o por la fórmula de Poisson.

Grandes valores den y pequeños valores de p suelen no incluirse en cuadros de distribución bino­ mial, por lo cual imposibilitan el uso de técnicas de cálculo binomial. El uso de la distribución de Poisson como aproximación a tal problema binomial en tales casos es una alternativa atractiva; de hecho, cuando no se dispone de una computadora, puede ser la única alternativa.

Como ejemplo, el siguiente problema de distribución binomial se puede resolver con el uso de la dis tribución de Poisson: n = 50 y p = .03. ¿Cuál es la probabilidad de que x = 4? Esto es, P(x = 4ln = ~ y p = .03) =?

Para resolver esta ecuación, primero determine lambda:

A=µ= n · p= (50)(.03) = l.S

Cuando n > 20 y n · p :S 7, este problema es un candidato para la aproximación de Poisson. Par­ x • 4, la tabla A.3 da una probabilidad de .0471 para la aproximación de Poisson. En comparación cor esto, resolver el problema con la fórmula binomial da los siguientes resultados:

soC4(.03)4(.97)46 • .0456

La aproximación de Poisson tiene una diferencia de 0.0012 respecto al resultado obtenido al usar la fórmula binomial para resolver el problema.

A continuación veamos una gráfica MINITAB para esta distribución binomial.

0.3

-e 0.2

"ª ::;¡¡ .a e 0.3 a.

o.o 1 1 1 1 1 1 o 3456789

Valon:sX

Page 191: libro.pdf

PIOBLEMA DE BEMOSTRACIÓN

5.10

CAPITVlO 5 Dl.SiRIBUOO~"E.S DISCRETAS 165

Con~ • 1.5, puede generarse la distribucién de Poisson. Veamos en ~ui<U una gr.ifia Ml~ITAB para esia dis1ribución de Poísson.

0.3

1 1 1 1 1 1

t 0.2

~ 0.)

o.o o • s 6 7 11 9

Valora X

Al comparar las dos gr.lficas, es dificil distinguir entre la distribución binomial y la distribución de Poisson debido a que es cercana la aproximación de la distribución binomial por la distribución de Poisson.

Suponga que la probabilidad de que un banco cometa un error al procesar un depó11to es .0003. Si se auditan 10 mil depósitos In), ¿cu61 es la probabilidad de que se cometan mb de seis erro· res al procesar depósitos?

Soluclón

~ µ • n · p • 110 000)(.0003) • 3.0

Debido a que n ..> 20 y n · p"" 7, la aproximación de Poisson est6 cercana lo suficiente para analizar x » 6. La tabla A.3 da las siguientes probabilidades.

). - 30 X Probeblllded

7 .0218 8 .0081 9 .0027

10 .0008 11 .0002 12 .0001

x>8 033!>

Para resolver este problema con el uso de la fórmula binomial es necesario empezar con"• 7.

10 ooo~l.0003)7(.9997)9913

Este proceso continuarla para valores x de 8, 9, 10, 11, .•. , hasta que las probabilidades se aproximen a cero. Obviamente, este proceso no es pr6ctico y hace de la aproximación de Poisson una alternativa atractiva.

5..3 PROBLEMAS 5. lS Encuentre los siguientes valores con el uso de la fórmula de Poisson.

L P(x • *' • 2.3) b. P(x • 21>. • 3.9) c. P(x s 31>. • 4.1) d. P(x • OI>. • 2.7) e. P(x • ll>- • 5.4) (. P(4 <X< SI>- - 4.4)

Page 192: libro.pdf

5.16 Encuentre los siguientes valores con el uso de las tablas de Poisson del Apéndice A. a. P(x = 6IA = 3.8) b. P(x > 7IA = 2.9) c. P(3 s X s 9IA = 4.2) d. P(x = OIA = 1.9) e. P(x s 6IA = 2.9) f. P(S <X s 8IA = 5.7)

5.17 Trace las gráficas de las siguientes distribuciones de Poisson. Calcule la media y desviación esta= dar para cada distribución. Localice la media en la gráfica. Observe la forma en que las probab lidades se grafican alrededor de la media. a. A= 6.3 b. A= 1.3 c. A= 8.9 d. A= 0.6

5.18 Los lunes por la mañana, el First National Bank tiene abierta sólo una ventanilla de cajera parad tos y retiros. La experiencia ha demostrado que el número promedio de clientes que llegan en un inR:I' valo de 4 minutos los lunes por la mañana es 2.8, y cada cajera puede atender con eficiencia más de número. Estas llegadas aleatorias a este banco los lunes por la mañana están distribuidas por Po· a. ¿Cuál es la probabilidad de que una mañana de lunes lleguen exactamente seis clientes en

intervalo de 4 minutos? b. ¿Cuál es la probabilidad de que no llegue ningún cliente a hacer depósito o retiro durante

intervalo de 4 minutos? c. Suponga que una cajera puede atender a no más de cuatro clientes en cualquier intervalo

4 minutos en esta ventanilla en un lunes por la mañana. ¿Cuál es la probabilidad de q: durante cualquier intervalo dado de 4 minutos, la cajera no pueda satisfacer Ja deman ¿Cuál es la probabilidad de que la cajera pueda satisfacer la demanda? Cuando la demanda pueda ser satisfecha durante cualquier intervalo dado, se abre una segunda ventanilla. ¡Q porcentaje del tiempo tendrá que estar abierta una segunda ventanilla?

d. ¿Cuál es la probabilidad de que exactamente tres personas lleguen al banco durante un de 2 minutos la mañana de lunes para hacer un depósito o retiro? ¿Cuál es la probabilidad que cinco o más clientes lleguen durante un periodo de 8 minutos?

5.19 La gerente de un restaurante está interesada en tomar un método más estad1stico para pron - car la carga de clientes. Ella inicia el proceso con una recopilación de datos. Uno de los empl de recepción del hotel se asigna a contar clientes cada 5 minutos de 7 p.m. a 8 p.m. todos los dos por la noche durante tres semanas. A continuación aparecen los datos. Una vez reunida información, la gerente calcula lambda con los datos de las tres semanas como un conjunte datos como base para el análisis de probabilidad. ¿Qué valor de lambda encontró ella? Su que estos clientes llegan al azar y que las llegadas son distribuciones de Poisson. Use el valer lambda calculada por la gerente y ayúdela a calcular las probabilidades de las partes (a) a la para cualquier intervalo dado de 5 minutos entre las 7 p.m. y las 8 p.m. de un sábado por la n

166 ESTADISTICA EN LOS NEGOCIOS

Número de llegadas Semana 1 Semanal Semana3

3 6 2 3 4 4 5 6 o 3 2 2 5 3 6 4 1 7 5 4 3 l 2 4 o 5 8 3 3 1 3 4 3

Page 193: libro.pdf

CAPITULO S DISTRIBUOO:\'E.5 Dl:>CaETAS 167

a. ¿Cuál es la probabilidad de que no lleguen dientes durante cualquier intervalo dado de 5 minutos?

b. ¿Cuál es la probabilidad de que seis o más clientes lleguen durante cualquier intervalo dado de 5 minutos?

c. ¿Cuál es la probabilidad de que durante un intervalo de JO minutos lleguen menos de cuatro dientes?

d. ¿Cuál es la probabilidad de que entre tres y seis (inclusive) clientes lleguen en cualquier inter­ valo de 10 minutos?

e. ¿Cuál es la probabilidad de que exactamente ocho clientes lleguen en cualquier intervalo de 15 minutos?

5.20 De acuerdo con el United National Environmental Program y la World Health Organization, en Bombay, India, los estándares de contaminación del aire por rnacropartículas han sido excedidos un promedio de 5.6 días en cada periodo de tres semanas. Suponga que la distribución del número de días que exceden los estándares por periodo de tres semanas es una distribución de Poisson. a. ¿Cuál es la probabilidad de que el estándar no sea excedido en ningún día durante un perio­

do de tres semanas? b. ¿Cuál es la probabilidad de que el estándar sea excedido exactamente 6 días de un periodo de

tres semanas? c. ¿Cuál es la probabilidad de que el estándar sea excedido 15 o más días durante un periodo de

tres semanas? Si este resultado ocurre en realidad, ¿qué podria concluirse?

5.21 El número promedio de viajes anuales por familia a parques de diversión en Estados Unidos es una distribución de Poisson, con una media de 0.6 viajes por año. ¿Cuál es la probabilidad de seleccionar al azar una familia estadounidense y encontrar lo siguiente:

a. La familia no hizo un viaje a un parque de diversiones el año pasado?

b. ¿La familia hizo exactamente un viaje a un parque de diversiones el año pasado?

c. ¿La familia hizo dos o más viajes a parques de diversiones el año pasado?

d. ¿La familia hizo tres o menos viajes a parques de diversiones en un periodo de tres años?

e. ¿La familia hizo exactamente cuatro viajes a parques de diversiones durante un periodo de seis años?

5.22 Las colisiones en el canal de navegación de Houston son raras. Suponga que el número de coli­ siones son distribuciones de Poisson, con una media de 1 .2 colisiones cada cuatro meses.

a. ¿Cuál es la probabilidad de que no ocurran colisiones en un periodo de cuatro meses?

b. ¿Cuál es la probabilidad de que ocurran exactamente dos colisiones en un periodo de dos meses?

c. ¿Cuál es la probabilidad de que ocurra una o menos colisiones en un periodo de seis meses? Si ocurre este resultado, ¿qué podría concluirse acerca de las condiciones del canal de navega­ ción durante este periodo? ¿Qué podría concluirse acerca del conocimiento de seguridad del canal durante este periodo? ¿Qué podria concluirse acerca de las condiciones del clima durante este periodo? ¿Qué podría concluir el estudiante acerca de lambda?

5.23 Una compañía fabricante de plumas para escritura promedia 1.2 plumas defectuosas por caia producida (200 plumas). El número de defectos por caja es una distribución de Poiss- n. a. ¿Cuál es la probabilidad de seleccionar una caja y no encontrar plumas defectuosa>?

b. ¿Cuál es la probabilidad de encontrar ocho o más plumas defectuosas en una e.ja) c. Suponga que un comprador de estas plumas deja de comprarle a esta compañía si una caja

contiene más de tres plumas defectuosas. ¿Cuál es la probabilidad de que una caja contenga más de tres plumas defectuosas?

5.24 Un investigador médico estima que .00004 de la población padece de una rara enfermedad de b sangre. Si el investigador selecciona al azar 100 mil personas de la población, ;cuál es la probabilidad de que siete o más personas tengan esa rara enfermedad de la sangre? ¿Cuál es la probabilidad de que más de 10 personas tengan esa enfermedad? Suponga que el investigador obtiene más de 10 personas que tengan esa rara enfermedad en la muestra de 100 mil pero que la muestra fue tornada de una región geográfica particular. ¿Qué podría concluir el investigador de los resultados?

Page 194: libro.pdf

5.25 Una empresa de regístro contiene gran cantidad de datos, Históricamente •• 9% de las pa¡: de datos rcgimadoa por la compar\1a contienen errores, Si al azar se seleccionan 200 paginas datos, a. ¿cuál o la probabilidad de que seis o mas paginu contengan errores! b, ;cuál es la probabilidad de que m.i> de 1 O p.iginh contengan errores! c. ¿cu.il o la probabilidad de que ninguna p.lgina contenga errorc ? d. ¿cu!I o la probabilidad de que menos de 5 páginu contengan errores!

5.26 Un aho porcentaje de personas que se fracturan o dislocan un hueso consultan un m Suponga que el porcentaje es 99%. Considere una muestra en la que 300 personas ~ selecci al aur y que se han fracturado o dislocado un hueso, a. ¿úúl n la probabilidad de que exactamente cinco no consulte al médico? b. ¿Cuál es la probabilidad de que menos de cuatro no con ulte al médico! c. ¿Cu.i.l es el número esperado de personas que no venan al médico!

5.5 DISTRIBUCIÓN HIPERGEOMÉTRICA

Otra distribucién ntadísuca discreta o la distribución hipergeométrica. lo expertos en e tadl•ll veces usan la distribución hípergeomérríca para complementar los tipo de an.ilisis que <e pu hacer con el uso de: la distribución binomial Recordemos que la distribución binomial aplica, en ría, solo a experimentos en los que lo intente se hacen con restitución (evento independientes). d1Stribucizn bipergeométrica aplica sólo en experimento que intentan hacerlo sin resutucién.

La distribución hipergeométrica, al igual que la distribución binomial, consta de do. posi resuhadoc éxito o fracase: pero el usuario debe: conocer el tamaño de la población y la proporción txllO> y frac:uos en la población para apli<•r la distribución hipergeométrica. En otrb palabras, d a que la distribución hípergeometrica se 11$3 cuando el muestreo se hace •in restitución, la informa' acerca de la compo kión de: la poblac:ión debe ccnecer-e para volver a determinar la probabilidad un hito en cada mtenro sucesivo a medida que cambia la probabilidad.

La distribución hipergeornétrica tiene las siguientes caracterisricas: • fa una dimibución discreta. • Cada resultado consta de un éxito o un fracaso, • El muestreo se hace in resutucién. • La población, N, es finita y conocida. • El numero de éxito. en Ja población. J\, '>C' conoce.

FORMUU. HlPfRGEOMtTIUCA

donde .\' • tamaño de la población n • tamaño muesrral J\ • numero de éxito. en la población x = número de éxito en la muestra: el muestreo '>C' hace sin restitución

Una dh1ribuaón hipergeométnca ~tá caracterizada o descrita por tres parámetros: N.A y n. la multitud de posibles combinadonn de oto> tre parámetros, crear cuadros para la distribución h geométrica es pnlct1camentc imposible. Por unto, el 111,-estigador que seleccione la di~tribución hi métrica para analizar datos debe: usar la fórmula para calcular cada probabilidad. Como este t puede 5C1' tedioso )' lento, la mayona de investigadores Usan la di tribucién hipergeométrica recurso cuando trabajan con problema. binomiale sin restitucién. Aun cuando la dístnbucién mlal teóricamente aplica sólo cuando se hace muestreo con restitución y p permanece constante, r demos que, sí la población es uficiememente grande en comparación con el tamaño mue.tral. impacto de muestrear sin restitución en p o minimo, Entonces, la distribucién binomial 'C puede

Page 195: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

5.11

CAPliUUl 5 DL~TRIBUCIOXE\ DISCRETAS 169

en algunas situaciones cuando el muestreo SC' hace >in restuución. Debido a lo~ cuadros existentes es preferible el uso de la dístnbucién binomial en lugar de la distribución hipcr¡:comctrka -iempre que ~ posible. Como regla pnktica, si el tamai\o muestral e> menor a 5% de la población, el uso de la dis­ tribución binomial en lugar de la dístribucién hipergeornétrica C'S aceptable cuando el muestreo se hace sin mutución. La distribución blpergeométrica da la prob.abilidad ex.lela, y la distribución binomial da una buena aproximacién de la probabilidad en esta• suuacíones.

En resumen, la distribución hipcrgcométrica debería usarse: en Jugar de la dístribucién binomial cuando cst~n presentes l.u ,jguientC'S condiciones:

l. El muestreo se hace sin restitución, 2. n ~ 5%N.

Las probabilidades hipergeométricas SC' calculan bajo )¡ suposición de un muestreo igualmente probable de demento> restante del espacio maestral.

Como aplicación de la dimibución hipergeométrica, consídere el siguiente problema. Veinticuatro personas, ocho de las cuales son muieres, solicitan un traNjo. Si al u.u se seleccionan cinco de lo. solí· citantes, ¿cuál e> la probabilidad de que exactamente tres de los muestreados sean muiere>?

Este problema contiene una población pequeña, finita, de 24, o 5C3 11 = 24. Se toma una muestra de cinco ~licitante>, o n = 5. El muestreo se: reafüa sin r<~titudón, porque los cinco -olicnames selec­ cienados para la muestra son cinco personas diferentes. El tamal'lo mu<~tral e> 21% de: la población, que es mayor al 5% de la población (ni.\' • 5/24 • 0.21 ). La distribución hipergeométrica e> la apro· piada para usarse, La \Ubdivísión de la población es A • 8 mujeres (éx11os) )' n - A • 24 - 8 • 16 hombres, La probabilidad de obtener x • J muieres en la muestra de 11 • 5 es

aC, • 1~C2 • (56) 120) -= _1581• 24Cs 42 5(M

Conceptualmente, la combinación en el denominador de la fórmula hipcrgcomctrica da toda. la> formas posibles de obtener n muestra, de una población • .\', incluyendo aquella> con resuhado desea • do. En este problema, hay 42 S<M formas de seleccionar cinco personas do: 24 pcr.o11a>. El numerador de la fórmula hipcrgcométrica calcula todas lai. forma. po-ibles de obtener x éxitos de lo, A éxito' di~­ ponibles )' n - x fracaso. do: lo. .\' - A íraca.o• disponibles de la población. Existen 56 formas de obre­ ner tres mujeres de un grupo de ocho y 120 form~ de obtener do> hombre. de un grupo de 16. la> combinaciones de cada una se multiplican en ti numerador porque la probabilidad conjunta de obre­ ner x hitos y además n - x fra~ se calcula.

Suponga que 18 imponantes compal'lias fabricantes de computadoras operan en Estados Unidos y que 12 están ubicadas en Silicon Valley de California. Si se seleccionan al azar tres de estas compañías de la lista, ¿cuál es la probabilidad de que una o más de las compal'lias selee­ cionadas estén ubicadas en Silicon Valley7

Solución

N • 18, n • 3, A• 12 y x 2:: 1

Este problema es en realidad tres problemas en uno: X 1 X 2 X 3 El muestreo se realiza sin restitución, v el tamaño muestra! es 16 6% de la población. Por tanto, este problema es un candidato pare la distribución hipergeométríca Veamos la solución.

X•l X•2

~+~+ 12C1 tCo • 1aC3 1aC3 1aC3 .2206 + .4853 + 2696 •• 9755

Page 196: libro.pdf

1- nCo ,e, 1- .0245 .9755 18~

170 ESTADISTICA EN LOS SEGOClOS

Un método alternativo de solución que usa la ley de complementos sería 1 (uno) menos probabilidad de que ninguna de las compafllas Htuviera situada en Silicon Valley, o sea

1 - P{x • OIN • 18, n • 3, A• 121

Por tanto,

Uso de la computadora para resolver probabilidades de distribución hipergeométrica Con MINITAB o Excel e) posible resolver probabilidades de dístribucién hipergeométrica en la comp tadora .. Ambo) paquetes de software requieren de la entrada de N, A, n y x. En cualquiera de los dol paquetes, la salida resultante es la probabilidad exacta para ti valor particular de x. La sali<U MINIT para el ejemplo presentado en esta sección, donde n • 24 ~™>nu de lu cuales A • 8 son muitM n • 5 se seleccionan al azar, y x • 3 son mujeres, se ve en la tabla 5.13. La sali<U Excel para este mis problema se presenta en la tabla 5.14.

5.4 PROBLEMAS 5.27 Calcule las siguientes probabilidades con el uso de la fórmula hipergeométrica,

a. La probabilidad de x = 3 si N = 11, A • 8 y n = 4 b. La probabilidad de x < 2 si N = 15, A = 5 y n = 6 c. La probabilidad de x - O si N = 9, A = 2 y n = 3 d. La probabilidad de x > 4 si N = 20, A = 5 y n = 7

S.28 A continuación se muestran las principales 19 compañías en el mundo en términos de capacicb! de refinación de petróleo. Algunas de las compañias son de propiedad privada y otras ~o gobiernos. Suponga que al azar se seleccionan seis compañías, a. ¿Cuál o la probabilidad de que exactamente una compañia sea de propiedad priva<U? b. ¿Cu.il e) la probabilidad de que exactamente cuatro compañlu sean de propiedad priva<U, c. ¿Cu.il es la probabilidad de que las seis compañías sean de propiedad privada? d. ¿Cuál es la probabilidad de que ninguna de las compañlas sea de propiedad privada] CompaJ\11 Estatus de propiedad Euon~1obil Privada Ron! Dut,h/Shell Privada BPAmoco Privada Totiliin¡tlf Privada Pñrólcos de \'ennuela dd Estado Sinopec Privacb SaudiAnm<o del Estado China P'1rochemical del Estado ~tróleo Bmildro cid ütado ~tróleo1 Mw<¡n°' dd E..tado National lraniam Oil del Estado Texaco Prh'llcb Chevron Pnvacb Rtp10l·YPF Privacb Kuwait Petroleum cid Estado Agip Petrolí Privada Nippon Miuubi>hi Oil Privacb Marathon Mhland P'1ro Privada Pnumina del Estado

Page 197: libro.pdf

CAPm11.0S DISTlUBUOO~~DISCRETAS 171

S.29 La publicación Oira/og Agt contiene una lista de las principales 17 empresas de ütados Unidos por ventas anuales por caúlogo. DeU Competer es la número uno. seguida por Gatew.ay y J.C. Penney. De las 17 empresas de la lisu,ocho est~n en algún upo de negocio rdacionado con eom­ putadoras. Suponga que al azar se seleccionan cuatro empresas, L ¿Clúl es la probabilidad de que ninguna de las empresas esté en algún tipo de negocio rela ·

cionado con computadoras? b. ¿Clúl es la probabilidad de que las cuatro empresas estén en algun tipo de negocio rdacionado

con computadoras? c. ¿Clúl es la probabilidad de que exactamente dos estén en negocio no relacionado con compu­

tadoras? S.30 W. Edwards Deming, en su experimento de cuentas rojas, tenía una caja de cuatro mil cuentas,

de las cuales 800 eran rojas y 3 200 blancas.· Suponga que una investigadora va 1 realizar una ver­ sión modificada del experimento de la cuenta roja. En su experimento, ella tiene una boba de 10 cuentas, de las cuales cuatro eran rojas y 16 blancas. Este experimento requiere que un partid· pante tome la bolsa y al azar seleccione cinco cuentas sin restitución. L ¿Clúl es la probabilidad de que el panicipante seleccione exactamente cuatro cuentas blancas? b, ¿Clúl es la probabilidad de que el participante seleccione exactamente cuatro cuentas rojas? c. ¿Clúl es la probabilidad de que el participante seleccione todas las cuentas rojas?

S.31 A continuación aparecen las principales 10 ciudades de Estad~ Unidos clasificadas por número de cuartos de hotel (información compilada por Smilh Travel Researeh). NdnMro Ciuclacl NdnMro de CUU10S

ta. \'eg¡u. NV 106100 2 Orlando, Fl 92 200 3 LM Ángdes·Long Bach, CA 80000 4 Atlanta,GA 73 100 s Chicago. lL 71 000 6 Washington, OC 68 700 7 ll:ueva York. !\'Y 66600 8 Da!W, TX 48 500 9 San Diego. CA 47 200

10 Anaheim-Sanu Ana, CA 44 600

Suponga que al azar se selecdonan cuatro de estas ciudades. L ¿Clúl es la probabilidad de que exactamente dos ciudades estén en California? b. ¿Úúl es la probabilidad de que ninguna de las ciudades esté al este del río Mí.ssi"ippi' c. ¿Clúl es la probabilidad de que exactamente tres de las ciudades tenga m~ de 70 mil cua."tOS?

S.32 Una compallla produce y envía 16 computadoras personales sabiendo que cuatro de ellas timen alambrado defectuoso. La companla que compra las computadoras hará pruebas minllomas a tres de las computadoras y puede detectar el alambrado defectuoso. ¿Cuál es la proNbWcbd de que la compallfa compradora encuentre lo siguiente? L Ninguna computadora defectuo.a b. Exactamente tres computadoras defectuosas c. Dos o más computadoras defectuosas d. Una o men~ computadoras defectuosas

S.33 Una ciudad del oeste tiene 18 oficiales de policía elegibles pira promoción. Once de 1o$ 1 son de origen hispano. Suponga que sólo cinco de I~ oficiales son escogidos para promoción y que uno es de origen hispano. Si los oficiales escogido. pua promoción lubi.an sido sde-cdonados sólo al azar, ¿cuál es la probabilidad de que uno o ~ de b cinco o6ciales promovido. hubiera sido de origen hispano? ¿Qu~ podría indicar este resultado?

Page 198: libro.pdf

TABLA S.14

172 ESTADISTICA E!' LO!> SEGOCIO~

TABLA S.13

Salida MINITAB para el problema hipergeométrico

Salida Excel para un problema hipergeométrico

Ri~ico con N • 24, X• 8, y n • 5

X P(X • X)

o.oo 0.106

1 1 A 1 a 1 e Probability Denaity Punction

El bueno y el malo en la imagen pública de la industria bancaria

Si los resultados del estudio de Ja banca nacional pueden ser aceptado> como cifras de población. numerosos porcentajes presentados se pueden usar como valoro p y aplicados al análisis muestra) el uso de distribución binomial. Por ejemplo, 80''0 de todos lo> consumidores financiero> considera qtx su banco es su institución financiera principal. Si al azar se -eleccíonan 25 consumidores financieros. número esperado de los que consideren que el banco es su insurución financiera principal se puedec determinar junto con Ja probabilidad de cualquier número panicular de O a 25. El valor de n es 25 r es .80. El número esperado es u = n · p = (25)(.80) = 20. Uno esperaría que 20 de las 25 perso seleccionadas consideran que el banco es su institución financiera principal. La probabilidad que 1 mas considere que su banco es su institución principal se puede obtener al sumar valores de x de 1 25 en la tabla A.2 que resulta en .997. Casi todo el tiempo en una muestra aleatoria de 25 consumido­ res financieros, 18 o más dirán que su banco e> su institución financiera principal si en verdad 8~ todo> los consumidores financieros asi lo piensan.

De igual modo, si 65% de todos los consumidores financieros están muy satisfechos con su inst. tución primaria y se seleccionan al azar 15 consumidores financieros, se puede aplicar la distribu · binomial (n = 15, p = .65). El número esperado es 11 = n · p = 15(.65) • 9.75. Vemos que con distribución discreta nunca obtendremos 9.75 consumidores financieros de 15 que están muy sati5!e cho>; sin embargo, las probabilidades para los valores x alrededor de e:;ta cantidad deberían ser los alto' para esta distribución,

Suponga que un estudio local de 32 consumidores de banco> revela que 26 piensan que e> ~ usar cajeros automáticos. Si al azar se toma una muestra de 7 de estos 32, ¿cuál es la probabilidad que exactamente 4 de lo> 7 se sientan seguros de usar cajero> automático>? En este problema hipergee­ métrico.N= 32,,, = 7,A = 26 y x • 4. La aplicación de Ja fórmula hipergeométrica da una probabilida! de 0.0888. En esta población, 26 de 32 o sea 81% piensan que e> seguro usar cajeros automáticos. obstante, en la muestra de 7, sólo 4 o sea alrededor de 51% piensan que e> seguro usar cajeros aut> maticos. La probabilidad, 0.0888, significa que sólo alrededor de: 8.88% del tiempo se presentarta al este resultado (4 de 7) en esta población.

8 frecuente que lo> problema> de llegadas aleatoria> sean descritos por Ja distribución de Pois Si, en promedio, un banco tiene 3.8 clientes que llegan cada 2 minutos, emonces es probable que preguntas de probabilidad acerca de llegadas específicas de cliente. se puedan contestar con el U'>O la distribución de Poisson con lambda igual a 3.8 y siendo de 2 minutos el intervalo. La probabili de que no haya llegadas en un periodo de 2 minuto> (x • OJ es .0224 obtenida con el uso de la t A.3 del Apendicc. La probabilidad de que más de cinco cliente. lleguen en un periodo de 2 minutos .1844. Si se emplea un intervalo de 4 minutos, lambda" ajusta al duplicar lambda para satisfacer intervalo duplicado que resulta en una lambda de 7.6 para 4 minutos. La probabilidad de obteoe menos de tres dientes en un intervalo de 4 minutos es .O 188.

Page 199: libro.pdf

CAPITUW S 01~ TRIBUCIO'l:E.~ Ol'>CRETAS 173

RESUMEN

Los expenmentos de probabilidad producen resultados alea­ ;orios. tina variable que contiene los resultados de un experi­ mento aleatorio \C denomina variable aleatoria. Las variables a:eatoria) tal~ que el conjunto de todos (0$ posibles valores es a lo sumo un numero finito o contablemente infinito Je valo­ res posíbtes se llaman variables aleatorias discretas, La> varia· bles aleatoria.' toman valores en todo> los puntos sobre un i::::tm-alo dado y se denominan variables aleatorias discretas. Las distribuciones continua. se construyen de variables alea· lOria.s continuas, Tres distribuciones discreta. son la dístribu­ ción binomial, la distribución de Poisson y la distribución é:pergrométrica.

La distribución binomial se adapta a experimentos cuando posible> sólo do> resultados mutuamente exclusivos, En

rrorla, cada intento en un experimento binomial debe ser in· dependiente de 10$ otros intentos, No obstante, id tam:iilo po­ bbcion:al e• suficientemente grande en relación con tamallo cuestral (n < 5%S), la distribución binomial se puede usar donde sea aplicable en caso> donde (0$ intentos no son inde­ pendientes. La probabilidad de obtener un resultado deseado en cualquier intento se denota como p. que es J;a probabilidad dt obtener un suceso. La distribución binomial se puede usar ~ analizar estudio, discretos que comprendan cosas como

;;;ua;'cruz. defectuoso/bueno y hombre/mujer. La fórmula bmomial se U$.1 para determinar la probabilidad de obtener x =ltados en n intento' Lo· problemas de di\tnbución bino-

se pueden resolver mas rápido con el uso de cuadros bom1tles que por fórmula. Una cuadro binomial se puede

construir por cada par ditcrcntc de valores n y p. la tabla A.2 dd A~ndice A contiene cuadros binomiales para valores seleccionados den y p. La media. o promedio a largo plazo, de una Jímíbudón binomial es m = n • p. La desviaeién están· dar de una disrribucién binomial l'S Vn · p • q.

La distribución Je Poisson se utiliza por lo general para analizar fenómeno que producen >UCCSO> poco comunes. la única información necesaria para generar una distribución de Poisson es el promedio a largo plazo, que se denota por lambda (>.). La Jistnl>udón de: Poisson e> propia de suceso de algun intervalo. Las suposiciones son que cada suceso e> indepen­ diente de otros sucesos y que el valor de lambda permanece constante en todo el experimento. Algun~ ejemplo de expe­ rimemos del tipo Je Poisson son el número Je errore por p.igina de papel, numero de accidente> por 1 000 vuelo> Je aerolíneas comerciales, y numero de llamadas por minuto en un conmutador. las probabilidades de Poisson se pueden determi­ nar ya sea por la fórmula Je Poisson o las cuadro. de Poisson Je: la tabl.i A.3 dd Apéndice A. Lambda es tanto la media como la \"UÍ.1n1.a de una distribución de Pois-.on. La distribucién Je Poisson se puede usar para calcular problema> de distribución binomial cuando n es grande (n > 20), p O pl"<¡Ucna y 11 • p :S 7.

La distribución hípergeométrica () una distribucién di>· creta que sude usarse para experimentos tipo binomial cuando la población es pcqueila y finita y el muestreo se rcali1a \in res­ titución. Debido a que usar la disrribucién hipergeométrica cs un procese tedioso, usar la distribución binomial siempre que sea posible c. generalmente m.U ventaioso.

TÉRMINOS CLAVE

t.::stribución binomial =nbuciones continuas .::suibucionesdisaetas

distribución hipcrgeom«rica distribución de Poisson lambcla(X)

variable aleatoria variables aleatorias continua> \-ariablo aleatorias discretas

valor medio o esperado

FÓRMULAS

\'alor medio (esperado) de una distribución diKrcta

µ • E(x) • ~[x · P(x)]

\'arianu de una distribución discreta q2 • L{(x -µ)2. P(x)]

Desviación estándar de una distribución discreta

"= J~(x-¡1)2 · P\x)I Fórmula binomial ,,, .c .. · P' • q"-~ • . · P" • q"-" .x!(n-xl! Media de una distribución binomial

¡1 • r1·p

Oe$'iadón estándar de una distribución binomial

Fórmula de Poisson

Fórmula hipcrgcomttrica

Page 200: libro.pdf

CONSIDERACIONES ÉTICAS

Deben destacane ftriol pullCol ~del UIO de cliltribucianel dilama La ~y/OA!pCllKKlllelelelllnllocleben ....... 11_.latlilb eD Sltu8C10IMI doadetl........, • ..imm lllltituci6n. ll t1m11oy .. ~" .._ facmt al mu la dilaillud6u ele PoillOll pera calc:uJar v.olllemm libim • l da Ba cWI; 1 a de los cb ca-. DO lllilfar- l8p MM lWI puede raullar 111 ......_ fllllL

Cuando 11 -. el _, de diltribucionft binomilla ,.. ...., .... E' fr1 ele valor "se hlcr .....,....., pan tomar decilionea. Aun cuado 111 ,....,..., da - -­ ntiwncDlfcanma.,cumclo 11 a hice .-pw1t.1a pl'oWlAWdratllqaia'wlat.,.... br te mtacir ponp hlY ... ...ae. entre loe aJlles diYidir ... pdllll'' da ........... " - 100.,, .so. .. ,...,...w de 1l 50 el .1796. Ea. pn>WIW e1e..mr...- ...... rr be;. aun camelo 50 w el valor aperedo dt esca clilcribad6a •....._el wlar _.. problble ... -. .... 6111 ..-w illd110DV.,.•cildD..W..,.zhrU: 1 .. ..._,..,....,....._ •• , ,..--. .. rst• a prMlltz n --- Jl(s 50) .-fts 50

En _ _. l -- lllftltlO ele ... lbadda ele Poilloa. Alguw luwlllplaM puedm pmdudr 1 t fo .._,_ qmel wlardr A Clllllbla ..._an atadlo. PorfjempD.-.ci .......... ..._tlwlar•A panel..._.,dr ...... eledBoaaunadmdaele,...._.. ,,_ • .,.,_., clk:leat.&Comocldeuae • 1111 mes8Clho en dradwclf,..._dl......,,._ ..... ele elmocletlllpera , .. 2,... ee....., lllfa luipwoplrlllo.,. cieno paneo. no aklD.

Loe tmlftll dt Jalcio CIOlllO IOD proMllen•• 1'1111 • cllio ile {tllt MI lit ftlca.Sla fllle ... apertolell•~·· 'J , 1 •lsl IUplllicble r 1plicado11a lplOpiadu dt ettu t«lllCIL La mapaddlll eMa di 111 's 'jan hacerlo 111 lbtt el canuno pen tomas de decisiones no fticls.

C.lculo de ntad1sticas

PROBLEMAS COMPLEMENTARIOS

S . .H Resueh11 las prob.lbilidadcs de los siguimtr$ problemas de distribución binomial con el uso de la fórmub binomial.

a. Si n m 11 y p e .23, ¿cuil es b prob3bilid3d de que .?

b. 51 r 6 y p • .50, ¿cuál es la probabilidad de que '2 l

c. Si n • 9 y P • .SS, ~cuál es la probabilidad de que X> i?

d. Sin • 14 y pe: .;o, c•uál es la probabilidad de que xs 3?

S.35 Uiilkt la tabla A.2. Aptndice A. para encontrar los \'alOl'e$ de los siguientes problema$ de distribucién binomial. a. P(ic • 14ln • lOyp • .60) b. l'tx< Slri • IOyp • .30) c. P(x <:: 12ln • IS ;y p • .60) d. P(x > 20ln • 25 y p • .40)

S.36 Utilia b fórmub de PoWon p.uu rnoh'tt las pro!W>ilid.i· des de los siguimtcs problmw de distnbución de Polsson. a. Si). • 1..25, (cuiJ es la prebabílidad de que X• 4? b. Si). • 6.3;', ccW.I es b probabilidad de que x s 1? c. Si ). • 2.4. ¿cuál es 1.1 probabilidad de que x > 5?

5.37 Use la tabla A.3, Apfodice A. p.ira encontrar los siguim­ tes valores de: distribución de Poisson. a. P<x ·JI>- - 1.s> b. P(x < 51>- • 3.3) c. P(x <:: 31>- • 2.1) d. />(2 <X S sp, "" 4.2)

S.38 Re>ud\"a los siguimto problmw con d wo dt la fón= hí~eomttrica. a. Si S .. 6, ri • 4 y A • 5, ~cuál es la probabilidad

quex .. 3~ b. Si N • 1 O. n • 3 y A • 5, ¿cuál es la probabilicüd de

qu~ s H c. Si ~ 13, n • 5 y A • 3, ¿cuál es b pr<>Nbilidad de

que x <:: 2?

Pruebe aua conocimiento•

S.39 En un estudio htdio por Pfter D. Han Research ~ para la :-;.ucUq S1ock Markct, se dctmninó q11t 20% todo. lo> invtrsionístas de acciones son penona5 jubila­ ~Adanis, 40% dt todos 10:1 adultos m üudos Unido& invierten en fondos mutuos. Suponga qut se loma - mucsira al azar de 25 im~rsionistas en acciontS. ¿Cuil la prubabílidad de que c:xacumente siete i<'an peno jubila.Ju? ¿Cu.U o la probabilidad de: que 10 o m4>

Page 201: libro.pdf

peno~ jubiladas? ¿Cuánw personas jubiladas espera­ na u red encontrar en una muestra aleatoria de 25 inver- 6ionisw en acciones? Suponga que se toma una muestra al var de 20 aduhOi de a,tado. Unidos, ¿Cuál es la pro· babilídad de que exactamente ocho adultos in\ icrtan en fondos mutuos! ¿Cuil es la probabilidad Je que menos de seis adultos inviertan en fondo• mutuos? ¿Cu.il es la probabilidad Je que ninguno de los aduhos inviertan en fondos mutuos! ¿QUI es la probabilidad de que 12 o m.li adulto.' inviertan en fondos mutuos? ¿Para que! número exacto de adulto~ o la probahilidad más alta? ¿Cómo se compara ~ta cifra cnn el número esperado!

5.40 Una gasolinera tiene una bomba que dimibuyc com- • bustible dibcl a automéviles. El propietario estima que sólo unos 3.2 autos usan la bomba de diésel cada 2 horas. Suponga que las llegad.u de usuarios de la bomba de diésel son una djstribucién de Poisson, L ¿QUI es la probabilidad de que tro auto. lleguen a

11$.lr la bomba de Jikt-1 durante un periodo de 1 hora?

b. Suponga que el propietario necesita cerrar la bomba de diésel durante media hora para hacer reparacio­ nes, aun cuando le disgusta perder un negocio, ¿Cuál es la probabilidad de que no lleguen autos a uar la bomba de diésel durante el periodo de mtdia hora?

c. Suponga que cinco autos U~ durante un periodo de una hora para usar la bomba de: diésel, ¿Cuil e~ la pro· babi.lid.1d de que cinco o más autos lleguen durante un periodo de 1 hora a usar la bomba de di6d? Si en rea­ lid.id OCWTC este resultado. ¿que! podría conduincl

S.~ 1 En una planta manufacturera en particular, dos maqui­ nas (A y B) producen una pina especial. Una máquina (B) es mis nueva y mis rápid.i. En un periodo de 5 minu­ tos se produce un lote formado por 32 piezas, 22 de l.u cuales son producidas por la máquina By el resto por la núquina A. Suponga que un inspector selecciona al azar doce píeus de este lote. L ¿Cuil o la probabilidad de que exactamente tres pie·

za• se hicieran en la máquina A? b. ¿Cuál es la probabilidad de que la mitad de las piczu

se hicieran en cada máquina? c. cCuil es la probabilidad de que toda> las piezas se

hicieran en la máquina B? d. ¿Cuil es la probabilidad de que: siete, ocho o nueve

picz~ se hicieran en la máquina B?

5.4.? Suponga que, por cada lote de 100 chips de computadora que produce una compai'úa. un promedio de 1.4 son de· fectuosos. Otra compat\ia compra muchos lotes de esto• chips a la \~1.; uno de otos lotes se selecciona al arar y se prueba en busca de defectos, e;¡ el lote probado contiene mis de tres defectos, cl comprador mhazan todo el lote enviado en esa remesa, ¿Cuál es la probabilidad de que el comprador acepte los lotes? Suponga que los defectos por lote son una distribución de Poisson,

CAPmJLO 5 OISTlUBUCI0:-01'.S DISCRETAS 175

5.0 FJ l\ational Cerner for Health Statistia reporta que 25% de todos los ntadounidcmt~ entre 65 y 74 aAos uenen un padecimiento crónico del corazén, Supongamos que el lector vive en un estado donde el ambimtc es propi­ do para una buena salud r estr~ bajo, y que las condicio­ ne:~ en ese estado promueven corazones sanos. Para inve tigar esta teoría, el lector rcafüa una encuesta tde· fónica aleatoria de 20 persona» de entre 65 y ;.i aflos de su estado, •· Con base en la cifra del National Centtt for Health

Statisucs, ¿cuál es el numero aperado de personas entre 65 y 74 afio¡ en JU encuesta que timm un padecimlento crónico del corazón!

b. Suponga que sólo una persona en ota encunta time un padecimiento crónico del corazón. ¿Cu.al o la pro· babilídad de tener una o mCOO) penona. con padeci­ miento crónico del corazón en una muestra de 20, si 25'!11 de la población de esta edad time este problema de salud? A partir de los daros muotralo, ¿qué con· cluyc usted a.:crca de su estado nattH

S.44 t:na encuesta rcalíl..1da por la l"orthwntcm Nauonal Life lnsurance Company m~16 que 70% de tratMjadom esta· dounidenses dicen que el estrt. del trabajo In causa pro· blemas frecuente. de salud. Cno de cada tres dijm>n que esperaban consumirse en el trabajo en un futuro cercano, Treinta r cuatro por ciento dijeron que el allo pasado pensaron seriamente en renunciar a \U trabajo por el mm, de los cuales 5)% dijm>n que con much.'I frecoen­ cia se lci. pedía trabajar m.t. de 40 hor<b a la $CJT11Da.

a. Suponga que se scl«dona una muestra aleatoria de 10 trabajadores estadounidenses, ¡Cuil es la probabilid.ad de que más de siete digan que el ntr~• del trabajo les cawó problema. frecuento de salud? ¿Cuil es el núme­ ro esperado de trabaiadore que dicen que el estrés del trabaio lo causó frecuentes problemas de salud'

b. Suponga que se selecciona al aur una muestra de 1 S trabajadorc. ~tadounidcnso. (Cuil o el número cspe· rado de estos trabajadores muestreado. que dipn cpe .e con<umirán en un futuro cercano? ¿Cuál es la pro­ babilidad de que ninguno de los trabajadores d:p que se con.urnirá en un fururo cercano?

c. Suponga que al azar se IC!ecdona una muestra de sxtt trabajadores. ¿Cuál es la probabilidad de que los ,iet<' digan que con &ecuenc .e les pide uabzja: ch de 40 hora. por semana' Si realidad ocwu es:t resultado, ¡qué podria co<1c d lcaor~

5.45 De acuerdo con Padgcn Business 5ervia:5., ~de lodos 10> propietaria. de pcqudlos negoaos dm cpe d COD· 5<'jo m~ importante' pa.ra inicu.r un DC'toOO es pnpa· ran.e para larg,i. horas y trabajar duro. \'cmtlCUXl) por ciento di.:en que d consqo más anpo:umc es tmcr listo un buen linandamicnto. ~-in~ por aemo dicm que: tener un buen plan es el consejo más unporunte; 18% dken que cstudiar b industria es el consejo más importante y 1 'líi citan otros consejos. upor.ga el ltaor

Page 202: libro.pdf

116 ESTADISTICA E~ LO) l'EGOCIOS

que se entrevista a 12 propietarios de pequd'l<» negocio,¡, y suponga también que los porcentajes se cumplen para todos los otros propietarios de ptqumo> negocios. a. ¿Cuál es la probabilidad de que ninguno de lo> pro­

pietario> diga que prepararse para~ horas y tra­ bajo duro es el consejo más importante!

b. ¿Cuál es la probabilidad de que .eü o más de los pro­ pietarios diga que prepararse para largas horas y tra­ bajo duro e. el consejo m.4 importante?

c. ¿Cuál es la probabilidad de que exactamente cinco propietarios digan que tena lllto un buen financia­ miento e. el consejo ~ imporunte?

d. ¿Cuál es el número esperado de prop~ que dírian que tener un bum pbn es d consejo ~ importante?

S.46 De acuerdo con un estudio reciente, la probabilidad de que un pasajero presente una queja ante el Department of Transportation. :tara de una aerolínea estadouni­ dense en particular, es .000014. Suponga que al azar se seleccionan 100 mil~ que volaron en es1a aero­ línea en p.irtkulu. 1. ¿Cuál es la probabilidad de que exactamente cinco

pasajeros presenten quejas? b. ¿Cuál es b probabilidad de que ningún pasajero pre­

sente quejas? c. ¿Cuál es b probabilidad de que más de scü pasajero>

pmcmm qucja5?

S.47 Un otilista de pduqunú ba estado un ano en este nego­ cio. Sesenta por ciento de sus diemes entran sin cita. Si al uar muestrea ocho de las personas de la füta de clientes de la 1ernana p.is;ida. ¿cuiJ es b probabilidad de que tres o menos entren sin cita? Si en realidad ocurriera este resul­ tado, ¿cu.ilcs iCrlan aJgmw de las explicaciones para ello?

S.48 Según el US Ccn5u¡ Burau.alttdedorde 20%de I06 resi­ dentes de ldaho ,;,-mm zonas mctropoti~ i::.te por· cenuje es el m.4 baio de los SO ~os de la l:nión. Una compafúa de ventas por aaUJoso de Georgia acaba de adquirir una füta de consumidor-e. de ldaho, Su analista de mercado selecciona al azar :!5 personas de esta lí$ta. 1. ¿Cuál e> la probabilidad de que exactamente ocho

persona. vivan en zonas metropolitana>? b. ¿Cuál es la probabilidad de que la analista obtuviera

más de 10 persona. en esta muestra que vivan en zonas metropolitana6?

c. Suponga que la analista obtuvo más de 10 personas que viven en zona> metropolitanas del grupo de 25. ¿Qué podrta concluir db acerca de la lista de la com­ pañta de consumidores de Id.abo? ¿Qué podría con· cluir eUa acerca de lo> dato> del censo?

S.49 Suponga que, por cada viaje de vacaciones familiares en auto de m.h de 2 mil millas, en promedio ocurre .60 de falla de neumáticos. Suponga también qÜe toda la distri­ bucíón del numero de fallas de neumático, por viaje de más de 2 mil millas es de Poisson, ¿Cuál es la probabili­ dad de que una familia haga un viaje de mis de 2 mil

millas y no tenga fallas de neumáticos? ¿Cuil es la pro· babilidad de que la familia tenga tres o más fallas de neumático. en ese viaie? Suponga que los viajes son independientes y el valor de lambda ~ cumple para todos lo> viajes de ~de 2 mil millas. Si una familia hace de» viajes dé m.4 de 2 mil millas durante un verano, ¿cu.U es la probabilidad de que la familia no tenga problemas de neumáticos en ninguno de esto. do. viajes?

S.SO La publicación Editor and Publisher Ytarbook publica cifras acerca de lo> principales periódicos de Estado> Unido>. A continuación \'Ca/110$ los 25 principales dia­ rios de Estados Unidos, clasificado> de acuerdo con >U circulación. Lugar Pttiódko

1 !\""'York Time. (1''Y) 2 Lo• Angel e> Times (CA) 3 WaJiington Po5t (DA) 4 Kcw "•rk Daíly ~ews (KY) s Oücago tribune (IL) 6 Long lsland K~scby (ISY) 7 Housten Chronicle (TX) 8 Dallas Morning K~·• (TX) 9 Otiago Sun-Times {IL)

10 Boston Globe (MA) 11 5An Francisco Chroniclc (CA) 12 Photnix Aru.ona R<publíc (AZ) 13 Kcw York Poo1 (~'Y) 14 Denver Roclq· Moun1am "~"' (CO) IS Deneer Poot ( CO) 16 !\cwark Slu· Lcdgcr (NI) 17 PhiWklphu lnquittr (PA) 18 San D1q¡o Ynion-Tnbune (CA) 19 Dctroil Pree Pm> (MI) 20 OC\dand Plain Dealer (OH) 21 Orangc Country ~lér (CA) 22 Portland OrcgoniAn (OR) 23 Maami Htrald ( FL) 24 MumeapoJi, Sm Tribune (MN) 2S St. Pncnburg TunQ ( fl)

Suponga que una investigadcra de-ea muestrear parte de estos periódico> y comparar los tamaños de secciones de negocios de los periédicos dominicales. azar ella muestrea ocho de estos periódicos. 1. ¿Cuál e. la probabilidad de que la muestra cont

exactamente un periódico localizado en el estado Nue..-a York?

b. ¿Cuál es la probabilidad de que la mitad de los~ estén dasj6oit!o,,, enue los 10 primeros por circulació::

c. ¿Cuál es la probabilidad de que ninguno de periódicos estén localizados en California?

d. ¿Cuál es la probabilidad de que exactamente tres los periódicos estén localizado> en estado> empiezan con la letra M?

Page 203: libro.pdf

~ Una oficina de Albuqum¡uc tiene 24 trabajadores incluyen· do b gercnda. Ocho de~ trabajadores \'iaian de un subur­ bio a su trabaio dock d bdo oeste del rio Grande (Bra•'O). Suponga que Iris de b olicinbw al azar se sdeccionan. a. ¿Cuál es la probabilidad de que lo> ~b trabajadores

viaien de un suburbio a su trabajo desde el lado oeste dd no Grande?

b. ¿Cuil o la probabilidad de que ninguno de lo. tra­ baiadores viaje de un suburbio desde el lado oeste del rio Grande?

c. ¿Ciúl probabilidad. (a) o (b) es mejor? ¿Por qué pim>a eso.

d. ¡Cuil es la probabilidad de que la mitad de lo. traba· jadores no viajen de un suburbio desde el lado oeste del río Grande?

.!.5.? ~ d U.S. Census Bureau, 20% de ~ traba~ra de • .\ll:uua usan transporte publico. Si se seleccionan al azar 25 trabajadores de Atbnta, ¡cu.tl es d numero esperado que use transporte público? Gra6que b distnbución binomial para e.ta muestra. ¿Cu.iles son b medja y la desviación esúndar para esta di)tnbución? ¿Cuál es b probabilidad de que más de 12 de los trabajadores seleccionados usen transporte público? Explique conceptualmente y a par· ur de la gráfica por qué obtendría usted esta probabili­ dad. Supongamos que el lector muestrea al azar 25 trabajadores de Atlanta y en realidad obtiene 14 que us.in transpone público. ¿Es probable este resultado? <Cómo podria explicar usted este resultado?

s..;J lina de las primeras aplicaciones de la distribución de Poisson fue para analizar llarnadas entrantes a un con· mutador telefónico. Algunos analistas generalmente piensan que las llamadas telefónicas aleatorias son du­ tribuciones de Poisson. Suponga que las llamadas tele· fónicas a un conmutador llegan a un ritmo promedio de 2.<I llamadas por minuto. a. Si una operadora desea tomar un descanso de un

minuto, ¿cuil es la probabilidad de que no haya lla· mad.i6 durante un intervalo de un minuto?

b. Si una operadora puede manejar a lo sumo cinco lla­ madas por minuto. ¿cuál es la probabilidad de que la operadora no pueda manejar las llamadas en ningún periodo de un minuto?

c. ¿Cuil n la probabilidad de que exactamente tres lla­ madas lleguen en un intervalo de do> minuto>?

d. ¿Cuil es la probabilidad de que una o menos llama· das lleguen en un intervalo de 15 segundos?

5.54 $ólo 1% de todas las familias esudounidenses no tienen televisor a color. Un analilta de mercadeo de televisión selecciona al azar 160 familias estadounidenses. a. ¿Cuántas familias esperana ti que no tengan televisor

a color? b. ¿Cuil es la probabilidad de que ocho o más familias

no tengan televisor a color? c. ¡Cuál es la probabilidad de que entre do> y sei> fami­

lía> [inclusive) no tengan televisor a color?

CAPfnlLO S DIST1UBUOO.SE5 DISCRETA:. 177

5.55 Suponga que en la operación de contabilidad de una gran corporación, la probabilidad de un error de registro en cu.11quicr facturación es .005. Suponga que b proNbilidad de un error de regí~tro de una fa.:turadón a b siguiente es constante y un audítor muestrea al azar mil facturas.. a. ¿Cuil es la probabilidad de que menos de cuatro fac·

ruraciones contengan un error de registro? b, ¿Cu!I es la probabilidad de que mí$ de JO íactura·

cienes contengan un error de facturacién! c. ¿Cuál es la probabilidad de que la. mil facturaciones

no contengan errores de reg~tro?

De acuerdo con la American Medícal Association, aire· dedor de 36% de todos 10> m~ÍCO> estadounidenses de meno. de 35 ai'i0> de edad son mujeres. Su companla acaba de contratar ocho médicos de menos de 35 ai'io> y ninguno es muier. Si un grupo de doctoras mujeres desea demandar a su compañía por práctiau discriminatorias de contratación, ¿tendría usted un caso dificil con base en estos número•? Utilice la distribución binomial para determinar la probabilidad de que el resultado de la con· tratacién de la compañía ocum al azar y comente sobre la potencial justificación para una demanda.

El siguiente cuadro es una lista de las 32 m.is grandes universidades de futado. Unido~ de acuerdo con cifras de inscripciones de \\orld Almanac.

Ull.ÍYa'Sidad hucritos

5.56

5.57

Univtrsi¡y of Phoenix (AZl Uni\usiry ofTeras at Ausun (TIC) Ohio Sme Uni•'m11}'-Columbu. (OH 1 Univmity of Mínnesota (~t!\) IJnh-mity of Florida t FL) Arizona Smt IJnh-míty (AZ) Tcus A&~t Univmiry--Collegt Station (TIC) \lichigan Statt Unh·mity (~U 1 Uni~ty of W'11COnsin-Madison (WI 1 Pmnsyh-ania Suie-Univmity Park (PA) Ul\l\-mity oí lllinoiJ...Ownpaign t IL) Purdue Uni,'tmty-\\est u~1e (l~'l Univnsity of Michipn (MI) ~tw York Uni,·rn.ity (:-.'Y) Indiana Uni,'Cr>lty-Bloomington (1~") Uni•tt>ity of California at Los .Angda (CA) Univnsity of Wuhington ( W:\ Univmity oí South Florida t FL) Rut8ff1 Uni•~nity (:-111 Unh~nity of Arizona (AZI Florida Statt Uni\Tnity ( FL) Unl\-mity of Cmtral Florida (FL) Unh·míty of Maryland-ú>lkge Park (MD) Brigham foung Unl\Tn11y (UT) Un"-mity of Houston (TXl Florida lntmiatíoml Unh'mÚV (FL) San Diege State Uni,'t'nlty (CA) Univ~ty of Califonm at Bcñdn- lCA) Uni•·rn.ity of Gorgü (GA) California State Uni.-enity Long 8rach (CA) l.Duiuans 'itate Unhnuty (U.) Waym \me UnMni1y (MI)

66SJ4 49996 47952 45481 45 11~ 44126 44 026 4) Jó6 41 219 405il 3;965 3;8il 37 59S 3; 150 3; (r.6 '6 '6134 '6015 JS2J7 JH60 JJ951 33 713

"I 315.S4 31123 31945 31609 31 ).47 31 2SS 30916 30861 30405

Page 204: libro.pdf

•· Si de la lista se seleccionan al azar cinco universida­ des difcttnt~. ¿cuál es la probabilidad de que tres de ellas tengan 40 mil o mú alumno, inscritos?

b. Si de la lista se seleccionan al azar ocho universidades diferentes, ¿cu.il es la probabilidad de que dos o menos san universidades de Michigan o Arizonal

c. Suponga que las universidades se seleccionan al azar de la lista y con restitución. Si se muestrean cinco universidades, ¿cu.il es la probabilidad de que la muestra contenga exactamente dos universidades de Texas?

5.58 En una ciudad de la Región Central, el gobierno tiene 14 cuas recuperadas, que al evaluarlas resulta que valen casi lo mismo. Diez de la:. casas están del lado norte de la ciudad y el resto est¡n en el lado oeste. Un contratista de la localidad remite una cotización para comprar cua­ tro de las casas. a. ¿Cu.iles de las casu que obtendrá el contratista está

sujeta a retiro aleatorio? b. ¿Cuál es la probabilidad de que las cuatro casas selee­

cionadas por el contratista estén en la lado norte de la ciudad?

c. ¿Cu.il es la probabilidad de que las cuatro casas selec­ donadas por el contratista estén en el lado oeste de la ciudad?

5.59 El Public Citizen's Health Research Group estudió las -cvcr.u acciones disciplinaria, que se tomaron durante un año reciente a doctores no federales en Estados Unidos El promedio nacional fue 3.84 acciones severas por mil doctores, El estado con el número mas bajo fue Mmncsota, con 1.6 acciones severas por mil doctores. Suponga que los números de acciones severas por mil doctoro en Estados Unidos y en ~linnt.)Ota son distri­ buciones de Poi-wn. a. ¿Cuál e> la probabilidad de seleccionar al azar mil

doctores de E:.tad~ Unid~ y no encontrar acciones severas tomadas?

b, ¿Cuál es la probabilidad de seleccionar al azar 2 mil doctores de Estados Unidos y encontrar seis acciones severas tomadas?

c. ¿Cuál es la probabilidad de seleccionar al azar 3 mil dcetores en Minnesota y encontrar menos de siete acciones serias tomadas?

Interpretación de le Nllde

5.60 Estudie la salida Mll'ITAB. Analice el tipo de distribu­ ción, la media, desviación estándar y la razón por la que las probabilidades caen como se ve aqui.

Probabílity Oenaity Function Binomial with n • 15 and p • 0.36000

X P(X •X) 0.00 0.0012 1.00 0.0104 2.00 0.0411 3.00 0.1002 4.00 0.1692 5.00 0.2093 6.00 0.1963 7.00 0.1419 8.oo 0.0798 9.00 0.0349

10.00 0.0118 11.00 0.0030 12.00 0.0006 13.00 0.0001 14.00 0.0000 15.00 0.0000

5.61 Estudie la salida Excel. Explique la distribución en tér­ minos de forma y media. ¿Son estas probabilidades bs que se esperarían! ¿Por qué si o por qué no?

Poiaon Probebilities: A • 2.78 o 0.0620 1 0.1725 2 0.2397 3 02221

' 0.16« 5 00858 e 0.0398 7 0.0158 8 0.0055 9 o. 17

10 0.0005 11 0.0001

5.62 Estudie la salida gráfica de Excel. Describa la distribu­ ción y explique por qué la gráfica toma la forma que K ve aquí,

Page 205: libro.pdf

Ol>lnbuáón binomlol: " - 22 'p - .64 o.i ...... ~~~~~~~~~~~'--~~---,

0.11 0.11> 0.14

~ 0.12

I 0.1 0.08

0.06

0.04

G.02

04-..~ ........ ~-.a.~~41.1,L.l,l.IJu,lol:i.u.u.i,i;~~ O 1234 S 6 719101112Ul41Sl6171119l02122 •

\'llom.r

cormo s nis TRIBUOO:-b DISCRETAS 179

5.63 ütudie la grtfia ~llNITAB. Discuta la distnbuctón incluyendo tipo, forma y resuhados de probabilúbd.

O.)

~ 0.2 ;a 1 0.1

o 10

ANÁLISIS DE LA BASE DE DATOS

t. Use la base de datos de manufactura. ¿Cuál es la proba· bílidad de que una indus1ria de código SIC al azar seleccionada 1enga un valor de embarques industriale, igual a 2? Use esto como el valor p para un experimen­ to binomial. Si usted fuera a seleccionar al azar 12 industrias de código SIC, ¿cuál es la probabilidad de que meno) de tres tengan un valor de embarques industriales igual a 2? Si usted seleccionara al azar 25 industrias de código SIC. ¿cuál es la probabilidad de que exactamente ocho tengan un valor de embarques industriales igual a 2?

1. Use la base de datos de hospital En esta población de 200. ¿cuál es la subdivisión entre hospitales que son hospuales generales y hospi1ales ~iqui.atricos? Con d uso de estas cantidades como subdivisión de la pobla­ ción y la distribución bipergeométrica, ¿cuál es la pro­ babilidad de seleccionar al azar 16 hospitales de esta

base de datos y obtener exactamente nueve que sean ho piules ~qui.itricos? Con el uso del número de hos­ pitales privados en esta base de datos, calcule p = pro­ babilidad de que ~ un hospital privado. Ahora use la fórmula binomial para determinar la probabilidad de seleccionar al azar 30 hospitales y obtener exactamente 1 O que sean privado .

3. Utilice la base de datos financiero) de compal\ías fabri­ cantes de productos químicos, Si cinco de estas compa­ ñías se seleccionan al azar. ¿cuál es la probabilidad de que exactamente tres tengan un rendimiento sobre capital contable de 15% o m.u1 Su~~ncia: use la dístri­ bución hlpergeométrica y una subdivisión de esta población de 19 compañías para calcular esta probabili­ dad. ¿Cuál es la probabilidad de seleccionar al azar ocho compañías de seguros y obtener exactamente cuatro de ellas con rendimientos promedio de menos de 1 %?

CASO: FUJI FILM INTRODUCE EL APS pnnap1os de la década de 1990, fuji Photo Film, USA, unió

~ con cuatro de sus rivales para crear el sistema avanzado tografia (APS) como el primer perfeccionamiento impor­ en la industria de películas desde que se introdujo la tec­ . de 35 mili.metro'- En febrero de 1996, se lanzó el nuevo

~ de 24 mili.metro) que prometía fotografbs ITlU claras y nlúdas. Para finales de ese afio. la falla de comunicación abasto l.imítado de productos hizo enojar a vendedo~ y~

=um.idores se sintieran frustrado .. Casi no exi.stla publicidad como el producto lo fabricaban cinco industrias rivales, I~

=;>afilas llegaron a un acuerdo secreto en d que nadie fuera ~ b admm~tración de la compal\ia, induvendo el personal de

conocerla IOl detallo sobre el producto ha)ia que cada copa!tla introduicra sus productos APS el mismo dia. Cuando

producto se introdujo. en realidad llegó con poca informa­ aóa a vendedores a detalle sobre el producto y pnlctiarnente

capacitación a representantes de \'tola) del producto (de

modo que pudieran hacer demostraciones y aplicar las carac· leristicas ), a~ de que se tuvo una ~ube)timación consickn· ble de la demanda por este producto. Afonunadamcnte. Fuji pmionó al adoptar la J)O'IUra de que la honesddad es b 1DtJOf politica y explicar a vendedores y otros clientes lo qix babia ocurrido y les pidió paciencia, Ademá). aumentó su un ción para comprobar mejor la posición y tamÚIO dd merado. Para 199i, habla multiplicado la producción para Atisfxer b demanda y aumentó la promoción a dientes, Los producto$ APS estaban camino dd hito. En 199 , las ámara:s APS n tenían 20% del mercado de airnaras para apuntar y cljsparar.

Anilisis

Supongamos que el lector es parte de un cqwpo Fu¡i CU)'3 tarea es examinar problemas acerca de b partJCJp.Kión en d mercado. aceptación de clientes, qutjas y las razones por las que los nuevos productos uenen éxito.

Page 206: libro.pdf

180 E.STADIS-nCA E.' LOS :-.EGOCIO~

J. Como ya se dijo, para 1998 las cámaras APS tenían 20% del mercado de cámaras para apuntar y disparar. En 2003 la participación del mercado se aceraba a 40%. Supongamos que al azar se seleccionan 30 clien­ tes del mercado de estas cámaras. Si la participación del mercado es en realidad 0.40, ¿cuál es el numero esperado de clientes que compran una cámara APS? ¿Cuál es la probabilidad de que seis o menos compren una cámara APS' Suponga que usted en realidad obtu­ vo seis o menos clientes de APS en la muestra de 30. Con base en la probabilidad que acaba de calcular, ¿es esto suficiente evidencia para convencerse de que la participación del mercado no es de 40%? ¿Por qué si o por qué no?

2. Suponga que las quejas de clientes sobre la película de 24 milímetros son distribuciones de Poisson a un por· centaje promedio de 2.4 quejas por cada 100 mil rollos vendido>. Suponga. además, que Fuji tiene problemas con embarques que llegan tarde y que un lote de 100 mil rollos proporciona siete quejas de clientes. Si se supone que es inaceptable para la administración que el porcentaje promedio de quejas aumente, ¿es esto

suficiente evidencia para convencer a la administra­ ción de que el porcentaje promedio de quejas aumentó o se puede escribir como un suceso aleatorio que ocurre." con bastante frecuencia? Elabore la distribución de Poisson para ola pregunta y analice su implicación para este problema.

3. Un estudio de 52 lanzamientos de productos encontró que los emprendidos con crecimiento de ingresos como principal objetivo, tienen más probabilidad de fracasar que Jo, que pretenden aumentar la satisfac­ ción de clientes o crear nuevos mercados, como el sis· tema APS. Suponga que de los 52 productos lanzados, 34 fueron lanzados con crecimiento de ingresos como su principal objetivo y el roto se lanzó para aumentar la satisfacción del cliente o crear nuevos mercados, Ahora suponga que sólo 10 de estos productos tuvie­ ron éxito (los demás fracasaron) y siete fueron pro­ ductos lanzados para aumentar la satisfacción del cliente o crear un nuevo mercado. ¿Cuál es la probabi­ lidad de que este resultado ocurra al azar? ¿Que nOI dice esta probabilidad sobre la premisa básica con res­ pecto a la importancia del objetivo principal?

EXCEL

USO DE LA COMPUTADORA

Excet se puede usar para calcular probabilidades exactas o acu­ mulativas para problemas con el uso de distribuciones bino· rniales, hipergeométricas o de Poisson. Para cada uno de estos cálculos. el proceso se inicia al seleccionar la tecla Paste Function.f,.. en la barra de herramientas, con lo cual aparece la caja de di~ Paste Function (Pegar Función).

Distribución binomial

Para trabajar un problema de distribución binomial con el uso de Excel, seleccione el nombre de función, BINOMDIST, de la caja de diálogo Paste Function. Aparece la cara de diálo­ go BINO~IDIST. Para usar esu función deben completarse cuatro lineas de información. La primera pide el numero de éxitos, x; la segunda e> para el tamaño muestral, n. En la ter· cera linea ponga el valor de p. la probabilidad de un solo éxito. La cuarta linea, acumulativa, es un valor lógico que determina si la respuesta se da como probabilidad exacta o probabilidad acumulativa. Si el usuario escribe FALSE en la línea, la res­ puesta será la probabilidad exacta de obtener x éxitos en n intentos: si escribe TRUE, la respuesta ">Crá la probabilidad acumulativa de obtener de cero a x éxitos. El resultado es el valor de la probabilidad.

Distribución de Poisson

Los problemas de distribución de Poisson se pueden resolver con el uso de la opción POISSON seleccionada de la caja de diálogo Paste Function. En la ca¡a de diálogo POISSON que aparece, deben completarse tres lineas para obtener una res-

puesta. La primera línea pide el número de éxitos, x; la segun­ da es para el valor de ). )' la tercera es un valor lógico que determina si la respuesta se da como probabilidad exacta probabilidad acumulativa. Si el usuario responde con FALS! en la linea, la respuesta ser~ dada como probabilidad exacta; se pone TRUE en la línea, la respuesta se dará como la proba­ bilidad acumulativa de valore> entre cero y x.

Distribución hipergeométrica

Cuando el usuario selecciona la opción HIPERGEOMDIST de la caja de diálogo Paste Function, aparece otra caja de dii­ logo. Para usar e)ta función deben completarse cuatro linea. La primera pide el número de éxitos en la muestra, x; la~ da pide el tamaño muestral, n. La tercera linea e) el numero de éxitos de la población, A, y la cuarta linea es para el tamaño de población, N La salida será un valor de probabilidad exacto.

MINITAB MINITAB Window) permite producir una distribución bi!'l>­ rnial, una distribución de Poi son. o una distribución hrpergeo­ métrica. El proceso empieza por seleccionar la opción Qt)c la barra de menú, con lo cual aparece el menú descendente

Seleccione la opción frobability ~i5tributions. Aparece otro menú descendente.

Distribución binomial

Para obtener una distribución binomial, seleccione la opció= D,inomial Aparece una caja de diálogo. De la caja, seleccioee la forma en que las probabilidades se calculan para selecciomr

Page 207: libro.pdf

Ra frob1bility, 'umulative Problbility, o Inverse ~ility. frobabiluy da Lu probabilidades eucw para cada

.:z: CumulJIÍ•~ Prob.ibiliry ds /.1 prob.Jbilid.Jd scumulniv» :a:a todo> y cada uno de I<» números de ~ibles mios de cero a.x.l!n'n'5C Probability dad inverso de Lu probabilidades acu­

" Numbcr of trills es el rama"º maestral, n, y ~ility o( 1 suceess es el valor de p. Si el usuario daca tener

:lid.1dcs calculadas para vanos \-a.loro de x; póngalo> en cnlumna, seleccione la opción de columna de entrada. y b !uta de la ubicación de columna de lo> valores :c. Si sólo c:akular la probabilidad para un valor de x en particular, die en Input const1111 y escriba el número de txitos que evaluar, x. La salida sera la probabilid.ld exacta, la proba·

acumulativa, o la probabilidad acumulati\'a inversa,

:::&::ñbudóndePoisson

obtener una distribución de foisson, seleccione la Polsson del menu descendente. Aparece una caja de

~ Sdcccione la forma en que la> probabilidades~ calculan ._ sO:caonar ya sea froblbility, Cumulative Problbility, o ~ Probability. frobability da las probabilidades exactas

~ valor x. Cumulati\'e Probability da la probabilidad m-a para 1od0> y cada uno de los numeres de posible)

de cero a x. Inverse Probability da el Ín\'e™> de las pro· es acumulativas. En la linea Mean escriba el valor de

~ tener probabilidades calculadas para varios valores a 1;.pónpl:u en una columna, seleccione la opción de colum-

CA.PmJlOS l>l~TRJBUCIOSESOISCRETAS 181

na de entrada, y haga la füta de la ubicación de columna para los valores x, Si 5610 desea calcular la probabilidad para un valor de A" en p.irru;u/~r. h.Jp .:/1<' en Input coptlUll y cs.-rib.i el número de txitos que desea evaluar, x. La salida será la pro­ babilidad exacta, la probabilidad acumulati\"a o la probabíli­ dad acumulativa inversa.

Distribución hipugeomttrica

Para obtener una distribución hipergeométrica, seleccione la opción HYP"Seomctric del menú descendente. Aparece una caja de diálogo. Seleccione cómo se calculan las probabili­ dades al seleccionar ya sea Prob1bilid1d, Cumul1tive Problbility o Jnverw Problbility. frobability da la> probabi­ lidades exacw para cada valor x: Cumulative Probability da la probabilidad acumulativa para tod<» y cada uno de los nume­ ro> de posibles txita> de cero 1 x. Inverse Probability da el ÍO\'tnO de lil> probabilidades acumulativas. En la cuarta línea escriba el tamaño poblacional, S. En la siguiente línea, escriba el número de hita> de la población, A. En la siguiente linea. escriba el u.mmo muestral, n. Si desea tener probabíhdades calculadas para varios valores de x, póngalas en una columna, seleccione la opción de columna de entrada, y haga la fura de ubicación de columna de la> valores x. Si <ólo dCRa calcular la probabilidad para un valor de x en particular, haga clic en lnput const1nt y escriba el número de éxuos que desea eva­ luar, x. La Wida será la probabilidad exacta, la probabilidad acumulativa. o la probabilidad acumulativa inversa.

Page 208: libro.pdf

CAPÍTULO 6

Distribuciones continuas

182

OBJETIVOS DE APRENDIZAJE El objetivo fundamental de aprendizaje del capítulo 6 es ayudar al estudiante a que comprenda distribuciones continuas, con lo cual: l. Entenderá los conceptos respecto a la distribución uniforme. 2. Apreciará la importancia de la distribución normal. 3. Reconocerá los problemas de distribución normal y cómo resolverlos. 4. Decidirá cuándo usar la distribución normal para calcular problemas de distribu­

ción binomial y cómo resolverlos. 5. Decidirá cuándo usar la distribución exponencial para resolver problemas en ne­

gocios y cómo resolverlos.

Page 209: libro.pdf

Los rostros cambiantes de la industria de seguros

La industria de~ en&m1ó muchos desaños en la década de 1990. Los mercados tradicionales se desgastaron y surgieron nuevas oportunidades. En décadas puadas, la. f~ tradicionales que contaban con un solo ingreso se apoyaron en la cobertura de seguros de ,;da contra la muerte prema­ tura del sostén de la familia. En esta década, lu parejas se c<Wn a mayor edad, tienen meno> hijos y a veces son dos quienes sostienen la familia. ~w y otras tenden~ muJ1an menos dependientes de un seguro de vida. De hecho. una encuesta realizada por Life lnsurance Marketing and Research Associa1ion mostró que sólo 59% de los estadounidenses creen que un seguro de vida es la mejor manera de proteger financieramente una familia contra la muerte prematura del sostén de la famiha. E!>ta cifra es menor a 72% de principios de la década de 1980. Financieramente, lOi anafü1as de esta indu 1ria dicen que e 1a caída cue ta a las compar\iu de ~uros unos 700 mil millonl!li de délares en coberturas y 4 700 millones en ingreso por primas. Ahora. para realíur nuevas \'tnla., lo> vendedores de seguro observan de cerca otros mercados que antes eran poco utiliudos; por ejemplo, 10) tradicio­ nalmente considerado, como ríe goso • incluyendo familias con padres solteros o de bajO) ingr('S()> ..

lo> seguro> de servicio medico, propietario de vivienda y de automóvil, a.a como otros tipo de aseguradores enfrentan situaciones difkilcs similare», excepto en lugares donde la cobertura de seguros e» obligatoria. El promedio de familia estadounidense ~ta S2 100 en todo tipo de seguros, de acuerdo con la Bureau of Labor Staristics' Consumer Expendhure Survey, Es1a cantidad no incluye seguro de servicio medico y de vida pagado en su totalidad o en parte por empleadores. Un desglose por tipo de seguro es 39% por cobertura de servicio médico, 33% por vehículos. 19% por seguro de vida y otro> se· guros perscnales y 9% para duei\os de viviendas y seguros relacionados.

La ubicación geoglifica inOure mucho en las tarifas de seguro pagadas por consumidores. En pro· medio. un consumidor estadounidense gasta S69 l al al'IO en asegurar su automóvil. Las tarifas más alw están en r.;ueva Iersey (SI 100 al afio), Nueva York (S960 al aflO) y Hawai ($959 al año). Las tarifas ma.' baj~ eslin en Oakota del Norte, donde el promedio de tuifa por allo es $402. La cantidad promedio en E!>tado. Unido> para asegurar una vivienda era de SHO, sin incluir a AJa.,ka y Hawai, Texas registró el costo anual más alto por asegurar una vivienda en $592. Maswchustll) en segundo lugar con SS48. El promedio anual mh bajo se encontró en Wiscon,in. donde a de "6lo S27'1.

Los costos de seguro> también varían según el valor del vehtculo y el tamano y ubicación de una casa. Es mh probable que familias con aduhos de mediana edad e hiios gasten m.ts en seguro El gasto en seguros de servicio médico también aumenta con la edad.

Preguntas gerenciales y estadísticas

l. En Estado> Unidos, el costo promedio anual de un seguro para automévil e) S69 l. Puesto que ata cantidad varia por estados. localidado e individuos, ¿cuál distribución de probabilidad des­ cribe mejor los costos anuales de seguro para aucomóvil en Estados Unido)? ¿Estos datos eswi distribuidos de manera uniforme o normal? Si IO$ dato> estan dístribuidos de manera urufo:­ me. ¿entre cuáles dos valores estarían 50% de la media? Si los data. aun distribuidos de manca normal con una media de $691 y una desviacién estándar de Sl09, ¿qu~ porcentaje de con­ surmdores pagan más de S874?

2. Según el estudio de la Bureau of Labor S1a1i>1ics', el costo promedio para ~ar wa 'ivlmda en Estados Unidos es de S420 al a/lo. Si lo> CO$IO$ para asegurar una son distribuidos de rm.ncn uniforme. ¿cu.U es la probabilidad de que un propietario de vivienda en part1culu ~~nos de $-100? Suponga que los costos de seguro de vivienda están distnbutdos de manera uruforme en el estado de Texas. con un costo medio de S592 y una desviación estándar de Si . ,Cuil es la probabilidad de que un propietario de vivienda de Toa., seleceionado al aur, pague entre $500 y $650 por asegurar su vi\'ienda?

183

Page 210: libro.pdf

3. El estudio reportado por la Life lnsurance Marketing and Research Associaucn mc»tró que 2 de los consumidores de seguro. prefieren comprar seguros por teltfono o por correo, Supo que se realiza un estudio de 80 estadounidenses seleccionados al azar. ¿Cuál es la probabilida:!: de que 21 o más de lo• seleccionados piense que un seguro de vida es la mejor forma de prote­ ger financieramente una familia contra muerte prematura del sostén de la familia?

4. Suponga que los cuadros con la anualidad de seguros muestran que, en promedio, 1.8 ~ hora son destruidas por incendio en Estados Unidos. ¿Cuál es la probabilidad de que t~ rra una hora y media sin que una casa sea destruida por incendio?

Fwnu:: adapudo dt ün Lanon. "lnwran<t 11 Rislr.': ~" ~"" oetubr< 1995, pp. SJ·S7; S.tloml ~ w..r.....,Comrnlssóonm. 71111\1111~ Jovnw/Alnwrw 1999. RocWcl J.Abop.cd.1ScwYork:a.llan1111e lloab.1999),p.

Mientru que el capitulo 5 ~ concentró en las característica, y aplicaciones de distribuciones creus, el capitulo 6 se concentra en información sobre distribuciones continuas, que se construyen variables aleatorias continuas, en las que \C toman valores por cada punto respecto a un intervalo y suelen generar experimentos en los que 101$ cosas se "miden" r no se "cuentan" Con dístrlbu continuas, lu probabilidades de resultados que ocurren entre puntos particulares se determma:: calcular el área bajo la curva entre esos puntos. Adcm.h, el área bajo la curva es igual a 1. ~ num distribuciones continuas en c•tadistica incluyen la distribución uniforme. la distribución no la distribución exponencial, la disrnbucién 1, la distribución ji cuadrada y la distribución F. Este tulo presenta la distribucién uniforme, la distribución normal y la dismbucién exponencial.

6.1 DISTRIBUCIÓN UNIFORME

La distribución uniforme, a veces llamada distribución rcc1angular es continua y rdarivamenre lla t11 la que la misma 11l111ra o f(x} ~ ob11cnc r11 1111 m11go de valores. La · iguiente función de d de probabilidad define una distribución uniforme.

FUl\OOS DE DENSIDAD DE PROBABILIDAD DE UNA DlSTRlBUCIOS l.'NlfORME 1

1 -- para <x <b f(x)• b-a -

O para todos l~ otro. valora

La figura 6.1 e) un ejemplo de una distribución uniforme. En una distribucién uniforme o tangular, el área total bajo la curva es igual al producto de la longitud y el ancho del rcct!ngulo igual a 1. Dado que la di~tribución se encuentra, por definición, entre IOi valores x de a y b, la lo del rectángulo es ( b - a). Al combinar el cálculo de e)la área con el hecho de que el área es igual a altura dd rectángulo \C puede resolver como sigue:

Árn• I

f{xl

Distribución uniforme

-----------...- _1_ •~o '-----0,__ .. ,, X

Page 211: libro.pdf

CAl'fTUl..06 DIST1UBtl00!1.'!SC0).°1Th1:.\S 185

Arca de rectángulo • (Longitudl(Altura) = 1 Pero

Longitud• (b - a)

Por tanto, (b - a){Altura) .. 1

y Altura•-1-

(b-a)

~tos cálculos muestran por qué, entre los valores x de a y b. la cllitríbución tiene una altura constante de l/(b - al.

La media y desviación estándar de una distribución uniforme están dadas como sigue,

a+b ¡1=-- 2

b-a u=7i'í Surgen muchas situaciones posibles en las que los datos podrían estar uniformemente distribui­

do). Como eiemplo, ~uponga que se prepara una línea de producción para manufacturar broches de máquina en lotes de cinco por minuto durante un turno. Cuando lo) lotes se pesan, la variación entre 106 pesos se detecta con pesos de lote que van de 41 a 47 gramos en una cllitribución uniforme. La altura de la distribución es:

1 1 1 f(x)= Altura=--=---=­ (b-11) (47-41) 6

La media y desviación est.indar de esta distribución son:

Media= a+b = 41+47 =~-« 2 2 2

. • b-a 47-41 6 Deviaaón estándar = ~ = ~:: -- = 1.732

._112 ._112 3.464

La figura 6.2 proporciona la distribución uniforme para este ejemplo, con su media, desviación están · dar y altura de la distribución.

Detenninación de probabilidades en una distribución unifonne Con distribuciones discretas, la fun(ión de probabilidad proporciona el valor de la probabilidad. Para distribuciones continuas, I~ probabilidades se calculan al determinar el 4rea sobre un intervalo de la función. Con distribuciones continuas, cualquier valor individual es posible pero tiene probab;!!cUd cero. No existe área bajo la curva para un punto individual. La )Íl(uiente ecuación se usa para deterrm­ nar las probabilidades de x para una distribucién uniforme nitre a y Ir.

/(x)

:i:s:nbución de :esos de lote

----------!

----.-,---µ--- .. --- ........ ¡ X

u• 1.732 lPnos> A ___ ___..;.. _/,

Page 212: libro.pdf

186 ESTADISTICA E.-: LOS S'EGOOOS

l,'.~fl¡f f$ .. f{x)

Probabilidad rHuelta en una distribución uniforme

.5000

------x 45 47 Pno. (gramos)

41 42

PROBABWDADES EN\JNA OISTRJBUCION UNlFORME donde:

P(x)• xi -xi b-a

a Sx1 Sx2 S b

PROBLEMA DE DEMOSTRACIÓN

6.1

Recuerde que el irca entre a y b o igual 1 l. La probabilidad para cualquier intervalo que in a y b o l. La probabilidad de x 2! bode x sao cero porque no hay 'rea arriba debo abaio de a.

Suponga que en el problema de los broches de máquina deseamos determinar la probabilidad que un lote pese entre 42 y 45 gramos. Esta probabilidad se calcula como sigue:

P(x)= x2 -x1 • 45-42 =!=.SOOO b-a 47-41 6

La figura 6.3 muestra ~ta solución. La probabilidad de que un lote pese más de 48 gramos es cero, porque x • 48 es mayor que el

superior, x • 47, de la distribución uniforme. Un argumento similar proporciona la probabilidad que un lote pese menos de 40 gramos. Como 40 o menor que el valor más bajo del rango de dis ción uniforme ( 41 ), la probabilidad o cero.

Suponga que la cantidad de tiempo necesario pare ensamblar un módulo de pl6stico varía di a 39 segundos y que el tiempo de ensamble est• uniformemente distribuido. Describa la di bución. ¿Cu61 es la probabilidad de que un conjunto dedo tome entre 30 y 35 segundos? ¿M de 30 segundos?

Solución

La altura de la distribución es 1 12. El tiempo medio es 33 segundos con una desviación dar ele 3.'64 segundos.

""' ((xi./)

I

---x 27 ><•33 39

v•3.~ Tiempo (aegundotl

Page 213: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

6.2

PIJO< X< 35)- 35-30 .1- •. 4167 - - 39-27 12

Hay un .4167 de probabilidad que tome entre 30 y 35 segundos ensamblar el módulo.

P(x < 30) a~• 2.. •. 2500 39-27 12

Hey un .2500 de probabilidad de que tome menos de 30 segundos enHmblar el módulo. Como no hay •rea menor a 27 segundos, P{x < 30) se determina con usar sólo el intervalo 27 s x < 30 En una distribución continua, no hay •rea en ningún punto (sólo sobre un intervalo). Entonces la probabilidad x < 30 es la misma que la probabilidad de x s 30.

Según la Natíonal Auociation of lnsurance Commissioners, el costo promedio anual para un seguro de automóvil en Estados Unidos es $691. Suponga que los costos de asegurar un auto­ móvil est•n uniformemente distribuidos en Estados Unidos con un rango de $200 a $1 182. ¿Cu•I es la desviación est•ndar de esta distribución uniforme? ¿Cu•I H la altura de la dtstribu­ ción7 ¿Cu•I es la probabilidad de que el costo anual para asegurar un automóvil en Estados Unidos sea entre $410 y $8257

Solución

La medía est• dada como $691 El valor de a es $200 y bes $1182.

b • 1182 200 283 5 (T -¡;:¡- Ji2 ... .

La altura de la distribución es: 1 182

1_ 200

• ~2 • .001. x1 • 410 y x2 • 825

Pj410 S X S 825) 825-410 -~- 4226 1182 200 982 .

La probabilidad de que una persona seleccionada al azar pague entre $410 y $825 anualmente para asegurar su automóvil en Estados Unidos es .4226. Esto es, alrededor de 42.26% de todos los estadounidenses pagan en ese rango.

fM

..._ __ _.......__" 200 '10 " - 891 825 1 182

,,. 283..5

Uso de la computadora para resolver probabilidades de distribución uniforme Con el uso de los valores de a, by x; MINITAB tiene la capacidad de calcular probabilidades pan b dis· tribución uniforme. El calculo resultante es una probabilidad acumubU\11 desde el enmno 12quittdo de la distribución para cada valor x. Como ejemplo. la pregunta de probabilid.ad,P(410 s x s 25), del problema de demostración 6.2 puede resolverse con el wo de MIS'ITAB.

Page 214: libro.pdf

188 blADl~TICA E.'HO~ SK.o<:JO!,

TABLA 6.1

Salida MINITAB para distribución uniforme

c:o.tiD_. aauon oe zoo.ooo to 1112.00

• 125.0000 410.0000

PI 1 C• ., O.&HS 0.2UI

MI!'.1TAB calcula la probabilidad de x s 825 y la probabilidad de x s 410, y estos resultados se maa­ tran en la tabla 6.1. La respuesta final a la pregunta de probabilidad del problema de demostración se obtiene al restar estas dos probabilidades:

P(410 S X S 825) = .6365 - .2138 = .4227

Excel no tiene la capacidad para calcular probabilidades directamente cuando se usa la distribu uniforme.

6.1 PROBLEMAS 6.1 Los valores siguientes están uniformemente distribuidos entre 200 y 240.

a. ¿Cuál es el valor de ftx) para esta distribución? b. Determine la media y desviación estándar de e:.ta distribución. c. Probabilidad de (x > 230) • ? d. Probabilidad de (205 S X S 220) • ? e. Probabilidad de (x s 225) = ?

6.2 x está uniformemente distribuida sobre un rango de valores de 8 a 21. a. ¿Cuál es el valor de f{x) para esta distribución? b. Determine la media y desviación estándar de e:.ta distribución. c. Probabilidad de (10 s x < 17)•? d. Probabilidad de (x < 22) • ? e. Probabilidad de (x 2: 7) • ?

6.3 El precio al publico de una caja mediana de una conocida marca de hojuelas de malz cuesta S2.80 y S3. l 4. Suponga que estos precios están uniformemente distribuidos. ¿Cuál es el pr promedio y desviacién est.tndar de precios en esta distribución? Si de esta lista se seleccioca azar un precio, ¿cuál es la probabilidad de que sea entre S3.00 y S3. I O?

6.4 El promedio de volumen de llenado de una lata normal de refrescos es 12 onzas. Suponga que volumen al llenarlas está entre 11.97 y 12.03 onzas y uniformemente distribuido. ¿Cuál es la de esta distribución? ¿Cuál es la probabilidad de que una lata seleccionada al azar contenga mb 12.01 onzas de liquido? ¿Cuál es la probabilidad de que ti volumen de Uenado sea entre 11 y 12.01 onzas?

6.S La familia estadounidense promedio gasta S2 100 al afio en todo tipo de seguros, Suponga que cifras están uniformemente distribuidas entre los valores de $400 y S3 800. ¿Cuál es la desvi estindar y altura de esta distribución? ¿Qut proporción de familias gasta mú de $3 000 al alío $CSUros? ¿~lh de S4 000? ¿Entre S700 y SI 500?

62 DISTRIBUCIÓN NORMAL Probablemente la más conocida y empleada de todas las distribuciones es la distribución normal ajusta a numerosas caractertsticas humanas como la estatura, peso. altura, velocidad, coeficiente · lectual ( IQ), logros académicos y ailos de esperanza de vida, entre otras. Por otra parte, todos los vi\"O~ en la naturaleza como arboles, animales e insectos, entre otros, tienen diversas ca.racterislÍC3$ e:.lán normalmente distribuidas.

Page 215: libro.pdf

CAl'tTULO 6 DlSTRlBUOO!'-"ES 00!'-'ll!>'UAS 189

la curva normal IR~IIRA 6.4

JI

Muchas variables en negocios e: industria también están normalmente: distribuidas, Alguno. ejemplo. de variables que: podrían producir mediciones normalmente distribui­ du incluyen el costo anual de: ~ro familiar, d CO>lO de: rentar por pie cuadrado d espa­ do en una bodega y la satisfacción y apoyo de gerentes por la propiedad de una b.Ucub de cinco punta.. Adem.L-. casi todo. lo. aniculm producidos o llenados por m!qumas están normalmente distribuidos.

Debido a sus difen:n10 aplicaciones, la dil.tribudón normal es sumamente importante, Adem.is de las dininta. variables mencionadas que e>tán normalmente distribuidas, la dis­ tribución normal y sus probabilidades asociadas QtJn integradas al control Je procesos cstadisticos (vt.uc el capítulo 18). Cuando se toman tamaños muestrales que son sufieiee­ temen te grandes, mucha. estadi>ticas cst.in normalmente disinbuida» cualquiera que sea la forma de la distribución fundamental de la cual se toman (como se m0>tró c:n el capítu­ lo 7). La figura 6.4 es una rcpn:smt.uión gr.ifica de la distribución normal: la curva normal,

Historia de la distribución normal El descubrimiento de la curva de errores normal se acredita por lo general al matematíco y a•trónomo Karl GallS) (17i7-1855), quien reconoció que los errores de mediciones repetidas de objetos e.tan a veces normalmente distribuidos, • Entcnces, la distribución normal \C conoce a veces como dísrribuci6rr dt Gauss o cun'll nomral dt mor. Una analogla moderna de la obra de GaUS> podN ser la distribución de mediciones de pina. producida. en máquina que a veces proporcionan una curva normal de: error alrededor de una espc:ci.6cación media.

En menor medida, también tiene algún credito Pierre-Simón de Laplace {17-i9-1827) por descu­ brir la distribución normal. No obstante, muchas personas ahora piensan que Abraham de Moivre (1667-17S4), matemárico francb fue el primero en entender la distribución normal.De Moivrc deter­ minó que la distribución binomial se aproxima a la distribución normal como un limite. De ~loi\'l'e trabajó con exactitud asombrosa. Sus valores de tabla publicados pua la curva normal están a sólo unos cuanto) dícunilbímos de lo) cuadros de valores publicados actualmente,"

La distribución normal tiene las siguientes características;

• Es una distribución continua. • Es una distribución simétrica alrededor de su media. • Es a•intó1ica al eje horizontal. • Es unimodal. • Es una familia de curvas. • El área bajo la cur.,.a es 1.

La distnbucién normal Q ,imttrica. Cada mitad de la distribución es una imagen reflejada de la otra mitad. ~lucho~ cuadro. de dí:.tribución normal contienen valores de probabilidad para sólo un lado de la disrribucíén porque lo. valol"Q de probabilidad para el otro lado de la distribución son adtn· ticos debido a la ~imetria.

En teoría, la disrribucién normal o a<intótica al eje: horizontal: e• decir, no toca al eje x )' n sino· pre en ca0da dirección. La realidad C'.\ que la mayor parte de aplicaciones de la curva normal son expe­ rimento) que tienen límites finitos de resultados potenciales. Por ejemplo. aun cuando las calificaaorxs de exámenes de aptitud escolar (SAT, por sus ''~u en inglb) son analíudu por la distribución oormal. el rango de cahficaeiones en cada parte del SAT o '6lo de 200 a 800.

A veces la curva normal se conoce como mn·a tn forma dt camparra. E. unimodal porqae n!otts ~amontonan en una parte de la gráfica, el centro de la curva, La distribucién normal en rcalid.ad es coa familia de curvas, Cada valor único de la media y cada valor único de la desviación estíncLu rcsulu en una curva normal diferente. Ademh. ti drca toldl baio cualquier distríburi6n normal n 1. El ma bz;o b curva proporciona lu probabilidades. de modo que el 1otal para una dí:.tn'bución normal es l. Debido a que la dístribucién es simttrica. el árt"a de la distribución en ada lado de b mcdia es 0.5.

'lohnA. ln¡ram y Jotcpb C. \lonb, Suttmaf#~-' ~(Sao Dic¡o: twcoun Btaa ~ Plzblishcts. 1989). 'Rogrr E. Kirl.. ~ tssun: A Rt.wr ¡.,. rlw Bc/Mn'iom! Wn<n 1~i..nun.,.. CA:. BtooLJCok Pllblisbio¡ eo..1m¡.

Page 216: libro.pdf

Función de densidad de probabilidad de la distribución normal La distribución normal se caracteriza por do) parámetro»: La media,µ, y la doviación c.tándar, o. lai valores de µ y" producen una distribución normal y la función de densidad de la distribución nomli es:

f(x)= 1 t-(112ll{i-p)lo)t

"ji; donde:

µ=media de x a • dc~'-Ución otándar de x -:: - J.14159 .•.• y t - 2.71828 ....

Debido a que la fórmula tiene esta complejidad ~la para determinar áttaS bajo la curva es un tra engorroso y lento. Prácticamente todo. le» investigadores usan valores de tabla para analizar problnm: de distribución normal en lugar de usar esta fórmula.

Distribución normal estándar Cada par único de valores de ¡1 y a define una distribución normal diferente. La figura 6.5 muestra gráficas MISITAB de distribuciones normales para le» ¡iguicntcs tres pares de parámetro :

l. µ•50yt1•5 2. u - 80 y t1 - 5 J. µ "' 50 y o - 10 ~ót~ que todo cambio en un parámetro (µ o '1) determina una distribucién normal diferctr:t.

tita caracteri)tica de la curva normal (una familia de curvas) resulta tedio¡¡ euando se analiza la tribución normal porque se requerirían los volúmenes de tablas de curva normales, una por cada ca::: binación diferente de I' y"· Por fortuna se ideó un mecanismo para que las distribuciones normales puedan convertir en una sola distribución: o decir, la distribución z, el cual proporciona la distribe­ ción normal estándar (o curva), \'eamO) la fórmula de conversién para cualquier valor x de una tn'bución normal dada:

1 FORMUU: z=x-µ, """º a

UM'PUm& Curvas normales para tres diferentes combinaciones de medias y desviaciones est~ndar

La estadistica z es e/ número dt dcsviacionts estándar cuando un 1·alor x tStá arriba o abajo ih mtdui.. i el valor de x es menor que la media, la estadística z es negativa; si el valor de x o más que media, la <!$Udbtica z es po'iti"a; y si el valor de x o igual a la media, la estadística z asociada es ce: Esta fórmula permite la convervién de la distancia de cualquier valor x desde su media, en unidades dmiación csúndar. Una e-tadistica z oúndar se puede usar para encontrar probabilidades para quier problmY de curva normal que se convierta a estadísticas z. La distríbueíén z es una disrríbu normal ain una media de O y una ~vi.ui6n estándar dt /.Cualquier valor de x en la media de una

o to 20

IT

\'alorax

Page 217: libro.pdf

normal es cero desviaciones estándar desde la media. Cualquier valor de x que e<té a una desviación estándar arriba de la media tiene un valor z de l. La regla empírica que vimos en el capitulo 3 se basa en la distribución normal la cual dice que alrededor de 68% de los valores están dentro de una desvia­ ción estándar de la medía, cualesquiera que sean los valores de µ y <T. En una distribución :, aproxi­ madamente 68% de los valores z estan entre z • -1 y z = +l.

Los valores de probabilidad de distribución z se muestran en el apéndice A, A.5; sin embargo, como es tan frecuente su uso, la distribución z también está impresa al final de este libro. En la tabla 6.:? -e presenta una lista de valores de distribución z para a)'Udar a su análisis.

La tabla A.5 proporciona el área total bajo la curva z entre O y cualquier punto del eje z povirivo, Como la curva es simétrica, el área bajo la curva entre z y O es igual si z es positiva o n~tiva (el ~ipio del valor z designa si la estadü.tica z est.á arriba o abajo de la media). Las áreas o probabilidades que se muestran en la tabla 6.2 son siempre positivas.

Resolución de problemas de curva normal La media y desviación estándar de una distribución normal y la fórmula z y tabla 6.2 hacen posible que un investigador determine las probabilidades para intervak» de cualesquier valor de una curva normal. Un ejemplo es el de los mucho> valores posibles de probabilidad de calificaciones GMAT que se exa­ minan a continuación:

El examen de aptitud de administración para graduado> (GMAT. por sus siglas en inglés), pro· ducido por ti Educational Te ting Service en Princeton, l'tw Jersey lo usan mucho las escuelas de administración para graduado> de Estados Unidos como requisito de admisión. Si se supone que las calificaciones están normalmente distribuidas <e pueden determinar las probabilidades para alean­ ur calificaciones en diversos rango. del GMAT. Hasta hace poco tiempo la calificación media GMAT era de 494 y la desviación estándar era alrededor de 100. ¿Cuál es la probabilidad de que una califica· ción seleccionada al azar ~ entre 600 y la medía?; es decir:

P(494 s x s 6001µ - 494 yq • 100) - !

La figura 6.6 es una representación gráfica de este problema. La fórmula z da el número de desviaciones estándar que ti valor x. 600, está alciado de

la media. ::lelcr1peión gráfica del área e:::re una calificación de 600 y

l"'edia en un GMAT z=~= 600-494 = 106 =l.06 (1 100 100

El valor z de 1.06 deja ver que la calificación GMAT de 600 es 1.06 desviaciones están­ dar más que la media. Los valores de distribución z de la tabla 6.2 dan la probabilidad de que un \-alor esté entre este valor de x y la media. La parte de numero entero y de décimos de la estadistica z aparecen en la primera columna de la tabla 6.2 (la parte 1.0 de esta esta·

µ • 494 x 600 dística z). En la parte superior de la tabla t tán los valores de la parte de centésimos de b q• 100 estadística z, Para esta estadística z, ti valor de centésimos es 6. El valor de probabilidad de

la tabla 6.2 para z "' 1.06 es .3554. La porción sombreada de la curva de la parte supcrior de la tabla indica que ti valor de probabilidad dado siempr« es la probabilidad o área entre

un valor de x y la media. En este ejemplo particular, é(a es ti área deseada. Por tanto, la respuesta es que .3554 de las calificaciones del examen de aptitud de administración para graduados (GMAT)

11RGURA '6.7 ' S:tuciones grificas • ;::rot>lern• del :::MAT

µ•,.94 x • 600 a» 100

<•> (b)

Page 218: libro.pdf

TABLA 6.2

Distribución z ~ o 1

SEGUNDO WGAR Dll!CIMAL EN s

• t.00 UI G.02 UJ 0.84 o.os .... 0#1 ... ..., o.o .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .OJl9 .0359 0.1 .0398 .0431 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .07S3 0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141 0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517 0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1n2 .1808 .1144 .1179 o.s .1915 .1950 .1985 .2019 .2054 .2088 .2123 2157 .2190 .2224 0.6 .2257 .2291 .2324 .23S7 .2389 .2422 .2454 .2486 .2517 .2549 0.7 .2580 .2'11 .2642 .2673 .2704 2734 .2764 .2794 .2823 .2852 0.8 .2881 .2910 .l939 .2967 .2995 .J02J .3051 .3078 .3106 .313) 0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3)40 3365 .3399 1.0 .J413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621 1.1 .3645 .3665 .l686 .)708 .3729 .3749 .3770 .3790 .3810 .3830 1.2 .3849 .3869 .3188 .3907 .3925 .'944 .'962 .3980 .3997 .4015 1.3 .40J2 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .41n 1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319 1.5 .4332 .4345 .4357 .4370 .4312 .4394 .4406 .4418 .4429 .4441 1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4S4S 1.7 A5S4 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633 1.8 .4641 .4649 .4656 .4664 .4671 .4671 .4686 .4693 .4699 .4106 1.9 .4713 .4719 .4726 .4732 .4731 .4744 .4750 .4756 .4761 .47'7 U) .cm .4778 .4783 .4781 .4793 .4791 .4803 .4808 .4112 .4117 2.1 .4121 .4126 .4830 .4134 .4831 .4842 .4146 .4850 .4154 .4157 2.2 .4161 .41164 .41611 .4871 .4875 .4878 .4811 .4814 .4U7 .480 2.3 .4193 .4896 .4191 .4901 .4904 .4906 .4909 .4911 .4913 .4916 2.4 .4911 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936 2.S .4931 .4940 .4941 .4943 .494S .4946 .4941 .4949 .4951 .4952 2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .49153 .4964 2.7 .4965 .4966 .4967 .4961 .4969 .4970 .4971 .4972 .4973 .4974 2.8 .4974 .4975 .4976 .4977 .4977 .4978 M79 .4979 .4980 .4911 2.9 .4981 .4982 .4912 .49113 .4984 ..... .4915 .4'15 .4916 .4916 3.0 .4987 .4987 .4987 .4981 4981 ...... .4989 ... .4990 .4990 . 3.1 .4990 .4991 .4991 .4991 .4992 .4992 .4992 .4992 .4993 .4993 3.2 .4993 .4993 .4994 .4994 .4994 .4994 .4994 .4995 .4995 .4995 3.3 .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996 .4996 .wn 3.4 .4997 .4997 .4997 .4997 .49'11 .wn .4997 .49J7 .4997 .4998 3.S .4998 4.0 .49997 4.S .499997 5.0 .4999997 6.0 .499999999

i,

estan entre una calificación de 600 y la media de 494. u figura 6.7(a) describe gráficamente la solu en términos de valores x. u figura 6.(7b) muestra la solución en términos de valores z.

Page 219: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

6.3

PROBLEMA DE DEMOSTRACIÓN

6.4

CAPm:l.06 Dl~TRIBUCIOS~CO'lm:O."UAS 193

¿Cu61 es la probabilidad de obtener una calificación mayor a 700 en un examen GMAT que tiene una media de 494 y una desviación estándar de 1007 Suponga que tas calificaciones GMAT están normalmente distribuidas.

Plx > 7001µ • 494 y cr • 1001 7

Soludón

Examine el siguiente diagrama.

" '9' q 100

Este problema pide determinar el área de la cola superior de la distribución. La estadística z para este problema es:

Z• X-µ 700 494 (T 100

206 100

2.06

En la tibia 6.2 se proporciona una probabilidad de 4803 pare la estadística t. que es el valor necesario para saber la probabilidad de sacar al atar un GMAT con una calificación entre ta media y 700. Encontrar la probabilidad de obtener una calificación mayor de 700, que es la cola de la distribución. requiere restar a .5000 el valor de probabilidad de .4803 porque cada mitad de ta distribución contiene .5000 del área. Et resultado es .0197 Nótese que un intento pare deter· minar el área de x '1' 700 en lugar de x > 700 no seria diferente porque en distribuciones eonti­ nuas, el área ba10 un número exacto como es x 700 es cero. Un segmento de recta no tiene ancho y por tanto no tiene área .

. 5000 (probabilidad de x mayor que la medial -L~O~ (probabilidad de x entre 700 y la medial

.0197 (probabilidad de x mayor que 7001

La solución se describe gráficamente en (al para valores x y en (bl para valores z.

z•O 1 2 •

l•I lb)

Para el mismo examen GMAT, ¿cuál es la probabilidad pera sacar al azar una calrfic.ción que su 5500 menos?

P(x s 550jµ • 494 y tr • 1001 7

Page 220: libro.pdf

194 ESTADISTICA EN LOS ¡..'EGOCJOS

PROBLEMA DE DEMOSTRACIÓN

ó.5

Solución

Veamos un bosquejo de este problema y determine el érea bajo la curva para todos los valOfm menores que o iguales a 550.

µ. • '94 X • 550 tT 100

La fórmula z proporciona el érea entre 550 y la media.

l 550 494 56

100 • 100 0.56

µ. 494 X 550 tT 100

(•) (b)

¿Cuél es la probabilidad para obtener una calificación menor a 400 en el mismo examen GMA!?

P(x < 400!µ. - 494 y u .. 100) - ? Solud6n

En la siguiente curva se comprueba que el problema es determinar el érea de la cola inferior la distribución:

X• 400 µ. • '94 v • 100

La estadística z para este problema es:

El érea bajo la curva para z - 0.56 es .2123 es la probabilidad de obtener una califi~ entre 550 y la media. No obstante, obtener la probabilidad para todos los valores menores q.e o iguales a 550 requiere incluir los valores menores a la media. Debido a que la mitad o .5000 » los valores son menores a la media, la probabilidad de x s 550 se encuentra como sigue:

.5000 (probabilidad de valores menores que la medial :t.....1ill (probabilidad de valores entre 550 y la media)

.7123 (probabilidad de valores s 550)

Esta solución se describe gráficamente en a) para valores x y en b) para valores z:

z •O z» 0.56

Page 221: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

6.6

z !!._.E. 400-494--94--0.94 (T 100 100

Nótese que el valor z es negetivo, el cual indice que el valor x esté 1b1jo de 11 med11 y el valor z esté sobre el ledo izquierdo de le distribución. Ninguno de los valores z de 11 t1bl1 6 2 es negativo, pero, como 11 distribución normal es simétrica, las prob1bilid1des pera valores zen el ledo izquierdo de 11 distribución son les mismas que los valores sobre el lado derecho de 11 dis· tribución. El signo negetivo del valor z simplemente indica que el éree esté en el ledo izquierdo de 11 distribución. Le probabilidad es siempre positiva. En 11 tibia 6.2 proporcione une probebi· lidad de .3264 pare un valor z de .94. El problema es encontrar el éree de 11 cole inferior de 11 distribución, de modo que 11 probabilidad, .3264, debe restarse de .500 para obtener 11 res­ pueste.

.5000 (probabilidad de valor menor que 11 medial ~ (probabilidad de valor entre 400 y 11 medial

1736 (probabilidad de valor menor 1 4001

Gráficamente, 11 solución se muestre en 1) p1r1 valores x y en b) pare valores z.

x·~ µ.• '9• tr • 100

l• -0.9• 1 •o

(el lb)

¿Cu61 es 11 prob1bilid1d de obtener 11 azar une calificación entre 300 y 600 en el examen GMATI

/'1300 < X< 600 µ. • 494 y V • 100) • 7

Las curvas describen gráficamente el problema; es decir, determinar el érea entre x • 300 y x • 600, que abarca el valor medio. Debido 1 que les áreas de la distribución z se obtienen con rala· ción 1 la media, este problema debe trabajarse como dos problemas separados y los resultados combinados.

Se determine une estadística z pare cede valor x . •

600 494 -~-1.06 100 100

l

y

x-µ 300-494 -194 z---- -----1.94 (T 100 100

Page 222: libro.pdf

196 ESrADlSTICA f." L05 :--EGOCIOS

PROBLEMA DE DEMOSTRACIÓN

6.7

La probabilidad para z • 1.06 es .3554; la probabilidad para z - -1.94 es 0.4738. La sot;. ción de P(300 < x < 6001 se obtiene al sumar las probabilidades .

. 3554 (probabilidad de un valor entre la media y 6001 ~ (probabilidad de un valor entre la media y 3001

.8292 (probabilidad de un valor entre 300 y 6001

GrMicamente, la solución se muestra en a) para valores x y en bl para valores z.

x•300 µ. • 494 X • 600 s•100

l 1.94

(al (bl

¿Cuál es la probabilidad de obtener una calificación entre 350 y 450 en el mismo examen G~,:.-r

P(350 <X< 4501µ - 494 y U - 1001 • ?

Solud6n

La siguiente curva muestra que la solución del problema determina el área de la porción s. breada en la mitad inferior de la curva.

& X - 350 I µ. 494

X • 450 tT • 100

En este problema, los dos valores x están sobre el mismo lado de la media. Las áreas o proti. bilidades de cada valor x deben determinarse y encontrar la probabilidad final al determinar diferencia entre las dos áreas.

x-µ z--- (T

350 494 =~--1.44 100 100

V

z 450 494 100

-44 -=-0.44 100

La probabilidad asociada con z • -1.44 es .4251. La probabilidad asociada con z -0.44 es .1700.

La sustracción proporciona la solución .

. 4251 (probabilidad de un valor entre 350 y la medial ::....JlQQ (probabilidad de un valor entre 450 y la medial

.2551 (probabilidad de un valor entre 350 y 4501

Page 223: libro.pdf

PROBLEMA DE DEMOSTRACIÓN

6.8

Gréficamente, la solución se muestra en al para valores x y en bl para valores t.

z -1.U / z•O z• --0.U

l•I lb)

Runzheimer lnternational publica costos de viajes de negocios para varias ciudades del mundo. En particular, publican totales de gastos de viaje diarios, que representan los costos promedios para el viajero típico de negocios incluyendo tres comidas al día en restaurantes clase de nego· cios y alojamiento con terifa por persona en hoteles y moteles de clase de negocios. Si 86.65% de los costos de gastos de viaje diarios en Buenos Aires, Argentina, son menores a $449 y si la desviación estándar de costos de gastos de viaje diarios es $36, ¿cuál es el promedio de costo de gastos de viaje diarios en Buenos Aires? Suponga que los costos de gastos de viaje diarios están normalmente distribuidos.

Solud6n

En este problema, se dan la desviación estándar y un valor x; el objeto es determinar el valor de la media. El examen de la fórmula de la estadística z revela cuatro variables; x, p., u y t. En este problema. se dan sólo dos de las cuatro variables. Debido a que es imposible resolver una ecua­ ción con dos incógnitas, debe determinarse una de ellas. El valor de t puede determinarse con la tabla de distribución normal (véase la tabla 6.21.

Debido a que 86.65% de los valores son menores a x • $449, 36 65% de los costos de gas· tos de viaje diarios son entre $449 y la media. El otro 50% de los costos de gastos de viaje d1a· ríos están en la mitad inferior de la distribución. La conversión del porcentaje a una proporción proporciona .3665 de los valores entre el valor x y la media. ¿Qué valor z está asociado con esta área? Esta área o probabilidad de .3665 que se muestra en la tabla 6.2 está asociada con el valor z de 1.11. Este valor t es positivo, porque está en la mitad superior de la distribución. El U$O del valor zde 1.11, del valor xde $449 y el valor ude S36 permite resolver algebraicamante la media.

l • !:._t! (T

1.11- 5449-µ $36

y

µ • $449- ($361(1.111 • $449- $3996 • $409.04

El costo medio de gastos de viaje diarios para un viaje de negocios en Buenos aires es de $409.04.

Page 224: libro.pdf

....... A B

1 xValue PYOl>lb<Ltv < X Value 2 450 03300 3 350 0.0749 .. 9 PYob 1350 < X < 4501 - 0.2551

Sllilal8Nl'IU CDIJLHlVB DD!llllllHll tucncm llmml vt.u - • •M.Off ud •undud ..,~ • 100.000

a ?C .... , ., ..... ... ,, .. uo.1111 . . ., ..

l'nlt e no e. e ... J ••• 2$11

TABLA td

Salida Excel y MINrTAB para distribución normal

PROBLEMA DE DEMOSTRACIÓN

6.9

La U.S. Environmental Protection Agency publica cifras respecto a la generación de d sólidos en Estados Unidos. Durante un afio, el número promedio de desechos generad°' persona por dia fue 3.58 libras. Suponga que la cantidad diaria de desechos generada por sona estj normalmente distribuida, con una desviación estjndar de 1.04 libras. De las ca des diarias de desechos generadas por persona, ¿a quj cantidad serla mayor 67.72%7

Solvclón Se proporcionan la media y desviación ostjndar pero x y z son incógnitas. El problema es peíar un valor x cuando .6772 de los valores x sean mayores que ese valor.

Si .6772 de los valores son mayores que x, entonces .1772 estj entre x y la media (.6 5000). La tabla 6.2 muestra que la probabilidad de .1772 estj asociada con un valor z de

Como x es menor que la media. el valor z en realidad es 0.46. Siempre que un valor Jr

menor que la media, su valor z asociado es negativo y debe reportarse esl:

Al despejar la ecuación z resulta:

z .. !!...:J!. (T

-046-~ 1.04

y

X .. 3.58 .,. (-0.46)(1.04) 3.10

Por tanto, 67.72% da la cantidad promedio diaria de desechos sólidos por persona P8A de 3.10 libras.

Page 225: libro.pdf

•Hº·lfii!fijlH.¡¡111Mi[.fi·!+M•--------------------- sis1ema de elm•CftU!miato TomplúN AS1ociata ttalizó una mcuau nacional desiste­ mas de alnw:awnimto en E.siados Unidos cuyo multado m~ló mucho. dato& interesantes. El listam de almacma­ miento es una industria de trabajo intauo que rtpmmta una gran oportunidad para mejorar la productividad. ~Qui aspecto presenta d a1macál bodega •promedio•? u cons­ trucción de nua'OI almacala está restringida por COSIOS prohibitivos. Quizá por esa razón, la edad promedio de una bodega es 19 a6o6. Los a1maanes vartan en tamaAo pm> d tamalto promedio es de llll06 50 mil pies cUldndos (4 600 m2 aproximadmimte). Para visualiur esta bodega •promedio':

imaginanol qix es un cuadrado con 224 pies por lado o un l'KÚngWo de 500 pies por 100 pies. u altura libre prome­ dio de una bodega en Eludos Unidos es de 22 pies.

Suponga que las tdadcs de bodegas. las dimmsioncs de ésw y sus alturas libra esún normalmente distribuidas. Con d uso de valora medios ya <Wfos y la desviaciones esúndar, es posiblt usar t«nicas pmmtadas en esta sección para dcttrminar, por tjmiplo. la probabilidad de que una bodega sd«cionada al aur tenga mmos de 15 allos de ann­ gOedad, mida 111'1de60 mil pies cuadrados (unos S 600 mZ) o tenga una altura libtt entre 20 y 25 pits.

Uso de la computadora para resolver probabilidades de distribución normal Tan10 Excel como ~llNITAB se pueden usar para resolver probabilidades de distribucién normal. En cada caso, el paquete de computadora usaµ, C1 y ti valor de x para calcular una probabilidad acumula­ tiva desde la izquierda. En la tabla 6.3 se ilustran '3lídas Excei y ~11!'/ITAB para la pregunta de proba· bilidad abordada en el problema de demostración 6.7: P(350 < x < 4501µ • 494yua100). Como los dos paquetes proporcionan probabilidades junt.t> desde la izquierda, este problema se resuelve de manera manual con la salida de computadora al encontrar la diferencia en Ptx < 450) y Pl,'C < 350).

i.2 PROBLEMAS

6.6 Determine: la probabilidad o área para las porcione de la distribución normal descrua . .. z i!: 1.96 b. z<0.73 c. -1.46 < z :S 2.84 d. - 2.67 :S z :S l.Oll c. -2.05 < z :s -0.87

6.7 Determine la. probabilidades p;ira los ~iguitntcs problemas de dístríbucién normal. .. µ .. 604, C1 = 56.8 •. 'C s 635 b. µ~48,u= 12,."C<20 C. Jl = 111,CI = 33.8, 100 :S X< 150 d. Jl = 264, C1., 10.9, 250 <X< 255 e. µ=37,u=4.35,x>35 f. µ=156,u""ll.4,xi!:liO

6.8 Tompkiru Assodates reporta que la altura libre media para un almacén Clase A en Estados Unidos es de 22 pi". Suponga que l.t> altul'3$ libres e.tán normalmente d1Stnbuídas v que la des­ viación e.tándar e. 4 pi". Al azar se selecciona un almacén Clase A en Estad<» Crudos. a. ¡Cual e. la probabilidad de que la altura libre sea mayor de 1 i pies? b. (Qué probabilidad existe de que la altura libre sea mayor de 13 pies? c. ¡Cuil es la probabilidad de que la altura libre sea entre ~5 y 31 pies?

6.9 Según la CcUular Tdecommunications Jndu,1rr As<\Odation, el promedio local de la cuenu men­ sual de un teléfono celular" S42.i8. Suponga que las cuenta• locale. mensuales de telefono celu­ lar estan normalmente distribuidas. con una desviación estándar de SI 1.35.

Page 226: libro.pdf

L ¿Ctúl o la probabilidad de que una cuenta "Seleccionada al aur de teléfono celular sea nm de S67.75?

b. ¿üúl o la probabilidad de que una cuenta seleccionada al azar de teléfono celular sea mur S30 y sso:

c. ¿Cu.U o la probabilidad de que una cuenta seleccionada al azar de teléfono celular no $C'3 ma de S25?

d. ¿Ctúl o la probabilidad de que una cuenta seleccionada al azar de teléfono celular sean::: S45 y S55?

6.10 Segtln el lnternal Revenue Service, el rendimiento de impuesto. de un allo promediaron SI en devoluciones para contribuyente. Una explicación para esta cantidad es que los contribuy« tes preferirían que ti gobierno lo retenga mucho dinero durante el olio que deberle dinero 1 de año. Suponga que la cantidad promedio de impuesto para fmales del año es una dC''Olución SI 332, con una desviación estándar de $725. Suponga que lu cantidades adeudad.u o que deben en devoluciones de impuesto. cst.in normalmente distribuidas, a. ¿Qué proporción de rendimientos de impuestos muestra una devolución mayor a S2 mil' b. ¿Que proporción de rendimientos de impuestos muestra que el contribuyente adeudad'

al goblemo! c. ¿Qué proporción de rendimiento. de impuestos muestra una devolución entre S 100 y S

6.11 ~ trab.ijadoro que laboran con herramientM mio propensos a lesiones rdadonadas con oficio. Una enfermedad, causada por rcalilar esfuerzo» con las manos y mul'l«a• se conoce síndrome de túnel carpiano y afC(ta hasta a 2J mil trabajadores al afio. El U.S. Labor Depart estima que el coste promedio de esta afección a empleados y aseguradores es alrededor de S30 por trabaiador lesionado, Suponga que estos cestos están normalmente distribuidos, con desviación cstindar de S9 mil. a. ¿Qut proporción de lo. costos e•tán entre S 15 y 45 miU b. ¿Qut proporción de los costos es mayor a SSO mm c. ¿Qut proporción de costos ot.i entre SSO y 20 mil? d. Suponga que la desviación estándar se desconoce, pero 90.82% de lo. cono. son mb de

mil. ¿Cuál serla el valor de la desviación estándar] e. Suponga que se desconoce el valor medio, pero la desviación ot.indar es toda\1a S9

¿Cuinto serla el costo promedio si 79.95% de los costos fuera menos de S33 miU 6.12 Supongamos que el lector e.U trabajando con un conjunto de datos que cstj normalmente

tribuido, con una medía de 200 y una desviación estándar de 47. Determine el valor de x a de la siguiente información. a. 60% de IO$ valores son mayor~ que x. b. x es menor que 17% de los valoro. c. 22% de lo> valores son menores que x. d. x es mayor que 55% de lo> valore»

6.13 Resuelve los siguientes problemas y suponga que los datos están normalmente distribuido$. a. La desvíacién estándar de la distnbucién es 12.56. y 71.97% de lo. valores son m.ayores a

¿Ctúl es el valor de Jt? b. La media de la distribución es 352, y ~lo 13.35% de los valores son menores a 300. ¿CuL

el valor de a? 6.14 Suponga que la desviacién estándar parad problema 6.8 se desconoce pero la median t

22 pies .. Si i.2.4% de todo> lo> almacenes Cluc A de Estado. Unido. tienen una altura libre a 185 pies, ¿,uá( es la desviación est.indar?

6.1 S Suponga que la altura libre media de todos los almacenes Cla~ A de Estados Unidos se d.e.¡co;:=-• pero se sabe que la desviación estándar es de: 4 píes. ¿Cu;il es el valor de la altura libre m 29% de lo> almacenes Clase A de Estado> Unidos tienen una altura libre menor a 20 pies?

6.16 La información acumulada por la l'ational Climatic Data Cerner muestra que el promedie velocidad del viente en milla. por hora para St, Louis, ~tissouñ, e. 9.i. Suponga q11C ta. cienes de la velocidad del viento esran normalmente distribuidas para un lugar geogr.iñc:o Si 22.45% del tiempo las mediciones de la velocidad del viento son más de 11.6 mil~ por ¿cu.il o la desviación estándar de la velocidad del viento en St, Louís!

200 ESTADtsnC.A E."' 10. iNIGOCIOS

Page 227: libro.pdf

CAl'lnlW 6 DI~ TRIBl,,'CIO~E.' CO~'TISUA!> 201

6.3 USO DE LA CURVA NORMAL PARA CALCULAR APROXIMADAMENTE PROBLEMAS DE DISTRIBUCIÓN BINOMIAL

Para cienos tipos de problemas de dis1ribución binomial, la distribución normal <e puede usar pau calcular aproximadamente las probabilidades. Cuando los tamaños muesuales son mur grandes. las distribuciones binomiales se aproximan a la distribución normal en forma, cualesquiera quC' sea d valor de p. Este fenómeno ocurre mis rápido (para valores más pequeños den) cuando p está cerca de .SO. Las figuras6.8 a la 6.10 muestran tres distribuciones binomiales. ~óte:.equcen la figura 6.S aun cuando el tamal'lo muestral, 11, C'> ~lo 10, la gr~fica binomial es muy parecida a una curva normal.

La gráfica de la figura 6.9 (n .. 10 y p a .20) está sesgada a la derecha debido al bajo valor p y el pequeño tamaño, Para esta distribución, el valor esperado es <61o 2 y las probabilidades <e acumulan en x •O y 1. No obstante, cuando tt es suficientemente grande, como en la distribución binomial (tt • 100 y p • .20) presentada en la figura 6.10, la gráfica e> relativamente simétrica alrededor de la media (µ "' n · p .. 20) porque suficientes y posibles valores de resultado a la izquierda de x .. 20 permiten que la curva caiga al eje x.

Para valores grandes de n, la distribucién binomial e. dificil de analizar sin una computadora. La tabla del Aptndicc A.2 llcga <6lo a n • 25. Es importante saber que debido al 1amaño de las factoriales in"olucrados <e dC'bcrí usar calculadora para resol"« los problemas binomiales cuando n e:. mu) grande', lo cual multa diftcil o imposible; ~in embargo, por fortuna, tenemos que la distnbucion normal e. una

.3 Distribución ... binomial para i .2 n • 10y p 50 ]

1 .1 c.

o o

~URA 6.9 Distribución binomial para n • 10 y p .20

FIGURA 6.10 :>istribución t. nomial para

100y p • .20

2 3 4 5 6 7 8 9 10 VaJon:. X

.3

.2

.1

OL-..l--L..--L--1~'---'--'--'-__JL-..._~-- o 2 3 4 5 6 7 8 9 10 \'alorn x

.10

.09 ~ .08 - .07 i ::

.04

.03

.02

.01 O'-'l.'"'--'-'--'L......L--'--'-_._.._.__. ........ _.__.__._-'-'--'--- 12 13 14 IS 16 17 18 19 20 21 22 23 24 25 26 27 28 29

\'alorcsx

Page 228: libro.pdf

202 ESTAI>bTICA v.; LOS SEGOOOS

0.10

~ :.o 1 o.os

o.oo~. uu, ll u l l l~..:....:....:..1111'-'-'-'11 '""'-'-'-' , ·~·

hM'M'Mi • Gr6fica del problema binomial: n • 60y p • .30

IS 3S \'alorax

Recordemos que la regla emptrica expresa que aproximadamente 99.7%; es decir. todos lo> valores de una curva normal otán dentro de tres desviaciones estándar ck

media. Para que una aproximación de curva normal de un problema de distribución sea acep todo> los posibles valores de x deben estar entre O y n, que son lo> límites inferior y superior, res vamente, de una distribución binomial. Si µ :!: 30' no est.á entre O y n, 110 uu la distribución n para resolver un problema binomial porque la aproximación no es suficientemente buena. úm demostración de que la curva normal es una buena aproximación para un problema binomial, nue el procedimiento. Otra rtgla práctica para determinar cuándo 11$1r la curva normal para ap mar un problema binomial es que la aproximacién es buena lo suficiente si n · p > 5 y n · q > 5.

El proceso se puede ilustrar en la solución del problema de distribución binomial.

P(x ~ 25ln • 60 y p • .30) • ? :-:ótoe que este problema binomial contiene un tarnaflo muestra! relativamente

y que ninguna de las tablas binomiales del Apéndice A.2 se puede usar para resolver el blema, Este problema o un buen ejemplo para 11$1r la di>tribución normal.

De la ua.<lación de un problema binomial a un problema de curva normal se o

µ • n · p • (60) (.30) • 18 y a= Vñ"7H • 3.55

FIGURA 6.12 Gr6fica de solución aparente de problema binomial trabajado por la curva normal

µ• 18 a « 3.55

TABLA 6.4

Reglas pr6cticas para la corrección de continuidad

v.llllaa .... ,

x> +.50 rll!: -.50 r< -.50 rs +.50

:SrS -.501 +.50 <r< +.50y-.50

.e• -.50r +.so

x2:25

buena aproximación para problemas de distribución binomial para valores den.

Para trabajar un problema binomial con la curva normal se requiere un proceso traslación. La primera parte de este proceso es convertir I<» dos parámetros de una di bución binomial, n y p. a lo. dos parametros de la distribución normal, µ y a. Este proas utiliza fórmulas que se vieron en el capuulo 5:

µ•n·pya•Vñ7M Ahora deberá realiza~ una prueba para determinar s1 la distribución normal es

aprox.i.madón suficientemente buena de la distribución binomial:

El intervalo de µ .:: 30', ¿se encuentra entre O y n?

El problema binomial se convierte en un problema de curva normal:

P(x ~ 251µ ., 18 y a= 3.55) •?

Ahora se deberá determinar <i la curva normal se ajusta lo suficiente a esta dís cien binomial para justificar el uso de la cun-a normal.

µ ::!: 30' = 18 ::!: 3(3.55) .. 18 :!: 10.65 7.35 s µ ::!: 3a s 28.65

Este intervalc se encuentra entre O y 60 de modo que la aproximación es s para permitir el uso de la curva normal. La figura 6.11 es una gráfica MINITAB de bU tribución binomial. ro:ótese el gran parecido a la curva normal. La figura 6.12 es la aparente de la versión de curva normal a este problema.

Page 229: libro.pdf

: Fi(füp 6.13

cornac 6 OlmtBUOOS'E.S CO~'TL'IUAS 203

Grifica de una porción del problema binomial: n • 60 y p • .30

.12

.ti

.10 j .09 .a .08 .B .07 ~ .06 .os

.04

.03

.02

.01 o . 1 1 1

13 14 IS 16 17 18 19 20 21 22 23 24 25 26 Valorux

Corrección para continuidad La traslación de una dístribución discreta a una distribución continua no es del todo íkil. Se requiere una corrección de + .50 o - .50 o :!: .50, dependiendo del problema. Esta corrección asegura que la mayor parte de la información del problema binomial está correctamente transferida al an.Uis~ de cur­ va normal y se conoce como correcclón pan continuidad que ~ haa durant« la amvrni6n dt una dis­ rribuci6n discma a una disrribua6n continua.

La figura 6.13 es una parte de la grifica de la distribución binomial, n • 60 y p • .30. Nót~ que con una distribución binomial todas las probabilidades están concentradas en numeres enteros. Por tanto, las respuestas para x ~ 25 se encuentran al sumar las probabilidades para x • 25, 26, 27, ••. , 60. No hay valores entre 24 y 25, 25 y 26, ••.• 59 y 60, pero la dls· tribución normal es continua, y hay valores presentes a lo largo del eje x, Debe hacerse una corrección para esta discrepancia para que la aproximación sea tan precisa como <ca posible.

Como analogfa, visualice el proceso de fundir varillas de hierro en un horno. w vsri­ Uas de hierro son como los valores de probabilidad en cada número entero de una distri­ bución binomial. Nóte-.e que la gráfica binomial de la figura 6.13 parece una serie de \'lnllas de hierro en una linea. Cuando las varillas se colocan en un horno se funden y dis­ persan. Cada varilla se funde y se mueve para llenar el área entre ella y las varillas adyaccn· res, El resultado es una 14mina continua de hierro <ólido (hierro continuo) que se partee a la curva normal. La fusión de las varillas es análoga a dispe~r la distribución binomial para aproximar la distribución normal.

¿Qu~ distancia se dispersa cada varilla hacia las otru? Una buena estimación es que cada varilla avanza mis o menos a media distancia hacia las varillas adyacentes. En otras palabras, la varilla que estaba concentrada en x • 25 se dispersa para cubrir el área de ~4.5 a 25.5; x • 26 se conviene en continua de 25.5 a 26.5 y asl sucesivamente. Para el proble­ ma P(x ~ 25ln • 60 y p • .30), la conversión a un problema de curva normal continua da P(x ~ 24.51µ • 18 y <T • 3.55). La corrección para la continuidad es de -.50 porque el problema cxígla la inclusión del valor de 25 junto con todos lo valores más grandes; d valor binomial de x .. 25 se traslada al valor de curva normal de 24.5 a 25.5. 1 el proble­ ma binomial hubiera sido analizar P(x > 25), la corrección hubiera sido ~.SO. que ruclu en un problema de curva normal de P(x 2 25.5). El último ca~ empeurla en más ck 25 porque el valor de 25 no estarla incluido.

La decisión en cuanto a cómo corregir para continuidad depende del 51px> de igua)­ dad y la dirección de los resultados deseados de la distribución binomW. La tabla 6..4 es cm lísta de algunas reglas pricticas que pueden ayudar en la aplicación de b corrección para continuidad.

Para el problema binomial P(x 2 25ln • 60 y p • .30), b run'I oormaJ 5C convime en P(x 2 24.51µ • 18 y a= 3.55), como <e ve en la figura ~.H y

Gráfica de la solución al :~blema binomial resuelto

, FIGURA 6.14

. r la curva normal

TABLA 6.5

Valores de probabilidad para el problema binomial: n • 60, p • .30 y X Z: 25 v.ilrS F1 J' ero e

2S .0167 26 .11116 r1 .- 28 ... 29 .Gll2

'° JIDD5 )1 JIOIZ 32 -· 3) ...

.. z: 25 .AB61 z= x-µ = 24.5-18 =l.83 <1 3.55

Page 230: libro.pdf

204 f~TAI>ISTICA L" Lo:. :-;EGQCJOS

PROBLEMA DE DEMOSTRACIÓN

6.10

PROBLEMA DE DEMOSTRACIÓN

6.11

La probabilidad (véase la tabla 6.2) de este valor z es .4664. la respuesta a este problema está en cola de la distribución de modo que la respuesta final se obtiene al restar:

.5000 ~

.0336

Si este problema se hubiera trabajado con la fórmula binomial, la solueién hubiera sido como ve en la tabla 6.5. la diferencia entre la aproximación de la distribución normal y los valores binoim. les reales es de sólo .0025 (.0361 - .0336).

Resuelve el siguiente problema de distribución binomial con el uso de le distribución normal.

Plx 12ln • 25 y p • ·'º' • 1 Solud6n

Encuentre p. y u. p.• n • p • (25)(.40) = 10.0

u• .Jn·p q Jl25)(.40)(.60) 2.45 Pruebe µ :t Ju• 10.0 :t 3(2.45) • 2.65 en 17.35

Este rengo se ubica entre O y 25, de modo que le aproximación es suficientemente cerca,.&. A continuación corrija para continuidad. Como el problema es determinar le probabilidad de qur x sea exactamente 12, la corrección supone .50 y • .50. Esto es, una probabilidad binomial e x• 12 se traslada a un 6rea de curve normal continua que est6 entre 11.5 y 12.5. Veamos la gr .. fice del problema:

¡; - 10 12.5 " v• 2.45 n.s

Entonces x-µ z---

(T

y

Z IS !!::J!.. = ~ 0.61 (T 2.45

z • 1.02 produce une probabilidad de .3,61. z • 0.61 produce una probabílídad de .2291.

De la diferencia entre las 6reas se obtiene le siguiente respuesta:

.3,61 - .2291 - .1170

Si este problema hubiera sido resuelto con el uso de los cuadros binomiales. la respuem seria .11'. La diferencia entre la aproximación de la curva normal y el valor obtenido con el usar los cuadros es sólo .003.

Resuelve el siguiente problema de distribución binomial con el uso de la distribución normal.

P{x < 27ln 100 y p 371 1

Page 231: libro.pdf

CAPtnno 6 DISTIUBU00'-1:' CO'-'TISI; \S 205

Solud6n

Como n1 el tamaflo muestra! ni el valor p están contenidos en la tabla del Apéndice A2. enton­ ces resolver este problema con las t6cnicas de distribución binomial no es práctico. Es un buen candidato para la curva normal. Del ~lculo de µ. y u se obtiene:

µ. • n · p • (100)(.37) • 37.0 u• Jn·p ·q • .J(lOOl(.37)(.631 •4.83

La prueba para determinar la cercanía a la aproximación es:

µ.:: 3tr - 37:: 3(4.831 - 37:: 14 49 El rango 22.51 a 51.49 es" entre O y 100. Este problema satisface las condiciones de la prue­

ba. Ahora, corrija para continuidad: x < 27 como un problema binomial se traslada a x s 26.5 como un problema de distribución normal. Veamos la gráfica del problema:

x:.28.5 µ • 37 u• •83

Entonces,

Z= X-µ= 26.5-37 =-2,1? (T 4.83

La tabla 6.2 muestra una probabilidad de .4850 y al resolver la cola de distribución se obtiene:

.500 - .4850 - .0150

que es la respuesta. Si este problema se hubiera resuelto con el uso de la fórmula binomial, las probabilidades

serian las siguientes:

Velor " l'fobebillded 26 .0059 25 .0035 2• .0019 23 .0010 22 .0005 21 0002 20 ..2!!!U

x< 27 .0131

La respuesta obtenida con el uso de la aproximación de curva normal 1.01501 se compara favorablemente a esta respuesta binomial exacta. La diferencia es sólo .0019.

6.3 PROBLEMAS 6.17 Convierta los siguientes problemas de distribución binomial en problmw de dutribua6n nor­

mal. Use la correccien para continuidad, a. P(x s 16ln • 30 y p • .70) b. P(IO<xS20ln•25yp•.SO) c. P(x • 22jn .. 40 y p • .60) d. P(x>14lrr•l6yp•.~5)

Page 232: libro.pdf

6.18 Use la pruebaµ :!: Ja para determinar si las siguientes distribuciones binomiales se pueden apro­ ximar con el uso de la distribución normal. a. n = 8 r p = .os b. n = 18 y p = .80 c. n = 12 y p • .30 d. n • 30 y p • .75 e. n = 14 y p • .50

6.19 Donde sea apropiado, trabaje los siguiente; problemas de distribución binomial con el U$O de b curva normal. También, use la ubla del Apéndice A.2 para encontrar las respuestas con el 11)() de la distribución binomial y compare las respuestas obtenidas por los dos métodos. a. Plx - 8lt1 - 25 y p - .40) - ? b. Pix :?! 13ln = 20 y p • .60) • ? c. P(x • 7ln • 15 y p • .50) • ? d. P!x < 3ft1 = 10 y p • .70) • ?

6.20 La Zimmerman Agency realizó una encuesta para Residence Ion by Marrion de agente:> viajeros que realizan ,·iaje> de cinco noches o más. Según esta encuesta, 37% de esto; viajeros di>fru~ ser turistas más que ninguna otra actividad que realizan en casa, Suponga que son entrt\·istadol 120 "iajero> seleccionados al azar que realizan viajes de cinco noches o mas. ¿Cu.ti e. la proNbt­ lidad de que meno; de 40 disfruten ser turistas más que ninguna otra actividad que no hacen et: as.t?

6.21 Un estudio respecto a satisfaccién de gerente.. con herramientas de administración revela que 5 usan equipo> de trabajo autodirigidos como herramienta de administración. Suponga que entrevistados 70 gerentes seleccionados al azar en Estado. Unidos. ¿Cuál e. la probabilidad de q¡r meno; de 35 utilicen equipo; de trabajo autodirigidos como herramienta de administradón?

6.22 Segun The Yanktt Group. 53% de las casas que tienen televisión por cable y clasifican a e:>t<l> co~ pall1a> como buenas o excelentes respecto a la calidad de transmisión. Se~nla por ciento de casa> que tienen tele\'Í>ión por cable clasifican a e>ta~ compallfas como buenas o excelentes tener personal profe ional. Suponga que al azar son entrevistadas 300 familias de tienen telt\1- ~ión por cable. a. ¿Cual es la probabilidad de que más de 175 familias que tienen televisión por cable clasifiq=

a esta> compamas como buenas o excelente. respecto a la calidad de transmisión! b. ¿Cuál e> la probabilidad de que entre 165 y 170 incluyendo a las familias que tienen telt\is::::

por cable clasifiquen a estas compañías como buenas o excelente> respecto a la calid:td transmisión!

c. ¿Cu.1.1 es la probabilidad de que entre 155 y 170 incluyendo a las familias que tienen televi • por cable clavifiquen a estas compalllas como buena. o excelentes respecto a la calidad transmisión!

d. ¿Cu~ e> la probabilidad de que menos de 200 familia. incluyendo a l<l> familias que titnc:: televisién por cable clasifiquen a olas compañías como buenas o excelente. como buenas excelentes al tener personel profesional!

6.23 La lntcrnational Data Corporation reporta que Compaq e número uno en participación en mercado de computadoras personales (PC) en Estados Unido), con 16% del mercado. Su que un investigador selecciona al azar 130 compradores recientes de: PC. a. ;Cu.ti e> la probabilidad de que más de 25 compradores de PC compren una Compaq? b. ;Cuál es la probabilidad de que entre 15 y 23 incluyendo a compradores de PC compren

Compaq? c. ¿Cuál e> la probabilidad de que meno> de 12 compradores de PC compren una Compaql d. ¿Cuál o la probabilidad de que exactamente 22 compradores de PC compren una Compacf

6.24 Una encuesta acerca de estrategias para competir en el mercado mundial expresa que 52% entrevistado; concuerdan en que la; compalllas nece$ita.n hacer inversiones directas en otros paiseL También expresa que alrededor de 70% de entrevistados e.t.ín de acuerdo con que es atractivo ~ una inversión conjunta para aumentar competitividad mundial Suponga que lo> directores de compalliai. manufactureras se seleccionan al azar acerca de estrategias mundiale, a. ¿Cuál es la probabilidad de que entre 4-1 y 52 incluyendo a directores estén de acuerdo

que las compaAJas deben hacer inversiones directas en otros países!

206 ESTADISTICA E.>,; 10> :O.'EGOCJOS

Page 233: libro.pdf

b. ¿Cuál es la probabilidad de que mú de 56 directores esttn de acuerdo con esa aseveración! c. ¿Cuál es la probabilidad de que menos de 60 directores estén de acuerdo con que es atractivo

tener una inversión conjunta para aumentar competitividad mundial! d. ¿Cuál es la probabilidad de que entre 55 y 62 di.rectom esttn de acuerdo con e1>a ~-eración'

6.4 DISTRIBUCIÓN EXPONENCIAL Otra distribución continua útil es la distnbución exponencial. Est~ estrechamente relacionada con la distribución de Poisson. Mientras que la distribución de Poisson es discreta y describe sucesos aleato­ rios en algún intervalo, la distribución exponencial es conrinua y d=riM una disrrib11d6n de probabi· /idad dt los ritmpos entre suce10s akaronos. Las siguientes son características de la distribución exponencial.

• Es una distribución continua. • Es una familia de distribuciones. • Está sesgada a la derecha. • Los valores x van de cero a infinito. • Su vértice está siempre en ;e • O. • u curva aumenta continuamente cuando x se hace mas grande. u distribución de probabilidad exponencial está dettrminada por lo siguiente:

Fl!NCI NDE OE.'ISIDAD DE PROBABILIDAD EXPONE.'ICIAJ.

f(JC) - .A.t-M

donde; }C~ o .l>O yt - 2.71828 ...

Una distribución exponencial se puede caracterizar por el parámetro A. Cada valor único de .l determina una distribución exponencial diferente, resultando en una familia de distribuciones expo­ nenciales. u figura 6.15 muestra gráficas de distribuciones exponenciales para cuatro valores de .l. Los puntos en la gráfica se determinan al U)ar .l )' díverw. valores de JC en la fórmula de densidad de pro· babilidad. u media de una distribución exponencial esµ • lfA .• y la desviación estándar de una dis­ tribucién exponencial es o « 11.A..

Probabilidades de la distribución exponencial U~ probabilidades se calculan para la distribucrén exponencial al determinar el 'rea bajo la curva entre do. puntos. u aplicación de cálculo a la función de densidad de probabilidad exponencial produce una fórmula que se puede usar para calcular las probabilidades de una distribución exponencial.

PROBABIUDADES DELA COLA OEJlECHADE LA DISTRJBUCION UPONE.NCW.

P(x~.a;.) • ,....,

donde; JCo e:: o Para usar esa fórmula se requiere encontrar valores de e-•. Esto• valores se pueden akular en casi

todas las calculadoras o de la tabla del Aptndice A.4, que contiene los valores de e-• para ,-aJores selec­ cionados de x. JCo es la fracción del intervalo o el numero de intervalos entre llegadas en b pregunu de probabilidad y >. es el pcrcenuje promedio de llegadas.

Por ejemplo, las Uegadas de Poisson a un banco están distribuidas con una ;. de l.~ dientes cada minuto. ¿Cuál e. el tiempo promedio entre Uegadas y cuál es la probabilidad de que al meno> ~ nunu­ tos transcurran entre una y otra llegada? Puesto que el intervalo para lambda e. 1 minuto y deseamos

Page 234: libro.pdf

flGURA 6.15 J{x)

Gráficas de 2.0 algunas distribuciones exponenciales

Distribución exponencial para ). 1.2 y solución para x ~ 2

llBLA 6.6

Salida Excel y MINITAB para distribución exponencial

Jxl 1.2 11 1.0

9 8

.6

.s

.4

.3

.2

.1 L ,i:=::::=---" o 2

WW.bml A 8

1 xValue Probebdaty < x Value 2 3 0.75 06448

Salida MINrJ'All Cl.mllatift DlstrillaUcn hnoticn Expoaeatial vitb .... • 0.72'600

" P( X<• . ) 0.7500 0.6448

conocer la probabilidad de que al menos 2 minutos transcurran entre llegadas (doble el interv lambda),XQ es 2.

lo> tiempo> entre llegadas y llegadas aleatorias están exponencialmente distribuidos. La m esta distribución exponencial es µ = 1/Á = 1/1.2 a .833 minuto> (50 segundos). En promedio. minutos, o sea 50 segundos, transcurrirán entre llegadas al banco. La probabilidad de un interv 2 minutos o más entre llegadas se puede calcular con:

P(x;?: 21>- = 1.2) = rum '"' .0907.

Alrededor de 9.07% del tiempo cuando en el ritmo de llegadas aleatorias es 1.2 por min minutos o más transcurrirán entre llegadas, como se ve en la figura 6.16.

Page 235: libro.pdf

P!OSLEMA DE BEMOSTRACIÓN

6.12

CAPITVLO 6 DISTRIBUOO~U CO~Tl''UAS 209

Este problema recalca el potencial de usar la dístríbución exponencial en coordinación con la <fu. tribución de Poísson para resolver problemas, En la ínw,tigación de operaciones r ciencias adminis­ trath-as estas do. distribuciones se utiliun juntas para resotver problemas de colas (teoría de linfa' de espera). La distribución de Poi•..on se puede usar para analizar la'\ llegadas a b cola, y la distribución exponencial se puede usar para analizar el tiempo entre llegadas.

Una empresa manufacturera ha panicipado en un control estadistico de calidad durante varios aflos .. Como pane del proceso de producción, al azar se seleccionan y prueban piezas. De los registros de estas pruebas se establece que una pieza defectuosa se presenta en un patrón que está distribuido de Poisson en promedio de 1.38 defectos por cada 20 minutos durante lotes de producción. Utilice esta información para determinar la probabilidad de que menos de 15 minu­ tos transcurran entre dos defectos.

Soludón

El valor de A es 1 38 defectos por intervalo de 20 minutos. El valor de p. se puede determinar con

µ = ..!. = -1- =.7246 .X 1.38

En promedio, es .7246 del intervalo, o sea (.7246)(20 minutos) • U.49 minutos, entre defec· tos. El valor de Xo representa el numero deseado de intervalos entre llegadas o sucesos para la pregunta de probabilidad. En este problema, la pregunta de probabilidad comprende 15 minu­ tos y el intervalo es 20 minutos. Por tanto, Xo es 15120 .75 de un intervalo. La pregunta aqul es determinar la probabilidad de que haya menos de 15 minutos entre defectos. La fórmula de probabilidad siempre da la cola derecha de la distribución -en este caso, la probabilidad de que haya 15 minutos o más entre llegadas. Con el uso del valor de Xo y el valor de A, se puede deter­ minar la probabilidad de que haya 15 minutos o más entre defectos.

La probabilidad de .3552 es la probabilidad de que al menos 15 minutos transcurrirán entre defectos. Para determinar la probabilidad de que haya menos de 15 minutos entre defectos, calcule 1 - P(x). En este caso, 1 - .3552 • .6448. Existe la probabilidad de .6'48 para que menos de 15 minutos transcurran entre dos defectos cuando se tiene un promedio de 1.38 defectos por intervalo de 20 minutos o un promedio de 14.49 minutos entre defectos.

Uso de la computadora para determinar probabilidades de distribución exponencial faccl y ~11NITAB se puede usar para resolver probabilidades de distribucién exponencial. Excel utiliza el valor de A y x.i, pero ~111\ITAB pideµ (igual a 1/A) y Xo- En cada caso, la computadora da la proba· bilidad acumulativa desde la i1quierda (d complemento de lo que da la fórmula de probabíi:dad mos­ trada en est;i sección). De l;i tabla 6.6 se obtienen las salidas Exccl y Ml!'llTAB para la pregunta formulada sobre la probabilidad en el problema de demostración 6.12.

1.1 PROBLEMAS 6.25 Utilice la fórmula de densidad de probabilidad para trazar las gráficas de Lu sipiícntcs distribu­

ciones exponenciales: .. i. = 0.1 b. }. = 0.3 c. i. = 0.8 d. i. - 3.0

Page 236: libro.pdf

110 ESUDISTICA e-· tos SEGOCIOS

6.26 Determine la media y desviación estándar de las siguientes distribuciones exponenciales:

•. )., = 3.25 b. )., = 0.7 c..i..=1.1 d. J..= 6.0

6.27 Determine las siguientes probabilidades exponenciales:

a. P(x C!: sjA .. 1.35) b. P(x < 3!.i.. = 0.68) c. P(x > 41.i.. - 1.7) d. P(x < 6!.i.. = 0.80)

6.28 El tiempo promedio entre llegadas a una caseta de pago en una autopista es de 23 segundl1 Suponga que el tiempo entre llegadas a la'caseta está distribuido exponencialmente.

a. ¿Cuál es la probabilidad de que un minuto o más transcurra entre llegadas? b, Si un auto acaba de pasar por la caseta de pago, ¿cuál es la probabilidad de que no apara.::a

un alto por lo menos en tres minutos?

6.29 Un concurrido restaurante determinó que entre las 6:30 p.m. y 9:00 p.m. y durante las noches viernes, las llegadas de clientes según la distribución de Poisson tienen un ritmo promedio de gada de 2.44 por minuto.

a. ¿Cuál es la probabilidad de que al menos 10 minutos transcurran entre llegadas? b. ¿Cuál es la probabilidad de que al menos 5 minutos transcurran entre llegadas? c. ¿Cuál es la probabilidad de que al menos 1 minuto transcurra entre llegadas? d. ¿Cuál es el tiempo esperado entre llegadas?

6.30 Durante el verano en un pequeño aeropuerto privado en el oeste de Nebraska, la llegada no ~ gramada de aviones según la distribución de Poisson tienen un ritmo promedio de llegadas 1.12 aviones por hora.

a. ¿Cuál es el tiempo promedio entre llegadas de aviones? b. ¿Cuál es la probabilidad de que al menos 2 horas transcurran entre llegadas de aviones? c. ¿Cuál es la probabilidad de que dos aviones lleguen con menos de 10 minutos de diferen

6.31 La distribución exponencial se puede usar para resolver problemas de Poisson en el que los in~ valos no sean tiempo. El Air Travel Consumer Repon publicado por el U.S. Department Transportation reportó que, en un año reciente, América West era el primer lugar nacional par tener menos quejas por el mal manejo de equipaje y un ritmo medio de 3.39 por cada mil ~ jeros. Suponga que las quejas por el mal manejo de equipaje son distribuciones de Poisson. Aho:a bien, con el uso de distribución exponencial para analizar este problema, determine el númctt promedio de pasajeros entre sucesos. Suponga acaban de manejar mal un equipaje. ¿Cuál es la probabilidad de que el equipaje de al menos 500 pasajeros se maneje correctamente antes se presente la siguiente queja por el mal manejo de equipaje? ¿Cuál es la probabilidad de que número sea menos de 200 pasajeros?

6.32 La Foundation Corporation se especializa en construir cimentaciones de concreto para casas nue­ vas en el sur. La compañía sabe que debido a los diversos tipos de suelos, condiciones de hume­ dad, construcción variable, entre otros factores, eventualmente la mayor parte de cimentaciones necesitarán reparación mayor. Con base en sus registros, la directora de la compañía piensa quc. en promedio, la cimentación de una casa nueva no necesitará reparaciones mayores durante anos. Si la compailía desea garantizar el trabajo contra reparaciones mayores y satisfacer r«b­ maciones a no más de 10% de sus garantías, ¿por cuántos años debe garantizar su trabai Suponga que los casos de reparaciones mayores son distribuciones de Poisson.

6.33 Durante el mes seco de agosto, una ciudad en Estados Unidos tiene lluvia mensurable en prome­ dio sólo dos dlas por mes. Si la llegada de días lluviosos es una distribución de Poisson en esu ciudad durante el mes de agosto, ¿cuál es el numero promedio de días que pasarán entre llu,;. mensurables? ¿Cuál es la desviación estándar? ¿Cuál es la probabilidad durante este mes que~ un periodo de menos de 2 días entre lluvia?

Page 237: libro.pdf

CAPfruLO 6 DIST'IUBCCIOSES CO~'TlSvAS 211

Los cambiantes rostros de la industria de seguros

La encuesta reporta el promedio de gastos para adquirir seguros para automóvil, de propietario de vivienda y todo tipo de seguros. Otros valore) medios se obtienen para algunos de lo) estados más extremos. Las preguntas de probabilidad se pueden contestar respecto a estos datos si se sabe la manera en que están distribuidos los datos poblacionales. Las técnicas para probar el ajuste de varias distribu­ dones a los datos se presentan en un capitulo más adelante, pero, si los datos están uniformemente drs­ tribuidos y se conocen los valores mínimo y máximo (a y b), las preguntas de probabilidad respecto a intervalos particulares se pueden contestar. Por ejemplo, suponga que las tarifas de seguro anual de automóvil en Estados Unido) van de $274 a SI 108 (a= 274, b = 1 108). ¿Entre cuales dos valores esta· ria 50% de en medio de los datos? La diferencia entre a y b es 834. Para que la probabilidad de distri­ bución uniforme sea igual a .50, x2 - x1 tendría que ser 417. La media, $691, está a la mitad entre a y by también está a la mitad entre x2 - x1 para encontrar el 50% de en medio. El 50% de en medio está entre $691:!:1/2($417) = $691 :!: $208.50 = $482.50 y $899.50. Suponga que el rango de pagos anua­ le) por seguro de propietario de vivienda en Estados Unidos es de $100 a $740 con una media de $420. La probabilidad de que una persona seleccionada al azar pague menos de $400 se puede calcular con las técnicas de la sección 6.1 con

a • $100, b • $740, x2 • $400 y x1 • $100 como .4688

Suponga que las tarifas anuales de seguro de automóvil están normalmente distribuidas con una media de $691 y una desviación estándar de $109. Con el uso de las técnicas presentadas en la sección 6.2, es posible determinar que el valor z para x = $874 es 1.68 con una probabilidad asociada de la tabla de distribución normal estándar como .4535. La probabilidad de que una persona seleccionada al azar pague más de $874 anualmente por seguro de automóvil es .5000 - .4535, o sea unos .0465. Suponga que los costos anuales de seguro de propietario de vivienda están normalmente distribuidos. El costo medio en Texas es $592. Suponga que la desviación estándar es $78. Con el uso de las técnicas presen­ tadas en la sección 6.2, es posible determinar que la probabilidad de que una persona de Texas selec­ cionada al azar pague entre $500 y $650 anualmente para seguro de propietario de vivienda es .6514.

El capitulo 6 presentó técnicas para trabajar problemas binomiales con la distribución normal. Veinte por ciento de estadounidenses prefieren comprar seguro de vida por teléfono o por correo. Suponga que 80 estadounidenses se seleccionan al azar; ¿cuál es la probabilidad de que 21 o más píen­ sen asP. En este problema de distribución binomial, n = 80, p ... 20 y x • 21. Los datos pasan la prueba para indicar que la distribución normal serla una aproximación lo suficientemente buena de este pro­ blema para usar como herramienta. Los datos se convierten en parámetros de distribución normal y resultan enµ • 16 y <T = 3.58. El valor de x se corrige a 20.5 dando un valor z de 1.26 y una probabi­ lidad de .1038 (.5000 - .3962).

Suponga que expertos de seguros de vida dicen que en Estados Unidos, en promedio, cada hora son destruidas 1.8 casas por incendio. Si se puede suponer que un incendio es una distríbudón de Poisson, entonces ). = 1.8 casas por hora. Con el uso de la información presentada en la secoen 6A, el tiempo promedio entre casas que son destruidas por incendio es .555 de hora, o sea cada 33.J mmu­ tos. ¿Cuál es la probabilidad de que transcurriría al menos una hora y media entre incendios que des· truyan casas? Con el uso de la distribución exponencial, Xo "' 1.5 y la probabilidad es .()6;::. E:lpertos de seguros de vida pueden usar estos tipos de probabilidades para asistirlos a fin de esubleca ta.rifas.

Page 238: libro.pdf

:?12 ESTAl>lSTICA L" 105 >,;EGOCJO~

CONSIDERACIONES ÉTICAS Vlriol punllDI deben Wlllidenne 11 tnlbejlr cm cllm......_ Q1111ti1n• La poNld6n que se estudia, ¡a la misma de la cu.i 1e cletaminaron p.nmmo. me&. denillc:ión-...: A)r Si no es ISi, los raukldos pueden no aer rilidol para d an'1isis que 1e rnlice. Se pueden ablelwr multados no rilidol o Wsos si 1e man perúnetros de una población para lnaliDr otra. Por ejemplo. UDI cnalllla ele mamdo fD Nueva Inglaterra puede moduir que la cmtidad ele pacado QJllllllDÍcll por mea por edabot elt6 nonDllmente dilttibuida C1DG el pmmedio ele 2.3 libru de peecado por ma. Una invalipdora ele merado cid IW'Oetlc no debe lllpCIDel' que.._ antida­ da aplican 1 IU población. Ea pnJblble que la población CD el IUlot* teDp WbÍlm muy dik· reata para mnmmir peecado que en Num ln¡laterra y a pniblble que la lplic:aci6n ck peñmdrol ele la poblad6n de Nueva IJlllalerra al swocste raulre cuationlbles.

MI como era wnlaclero con la distribución de PoWon del a¡*ulo S. d uso ele >. CD la dis uibuci6n aponmc:ial debe aer IClftUdo porque una >. para un iatmllo m un periodo e litua ción clildol puede no aer la milllla que una >. pua el mumo iDllenllo ta an periodo o litulción dlfaata. Porejcmplo.d DWnao ele liepdla por periodo de S IDiDUtllll UD ralaUrlideen Wr nea por la noche a probable que no wa el llllllllO que el n6mm> ele ..... en UD periodo de 5 minutoa en el millilo ratauraate Clllle laa 2 y la 4 p.m. durante los cllu Wbila. Al 11111' pari· mdnll escablccidol tala a>iDO p. y )., UD iiMltipdor debe estar qulO que la pobladón de la que se detaminó el pm.metro es, en wrclad. la iiUSIDI población en -.dio.

A veces se utiliza una distn"bución normal para analizar dalm cuando át101 no son nomu· les. Dicho an4lü puede producir resultados falsos. Cierta técnicas para probar una disuibución ele daiOI pueden determinar si atm diatribuidol ele cierto modo. Algunu ele lu técnicu se pre­ sentan en el capitulo 17. En smenL las técnicu del capitulo 6 pueden utilirane 11111 li se aplica el tipo erróneo de diluibucióD a los clalot o á la dillribuci6o empicada pin amlilis es la cometa y los puúnetros (µ,a,>.) no se ajmtan a los dalm ele la poblKión que 1e esté analizando.

RESUMEN

En este capuulo estudiamos tres distribuciones continuas di­ ferentes:

• Distribución uniforme. • Distribución normal. • Distribución exponencial.

Con distribuciones continuas, el valor de la función de densidad de probabilidad no proporciona la probabilidad pero si la altura de la curva en cualquier punto dado. De hecho, con distribuciones continuas, la probabilidad en cua • lesquier punto discreto es .0000. Las probabilidades se deter­ minan para un periodo y en cada caso, la probabilidad es el área bajo la curva para el intervalo en consideración. En cada distribución, la probabilidad o área total bajo la curva es 1.

Probablemente la más sencilla de estas distribuciones es la distribución uniforme, a veces conocida como distribución rectangular. La distribución uniforme est.i determinada por una función de densidad de probabilidad que contiene valores iguales a lo largo de algún intervalo entre los puntos a y b. Bá'icamente, Ja altura de la curva es la misma en todas panes entre estos dos puntos. Las probabilidades se determinan al calcular la porción del rectángulo entre los dos puntos a y b que <e considere.

La más empleada de todas es la distribución normal. Mxhos fenómeno' están normalmente distribuidos. inclu­ -.'Cldo caractensucas de cavi todas las piezas producidas a

máquina, muchas mediciones de entornos biológicos y rales, numerosas características humanas como son eslat peso, IQ y calificaciones en exámenes. La curva normal continua, simétrica, unimodal y asintótica al eje; en re · es una familia de curvas,

Los parámetros necesarios para describir una di•t ción normal son la media y la desviación estándar. Por c didad, los datos que son analizados por la curva normal estandarizarse al usar la medía )' desviación estándar calcular estadísticas z. t:na estadística z es la distancia a la un valor x está desde la media,µ, en unidades de desviac · estándar. Con la estadística z de un valor x, la prob3bilí..UC que ese valor <e presente al azar desde una distribución mal dada se puede determinar con el uso de un cuadro estadísticas z y sus probabilidades asociadas.

La distribución normal se puede usar para trabajar tos tipos de problemas de distribución binomial. Hacerlo requiere convertir los valores n y p de la distribución bin a µ y u de la distribución normal. Cuando sea resuelta uso de la distribución normal. la solución de una distrib binomial es sólo una aproximación. Si los valores de µ = están dentro de un rango de O a n, la aproximación es r blemente precisa. Hacer ajuste. para el hecho de que un blema de distribución discreta se trabaja con el uso de distribución conunua requiere una corrección para con dad. La corrección para continuidad implicar sumar o mw

Page 239: libro.pdf

al valor x que se analice. Esta corrección suele mejorar la apro­ ximación de la curva normal.

Otra distribución continua o la dístribucion exponen· cial. Complemente la distnbucién discreta de PoÍSM>n. La dis· aibución exponencial se usa para calcular las probabilidades

CAPITI:LO 6 DISTRIBUCIOSU U>:"<ilNUAS 213

de tiempos entre suceso aleatorios. La cfu1ribución exponen­ cial es una familia de distribuciones descritas por un paráme­ tro, u. La distribución oU sesgada a la derecha y siempre tiene su valor m.i.s alto en x • O.

TÉRMINOS CLAVE

mrr«ción para conunuidad Cistribución exponencial Cistribución normal

distribución normal estandarizada distribución rectangular distribución uniforme

distribucién z estadística z

FÓRMULAS

fCDaón de densidad de probabilidad de una distribución Fórmula r. =forme

11

f(x)= b-a paraa:Sx:Sb O para otres valore•

Media r desviación oi.indar de una dimibución uniforme

a+b J•=-- 2 b-il

a=~ "12

F-Dción de densidad de probabilidad de la dbtribución normal:

/(x)= 1 r-lll2l(b-µ)/ol~

"Ji:

x-1• z=-- "

Conversión de un problema binomial a la curva normal

11=11·p r a:J11·p·q

Función de densidad de probabilidad exponencial

f{x) = ).rU

Probabilidades de la cola derecha de la distribucién exponen· cial

PROBLEMAS COMPLEMENTARIOS

iculo de est1dlstlcas

Los datos es1án dismbuidos uniformemente entre lo• valore de 6 y 14. Determine el valor de /{x). ¿Cu.íles son la media y desviación otfodar de ota distribución? éCual es la probabilidad de seleccionar al azar un valor mayor que 11? ¿Cuál es la probabilidad de seleccionar al azar un valor entre 7 y 12?

• Suponga una distribucién normal y encuentre las ,jguien10 probabilidades. 1. P(x< 211¡1•2Sya•4) b. P(x :a: 771µ-= SO v o • 9) c. Pf.x > 471µ = SO y u • 6) d. P\13 <x< 29'µ • 23yu =4) e. P(x C!: 1051µ • 90 )'<1"" 2.86)

<i.36 Trabaje los siguientes problemas de di>tribución bino­ mial con el uso de la distribución normal. Verifique sus respuestas con el uso de la tabla del Apéndice A.2 para resolver las probabilidades.

1. Ptx • 12¡11 = 25 )' p • .60) b, Ptx > 5ln = 15 y p • .SO) c. P(x :S 3ln = 10 y p ..• SO) d. P(x 01! 8 n • 15 y p • .40)

6.37 Encuentre las probabilidades para los siguientes proble­ mas de distribución exponencial. 1.P(x:a:31'-= 1.3) b. P\x < 2IA = 2.01 c. pr 1 :S X :S 3IA = 1.65) d. P(x > 21'- = .405 1

Pruebe sus conocimientos

6.38 La U.S. Bureau of Labor Stafbtl(S reporta que las perso­ nas que por lo general trabaiau tiempo compkto, d número promedio de horas uabajadas por semana es 43.4 Suponga que el numero de horas trabajadas por semana. por quienes suden traba1ar uempo completo. está normalmente distribuido, Suponga que 1::!% de

Page 240: libro.pdf

estos empkados trabaian mis de 48 horas. Con base en este porcentaje, ¿cWl a la desviación estándar del ndmno de horas trabajadas por semana para estos mipleados?

6.39 Una encuesta de la U.S. Bureau of Labor Statistio mos­ uó que uno de cada cinco personas de 16 aJ\o> de edad o ~yortS es voluntario en parte de su tiempo. Si esta cifra se cumple para toda la población y 'i se toma al azar una muestra de 1 SO perwnas de 16 afio> o mayores, ¿cuí! es la probabilidad de que mú de SO de lo> mues­ treado> trabaje voluntariamente¡

6.40 t:n empresario abrió una pequeña ferretería en una zona comercial. Durante las primera. semanas, el nego­ cio tenía poco> clientes y <ólo atendían a uno cada 20 minuto> en la mallana .. Suponga que la llegada aleatoria de clienta a una dútribución de Poisson. L ¿Cu!! es la probabilidad de que al meno> 1 hora

transcurra entre clienta? b, ¿Cu.ti es la probabilidad de que de 10 a 30 minutos

transcurran entre cliente>? c. ¿Cuí! es la probabilidad de que meno> de 5 minuto>

transcurran entre diente)? 6.41 En un ano reciente, el precio promedio de un paquete de

sofu.-are de actualización Microsoft Windows era S90.28 según PC Data. Suponga que 10> precio> de ese paquete ese aJ\o ataban normalmente distribuido>, con una des­ viación estándar de 58.53. Si un vendedor al público de paquetes de computadoras" seleccionó al azar ese allo, ¿cu.il C. la probabilidad de que el precio fuera arriba de S95? ¿Cuál Q la probabilidad de que el precio estuviera entre $33 y S8P

6.42 Según el U.S. Depanment of Agriculturc, los producto· res de huevo de Alabama producen millones de huevos al ano, Suponga que la producción por aJlo en Alabama est.i normalmente distribuida, con una desviación están­ dar de 83 millones de huevos. Si durante <ólo 3% de los años se producen m.h de 2655 millones de huevos, ¿cuí! es la producción media por parte de granjeros de Alabama?

6.43 La U.S. Bureau of Labor Statinio publicó cifras sobre el numero de trabajadora de tiempo completo >' trabaja­ dores a sueldo con hcrarios flexibles, lo> trabajadores de tiempo completo y a sueldo de cada categoría de edad es1.tn casi uniformemente distribuidos por edad, con edades que van de 18 a 65 ~ Si un trabajador con hora­ rio Oexible se selecciona al azar de una fuerza de trabajo de Estados Unidos, ¿cual e> la probabilidad de que tenga entre 25 y 50 allos de edad? ¿Cuál es el valor medio para esta distribución? ¿Cuál e> la altura de la distribución!

6.44 Una convención de negocios mantiene su registro el viernes por la matlana entre la. 9 a.m. r las 12 p.m. Experiencias pasadas muestran que las personas que lle· gan se registran y siguen una distribucién de Poi550n a un ritmo promedio de 1.8 cada 15 segunde •. Por fortu na, se díspene de \-arw instalaciones para registrar miembros a la convención,

L ¿Cuál es el número promedio de segundos entre gadas al lugar de registro pan esta conferencia, base en resultados pasados?

b, ¿Cual es la probabilidad de que transcurran segundos o m.ts entre llegadas al registro?

c. ¿Cual es la probabilidad de que transcurran de 5 segundos entre llegadu?

d. Suponga que las computadora. de registro se componen durante un periodo de 1 minuto. e situación seria un problema? ¿Cuál e> la probab de que transcurra al menos 1 minuto entre 11

6.45 A-1/PF R&11rdt, Inc: tiene registrado el promedio de mensual por departamento en alguna. de la. diud.lm .• más costosas en Estados Unidos. Según su reporte costo promedio para rentar un departamento Mmneapol~ es S951. Suponga que la desviadén dar para rentar un departamento en Minne.ipolis es y que las renta. en Minneapolis cstán normalmente tribuidas. Si un departamento en Minneapolis se ciona al azar, ¿cuál es la probabilidad de que el <>ea: a. SI 000 o mas? b. entre S900 y SI 100? c. entre S825 )' S925? d. Meno> de S700?

6.46 Según The \\'irthlin Rtport, 24% de lo. trabai dicen que su trabajo es muy estresante, Si al azr seleccionan 60 trabajadore», ¿cual e> la probabi.;.idad que 17 o m.is digan que su trabajo es muy estr ¿Cual es la probabilidad de que mis de 22 digan qut trabajo es muy est~nte? ¿Cual es la probabilidad que entre 8 y 12 (inclusive) digan que su trabajo es estresante!

6.47 La U.S. Bureau of Labor Statistio reporta que el promedio anual en la zona metropolitana de Bostcm $45 121. Suponga que los salarios anuales de la metropolitana de Boston están normalmente díst dos, con una desviación estándar de S4 246. Al azr selecciona un trabajador de la zona de Boston. L ¿Cu.il c. la probabilidad de que el salario anua!

trabajador ~ mis de SSO mil? b. ¿Cuí! es la probabilidad de que el wrio anual

trabajador sea menos de S40 mil? c. ¡Cu.il es la probabilidad de que ti salario anual

trabajador sea mas de S35 mil? d. ¿Cual es la probabilidad de que el salario anual

trabajador sea entre S39 mil y $47 mil? 6.48 Suponga que los intervalos de una sala de emergmcu

un hospital durante un dia hábil están di~1n"b exponencialmente, con un tiempo promedio entre gadas de 9 minutos. Si la. llegadas son dbtribudono Poisson. ¿cual 5Cria el número promedio de llegadas hora? ¡Cual es la probabilidad de que menos de 5 tos transcurran entre cualesquiera do> llq¡adas?

6.49 Suponga que la. velocidades promedio de trenes pasajeros que viajan de Sewark, Sew Jersq, Philadelphia, Pcnnsylvania, están normalmente

Page 241: libro.pdf

buldas, con un promedio de velocidad media de 88 millas por hora y una desviación otándar de 6.4 millas por hora. a. ¿Cuál es la probabilidad de que un tren promedie

menos de 70 millas por hora? b. ¿Cuál es la probabilidad de que un tren promedie

más de 80 millas por hora? c. ¿Cuál es la probabilidad de que un tren promedie

entre 90 y 100 millas por hora? 6.50 La Conference Board publicó información de por qué

las compalltas esperan aumentar el numero de trabajos de tiempo parcial y reducir lo) puestos de trabajo de tiempo completo. Ochenta y uno por ciento de las com­ pal'l.las dijeron que la razón era obtener una fuerza de trabajo Oexible. Suponga que se identifica y entrevista a 200 companias que esperan aumentar el número de tra­ bajo• de tiempo parcial y reducir los puestos de trabajo de tiempo completo. ¿Cuál es el número esperado de estas compallias que estarían de acuerdo en que la razón es obtener una fuerza de trabajo Oexible? ¿Cuál es la pro­ babilidad de que entre 150 y 155 (sin incluir la 150 o la 155) den esa razón? ¿¿Cuál es la probabilidad de que mas de 158 den esa razón? ¿Cuál es la probabilidad de que menos de 144 den esa razón?

6.51 Según la U.S. Bureau of ihe Census, alrededor de 75% de usuarios de transporte suburbanos en Estado» Unidos van solos en su auto al trabajo. Suponga que al azar K muestrean 150 viaieros. a. ¿Cuál es la probabilidad de que menos de 105 viaje­

ros vayan solos en auto a su trabajo? b. ¿Cuál es la probabilidad de que entre 110 y 120

(inclusive) viajeros varan solos en auto a su trabajo? c. ¿Cuál es la probabilidad de que más de 95 ~iajeros

vayan solo) en auto a su trabajo? · .5? Segun lu cantidade) publicadas por el National

Agricultura! Statini~ Service del U.S. Department of Agricuhure, la producción de trigo en Estados Unidos en los últimos 20 al\os ha sido distribuida uniforme­ mente. Suponga que la producción media en este perio­ do es de 2 165 millones de bushtls. Si la altura de esta distribución es de .862 mil millones de bushtls, ¿cuáles son los valores de a y b para esta distribución?

li.SJ El Federal Reserve S)"$tem publica datos sobre ingl"C$0S familiares con base en su encuesta de linanus del con­ sumidor, Cuando el jefe de familia tiene grado uníversi­ tario. el ingreso medio de la familia antes de impuestos es S85 200. Suponga que 60% de los ingresos de la fami­ lia antes de impuesU» están entre $75 600 y $94 800 y que estos ingresos esun normalmente distribuidos. ¿Cuál es la desviación esúndar de ingresos de la familia antes de impuestos cuando el jefe de la familia tiene grado uni­ versitario?

LS4 Según The Polk Company, una encuesta de familiu que usan Internet para comprar o rentar autos reporté que 81 % estaban buscando información de precio •. Además, """" estaban buscando información sobre productos ofrecidos. Suponga que se entrevistan 75 familias selec-

CAPIT\iLO 6 OISTIUBl/OOSE$ CO!'."lTh"UAS 215

clonadas al azar y que usan Internet para comprar oren­ tar autos. a. ¿Cuál es el número esperado de famílw que buscan

información de precios? b. ¿Cu'1 es el número esperado de familia. que buscan

información acerca de productos ofrecidos? c. ¿Cuál es la probabilidad de que: 67 o má. familias

busquen información de precios? d. ¿Cuál es la probabilidad de que menos de 23 familia..

busquen información acerca de productos ofrecidos? 6 • .SS Los negocios situado~ en la costa a lo largo del Golfo de

Mtxico desde Texas hasta Florida se preocupan por la amenaza de huracanes durante la estación de junio a octubre. Los negocios se ponen especialmente inestables cuando entran huracanes al Golfo de México. Suponga que la llegada de huracanes durante esta estación es una distribución de Poisson, con un promedio de tres hura­ canes que entran al Golfo de México durante la estación de cinco meses. Si un huracán acaba de entrar al Golfo de México, ¿cuál es la probabilidad de: que transcurra al menos un mes antes que: al golfo entre el siguiente hura­ dn? ¿Cu.ti es la probabilidad de que otro huracán entre al golfo de México en dos semanas o menos? ¿Cu'1 es el tiempo promedio entre huracanes que entran al Golfo de México?

6.56 Con el creciente interés por la tecnología r el entorno cambiante de los negocios, muchos trabajadores están descubriendo que la capacitación en forma de reeduca­ ción, desarrollo de habilidades r crecimiento personal son de gran ayuda en d mercado de trabajo. IJna reciente encuesta de Gallup encontró que 80%, de quienes son de la generación X, consideró la disponibilidad de capa­ citación pagada por la empresa como un factor para valorar al tomar un trabajo. Si al azar se seleccionan 50 personas de la generación X. ¿cu.ti es la probabilidad de que menos de 35 consideren la disponibilidad de: capa· citación pagada por la empresa como factor para valorer al tomar un trabajo? ¿Cuál o el numero esperado? ¿Cuál es la probabilidad de que entre 42 y 47 {induslve) con· slderen la disponibilidad de capacitación pagada por la empresa como un factor para valorar al tomar un tra­ bajo?

6.S7 Segun la Air Transport Aisociation of America, d costo promedio de operación de un avíén ~ID-SO es S20S7 por hora. Suponga que los costo> de ~raOOn de: an l'ión .MD-80 están normalmente distribuidos con ana desviación estándar de $175 por hora. ¿A qui COSU> de operación serian menos 20% de los costos de openóón? ¿A qué costo de operación Krian mis 65% de los cos:os de operación? ¿Qué costo de operación seria má$ de 85% de los costos de operación?

6.S8 Por lo general los >upermercados suden estar llW con­ curtidos a N> de la. 5 p.m. en dW ~biln. porque: mucho> rrabaiadores se detienen en 5U canuno 1 Cl$a

para comprar. Suponga que 1 esa hora las llepdas a una caja rápida de pago del supennerado son una dístribu­ ción de Potsson, con un promedio de .8 penon.a.s/minuto.

Page 242: libro.pdf

216 ESTADISTICA E.'l l.05 :>:EG0005

Si la ajera acaba de hacer el cobro a la última persona de la fila. ¿cu.U e> 1.a probabilidad de que tran~urra al menos un minuto antes que llegue el siguiente cliente? Suponga que la cajera desea ir a la oficina del gerente y hacer una prq¡unta rápida y necoita 2.5 minutos para hacerlo. ¿Cuál es b probabilidad de que la empleada regrese antes que llegue el siguiente cliente?

6.59 Stgún Edrror and Pub/1.W,. fo1rfiook, d promedio de cireu­ ladón diaria de Th« \\'ali Strttt lournal con base en cifraa dd alto 2000 e 1 762 751. Suponga que Ja desvía­ ción C61indar es 50 940. Suponga que la circulación día­ ri.t del periódico está normalmente distribuida. ¿En qu~ porcentaje de días rebasarla una circulación de 1 850 000? Suponga que el periódico no puede soportar los gastos fijos de una preparación de circulación corn­ pleta si la circulación cae por abajo de 1 620 000. Si Ja probabilidad de que ocurra este evento es baja, el geren · te de producción podría tratar de mantener b plantilla completa de perscnal en >U Jugar y no alterar operario­ nes, ¡Con qué ftt.:uencia ocurrirá este evento, con base en inform.:adón histórica?

6.60 Las llamadas telefónica. emrames por lo general 5C con· sidttan de distribución de Poisson, Si una operadora promedia 2.2 llamadas cada 30 segundos. ¿cuál es el tiempo esperado (promedio) entre llamadas? ¿Cuál es la probabilidad Je que transcurra un minuto o m.ú entre lbnudu entrantes? ¿Dos minutos!

Interpretación de i. aalide

6.61 A continuación se ilustra una valida Ml~ITAB. Suponga que los datos representan el numero de compañeros de ventas que trabajan en una tienda de departamento. en cualquier dla hábil. Describa la distribución que incluya Ja media y b des'iadón estándar. Interprete la forma de b distn'bución )'la media en vista de lo> date» esiudíadcs. ¿Cuál si¡;mfican la> expresiones de probabilidad?

CUHULATIVE DISTRIBUTION FUNCTION Continuoua uniform on 11.0000 to 32. 0000

X P(X <• X)

28.0000 0.8095 34.0000 1.0000 16.0000 0.2381 21.0000 0.4762

6.62 Un.:a compatlia fabricante produce una varilla de metal. Utilice la salid.:a Eltcd que !!C muestra aquí para describir el peso de la \-arilla. Interprete los valores de probabili· dad en térmmos del proceso de manufactura.

Suponga que Ja ulida MISITAB que se muestra representa el anilisis de la duración de llamadas de fono celular p.ira uso en casa, en términos de mil" i=i ... Describa la d~1ribución de duracione> de llamada teléfono celular e interprete el signífkaJo de las siones de probabilidad.

CUMULATIVE DISTRIBUTION FUNCTIOS Normal with mean • 2. 35000 and standard deviation • O .110000

X P(X <• X) 2.6000 0.9885

6.63

2.4500 2.3000 2.0000

0.8183 0.3247 0.0007

6.64 Un restaurante promedia 4 .51 clientes por 1 O durante el verano en las últimas boras de la tarde.A 1inuaci6n se muestran salidas Excrl y MINTTAB este restaurante. Analice el tipo de distribudón Jo y el ,jgnificado de w probabilidades.

A T 11 1 Distrlbution: A • ' 51 2 )( Values Probabi'.:tv " s 3 0.1 o~ 4 02 0.5942 1 0.5 0.8951 • 1 o o~ 7 2• 1 oooc:

CUMULATIVE DISTRIBUTION FUNCT: Exponential with mean• 0.221

X P(X <• X)

0.1000 0.3630 0.2000 0.5000 l.0000 2.4000

0.5942 0.8951 0.9890 1.0000

Page 243: libro.pdf

CAPfTULO 6 DISTRIBUCIO:SES CO!'lll.'1,'tJA!> 217

ANÁLISIS DE LA BASE DE DATOS

L Seleccione la base de datos de sene de nempo de una em­ p:n:a agrícola industrial y realice una gráfica de lú)tograma para cebo!W o para brócoli. De manera aproximada. cada cm de esus variables está distribuida normalmente. Cakule la media y la desviación estándar para cada distri­ boción. Los datos de esta base de datos representan el peso ~ual (en miles de libras) de cada legumbre. En térmi­ DOS de pe-o mensual, describa cada una de t<>ta.s legumbres aboU.~ v brócoli 1• Si al azar se selecciona un mes de la dis­

cñbudón0de cebollas, ¿cuAI es la probabilidad de que cl peso tca más de SO mm ¿Cuál u la probabilidad de que el peso ~ entre 25 mil y 35 mil? Si al azar se selecciona un me de la distribución de brócoli, ¿cu.il es la probabilidad de que el peso sea má> de 100 mil? ¿Cual es la probabili- 6d de que el peso ~a entre 135 mil y 170 mil?

2. Utilice la base de dato de manufactura. La variable del grupo industrial e<tá casi uniformemente distribwda en esta base de dato», con valores de a • 1 a b • 20. ¿Cuil es la altura de esta distribución! ¿Cuál es la probabilidad de seleccionar al az.a.r un grupo Industrial de 7 a 13 (inclus» ve) de e.ta población si la dí)tribución es uniforme? Utilice la teoría de distribución uniforme para 1rabajar este pro­ blema. no lo) números reales de la base de datos,

3. Construya gráfica) de histograma de las variables de la base de datos de manufactura. Encuentre al menos una grá(ka que parezca tomar la fonm de una dimibución exponencial. Calcule estadísticas descriptivas p;ua esa variable . .b1udie las estadisricas y analice qw! informadón transmitida por la.s estadísticas indicarla que la forma de la distribución podría ser exponencial.

' CASO: MERCEDES VA TRAS COMPRADORES JÓVENES mis de 1res décadas, Mm:tdes y B~f\\' han competido

con cabeza por 'U participación en el mercado de aUIO) En 1959, Baycrische Mo1oren Werke (B~IW) casi se

:a b quiebra y casi fue \cndida a Daimler-Benz, fabricante autos Mercedes-Benz. u B~IW pudo recuperarse, al que en 1992 rebasó a Mercedes en ventas en todo el

Entre las razone> del éxito de la BM\\' fue su capaci­ pra vender modelo> que eran m.b lujoso) que los mode­

z:::a10rc> pero se concentré en proporcionarle calidad al ==llOOr y responsabilidad ambiental, En panicular, 8/11\\'

como objetivo su campo de ventas hacia el merado de mientras que Mercedes retenía una base de cliente)

En mpucsta al éxito de BM\\', xtercede, trata de cambiar al lanzar varios producto> en un esfuerzo por atraer

:::::=;ndores jóvene interesados en autos deportivos y de docmpeño. BMW, influida por Merccdc-; e-1.i presio­

para que s~ autos sean más refinados )' cómodos. De un experto automotriz dice que .\ler(tdc> desea con m B~IW y viceversa, :-.10 obstame, según un experto motores, el interés está todavía en el luio y comodidad

Mcctdes en tanto que 8/11\\' se concentra en el desern­ y manejo dinámico de sus autos. Aun cuando cada una

cs:zs compañ[as produce muchos modelo) diferentes, dos -~~·wcs cupt relativamente comparables son el B~IW

Yd Mercede, CU:: 320. Ha.sta el afio 2002, el precio pro· ckl 330ci era de S34 990 en comparación con S-13 215

an Cí.K 320. El rendimiento de combustible para el 330ci 30 miJW por galón en carretera y 21 milla> por galón en

• en comparación con 29 millas por galón en carretera cilhs por galón en la ciudad para el CLK 320.

~23 que ~tcrctcb e•1á preocupada porque los precios de distribuidores del CLK 3:!0 no 50n consistentes r que

cuando el precio e> S-13 21 S, los precios están en reali-

dad normalmente distribuidos con una desviacién están· dar de .S2981. Suponga también que Mcrcc:de) cree que a S42 mil. el CU.: 320 tiene un precio que está fuera del mer­ cado del B~I\\' 330ci. ¿Que! porcentaje de los precios de distribuidore» para el Mcrct-dcs Cl.K 320 es m.b de S42 mil y por tan10 fuera del mercado del B~IW .330d? El precio promedio de un BMW 330ci e) Sl4990. Suponga que estos precios también están normalmente distribuidos con una desviación estándar de S2367. ¿Qué porcentaje de dis­ tribuidore de B~I\\' fijaron el precio del 330ci a mis del precio promedio de un Cl.K 320? ¿Qué porcentaje de dis­ tribuidorcs de Mercedes es1an fijando el precio del Cl K 320 a menos que el precio promedio de un 330ci? Suponga que un distribuidor de B~IW vende un 330ci en S3;' 059. ¿Qué porcentaje de distribuidores de ,\krctdn fijad pre­ cio del CLK 320 a menos de este precio? En rérmínos del Cl.K .320 que compile con d 330ci por precio. ¿que! nos di'cn <:>10$ dato'?

2. Suponga que el rendimicn10 en m'.!las por galón para \'arios autos cu::. incluyendo d h«ho de que algunos con· due1or~ son menos eficiente que olros, está uniforme· mcnlc dis1ribuido sobre un rangn de 24 milla$ por g.¡lón a 34 millas por galón en carretera. ¿Qu~ proporción dc autos cae en d rango de 26 a 30 millas por galón? Suponga que el rcndimknto en millas por galón pJra \-arios autos 3 JOa C)l.l uniformcmen1c dis1ribuido sobre un rango de ::.~ milla' por galón a 35 milla.) por galón en arreura.. (Qué proporción de au10' .330ci cae en el rango de 26 .1 30 r.:= por galón? ¿Cómo ~ compara este rcndmumto con b cifra para el CU\? ¿Qu~ significa csu compuao6t!> Suponga qu~ es1as can1idadcs fueron '-crdadtras v M~­ de\ desea apelar a compradOttS coruamtes cid ambiente con base en cconomia de combustible. Cakuk b propor­ ción de cada uno de los dos moddos de autos que obut­ ncn .~O millas o mis por pión según estas cantidades. v compare lo' resuhados.

Page 244: libro.pdf

218 ESTADISTICA E..''LOS NEGOCIOS

J. Suponga que en una distribuidora se vende un prome­ dio de 1.37 CLK cada 3 horas (durante un db de 12 hora. de expo>ición) y que esas ventas son distribucio­ no de Poisson. !.a) siguientes probabilidades produci­ ~ por Excel indican la presentación de diferentes l.lempoi entre venias con base en esta información. E.midie la glida e imerpré1da para los vendedores. Por ejemplo, ¿cuil es la probabilidad de que transcurra n>m()) de una hora entre \"Cntas? ¿Ctdl es la probabili­ dad de que traJJSCUm nW de un db ( 12 horas por dla) amo de la siguiente venta una \U que se baya vendido un auto? ¿Qué pueden hacer los gerentes de la distri­ buidora con esta información? ¿Cómo puede esto ayu­ dar en la contratación de personal? ¿Cómo puede usarse esta información como medio de seguimiento

para el impacto de publicidad? ¿Hay opción de que estas probabilidades cambien durante el ano? Si es uf. ¿por qué?

Partt de un marco dt tiempo de 3 horas

Prob8billdadts txponenci&lts ICIUDuiativas dtsdt

la liqula'da 0.167 0.)33 0.667 1 2

3 4 5

0.2045 0.3663 0.5990 0.7459 0.9354 0.9836 0.9958 0.991!9

EXCEL

USO DE LA COMPUTADORA

Excel ~ putek usar para calcular probabilidades acumulativas para ,-aJores ~ de x ya sea de una distribución expo­ nencial o de una dístribucién normal. En cualquier de los dos casos, comience por seleccionar la tecla de función, /10 de la barra de bnramknw. Produciri la función Paste Function. A continuación K!Kcione la función, Statistical, del lado izquierdo de la YCl!Wla ~te Function. Aparece una nueva lis­ ta de opciones en d lado derecho.

Distribución normal w probabilidades de curva normal se pueden obtener al seleccionar la función NORMDlST del lado derecho de la función StatisticaL Aparece una caia de diálogo. La caja de diálogo tiene cuatro lintU a w que se debe responder. Escriba el valor de x en la primera linea. la media en la segunda línea, y la desvíacién est.indar en la tercera linea. La cuarta linea requiere una re.puesta lógica )"ll sea TRUE (VERDADERO) o FALSE (FALSO). Si el usuario escribe TRUE. obtendr4 las pro­ babilidades acumulativa. para todos los valores hasta x; si escribe FALSE. obtendré el valor de la función de densidad de probabilidad para esa combinación de x; µ )' u. En este capi­ tulo, estarnos intelbado• en resolver y usar probabilidades y, por lo 1an10, casi siempre usaremos la respuesta lógica TRUE.

Distribución exponencial ~ po ible obtener probabilidades de una durnbucién expo­ nencial al seleccionar la función EXPONDIST de la lista del lado derecho de la función StatisticaL Aparece una caja de di.ilogo EXPONDIST. Esta caia de di.ilogo contiene tres lineas a las que el wuario debe responder. Ponga el valor de Xo en la primera linea y el valor de .\ en la segunda linea La tercera linea requiere una respuesta lógica ya~ TRUE o FALSE. Si el usuario escribe TRUE, obtendrá las probabilidades acumula-

tivas desde cero al valor de xo; si escribe FALSE. obtcndri d valor de la fórmula de densidad de probabilidad. Para proble­ mas trabajados en este texto, estarnos interesados en las pre­ babilidades acumulativas y pondremos TRUE como mpuea en esta caja.

MINITAB

MINITAB ofrece la función de producir probabilidades pan distribuciones exponenciale-, distribuciones normales o di5- tribuciones uniformes. Comience el proceso al seleccionar opción ~c en la barra de menú, que multa en un menú eendeme. En este menú, seleccione Probability J2is tions. Cuando el usuario seleccione esta opción, aparea menú descendente.

Distribución uniforme

Para usar MINITAB Window) para calcular probab desde una distribución uniforme, seleccione Uniform menú descendente Probability Distributions. Esta resuhara en una caja de di!logo. Esco1a cómo se calcu1z:; probabilidades al seleccionar Probability IXnsity, Iatlve Probability o Inverse Probability. Probabilíty proporciona el valor de la densidad de probabilidad para combinación panicular de a, b y x, Cumulatrvt Pn produce las probabilidades acumulati~-as para valores o iguales a x: Con lnverse Probability da la inversa de !al babilidades acumulativas. Aqul estarnos interesado$ p mente en probabilidad acumulativa. En la otra línea. tndpoint, escriba el valor de a. En la linca, Upper en escriba el valor de b. Si el usuario d~ tener probab~• calculadas para varios valores de x, póngalas en una seleccione la opción de columna de entrada, y ponga ci: lista la ubicación de columna de los valore. x. Si sólo calcular la probabilidad para un valor particular de x. ba;z en constan le de entrada y escriba x.

Page 245: libro.pdf

Distribución normal

Pan usar MlNITAB para calcular probabilidades desde una d.üin1>ución normal, seleccione qponeotial del menú des­ eendente Probabiliry Distributioos. Esta selección resultará en una caja de diálogo. Elija cómo se calculan probabilidades al seleccionar Probability Density, Ounulative Probability o ID\·tne Probability. Probabiluy Density dad valor de la deo­ s:xiad de probabilidad para una combinación particular de x,

', o. Cumulative Probability produce las probabilidades acu­ culativas para valores menores o iguales a x. lnverse Probabi/11y proporciona la inversa de las probabilidades acu­ culativas. Aquf estamos interesados principalmente en pro­ blbilidad acumulativa. En la linea, .Mean escriba el valor deµ, J en la linea Standard desvíarien, escriba el valor de o Si el auario desea tener probabilidades calculadas para \'UIO~

«res de x, póngalas en una columna, seleccione la opción de umna de entrada, y ponga en una lista la ubicación de co­

t:::zona de lo) valores x. Si sólo desea calcular la probabilidad ¡¡:wa un valor panicular de x, hap clic en constante de entra· a y escriba JC.

CAJ>llVLO 6 DISTIUBUC101''ES C01'"111''VAS 219

Distribución exponencial Para usar MINITAB para calcular probabilidades desde una distribución exponencial, seleccione EJponMrial del menú descendente Probability Disrriburions. Esta selección ruultari en una caja de díilogo. Escoja cómo se calculan probabilida­ des al seleccionar Probability IXnsity, Cumu/ari•-t Probabiliry, o lnvtrU Probability. Probability Density proporciona d valor de la densidad de probabilidad para una combinación particu­ lar de JCo yµ. Cumulative Probabilíty produce las probabilida­ des acumulativas para valores menores o ígualb a JCo. lnverse Probability da la inversa de las probabilidades acumulativas, Aquf estarnos interesados principalmente en la probabilidad acumulativa. En la línea .Mean, escriba el valor de µ Si el usuario desea tener probabilidades calcufadas para vario) valores de "°' póngalas en una columna, seleccione la opción de columna de entrada, r ponp en una lista la ubicación de columna de IO$ valores JCo. Sí sólo desea calcular la probabili­ dad para un valor particular de JCo. haga clic en constante de entrada y escriba JCo. J\"ota: MINITAB usa la medía,µ • 11>., no el valor de >..

Page 246: libro.pdf

CAPÍTULO 7

Muestreo y distribuciones muestrales

220

OBJETIVOS DE APRENDIZAJE Los dos objetivos principales del capítulo 7 van a proporcionar al lector una aprecia ción para la correcta aplicación de técnicas muestrales y la comprensión de las distri­ buciones muestrales de dos estadísticas, con lo cual podrá: l. Determinar cuándo usar muestreo en lugar de un censo. 2. Distinguir entre muestreo aleatorio r muestreo no aleatorio. 3. Determinar cuándo y cómo usar diversas técnicas de muestreo. 4. E tar alerta de los diferente' tipos de errores que pueden presentarse en una

encuesta. S. Comprender el impacto del teorema central de limite en un análisis estadístico. 6. Usar las distribuciones muesrrales de la media i y la proporción p.

Page 247: libro.pdf

¿Cuál es la actitud de los trabajadores de maquiladoras?

A principio> de la década de 1960 el gobierno de México estableció un programa de maquiladoras. Este programa permitió a corporaciones estadounidenses construir plantas de manufactura dentro del territorio mexicano, donde pudieran imponar suministros y materiales de Estados Unidos, libres de impuestos, para ensamblar y fabricar producto), y luego exportar los artículos terminado> de regreso a Estados Unidos. La idea era convencer empresas estadounidenses pua construir en México por la ma­ no de obra barata que hay en este país, y asl crear trabaio$ para mexicanos.

El programa ha sido exitoso. con más de 3 500 compatlw registradas en él. Para el atlo 2000 esta­ ban empleados más de 1.1 millones de trabajadores, Se ntima que l3$ maquiladoras gastaron 50 mil millcnes de dólarn con proveedores en 1999, con exportaciones de la industria maquiladora unos 65 mil millones de dólares. Casi 85% de la manufactura de maquiladoras e>l.i en lo> e>tado> del norte de Mhico que hacen frontera con Estados Unido>. Estas empresas están concentradas en Ciudad lua­ rez .. Tijuana, .Mexicali. Nuevo Laredo y .Ma1amOTO$. El programa de maquiladoru abarca ahora com­ patlias de todo el mundo, incluyendo Japón, Corea, China. Canadá y muchos pal~ europeo>.

¿Qué perfil tienen lo) trabajadores mexicanos de maquiladora.? ¿Cu.tics son sus actitudes hacia sus trabajo. y sus compaflias? ¿Hay brechas culturales entre compatlia y trabajador que deben cerrarse para utilizar con más eficiencia lo> recursos humano>? ¿Qué actitudes y expectativas basadas en la cultura llevan los trabajadores de maquiladoras a su trabajo? ¿Cómo se ocupa un investigador de negocios en encuestar trabaiadores!

Preguntas gerenciales y estadísticas

Suponga que unos mvesugadores deciden encuestar a trabajadores de maquiladoras para averiguar lu actitudes de los trabajadores hacia el entorno del trabajo y la compañía, y lo que de ella esperan,

l. ¿Deben k» investigadores tomar un censo de todos los trabajadores de una maquiladora o ~.lo una muestra? ¿Cuáles son las razone' de cada una de ellas?

2. Si ~utiliza una muestra, ¿qué tipo de técnica de muestreo ganarla la información m.i> valiosa? ¿Cómo pueden lo> investigadores estar seguros que la muestra de trabajadores es representativa de la población?

). ¿Qué tipos de pregunw deben formularse y cómo deben expresarse? 4. ¿Pueden 13$ preguntas ser analizadas cuanmauvamente! Si es asr, ¿qué técnicas estadísticas son

mas apropiadas? S. ¿En qué formato pueden los investigadores 11~-ar con más eficiencia los re ultados del estudio

a la administración? 6. ¿Cómo puede la administracién hacer uso completo de los resultado'> de una encuesta para te­

ner un entorno de trabajo más productivo!

Fwntt: adopl.do do Ch<tyl L Noll. •Moi<an M~1bdon \~ An Altitud< Towvd Y.'brking." Scvt!n.n: ~ S­ ª"" E'.Gmo..aa. vol IX. no.l ISpring 19921. pp.14; MaJ/lblit ,\Wp:iM, hnyJ/www~mihtm. acUU<d 2000; s~ 8. Ziiitr. ·~~iladora 2001 UnckrmnJlllil and Prq>orq." aVlibblc at bnp:/1-w.nw¡gwdc comlmal ~

221

Page 248: libro.pdf

222 ESTADISTICA ES ios SEGOCIOS

7.1 MUESTREO

Este capuulo explora el proceso de muestreo r las distribuciones muestrales de algunas enadísti­ ~.¿Cómo obtenemos los datos empleados en análisis estadístico? ¿Por qué a veces los investigadores toman una muestra en lugar de realizar un censo? ¿Cu~les son las diferencias entre muestreo aleatorio y no aleatorio? Este capítulo aborda 6tas y otras preguntas acerca del muestreo.

También se presentan las distribuciones de dos estadísticas: • La media muestral. • 1..1 proporción muestral. Se ha determinado que estas estadi>tícas están casi normalmente distribuidas bajo ciertas cond:

cienes. El conocimiento ruso de la medía muestra] y proporción muestral es importante en el estu de estadlstica res bisico para gran pule del análisis estadístico.

El muestreo se utiliza ampliamente en negocios como medio para reunir información útil acerca una población. Se reúnen datos de muestras y se sacan conclusiones acerca de la población como panr del proceso de estadísticas inferenciales, En el Dilema de deciliión sobre trabajadores de maquilador& podría tomarse una muestra aleatoria de trabajadores de una amplia selección de compafllas en '-UUS industrias de las ciudades fronterizas más importantes. Un cuestionario cuidadosamente formu que sea culturalmente sensible para ~ mexicanos podría aplicaN a trabajadores seieccionados p¡:t determinar actitudes de trabajo, expectativas )' diferencias culturales entre trabajadores y comp¡l! Los im-núgadore• podrían compilar y analizar 10> datos recogidcs de las respuestas, Asi como hacmr resúmenes y observaciones acerca de la perspecnva y cultura en el programa de maquiladoras. 1..1 a~ rilitración y quienes toman decisiones podrlan entonces tratar de usar lo. multado. del estudio mejorar el rendimiento y motivación de trabajadores. A veces, una muestra proporciona medios ra» nables p.ira reunir esta útil información para toma de decisiones que, de otra manera, podría 'ICr · canzable y no asequible.

Razones para muestreo Tomar una muestra en lugar de llevar a cabo un censo ofrece varias ventajas.

l. La muestra puede ahorrar dinero. 2. La muestra puede ahorrar tiempo. ). Para recursos dados. la muestra puede ampliar el alcance del estudio. 4. Como el proceso de investigación a veces es destructivo, la muestra puede ahorrar produ~ S. Si el acceso a la población es imposible, la muestra es la única opción. Puede ser más barato obtener una muestra que un censo para cierta cantidad de preguntas,

ejemplo. sí se rcafüa una entrevista telefónica de 8 minutos, llevar a cabo las entrevistas con una n:;a. tra de 100 dientes en lugar de con una población de 100 mil clientes obviamente es menos c Ademh de ahorros en costo, el número considerablemente menor de entmistas por lo general menos tiempo total. Así, si obtener los resultado. es materia de urgencia. muestrearlos seria mh rí¡: Con la velatilidad de alguno) mercados y el constante bombardeo de la nueva competencia )' n ideas. muestrear tiene gran ventaja sobre un censo en términos del tiempo del ciclo de inve.tígaci&:.

Si los recursos asignados a un proyecto de investigación son fijos. es posible reunir información tallada si se toma una muestra que si se realiu un censo. Con recursos concentrados en menos íné:;; duos o articules, el estudio puede ampliarse en alcance para tomar en cuenta más p~ especializadas, Una organización asignó un presupuesto de S 100 mil para un estudio'! optó por un censo en lugar de una muestra al U$3r una encuesta por correo. Los investigadores enviaron po: rreo miles de ejemplares de una tarjeta computarizada que parecía voto de un juego de estrellas de bol de lip ma)'or. La tarjeta contenta 20 preguntas que el interesado podría contestar Sí o :>:o al un agujero. u información recuperada sir\'ió para obtener lo> porcentajes de quienes contestaron :>:o a las 20 preguntas. Por la mí.$ma cantidad de dinero, la companta podría haber tomado una tra aleatoria de la población, tener sesiones personales con entrevistadores capacitado y reunir ·

Page 249: libro.pdf

CAPtn:LO 7 .\l\JESTREO Y DISTIUBUCIONE.S Ml!EST1W..ES 223

mación de1allada <obre el procese en estudio, Al usar el dinero para una muestra, los inve tigadores po­ drtan pasar mucho más tiempo con cada persona entrevistada y por tanto aumentra el potencial para reunir información útil.

Algunos procesos de invcs1igación destruyen IO$ productos o articules en estudio. Por ejemplo. si se prueban bombillas eléetrieas para determinar cuanto tiempo encienden o si se prueba el sabor de barras de dulce para determinar si el gusto es aceptable, el producto se destruye, S1 se realiza un censo para este tipo de investigación, no quedaría ningún producto para venderse. Por 1an10. lomar una muestra es la única opción realista para probar estos productos.

A veces es pracncamente imposible tener seceso a una población para su investigación. Por ejem· plo, algunas personas se niegan a contestar preguntas sensibles y algunos números telefónicos no apa­ recen en las gulas. Algunos arttculos de inler6 (como un Chevrolet 1957) están tan dispersos que localizarlos seria sumamente diAcil. Cuando la población es inaccesible por k1as u otras razones. el muestreo es la única opción.

Razones para tomar un censo A veces tornar un censo llene m.is sentido que usar una muestra, Una razón para lomar un censo es eli­ minar la posibilidad de que, por casualidad, una muestra seleccionada en forma alca1oria pudiera no ser representativa de la población. Incluso cuando se pongan en práctica todas las técnicas apropiadas de muestreo, una muestra que no es representativa para la población puede seleccionarse por casuali­ dad. Por ejemplo, si la población de interés son los propietarios de camiones del estado de Colorado. una muestra alca1oria de propietarios podrían ser principalmente rancheros, cuando de hecho muchos de los propietarics de camiones de Colorado son citadinos.

Una segunda razón para realizar un censo es que el cliente (persona que auloriza y/o suscribe el estudio) no tiene una apreciación para muestreo aleatorio y se siente más cómodo al conducir un censo. Estas dos razones para realizar un censo es1án basadas en la suposición de que se dispone de suficiente tiempo y dinero para llevar a cabo un censo.

Marco Todo estudio de investigacién tiene una población objetive que es1.i formada de individuos, insutucio­ nes o entidades que son el objeto de investigacién. La mueslra se inicia con una lista, mapa, direaorio u otra futntt tmplt,1dn para reprtstntar la poblaci6n que recibe el nombre de marco, el cual pueden ser lisias escolares, de asociaciones de comercio o incluso lisias vendidas por corredores de lisias. En el ideal, existe una correspondencia exacta entre las unidades del marco y las de la población, por lo que el marco y la población objetivo suelen ser diferentes. Por ejemplo, suponga que la población objetivo son las familias que viven en Detroit. Un marco factible serian las páginas residenciales de las guías de teléfonos de Detrou, ¿Cómo es que el marco podria ser diferente de la población obje1i,·o? Algunas fa. milías no uenen 1el~fono. 01m familias 1ienen números que no aparecen en las gulas. Incluso podrla haber 01ras familias que desde que se imprimió el directorio se mudaron y/o cambiaron los números telefénicos, otras has1a tienen lisias múhiplcs bajo diferemes nombres.

Lo. marcos tienen rtgutro> tn exceso en las unidades de población objetivo, mas algunas otras uní· dades, Los marcos a los que le falta11 registros contienen menos unidades que la población objetivo, El muestreo se realiza desde el marco y no desde la población objeuvo. En teorfa, la población objetivo y el marco son los mismos. En realidad, la mela de un investigador es minimizar las diferencias entre el marco y la población cbjetivo,

Muestreo aleatorio contra no aleatorio Los dos npos pnncipales de muestreo son el aleatono y el no aleatorio. En el muestreo aleatorio cada unidad dt la poblaci611 tiene la misma probabilidad dt ser $tlt«io11nda en la muestra. El muestreo alca­ torio implica que la probabilidad entra en el proceso de selección. Por ejemplo, a casi iodos los t~la­ dounidenses lo gus1a creer que lo> ganadores de la apuesta nacional son seleccionados al sacar mimtro> al azar. A finales de la dttada dt 1960, cuando se usaba ti sorteo mililar, casi rodas las perso­ oas elegibles para el redutamientc confiaban que al azar se seleccionaba una fecha de nacimiento como la primera fecha usada para reclutar personas. En estas dos shuaciones, los miembros de la población pensaban que las selecciones se hacían al azar.

Page 250: libro.pdf

224 ESTADISTICA[.'; LOS Nf.GOCIOS

TABLA 7.1

Breve tabla de números aleatorios

En el muestreo no aleatorio no toda 1midad dt población tiene la misma probabílidad dt S6 sd«· cionada en la muestra. Los miembros de muestras no aleatorio• no son seleccionados al a.ur. Por ejem­ plo. podrían seleccionarse porque cst~n en el lugar apropiado en el momento apropi.1do o porqut conocen a las personas que conducen la investigación.

A vece el muestreo aleatorio se denomina muestreo de probabilidad y el muestreo no aleatorio K llama muestre« dt no probabilidad. Debido a que no e:. igualmente probable que sea seleccionada cada unidad de población. asignar una probabilidad de que ocurra un suceso en muestreo no aleatorio a imposible. los método> estadístico> presentados y estudiados en este texto esún basado, en la >Upc:w­ ción de que los dat<» provienen de muestras aleatorias. Los mttodos muestrale» no aktlrorios no son rk­ nicas apropiada.~ para reunir datos para ~r analizados por la mayor pan« iú los mttodos cstadímas pr~ntados en est« texto. No obstante, en esta sección se describen varias técnicas de muestreo no alea­ torias, principalmente para alertar al estudiante de sus características y limitaciones,

Técnicas de muestreo aleatorio t....~-~;,_ lt'Cfli~ b.isícas de muestreo aleatorio pueden ser simples aleatorio> estratificado,, aleare sistemérico y aleatorio de grupo (o área). Cada una de estas tknica> ofrece ventaja) y de.venta¡u. .AJgu~ técnicas son más fáciles de usar, algunas con menor costo, y otras con mayor potencial pan reducir error de muestreo.

Muestreo aleatorio simple

La tknica m.h elemental de muestreo aleatorio e> el muestreo aleatorio simple, el cual se puede ,;sm. lizar como la base para I~ otras técnicas de muestreo aleatorio. Con muestreo aleatorio simple, unidad del marco se numera del 1 a N (donde N es el tamallo de la población). En seguida.~ realiu cuadro con números aleatorios o un generador de número aleatorio se utiliza para seleccionar artkulos en la muestra. Un generador de número aleatorio suele ser un programa de cómputo que pe mhe que la salida calculada por la computadora dé número. aleatorio" u tabla 7.1 contiene una bmc lista de número. aleatorio •. La tabla A.I, del Apéndice A contiene una lista completa de números ale> torios en toda• direcciones. Lo. espacios de la tabla A. I sólo sirven para facilitar la lectura de valora. Por cada número, cualquiera de los 10 dlgitO• (0-9) es igualmente probable, de modo que es posiNt obtener el mismo dígito dos veces o mas en una lila.

Como ejemplo, del marco de población de compañías que aparecen en la füta de la tabla 7.2 un muestreo aleatorio simple para seleccionar una muestra de seis compañías,

• Primero, numeramos cada miembro de la población. • Seleccionamos tanto• dígito• para cada unidad mue treada como exlstan en el número

grande de la población. Por ejemplo, ii una población tiene 2 mil miembro>, seleccionamos números de cuatro dígi

Como la población de la tabla 7.2 contiene 30 miembros, sólo e. necesario seleccionar dos digítos cada número. La población está numerada de O 1 a 30, como se ve en la tabla 7.3.

El objeto es muestrear seis compañías, de modo que de la tabla con cuadro números aleatorios ben seleccionarse <ei' diferentes de dos dlgnos. Como e.ta población contiene sólo 30 compaflias número. ma)"OfQ a 30 (31·99) deben excluir-e. Si, por ejemplo. se selecciona el número 67, el p se continúa hasta obtener un valor entre 1 y 30. Si el mismo número se presenta más de una va, tinuamo• con otro número. Para facilitar la comprensión, comenzamos con el primer par de dígitos la tabla 7.1 y continuamos en sentido horizonral en la primera fila ha.ta que sean seleccionados n

91567 mt5 27951 30134 04024 ""' 2'llO 997]0 - 1-. 11145 8611 02JM 51038 Z0655 'Stl127 ,... .,,. ano ll27e )M76 l'10J2 17'8 aJ6 57f91 l67m 2'167 f9J2J 45021 :mu 12544 41CIS5 l9I05 .,,. 2m2 1402 J~ 45799 22716 19792 .., 7059 ""' *29 "'7S5 25f99 1"31 35006 "900 07119 97336 71CMI 08171 rn.n 13916 4756t

Page 251: libro.pdf

lABlA 7.2

Marco poblacional de 30 compa"1as

UBLA 7.J

~ión =erada de JO compañías

CAPtrulO 7 .ML'ESTRFO Y 1>15TIUBUCIO:-ifS MllES'TltALES 225

AlllbAldinm Akm MbllDd a..lr.olAamica WSoadi a..­ Cllfllalip a.. DllllA/6Llllll Dlme7

Dar.a lllmaMaWI o-.ao,-a e;...! a.clric ~.-. .... - llM w. s._. 1.-ñ

lac8ll ....... Mad ~ Ocicirlm..a ...... JCf'eMq ..... Cimllllt .,... s.n ,.. ....

OI Allllm~ 11 Dafll.- 21S- OI Akm 12 ......... 22 .......

°'~ IJ~o,.-lm zs ..... CM ... ol.w.ka 14 Gmall l!leclrk :HMlclola6 CISlllSOllll IS<iamll ... 25 Ocdllealli ......... 06a..- '' HAurtoll -~ m ClliFlllP 17 llM 27 PIOCllr. a..11 •O.. 11 leloil :za R,.icr ., DlllaA/6U.. 19 lmut 29 San 11 DimlJ 2IO 1-'t 30 Time w.rner

diferentes valores entre O 1 y 30. Si se requieren más números, continu.uno. en sentido horizontal a la segunda fila y a~i sucesivamente. A veces un investigador comenuri en algún lugar seleccionado al az.ar de la tabla y continuará en una dirección predetermlnada para seleccicnar números.

En la primera 6Ja de dígito. de la ubla 7.1, el primer número es 91 y está fuera de rango, de modo que se desecha, lo) siguientes dígitos son 56, 74 y 25, que es el primer número utilizable. De la tabla 7.3 vemos que 25 es el número asociado con Occídmtal Petroleum, por lo que Occidental Petroleum es la primera compa.JUa seleccionada en la muestra, El siguiente número no utilizable es 95, seguído por 27, que si es utilizable. A Procter & Gamble le corresponde el número 27, por lo que esta comparua se se­ leeeiona, Continuando con el proceso. pasarnos los número) 95 y 83. El siguiente número utilizable es 01, que es el valor para Alaska Airlín~ después siguen el 24, 04 y 02, ambo. utilizables. ~los número' están asociados con Bank of Arnerica y Alcoa, respectivamente. Si se continúa a lo largo de la primera fila. el siguiente número utilizable es 29, que está asociado con Scars. Como esta selección C) la sext.i, la muestra esl.á completa. Lis siguientes compaAlas constituyen la muestra final.

Alaska Airlines Alcoa Bank of America Occidental Petroleum Procter & Gamble Sears

El muestreo alea1orio simple es más fácil de ejecutar en pobl.iciones pequeña» que en grandes. El procese para numerar a lo. miembros de la población y seleccionar artículos se difkulta mucha para poblaciones grandes.

Muestreo aleatorio estratificado

Un segundo upo de muestreo aleatorio es el muestreo aleatorio estntificado, en el que la población se divide en subpoblaciones que no K tl"l$lapan y se denominan estratos. El investigador extrae en ton· ces una muestra aleatoria simple de cada una de las subpoblaciones, La razén principal para usar mUC$• treo aleatorio C)tratificado es que sirve para reducir el error muestrsl, El error muestral se presenta

Page 252: libro.pdf

cuando. al azar, la muestra no representa la población. Con muestreo aleatorio C$tratificado. el potmaa: para comparar la muestra cerca de la población es mayor de lo que es con muestreo aleatorio simple por que se toman partes del muestreo total de lo) diferentes subgru~ poblacionales. No obstante, el rmn­ treo aleatorio estratificado es por lo general más CO$tOSO que d aleatorio simple porque a cada u • de la población se le debe asignar un estrato antC$ que se inicie d proceso de selección alcatoña.

La selección de estratos suele basarse en la información dispenibíe que pudo recogerse en en o censos previo). Los beneficies de la e)tratificación aumentan entre más difieran. lntemamentt. estrato debe ser relativamente homogeneo y externamente, deben contrastar entre si. La estratifi se hace a veces usando variables demográficas. por ejemplo sexo, clase soeioeconómica, región fica, religión y grupo étnico. Por ejemplo, si una elección para presidente de Estados Unidos timt realiz.arla una firma de investigación de mercado. ¿qué importantes variables deben ser estra · El sexo de la persona que conteste podria ser la diferencia porque en las pasadas elecciones observó diferencia en la preferencia de los votantes ~ su género: es decir, los hombres y mujeres \'Otarc: modo diferente en las elecciones nacionales. u región geográfica también proporciona una im variable en elecciones nacionales porque los votantes son influenciados por valores culturales que difieren de una región a otra. Los votantes en el sur votaron ca.si exclusivamente por los tas en el pasado, pero en fechas reciente) lo hicieron por candidatos republicano) en elecciones nales, Los votantes de los estados de las Montallas Rocosas apoyaron a candidatos presid republicanos: en el noreste industrial, se inclinaron mi) hacia candidatos democráticos.

En mercados de radio F.\.1, la edad de los oyentes C$ determinante pua el tipo de progr empicada por una estación. La figura 7.1 contiene una estratificación por edad con tres estrato&. base en la suposición de que la edad hace la diferencia entre la preferencia de programación. E.su tificación implica que lo~ radioescuchas entre 20 y 30 al'los prefieren el mismo tipo de progr que es diferente de la que prefieren los radioescuchas entre 30 y 40 y entre 40 y SO allos de edad. de cada subgrupo (estrato), la homogt11tidad o semeja~ tsú preseme: entre cada par des existe una diferencia, o htttrogtntidad.

El muestree aleatorio estratificado puede ser proporcionado o desproporcionado. El aleatorio estratificado proporcional se presenta n1ando ti porwrrajt dt la muestra tomada tk trato ts proporcional al porcentaje q11t cada estrato está dtnrro dt toda la poblaci6n. Por ejemplo. ga que se realiza una encuesta de votantes en Boston y la muestra es estratificada por religióa católica, protestame, y judía, entre otras. Si la población de Boston es 90% católica y si se muestra de mil ~'Otantes. la muestra requerirla la inclusión de 900 católico) para alca.nz.ar estra proporcional. Cualesquier otro número de católico) $erla una estratificación desproporci proporción muestral de otras religiones también tendría que seguir porcentajes poblacionales.. bíen.sl consideramos a El Paso, Texas, donde la población es aproximadamente 77% de origee no y un in~tigador rnliu. una clccci6n en \a que \a estra\iñcación es por grupo ttnico, una aleatoria estratificada proporcional deberla contener 77% de personas de origen hispano. Par una muestra estratificada proporcional étnicamente de 160 residentes de los 600 mil rC$iden:o

226 ESTADISTICA E.-.; LOS :"EGOCIOS

FIGUIA 7.1 Muestreo aleatorio estratificado de radioescuchas deFM

Esuatifiaclo por edad

Hctcrogbleo (difemne)

entre

Hnerogmeo [diferente}

entre

Page 253: libro.pdf

CAPfTULO 7 MUESTREO Y DISTRIBUCIOSB MllE.STlW.E) 227

Paso debería contener 123 personas de origen hispano. Sitmprt qut las proporciona 1it los estnuos de la muestra sean diferentes a las proporciones dt los estratos dt la poblaci6n, se presenta un muestreo alta· torio estratificado desproporcionado.

Muestreo sistemático

El muestreo sistemático es una tercer técnica muestra! aleatoria. A diferencia del muestreo aleatorio o· tratificado, el muestreo sistemático no se realiz.a para reducir el error muestral, Más bien, el muestreo sistemático se emplea por su comodidad y relativa facilidad de administración. Con el muestreo siste­ m'tico, cada k-énmo elemento se selt«iona para producir 11na muestra dt tamaño n de una poblaci6n dt tamaño N. El valor de k, a veces llamado ciclo muestra! se puede determinar con la siguiente fórmula. Si k no es un valor entero, debe usarse el valor de número entero.

DETERMJNAOON DEL VALOR DE le

donde: n • tamailo muestra! N • tamailo poblacional k .. lama.do de intervalo para selección

Como ejemplo de muestreo sistemático, un Investigador de sistemas de información de adminis­ tración deseaba muestrear fabricantes en Texas y tenla suficiente apoyo financiero para muestrear mil · compañías (n). El Direaorio de Fabricantts de Texas tenla en sus llitas aproximadamente 17 mil fabri­ canto en tot¡J en Texas (N) en orden alfabttico. El valor de k era 17( 17 000/1 000) y el investigador se­ leccionó una de cada 17 compai\las del directorio para su muestra.

¿Empezó el investigador con la primera compai\fa de la lista, o con la número 17. o alguna otra in­ termedia? Al seleccionar cada valor k~imo, debe usarse una tabla con número. aleatorios simples para seleccionar un valor entre 1 y k incluso como punto inicial. El segundo elemento para la muestra es el punto inicial más k. En el ejemplo, k • 17, de modo que el investigador recurriria a una tabla de nú­ meros aleatorios para determinar un punto inicial entre 1 y 17. Suponga que seleccionó el número 5, entonces tendría que empezar con la compaflla número 5, luego seleccionó la número 22: es decir, (5 + 17) y luego la número 39, y asi sucesivamente.

El muestro sistemático tiene otras ventajas ya que está distribuido de manera uniforme en el mar­ co. una persona informada puede fácilmente determinar si en un estudio se sigue un plan de muestreo. l'o obstante, puede presentarse un problema con muestreo sistemático si los datos están sujetos a cual· quier periodicidad y el intervalo está en sincopa (que se pueden suprimir dos o mh elementos) con el muestreo. En e-e caso, el muestreo seria no aleatorio. Por ejemplo, si una lista de ISO estudiantes uni­ versitarios o en realidad una lista fusionada de cinco grupos. con 30 estudiantes cada uno y •i cada una de las listas de los cinco grupos se ordenó con los nombres de los mejores estudiantes primero y los de menor nivel al final, entonces el muestreo sistemático de cada 30 estudiantes podría provocar la selec­ ción de los mejora estudiantes, los estudiantes de menor nivel o los estudiantes mediocres; esto es. la lista original esú $Ujeta a una organiz.ación cíclica o periódica. La metodología del muestreo sisttmátko C$t.i basada en la suposición de que la fuente de elementos de población C$ aleatoria.

Muestreo de grupo (o área)

El muestreo de grupo (o área) o un cuarto tipo de muestreo aleatorio. El muestreo de grupo (o &mal comprende la división de la población en áreas o grupos que no se traslapan. So obstante, en con· traste con el muestreo aleatorio estratificado donde los estratos son homogéneo>, el muestreo de grupo identifica grupos que tienden a ser internamente heterogéneos. En teoría. cada grupo conuene una am­ plia variedad de elementos, y el grupo es una miniatura, o microco mos, de la población. Ejemplos de grupos son ciudades. compai\ias, colegios. áreas de una ciudad y regiones geográficas. A veces los gru· pos de la población se presentan naturalmente y ya e>tán identificado,, por ejemplo C>tados o Áreas Estadísticas Metropolitanas Estándar. Aun cuando el muestreo de área suele referirse a grupos que son áreas de población, por e¡emplo regiones geográficas y ciudades, los término> mumrro dt gn.po mues· treo de drta se usan Indistíntamente en este texto,

Page 254: libro.pdf

228 ESTADISTICA EN tos l"EGOCIOS

HM'l;tQ .. Algunas ciudades de ventas de prueba

Dnpub de seleccionar lo. grupos, el investigador 5Clccdona al azar elementos individuales cn muestra desde los grupos, Un ejemplo de investigacíón de n(S<KÍO• que hace uso de agrupación la prueba de mercado de: nuevos productos. Con frecuencia en ventas de prueba. htado. Unidos a dividen en grupos de ciudades de prueba de mercado. y se hacen encuot.u a consumidores indiv · les demro de: las ciudades de: prucb.t de mercado. La figura 7.2 muestra algullll5 ciudades cstadou~ ~ de prueba de mercado que se usan como grupo• para probar productos. El artículo en publicación btadlstia• en los negocios de hoy sobre ciudades de prueba de mercado analiu al de las ciudades estadounidenses investigadas con m~ frecuencia,

A \TCCS los grupos son dmlasiado grandes. y se torna un segundo conjunl:O de grupos ck cada original. üta técnica se denomina muestreo de dos et1pas Por ejemplo, una investigadora dividir Estados Unidos en grupos de ciudades. Ella podría ernonces dividir las ciudades en grupo& manzanas y al aur seleccionar casa. individuales de lo• grupos de manun.u. La primera etapa es donar las ciudades de prueba y la segunda tl.tpa e• seleccionar las manzanas,

El muestreo de grupos o área\ ofrece vari~ ventaja.. Dos de las primera.' \·mtaj;li son la dad y el costo. Por lo general los grupos se obtienen con comodidad y el costo de muestrear dcsdc da la población se reduce porque el alcance del estudio K reduce a los grupo>. El costo por sude: ser mmor en muestreo de grupo o árc:a que en muestreo e.tratificado por l.u llita> de de mis bajas o IO$ costos Je: ubicación mas bajo>. El tiempo y el costo de contactar elementos de la dón se: pueden reducir, en especial si se trata de viajar, porque la agrupación reduce la dhtan,u a cimientos muestreados. Además, Se puede 'implifiar 11 administración de la encuesta muestral, A ces d muestreo de grupo o área es el único método factible, porque no se dispone de los rn.tf(OS trales de los elementos individuales de la población y por tanto no se pueden usar otras t&nicas muestreo aleatcrio,

El muest reo de grupo o arca también tiene vari.u desvemajas, Si los elementos de un grupo loClll mílares, el muestreo de grupo puede 5C'r estadísticamente meno. eficiente' que d muestreo ale simple, En un caso extremo. cuando I~ elementos de un grupo son los mismos, d muestreo dndr grupo puede no ser mejor que muestrear una rola unidad del grupo. Adrmas. los costos y prob de análisis estadístico son mayores con muestreo de grupo o área que con muestreo aleatorio Wti;it

Muestreo no aleatorio Las tttni.:as de muestreo empicadas para seleccionar elementos de la pobladón por cualquier m mo que no comprende un proceso de selección aleatorUi se denominan tttniau de muestreo no torio Como no se u~ la probabilidad para seleccionar elementos de las muestras, C'St.1> th"llicas thTiicas de no probabilidad y no son dC>Cable• para u,,;irlo. a fin de reunir datos a ser analiudos por métodos de c~tadisti•"I inferencia) presentada en este tato. El error de muestreo no puede ser

Page 255: libro.pdf

CAPITVLO 7 ~ll.''ESTilEO Y OISTRJBV<lO~'ES MU~l'lWLS 229

•'ii'·'Hº!'Ul!·Jiiifü·*·Jl·'':i.t•--------------------- audacia c1e prueba c1e mm:ac1o Por varias l'UOOC$ lt acosen como prueba de merado dda'minadas ciudades, incluymdo demogrificas. psicogr6· ñcu. f'arnilWidad, co!Mllimcia y otras. fl árn metrópoli­ tana mú mcuatada en Eatados Unidos es Odma-Midland, Tau, donde los midentes recibfti mú 11amadu por penona que lo& dt cualquiera otra parte. Ockssa-Mídland es~ por Port1and. Maine, y Bouldtr-Longrnont, Colorado. res­ p«tivammtt. La tabb muestra las 10 4sns metropolitanas mú mcucmdas segun d Survq Sampling of Fairfidd, Coruwcticut.

Las ciudades mis encuestadas no ton necesariammtt las mú rqnamtauvas en Estados Unidos. Tu1sa no es una de las ciudades mú encuestadas pero 1t cree que ts la cíu­ dad que mú se acera al pafil dmlognfico nacional en th­ minos dt población, edad. grupos Micos y valores de v1V1mda. Le ligue Charlaton, West Virginia.

Los invcstigadorn de macado tienen difrttntcs crite ríos para seltcaonar ciudades para pruebas de mercado. Una de las razones fund.umntalcs es la propiedad. Una prueba de mercado se cscogt a vece porque la compailla ya la utiliz6 en una prueba y el producto fue un éxito, Otros mercadoa son con-Uentts o cómodos parad 1nvntigador.

Citttos productos tsUn dtstimdos a segmentos deme­ gráficos o psicogríficos de la población en penicular. La se­ lección de una ciudad de prueba de mercado podría estar basada en quf ciudad tiene la proporción o número mú alto de ptnonu en estos scgmenl06 objdivo. Incluso otros fac­ tores pueden entrar en la sdttción de una dudad para

prueba de mm:ado. Existe •entradl• cuando dos o mis mer­ aidos mm tan cercanos entre si que las pmonas de otros lugares "tntnn• a comprar. Existe "u.lida• cuando una prueba de mercado a influenciada por medios de comum cadón de otro1 lupres. Ambo6 son problema que 5C.' toman en considmición al ldec:aonar una ciudad pera prueba de mercado. Por ejemplo. aun cuando Baltimott CI b ciudad número uno psicogrificammte, CI afectada por "entradas" de Washington. o.e.. de moc1o que d mm:ac1o dt Baltimott CI dificil de aislar y estudiar Sin tomar en cuenta a Wasbing· ton. Por ata razón y otras. Morlrning 1'kws clasificó a Boue, ldaho, como uno dt los mtjom lugares pera vmder pro­ ductos de consumo en E.atados Unidos. Es un mic:roc:ounos de la nación pero tsú repleto con publicidad aislada quc pttmitt el control dd diltllo de invatipciona.

AllEAS METROPOLITANAS MÁS ENCUESfAIMS Lupr Ana a.tropolltana

1 Odeua Mu:lland, TX 2 Porthnd,Mll

' Bouldn Longmont, CO 4 Gr-~nd Forb, ND MN s Phonux-Mn.a, 112. 6 Dmwr,CO 7 Fargo-Moorhad, ND-MN 8 Bo~.ID 9 T~.112.

JO Pimfield. MA

nado objetivamente para otas técnicas de muestreo. Aquí se presentan cuatro tkruca. de muestreo no aleatorio: muestreo de conwnicncia, muestreo de juicio, muestreo de cuota y muestreo de bola de nieve,

Muestreo de conveniencia

En el muestreo de conveniencla, los tltmttllos pam In mu""ª st stl«cionan para comodidad dtl inws­ rigador. Por lo general el inve tigador selecciona elemento de lo~ que se dispone con facili~d. cerca­ nos o dispuestos a participar. La muestra tiende a -er menos variable que la población porque en mucho, entornos los elementos extremos de la población no se encuentran fácilim.'Ilte. El invc.tigador seleccionará mh elementos de la parte media de la población. Por ejemplo, un muestreo de convenien­ cia en hogares para entrevistas de puerta en puerta podría incluir casa. donde I~ personas oteo en ca­ sa, ~s donde no haya perros, casas cerca de la calle. departamento) en primer piso, y cas.u con personas amables, En contraste, una muestra aleatoria requerirla que d invatigador reuniera datos sólo de casas >· departamento) que hayan sido seleccionado) al azar, sín importar qué incómodo o poco amable $C3 la ubicación. Si una firma de investigacién c.t.á locali1.ada en una zona comercial peatonal. una muestra de com·enicncia podría ser seleccionada al entrevistar sólo compradores que pasan por la tienda y se ven amables.

Muestreo de juicio

Un muestreo de juicio se presenta cuando los tkmtntos stltcdonndos para la muesrm son mogidos por ti 11licio del invt$tigador. A veces los im·estigadorei. piensan que pueden obtener una muestra represen­ tativa al usar un juicio razonable, que resultará en ahorro de tiempo y dinero .. A veces éticos, los inves-


Recommended