+ All Categories
Home > Documents > Modulo Optimización

Modulo Optimización

Date post: 07-Jul-2018
Category:
Upload: anthony-martinez
View: 224 times
Download: 0 times
Share this document with a friend

of 130

Transcript
  • 8/18/2019 Modulo Optimización

    1/130

    2016

    MODULO

    OPTIMIZACION POR DISEÑOSEXPERIMENTALES

    FACULTAD DE INGENIERIAESCUELA DE FORMACION PROFESIONAL

    INGENIERIA METALURGICA

  • 8/18/2019 Modulo Optimización

    2/130

    UNIDAD I

    Sesión I: Diseño ExperimentalSesión II: Experimento de comparación SimpleSesión III: Inferencia de las Medias DiseñoAleatorizadoSesión IV: Experimento de un Solo Factor

  • 8/18/2019 Modulo Optimización

    3/130

    SESI N I

    !"!"E#$E%IMEN&

    DefiniciónSe refiere a la creación y preparación de lotes de prueba que verifiquen la validez de lashipótesis establecidas sobre las causas de un determinado problema o defecto, objeto deestudio.

    'onceptoEn un Experimento, el experimentador escoge ciertos factores para su estudio, los alteradeliberadamente de forma controlada y después, observa el efecto resultante.El Experimento puede realizarse bien en laboratorio o bien en el exterior En la f!brica, en unosalmacenes, en los locales del usuario, etc.

    !"("DISE) DE E#$E%IMEN& SDefinición"etodolog#a estad#stica destinada a la planificación y an!lisis de un Experimento.

    'onceptoEl $ise%o de un Experimento debe garantizar que este cumpla ciertos requisitos m#nimos

    • $ebe poder comprobar las hipótesis objeto de estudio, no dej!ndose confundir por variablesinsospechadas &'ruido(, como errores de medida desproporcionados, etc.

    • $ebe poder revelar la existencia de cualquier causa importante de variación, aunque nohaya sido adelantada como hipótesis.

    • $ebe mantener los costos de experimentación a un nivel razonable, en comparación con elproblema objeto de estudio.

    • $ebe tener un alto grado de seguridad en las respuestas.• Si el Experimento se realiza en un laboratorio, éste ha de ser, respecto a las variables

    estudiadas, un buen indicador de las pruebas que se obtendr#an en el taller o )in situ).• Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se tendr!

    adem!s cuidado de interferir lo menos posible en el trabajo normal y protegerse de lasinterferencias no autorizadas o involuntarias en la prueba por parte del personal adepto.

    !"* +,UE ES E- DISE) E#$E%IMEN&A-.&seg*n $uglas "ontgomery(+os investigadores realizan experimentos virtualmente en todos los campos del saber, por logeneral para descubrir algo acerca de un proceso o sistema en particular. +iteralmente,unexperimento es una prueba o ensayo. Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambiosen la respuesta de salida.

  • 8/18/2019 Modulo Optimización

    4/130

    El proceso o sistema bajo estudio puede representarse por medio del modelo de la ig. - -.Suele ser posible visualizar el proceso como una combinación de m!quinas, métodos, personasy otros recursos que transforman alguna entrada a menudo un material en una salida que tieneuna o m!s respuestas observables. /lgunas de las variables del proceso x-, x0...............xn, soncontrolables, mientras que otras z-, z0,... zp son incontrolables aunque pueden ser controlables

    para los fines de una prueba(. Entre losobjetivos del experimento pueden incluirse-. $eterminar cu!les variables tienen mayor influencia en la respuesta, y.0. $eterminar el mejor valor de las x que influyen en y, de modo que 1 tenga casi siempre

    un valor cercano al valor nominal deseado.2. $eterminar el mejor valor de las x que influyen en y, de modo que la variabilidad de y

    sea peque%a.3. $eterminar el mejor valor de las x que influyen en y, de modo que se minimicen los

    efectos de las variables incontrolables z-, z0,..., zp.

    Los métodos de diseño experimental tienen un cometido importante en el desarrollo de procesos y en la depuración de procesos para mejorar el rendimiento. En muchos casos, el objetivo puedeser desarrollar un proceso consistente o robusto4 esto es, un proceso afectado m#nimamente porfuentes de variabilidad externas &la z(.5e aqu# un ejemplo de experimento. Supóngase que un ingeniero metal*rgico est! interesado enestudiar el efecto que tienen sobre una aleación de aluminio dos procesos diferentes deendurecimiento el templado en aceite y el templado en agua salada. En este caso, el objetivodel investigador es determinar cu!l de las dos soluciones produce el m!ximo grado de durezasobre la aleación mencionada. El ingeniero decide someter un cierto n*mero de probetas de laaleación a cada medio de templado, para después medir la dureza de las muestras. +a durezapromedio de las probetas tratadas en cada solución servir! para determinar cu!l de las dossoluciones es la mejor.

    !"/ A$-I'A'I NES DE- DISE) E#$E%IMEN&A-&seg*n $uglas "ontgomery(El dise%o experimental tiene amplia aplicación en muchas disciplinas. En efecto, es posibleconsiderar a la experimentación parte del proceso cient#fico y una de las formas en queaprendemos acerca de la forma en que funcionan los sistemas o procesos.El diseño experimental es un medio de importancia cr#tica en el medio de la ingenier#a paramejorar el rendimiento de un proceso de manufactura. 6ambién se emplea extensamente en eldesarrollo de nuevos procesos.La aplicación de técnicas de diseño experimental en una fasetemprana del desarrollo de un proceso puede dar por resultado:

    -. "ejora en el rendimiento del proceso.

  • 8/18/2019 Modulo Optimización

    5/130

    0. "enor variabilidad y mayor apego a los requerimientos nominales u objetivo.2. "enor tiempo de desarrollo.3. "enores costos globales.

    -os m0todos de diseño experimental también tienen un cometido importante en las actividades de dise%o técnico &o dise%o de ingenier#a(, en las cuales se desarrollan nuevos productos yse mejoran otros ya existentes. /lgunas aplicaciones del dise%o experimental en el dise%otécnico son

    -. Evaluación y comparación de configuraciones de dise%o b!sicas.0. Evaluación de materiales alternativos.2. Selección de par!metros de dise%o de modo que el producto funcione bien en una

    amplia variedad de condiciones de campo &de uso real(4 esto es, de modo que elproducto sea consistente &robusto(.

    El uso del dise%o experimental en estas !reas puede dar por resultado productos con mayorconfiabilidad y mejor funcionamiento en el campo, menores costos, y menor tiempo de dise%o y

    desarrollo del producto. En seguida se presentan algunos ejemplos que ilustran algunas de estasideas.

    Ejemplo -.-'aracterización de un $roceso"Se utiliza una m!quina de soldar en onda en el proceso de manufactura de tarjetas de circuitosimpresos. +a m!quina limpia las tarjetas en un ba%o de fundente, las precalienta y las hacepasar en banda transportadora a través de una onda de soldadura fundida. Este proceso desoldadura forma las conexiones eléctricas y mec!nicas entre los componentes de las tarjetas.

    En la actualidad, el proceso opera a un nivel de defectuosos aproximado de -7. Es decir,alrededor del - 7 de los puntos de soldadura, en una tarjeta son defectuosos y requierenretoque manual. Sin embargo, dado que en promedio una tarjeta de circuito impreso contienem!s de 0888 uniones de soldadura. 9ncluso un nivel de defectuosos de -7 significa quedemasiadas uniones de soldadura requieren trabajo. El ingeniero de proceso responsable deesta !rea quisiera emplear un experimento dise%ado a fin de determinar que par!metros de lam!quina 9nfluyen en la ocurrencia de defectos de soldadura y que ajustes deben hacerse endichas variables para reducir tales defectos.+a m!quina de soldar en onda tiene varias variables que pueden controlarse. Entre ellas seincluyen

    -. 6emperatura de la soldadura0. 6emperatura de precalentamiento2. :elocidad de banda transportadora3. 6ipo fundente;. $ensidad relativa del fundente. /ngulo de la banda transportadora

    /dem!s de estos factores controlables, existen varios otros cuyo control no es f!cil durante elproceso de manufactura ordinario, aunque podr#an controlarse para los fines de una prueba.Ellos son

    -. Espesor de la tarjeta de circuitos impresos.0. tipos de componentes usados en la tarjeta.

  • 8/18/2019 Modulo Optimización

    6/130

    2. $isposición de los componentes en la tarjeta.3. ?perario.;. @itmo de producción.

    En estas circunstancias el ingeniero est! interesado en caracterizar la m!quina de soldadura enonda4 es decir, desea determinar los factores &controlables e incontrolables( que influyen en laocurrencia de defectos en las tarjetas de circuitos impresos. =ara lograrlo puede dise%ar unexperimento que le permita estimar la magnitud y dirección de los efectos del factor esto es,cuanto cambia la variable de respuesta &defectos por unidad( cuando se modifica cada factor, ysi cambian los factores simult!neamente produce resultados distintos de los que se obtienen conajustes de factores individuales /lgunas veces, esto se denomina experimento de escrutinio.+a información que se obtiene de este experimento de escrutinio o caracterización se utilizaentonces para identificar los factores cr#ticos del proceso y determinar la dirección de ajuste deestos factores a fin de reducir a*n m!s el n*mero de defectos por unidad. El experimentotambién puede proporcionar información acerca de cu!les factores deben controlarse con m!scuidado durante el proceso ordinario de manufactura a fin de evitar altos niveles de productosdefectuosos y comportamiento err!tico del proceso. $e este modo un resultado del experimentopodr#a ser la aplicación de técnicas tales como los diagramas de control a una o m!s variablesdel proceso como temperatura de la soldadura, as# como a su salida. Aon el tiempo, si elproceso mejora lo suficiente, suele ser posible basar la mayor parte del plan de control delproceso en la regulación de sus variables de entrada en vez de hacerlo en el an!lisis dediagramas de control de la salida.

    Ejemplo -.0ptimización de un $roceso

    En un experimento de caracterización, normalmente nos interesa determinar cu!les variables,del proceso influyen en la respuesta. Bn siguiente paso lógicoes optimizar esto es, determinaren qué región los procesos importantes conducen a la mejor respuesta posible. =or ejemplo, si larespuesta es rendimiento, buscar#amos una región en que este fuera m!ximo mientras que si larespuesta es variabilidad en una dimensión critica de un producto, buscar#amos una región devariabilidad m#nima.Supóngase que nos interesa mejorar el rendimiento de un proceso qu#mico. Sabemos, con baseen los resultados de un experimento de caracterización, que las dos m!s importantes variablesde proceso que influyen en el rendimiento son temperatura y tiempo de reacción. En laactualidad el proceso ocurre a -;; C en un tiempo de reacción de -.> h, con rendimiento

    aproximada de >;7. En la ig. - 0 es una vista en planta desde arriba de la región tiempotemperatura. En dicha gr!fica, las l#neas de rendimiento constante se unen para formarcontornos de respuesta, de los cuales se muestran los de 8, D8, 8 y ; 7 de rendimiento.

  • 8/18/2019 Modulo Optimización

    7/130

    ig. - 0 $iagrama de contornos de rendimiento en función del tiempo y la temperatura dereacción, para ilustrar un experimento de optimización.

    Estos contornos son proyecciones en la región al tiempo temperatura de cortes transversales dela superficie de rendimiento que corresponden a los rendimientos antes mencionados. $ichasuperficie se denomina en ocasiones superficie de respuesta. +a verdadera superficie derespuesta real correspondiente a la ig. - 0 es desconocida para el personal deproceso, demodo que se requerir!n métodos experimentales a fin de optimizar el rendimiento con respecto atiempo y temperatura.

    =ara localizar el intervalo óptimo, es necesario realizar un experimento en el que se hagan variarsimult!neamente tiempo y temperatura. Esto se denomina experimento factorial4 la ig. - 0 es unejemplo de los resultados que se obtienen cuando tiempo y temperatura var#an en dos niveles,+as respuestas observadas en las cuatro esquinas del cuadrado indican que debemosdesplazarnos en la dirección general de aumento en la temperatura y descenso en el tiempo dereacción con objeto de incrementar el rendimiento. =odr#an efectuarse algunas pocasvariaciones m!s en esta dirección, lo cual bastar#a para localizar la zona de m!ximo rendimiento.

    Ejemplo -.2Diseño de un $roducto/ menudo es posible aplicar los métodos del dise%o experimental en el proceso de dise%o de unproducto. =ara ilustrar lo anterior, supóngase que un grupo de ingenieros dise%a una bisagrapara la puerta de un automóvil. +a caracter#stica de calidad de interés es el esfuerzo de cierre, osea la capacidad de retención del picaporte de la puerta lo cual impide que esta se cierre cuandose le tiene abierta estando el veh#culo estacionado en una pendiente. El mecanismo de cierreconsiste en un resorte de hojas y un rodillo. Auando la puerta se abre, el rodillo describe un arcohacienda que el resorte de hojas se comprima. =ara cerrar la puerta, el resorte debe ser forzadoa desplazarse a un lado, y esto crea el esfuerzo de cierre. El equipo técnico considera que esteesfuerzo es función de los siguientes factores

    -. $istancia de recorrido del rodillo.0. /ltura del resorte, del pivote a la base.2. $istancia horizontal del pivote al resorte.

    http://proceso.de/http://proceso.de/

  • 8/18/2019 Modulo Optimización

    8/130

    3. /ltura libre del resorte de refuerzo.;. /ltura libre del resorte principal.

    +os ingenieros pueden construir un mecanismo de bisagra prototipo en el cual todos estosfactores pueden hacerse var#an entre ciertos intervalos. Bna vez que se han identificado nivelesapropiados para estos cinco factores, es posible dise%ar un experimento que consiste endiversas combinaciones de niveles de los factores, y probar la bisagra prototipo a estascombinaciones. Ello proporcionar información acerca de los cuales factores influyen m!s en elesfuerzo de cierre del picaporte, y mediante el an!lisis de esta información es posible mejorar eldise%o de este *ltimo.

    !"1 DI%E'&%I'ES $A%A E- DISE) DE E#$E%IMEN& S&seg*n $uglas "ontgomery(=ara usar un enfoque estad#stico al dise%ar y analizar un experimento se requiere que todos losparticipantes en el tengan de antemano una idea clara de que es exactamente o que se va aestudiar, como se van a recopilar los datos y, al menos, una idea cualitativa de cómo se van aanalizar. / continuación, se ofrece una gu#a del procedimiento recomendado

    1. 'omprensión 2 planteamiento del pro3lema. Este punto pudiera parecer obvio, sinembargo, en la pr!ctica no es sencillo darse cuenta de que existe un problema querequiere experimentación, ni dise%ar un planteamiento claro y aceptable del mismo. Esnecesario desarrollar todas las ideas sobre los objetivos del experimento. Suele serimportante solicitar la opinión de todas las partes implicadas cuerpo técnico,aseguramiento de la calidad, manufactura, división comercial, dirección, clientes ypersonal operativo &quienes normalmente saben mucho del asunto pero con demasiadafrecuencia son ignorados(.Un planeamiento claro del problema contribuye a menudo enforma sustancial a un mejor conocimiento del fenómeno y de la solución final del problema.

    0. Elección de factores 2 ni4eles" +a elección de los factores o variables, intervalos yniveles espec#ficos a los cuales se har! el experimento, son tareas que debenemprenderse desde inicio. 6ambién la forma de controlar esos factores y los métodos demedición. Es importante fijar todos los factores que pueden ser de interés, y nodepender demasiado de experiencias pasadas, en particular durante las primerasetapas, cuando el objetivo es la caracterización del proceso.

    2. Selección de la 4aria3le de respuesta. /l seleccionar la respuesta o variabledependiente se debe estar seguro que la respuesta que se va medir realmente proveainformación *til acerca del proceso de estudio. Bsualmente el promedio o la desviaciónest!ndar &o ambos( de la caracter#stica medida, ser!n la variable de respuesta. +acapacidad de medición es también un factor importante y si esta es deficiente, no podr!esperarse m!s que la detección de efectos relativamente grandes de los factores4 encaso contrario deben hacerse repeticiones.

    3. Elección del diseño experimental. =ara elegir el dise%o es necesario considerar eltama%o de muestra &n*mero de repeticiones(, seleccionar un orden, adecuado para losensayos experimentales, y determinar si hay implicado bloqueo u otras restricciones dealeatorización.

    ;. %ealización del experimento" Auando se realiza elexperimento, es vital vigilar el

    http://experinnento.es/http://experinnento.es/

  • 8/18/2019 Modulo Optimización

    9/130

    proceso cuidadosamente para asegurar que todo se haga conforme a lo planeado. Eneste caso, los errores en el procedimiento suelen anular la validez experimental. +aplaneación integral es decisiva para el proceso.

  • 8/18/2019 Modulo Optimización

    10/130

    Causa(Variable Independiente)

    Efecto(Variable Dependiente)

    X Y

    )t) y principalmente para nuestro estudio.

    !" +'U;- ES $%IME% %E,UISI& DE UN E#$E%IMEN& VA%IA?-ES DE UN $% 'ES "En general, en un sistema multivariable disponemos de dos tipos de variables, de cuyoconocimiento depende el control, que sobre el proceso podemos ejercer

    a9 Varia3les de entrada"Son las variables independientes del proceso, definen las caracter#sticas de este y seg*n susvalores relativos determinan los valores de las otras variables del sistema.

    39 Varia3les de salidaSon, las variables dependientes del proceso y pueden considerarse como efectos o respuestas alas variables de entrada.

    Alasificación de :ariablesI" Varia3les Independientes II" Varia3les Dependientes

  • 8/18/2019 Modulo Optimización

    11/130

    /. Aontrolables /. $e rendimiento-. H!sicas o primarias -. Económicas0. 6ransformadas 0. Aontre%idas

    H. 9ncontrolables H. -. Aualitativas -. "aterias primas 0. Auantitativas

    0. Aondiciones ambientales a( #sicas 2. Aondiciones de operación b( ?peracionales 3. actores económicos A. 9ntermediasAomo ejemplo de lo dicho anteriormente, tomaremos el caso de un proceso de flotación, en elcual se dispone de ciertas variables caracter#sticas cuya, clasificación se presenta a continuacióny la cual puede extenderse, a otros4 procesos mineralurgicos.

    Alasificación/. :ariables incontrolables de entrada

    -( +ey de minerales primarios 7 &fino(0(. +ey de minerales secundarios 7 &fino(2( impurezas3( Ianga;( Irado de oxidación

    H. :ariables controlables de entrada-( 6onelaje alimentación0( $osificación de reactivos

    o 6iempoo p5o Aolector.o Espumante

    2( /gua de alimentación3( @ecirculación de pulpa,;( /ireación

    A. :ariables de salida-( Aantidad de concentrado producido0( Aontenido fino del concentrado2( Iranulometr#a del concentrado3( Aantidad de relaves producidos;( Aontenido fino de los relaves( Aoncentración de reactivos residuales

    $. :ariables de rendimiento-( Aonstantes din!micas de flotación0( @ecuperación de minerales *tiles2( @ecuperación de minerales in*tiles &impurezas(3( +ey de concentrados.

    ;( =érdidas en las colas

  • 8/18/2019 Modulo Optimización

    12/130

    >( Aonsumo por tonelada beneficiadaD( Aonsumo por d#a

    SESI N IIE#$E%IMEN& S DE ' M$A%A'I8N SIM$-ES

    Se usan para comparar dos condiciones &a menudo llamadas tratamientos(. / menudo, sedenominan experimentos de comparación simples. Se comienza con un ejemplo de unexperimento realizado para determinar si dos fórmulas diferentes de un producto producenresultados equivalentes.+os experimentos comparativos son, b!sicamente, experimentos en los cuales la muestra secompara por sus efectos medios sobre una variable respuesta. El objeto principal es determinarcu!l de ellos es FmejorJ en alg*n sentido.

    Esta discusión conduce a una revisión de los conceptos b!sicos de la estad#stica, tales comovariables aleatorias, distribuciones de probabilidad, muestras aleatorias, distribuciones muéstralesy pruebas de hipótesis.

    (@! IN&% DU''I N

    +a resistencia adhesiva a la tensión del mortero de cemento =ortland es una caracter#sticaimportante del producto. Bn ingeniero est! interesado en comparar la resistencia de una formulamodificada, a la que se han agregado emulsiones de pol#meros de latex durante elmezclado, contra la resistencia de la argamasa hecha con la formula no modificada. Elexperimentador ha recolectado -8 observaciones de la resistencia de la formula modificada yotras -8 de la formula no modificada. +os datos aparecen en la 6abla 0 -. +as dos fórmulaspueden considerarse como dostratamientos, o dosni4eles de lasformulaciones de factor.+os datos de este experimento se grafican en la ig. 0 -. Esta representación gr!fica se denominadiagrama de puntos . / primera vista, estos datos dan la impresión de que la resistencia delmortero no modificado es mayor que la del modificado.

    Esta impresión se refuerza al comparar los valoresmedios de la resistencia a la tensión, es decirӯ- ' -< KgfLcm0, del mortero modificado contraӯ0 ' ->. 0 KgfLcm0, del mortero no,modificado. +os promedios de la resistencia a la tensión en estas dos muestras difieren en unacantidad que parece ser significativa. Sin embargo, no es evidente que esta diferencia seasuficientemente grande como para implicar que las dos fórmulasson realmente distintas. Muiz!sla diferencia que se observa en el promedio de las resistencias es resultado de las fluctuacionesen el muestreo, siendo en realidad las dos fórmulas idénticas. =osiblemente otras dos muestrasproduzcan resultados contrarios, cuando la resistencia de la fórmula modificada supera a la de lafórmula original.

    Bna técnica de inferencia estad#sticallamada prueba de hipótesis & pruebas de significación !puede servir para ayudar al experimentador al comparar estas dos fórmulas. +a prueba dehipótesis permite que la comparación de las formulas se realice sobre basesobjetivas!con un

  • 8/18/2019 Modulo Optimización

    13/130

    conocimiento de los riesgos asociados si se llegara a una conclusión equivocada.Aada observación del experimento del cemento portland descrito anteriormente, puededenominarse una prueba &o corrida(."ebe tomarse en cuenta #ue $ay diferencia entre las pruebas individuales, por lo cual existe fluctuación o discrepancia en los resultados. Bsualmente,a esta discrepancia se le denominaerror experimental o simplemente error . Es un error

    estad#stico, lo que significa que es producto de una variación incontrolable y generalmenteinevitable. +a presencia del error implica que la variable de respuesta, en este caso la resistenciaa la tensión, es una variable aleatoria. Bnavariable aleatoria puede ser discreta o continua. +avariable aleatoriaes discreta si el conjunto de todos los valores posibles de esta es finito o infinitonumerable4 en cambio ser!continua si todos los valores posibles de la variable aleatoriaconstituyen un intervalo.

    (@( ' N'E$& S ES&ADIS&I' S ?;SI' SDescripción 7rafica de la Varia3ilidad. / menudo se utilizan métodos gr!ficos simples parafacilitar el an!lisis de los datos de un experimento.

    El dia rama de puntos, es un medio *til para representar una serie peque%a de datos &hasta deunas 08 observaciones(. El diagrama de puntos permite al experimentador ver r!pidamente lalocalización general o tendencia central de las observaciones y su dispersión.

    =or ejemplo, en el experimento sobre la resistencia a la tensión del cemento portland, el diagramade puntos revela que las dos formulaciones probablemente difieren en resistencia media pero queambos tienen aproximadamente la misma variación en esta propiedad.

    ig. 0 -. $iagrama de puntos de los datos de la fuerza a la tensión de adhesión

    ElBisto ramase utiliza cuando los datos son numerosoC se representa la tendencia central, ladispersión y la forma general de la distribución de los datos. Bn histograma se construyedividiendo el eje horizontal en intervalos &por lo regular de la misma longitud( y trazando sobre el

  • 8/18/2019 Modulo Optimización

    14/130

    esimo intervalo un rect!ngulo con !rea proporcional a ni, el n*mero de observaciones que caen enese intervalo. / continuación en la ig. 0 0 se presenta el histograma de 088 observaciones de larecuperación de metal &rendimiento( en un proceso de fundición.

    El diagrama de caja es un medio muy *til para representar gr!ficamente datos. En dichodiagrama, los valores m#nimo y m!ximo, los cuartiles inferior y superior &percentiles 0; y >;respectivamente( y la mediana &percentil ;8( se representan en una caja rectangular alineada yasea horizontal o verticalmente. +a caja se extiende del cuartil inferior al superior, y es atravesadade un lado al otro por la mediana. / partir de los extremos de la caja se extienden l#neas&)3i otes)( hasta los valores m#nimo y m!ximo.En la ig. 0 2 se presentan los diagramas de caja para las dos probetas de resistencia adhesiva ala tensión del experimento con mortero de cemento portland. Esta representación revelaclaramente la diferencia de resistencia media entre las dos formulaciones. 6ambién indica ambas

    formulaciones producen distribuciones simétricas de resistencia con similar variabilidad odispersión.

    Distri3ución de $ro3a3ilidad+a estructura probabil#stica de una variable aleatoria, digamos y , se describe por sudistri3uciónde pro3a3ilidad. / menudo, la distribución de probabilidad de y , representada por p%y, sedenomina función de probabilidad y es discreta. Si y es continua, usualmente la distribución deprobabilidad de y , es! f%y, se denomina función de densidad de probabilidad de y . En la figura 0 3 se ilustra dos distribuciones de probabilidad hipotética, una discreta y la otracontinua. ?bsérvese que en la distribución de probabilidad discreta es la altura de la función p%y j

  • 8/18/2019 Modulo Optimización

    15/130

    la que representa la probabilidad, mientras que en el caso continuo, es el !rea bajo la curvaf%yasociada con un intervalo dado la que representa la probabilidad.

    ig. 0 3. $istribución de probabilidad continua y discreta

    MediaC 4arianza 2 4alores esperados+a media, μ , de una distribución de probabilidad es una medida de su tendencia central olocalización."atem!ticamente, la media se define como

    -a 4arianzaC&que es el cuadrado de la desviación est!ndar N0( se define as# Es la media de lasdiferencias con la media elevadas al cuadrado.

    (@* MUES&%E DIS&%I?U'I NES MUES&%A-ES

    Muestras AleatoriasC Media Muestral 2 Variancia Muestral.El o3 eti4o de la inferencia estad stica es obtener conclusiones acerca de una poblaciónusando una muestra de la misma. +a mayor#a de los métodos que se analizaran suponen el usodemuestras aleatorias. Esto significa que si una población contiene O elementos, y una muestra

  • 8/18/2019 Modulo Optimización

    16/130

    es n de ellos ser! seleccionada, entonces el procedimiento empleado se denominamuestreoaleatorio si cada una de la OPL&O n(PnP posibles muestras tiene la misma probabilidad de seelegida.+a inferencia estad#stica se utiliza profusamente cantidades calculadas a partir de lasobservaciones. Bn estad#stico se define como cualquier función de las observaciones de una

    muestra que no contenga par!metros desconocidos. =or ejemplo, supongamos que y 1! y &! '.y nrepresenta una muestra. Entonces,lamedia muestral

    y la4ariancia muestral

    son estad#sticos. Estas cantidades son medidas de la tendencia central y la dispersión demuestra, respectivamente. /lgunas veces( ' √S0, llamadades4iación est5ndar muestral, seusa como medida de dispersión. / menudo, los ingenieros prefieren el uso de la desviaciónest!ndar como medida de dispersión porque sus unidades son las mismas que las de la variablede interés y .

    $ropiedades de la Media 2 la Variancia Muestrales.+amedia muestral ӯ es un estimador puntual de la media poblacional μ , y la variancia muestral( & es un estimador puntual de la varianza poblacionalσ &. En general, unestimador de unpar!metro desconocido es un estad#stico que corresponde con dicho par!metro. ?bsérvese queun estimador puntual es una variable aleatoria. /l valor numérico particular de un estimador,calculado a partir de los datos muestrales, se le llama unaestimación. =or ejemplo, supóngaseque se desea estimar la media y la variancia de la resistencia a la ruptura de un tipo de fibra textilen particular. Se prueba una muestra aleatoria de n ' 0; probetas de la fibra, y la resistencia a laruptura es registrada para cada probeta. +a media y la varianza muestral se calculan mediantelas ecuaciones 0 - y 0 0 respectivamente, siendoӯ ' -D.< y( & ' -.08. =or lo tanto, la estimaciónde μ esӯ ' -D.< y la estimación paraσ & es ( &'-.08

    Se requieren ciertas propiedades para tener varios estimadores puntuales. $os de las m!simportantes son las siguientes

    -. El estimador puntual debe serinses ado. Es decir, el par!metro que se est! estimandodeber! ser el promedio o valor esperado a la larga del estimador puntual. /un cuando laausencia de sesgo es deseable, esta propiedad por s# sola no siempre hace que unestimador sea adecuado.

    0. El estimadorinses ado deber! tener4ariancia m nima. Esta propiedad establece queel estimador puntual de varianza m#nima tiene una varianza que es menor que lavarianza de cualquier otro estimador del par!metro en cuestión.

    Se puede demostrar f!cilmente queӯ y ( & son estimadores insesgados de μ y σ 2 ,respectivamente. Aonsidérese primeroӯ. Bsando las propiedades del valor esperado, se tiene

    0 -

    0 0

  • 8/18/2019 Modulo Optimización

    17/130

    porque el valor esperado de cada observación y i , es μ . =or lo tanto,ӯ es un estimadorinsesgadode μ .Aonsidere ahora la variancia muestral( &. Se tiene

    donde SS '∑n i'- %y i ) ӯ) 2 es lasuma corre ida de los cuadrados de las observaciones y i .Entonces

    =or lo tanto,

    1 se observa que( & es un estimador insesgado deσ 2 .

    7rados de -i3ertad+a cantidad n - de la ecuación 0 3 se denominarados de li3ertad de la suma de cuadradosSS. Este es un resultados muy general4 si y es una variable aleatoria con varianciaσ 2 y !∑n i'- %y i )ӯ ) 2 tiene grados de libertad.

    0 2

    0 3

    0 ;

  • 8/18/2019 Modulo Optimización

    18/130

    E9 n*mero de grados de libertad de una suma de cuadrados es igual al n*mero de términosindependientes en dicha suma. =or ejemplo, en la Ecuación 0 2, SS ' ∑n i'- &yi ӯ)" consiste enla suma de cuadrados de los n elementos y 1 ) ӯ ! y & ) ӯ !'..!y n ) ӯ . Estos elementos no son todosindependientes, ya que∑n i'- %y i ) ӯ) 2 ' 8, siendo independientes solo n - de ellos. Esto implicaque SS tiene n - grados de libertad.

    -a Distri3ución Normal 2 tras Distri3uciones Muestrales/ menudo puede determinarse la distribución de probabilidad de un estad#stico particular puededeterminarse si se conoce la distribución de probabilidad de la población de la que se tomó lamuestra. +a distribución de probabilidad de un estad#stico se le llama ladistri3ución demuestreo. / continuación se analizan, brevemente, algunas distribuciones muestrales *tiles.Bna de las distribuciones de muestreo m!s importantes es ladistri3ución normal. Si y es unavariable aleatoria normal, la distribución de probabilidad de y es

    donde # Q μ Q# es la media de la distribución, y$ " R 8 es la variancia. En la figura 0 < seilustra la distribución normal.$ebido a que las corridas muestrales que difieren, como resultado del error experimental amenudo se encuentra descritas adecuadamente en la distribución normal, esta desempe%a unpapel fundamental en el an!lisis de los datos de experimentos dise%ados. 6ambién es posibledefinir muchas distribuciones de muestreo importantes en términos de variable aleatoriasnormales. Aon frecuencia se usa la notación y ~ *% μ,σ 2 para denotar que y sigue unadistribución normal con media μ y varianzaσ 2

    Bn caso especial importante de la distribución normal es el de ladistri3ución normal est5ndar,

    es decirμ !% y$"

    ' -. Se observa ques+ y~ *% μ, σ 2

    , entonces la variable aleatoria.

    ..

    sigue una distribución normal est!ndar, denotada por z ~ *% 0, 1 . / la operación ilustrada enla Ecuación 0 > suele llamarse laestandarización de la variable aleatoria normal y .En muchas técnicas estad#sticas se supone que la variable aleatoria sigue una distribuciónnormal. El teorema del l#mite central es con frecuencia una justificación de la normalidadaproximada.

    0 <

    0 >

  • 8/18/2019 Modulo Optimización

    19/130

    SESI N III

    ("/ INFE%EN'IAS A'E%'A DE -AS DIFE%EN'IAS EN -AS MEDIASC DISE) S

    A-EA& %IGAD SEstamos preparados ahora para volver al problema del mortero de cemento portland de la sección0 -.@ecuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren enla fuerza de la tensión de adhesión. En esta sección se examina como pueden realizarse los datosde este experimento comparativo simple utilizando procedimientos de pruebas de hipótesis eintervalos de confianza para comparar las medias de dos tratamientos./ lo largo de esta sección se supone que se usa un dise%o experimental completamentealeatorizado. En este dise%o, los datos se consideran como si fueran una muestra aleatoria de unadistribución normal.

    ("/"! $rue3a de BipótesisSe retoma ahora al experimento del cemento portland introducido en la sección 0 -. @ecuerde queel interés se encuentra en comparar la fuerza de dos formulaciones diferentes una del mortero sinmodificar y una del mortero modificado. En general, estas dos formulaciones pueden considerarsecomo dosni4eles del factor FformulacionesJ.Sea que y 11! y 1&!''.y 1n1 represente lasn1 observaciones del primer nivel del factor y que y &1! y &&''.! y &n& represente lasn, observaciones del segundo nivel del factor. Se supone que lasmuestras se sacan al azar de dos poblaciones normales independientes. En la figura 0 < se ilustrala situación.

    Fi ura ("6+a situación del muestreo para la prueba t de dos muestras

    Un modelo de los datosAon frecuencia los resultados de un experimento se describen como un modelo. Bn modeloestad#stico simple que describe los datos de un experimento como el que acaba de describirse es

    0.Ddonde yij, es la observación j esima del nivel i del factor,μ4 es la media de la respuesta para elnivel i esimo del factor, yε ij4 es una variable aleatoria normal asociada con la observación ij esima.Se supone que lasε ij son O9$&8,N0(, i ' -, 0. Se acostumbra hacer referencia aε ij como elcomponente delerror aleatorio del modelo. =uesto que las mediasμ-, y μ0, son constantes, seobserva directamente a partir del modelo que las yij son O9$&8, N0(, i ' -, 0, como se acaba desuponer arriba.

    Hipótesis estad sticas

  • 8/18/2019 Modulo Optimización

    20/130

    Una $ipótesis estad+stica es un enunciado o afirmación ya sea acerca de los par,metros de unadistribución de probabilidad o de los par,metros de un modelo. +a hipótesis refleja alguna conjeturaacerca de la situación del problema. =or ejemplo, en el experimento del cemento portland, puedepensarse que las fuerzas de la tensión de adhesión promedio de las dos formulaciones del morteroson iguales. Esto puede enunciarse formalmente como

    donde μ1, es la fuerza de la tensión de adhesión promedio del mortero modificado y , μ &, es lafuerza de tensión de enlace promedio del mortero sin modificar. /l enunciado- o μ1 μ &, se lellama laBipótesis nula y a - 1: μ1/ μ &, se le llama laBipótesis alternati4a. / la hipótesisalternativa que se especifica aqu# se le llamaBipótesis alternati4a de dos colas porque ser#averdadera si μ1 0 μ & o si μ1 μ &.

    =ara probar una hipótesis se proyecta un procedimiento para tomar una muestra aleatoria, calcular

    unestad stico de prue3a apropiado para después rechazar o no estar en posición de rechazar lahipótesis nula- o. =arte de este procedimiento consiste en especificar el conjunto de valores delestad#stico de prueba que llevan al rechazo de- o. / este conjunto de valores se le llama lare ióncritica ore ión de recBazo de la prueba.=uede cometerse dos tipos de errores cuando se prueban hipótesis. Si la hipótesis nula se rechazacuando es verdadera, ha ocurrido un error tipo 9. Si la hipótesis nula no se rechaza cuando es falsase ha cometido un error tipo 99. +as probabilidades de estos dos errores se expresan con s#mbolosespeciales

    En ocasiones es m!s conveniente trabajar con la potencia de la prueba, donde

    El procedimiento general en la prueba de hipótesis es especificar un valor de la probabilidad T delerror tipo 9, llamada con frecuencia el nivel de significación de la prueba, y después dise%ar eprocedimiento de prueba de tal modo que la probabilidadβ del error tipo 99 tenga un valorconvenientemente peque%o.

    -a prue3a t de dos muestrasAonsidere que puede suponerse que las varianzas de las fuerzas de la tensión de adhesión fueronidénticas para ambas formulaciones del mortero. Entonces el estad#stico de prueba que deber!usarse para comparar las medias de dos tratamientos en el dise%o completamente aleatorizado es

    . 0dondeӯ-, yӯ0, son las medias muestrales, n- y n0 son dos tama%os de las muestras,( & p es unaestimación de la varianza com*n2 &1 2 & & 2 & calculada a partir de

    0.-8

  • 8/18/2019 Modulo Optimización

    21/130

    y S0-, y S004 son las dos varianzas muéstrales individuales. =ara determinar si deber! rechazarse- o μ1' μ0, se comparar#at o con la distribuciónt conn1 3 n & ) & grados de libertad. Si 9 to 9 R dondetTL0,n-Un0 0 es el punto porcentual TL0 superior de la distribución t con n-Un0 0 grados de libertad,entonces se rechazar#a 5o y se concluir#a que las fuerzas promedio de las dos formulaciones delmortero de cemento portland difieren. / este procedimiento de prueba se le llama generalmente la

    prue3a t de dos muestras.Este procedimiento puede justificase de la siguiente manera. Si el muestreo se est! haciendo dedistribuciones normales independientes, entonces la distribución de ӯ 1-ӯ 2 es *4 μ1 ) μ &!2 &%15n1 315n & 6. =or lo tanto, si se conociera2 &, y si- o: μ1 μ & fuera verdadera, la distribución de

    Seria O&8,-(. Sin embargo, al sustituir 2 con Sp en la ecuación 0 --, la distribución de Vo cambia dela normal est!ndar a la distribución t con n- Un0 0 grados de libertad. /hora bien, si 5o esverdadera, to de la ecuación 0 se distribuye como tn-Un0 0y, por consiguiente, se esperar#a que-88&- T( por ciento de los valores de to estén entre tTL0,n-Un0 0 y tTL0,n-Un0 0. Bna muestra queprodujera un valor de to que estuviera fuera de estos l#mites seria inusual si la hipótesis nula fueraverdadera y es evidente de que 5o deber! rechazarse. =or lo tanto, la distribución t con n- Un0 0grados de libertad es ladistri3ución de referencia apropiada para el estad#stico de prueba to. Esdecir, describe el comportamiento de to cuando la hipótesis nula es verdadera. ?bserve que T es laprobabilidad del error tipo 9 de la prueba.En algunos problemas quiz! quiera rechazarse 5o *nicamente si una de las medias es mayor quela otra. =or lo tanto, se especifican a unaBipótesis alternati4a de una cola - 1: μ1 μ & y- o solo serechazara si to R tTL0,n-Un0 0. Si se desea rechazar- o solo si, es menor queμ- entonces la hipótesisalternativa es- 1: μ10 μ &, y- o se rechazar#a si to Q tTL0,n-Un0 0

    =ara ilustrar el procedimiento, considere los datos del cemento portland de la tabla 0 -. =ara estosdatos, se encuentra que

    =uesto que las desviaciones est!ndar muestrales son razonablemente similares, no esimprocedente concluir que las desviaciones est!ndar &o las varianzas( poblacionales son iguales.

    =or lo tanto, puede usarse la ecuación 0 para probar las hipótesis

    /dem!s, n- U n0 0 ' -8 U -8 0 ' -D, y si se elige T ' 8.8;, entonces- o: μ1 μ & se rechazar#a si elvalor numérico del estad#stico de prueba to R t8.80;, -D '0.-8-, o si to Q t8.80;, -D ' 0.-8-. Estosl#mites de la región cr#tica se ilustran en la distribución de referencia &t con -D grados de libertad(la figura 0 >. /9 utilizar la ecuación 0 -8 se encuentra que

  • 8/18/2019 Modulo Optimización

    22/130

    y el estad#stico de prueba es

    =uesto que to ' .-2 Q t8,80;, -D ' 0.-8-, se rechazar#a 5o y se concluir#a que las fuerzas de latensión de adhesión promedio de las dos formulaciones del mortero de cemento =ortland sondiferentes.

    El uso de 4alores $ en la prue3a de BipótesisBna manera de reportar los resultados de una prueba de hipótesis es estableciendo que lahipótesis nula fue rechazada o no para un valor de T oni4el de si nificación especifico. =orejemplo, en el experimento del mortero de cemento portland anterior puede decirse que- o: μ1 μ &se rechazó con el nivel de significación 8.8;. Esta enunciación de las conclusiones es confrecuencia inadecuada porque no le ofrece al responsable de la toma de decisiones idea algunade si el valor calculado del estad#stico de prueba apenas rebaso la región de rechazo a si seadentró bastante en la misma. /dem!s, al darse los resultados de esta manera se les impone aotros usuarios de la información el nivel de significación predefinido. Este enfoque puede serinsatisfactorio porque algunos responsables de la toma de decisiones podr#an sentirse incómodoscon los riesgos que implica el valor T ' 8.8;.

    =ara evitar estas dificultades, en la pr!ctica se ha adoptado extensivamente elenfo ue del 4alor=. El valor = es la probabilidad de que el estad#stico de prueba asuma un valor que sea al menostan extremo como el valor observado del estad#stico cuando la hipótesis nula 5o es verdadera. =orlo tanto, un valor = transmite mucha información acerca del peso de la evidencia en contra de 5oy, por consiguiente, el responsable de, la toma de decisiones puede llegar a una conclusión concualquier nivel de significación especificado. En términos m!s formales, el4alor $ se define comoel nivel de significación menor que llevar#a a rechazar la hipótesis nula 5o.Se acostumbra decir que el estad#stico de prueba &y los datos( es significativo cuando se rechazala hipótesis nula4 por lo tanto, el valor = puede considerarse como el menor nivel T en el que losdatos son significativos. Bna vez que se conoce el valor =, el responsable de la toma dedecisiones puede determinar la medida en que los datos son significativos sin que el analista delos datos imponga formalmente un nivel de significación preseleccionado.

  • 8/18/2019 Modulo Optimización

    23/130

    Oo siempre es sencillo calcular el valor = exacto de una prueba. Sin embargo la mayor#a de losprogramas de computación modernos para realizar an!lisis estad#sticos reportan valores = ypueden obtenerse también en algunas calculadoras portables. / continuación se indicara comoobtener una aproximación del valor = para el experimento del mortero de cemento portland. =or latabla 99 del apéndice, para una distribución t con -D grados de libertad, la probabilidad menor en el

    !rea de la cola es 8.888;, para la cual t8.888;,-D ' 2. 00. /hora bien, 9tol ' .-2 R 2. 00, de donde, yaque la hipótesis alternativa es de dos colas, se sabe que el valor = debe ser menor que 0&8.888;(' 8.88-.

    SESI N IV

    E#$E%IMEN& S ' N UN S - FA'& %: AN;-ISIS DE VA%IAN'IA

    Este modelo es el m!s sencillo del dise%o de experimentos, en el cual la variable respuesta puededepender de la influencia de un *nico factor, de forma que el resto de las causas de variación seengloban en el error experimental.Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las unidadesexperimentales han sido asignadas al azar a los tratamientos.

    En la sesión anterior se consideraron métodos para comparar dos condiciones o tratamientos. =orejemplo, en el experimento de la resistencia adhesiva a la tensión del cemento =ortlandparticipaban dos formulaciones &clases( distintas de mortero. ?tra forma de describir esteexperimento es como uno unifactorial con dos niveles del factor, donde el factor es formulación delmortero y los dos niveles son los dos métodos distintos de formulación. "uchos experimentos deeste tipo implican m!s de dos niveles del factor.

    *"! UN EJEM$-Bn ingeniero de desarrollo de productos est! interesado en maximizar la resistencia a la tensiónde una nueva fibra sintética que se empleara en la manufactura de tela para camisas de hombre.El ingeniero sabe por experiencia que la resistencia es influida por el porcentaje de algodónpresente en la fibra. /dem!s, el sospecha que elevar el contenido de algodón incrementara laresistencia, al menos inicialmente. 6ambién sabe que el contenido de algodón debe variar aproximadamente entre -8 y 387 para que la tela resultante tenga otras caracter#sticas de calidad quese desean &como capacidad de recibir un tratamiento de planchado permanente. El ingenierodecide probar muestras &o probetas( a cinco niveles de porcentaje de algodón -;, 08, 0;, 28 y2;7. /s# mismo, decide ensayar cinco muestras a cada nivel de contenido de algodón.

    Este es un ejemplo de experimento unifactorial con a ' ;ni4eles del factor y n ' ;repeticiones.

    +as 0; corridas deben hacerse al azar. =ara ilustrar la forma en que puede aleatorizarse el ordende ejecución, supóngase que las corridas se numeran como sigue

    /hora se elige un n*mero aleatorio entre - y 0;, supóngase que este n*mero es D. Entonces laobservación n*mero D&087 de algodón( se ejecuta &FcorreJ( primero. El proceso se repite hasta

    http://reststencia.al/http://reststencia.al/http://reststencia.al/

  • 8/18/2019 Modulo Optimización

    24/130

    que se ha asignado una posición en la secuencia de prueba a cada una de las 0; observaciones.Supóngase que la secuencia de prueba obtenida es

    Esta secuencia de prueba aleatorizada es necesaria para evitar que los resultados seancontaminados por los efectos de variables inconvenientes desconocidas, que pueden salir decontrol durante el experimento. =ara ilustrar esta situación, supóngase que se corren las 0;muestras de prueba en el orden no aleatorizado original &esto es, las cinco muestras con -;7 dealgodón, se prueban primero, luego las cinco muestras con 087 de algodón, y as#sucesivamente(. Si la maquina probadora de la resistencia a la tensión presenta un efecto decalentamiento tal que a mayor tiempo de funcionamiento menores lecturas de resistencia a latensión, entonces dicho efecto potencialmente contaminara los datos de resistencia e invalidara elexperimento.

    Supóngase ahora que el ingeniero ejecuta la prueba en el orden aleatorio que hemos determinado+as observaciones que el obtiene acerca de la resistencia a la tensión se presentan en la 6abla 2

    -.Siempre es una buena idea representar gr!ficamente los datos experimentales. En la ig. 2 - semuestran diagramas de caja para resistencia a la tensión a cada nivel de porcentaje de algodón, yla ig. 2 0 es un diagrama de dispersión para resistencia contra porcentaje de algodón. En esta*ltima figura, los c#rculos negros son +as observaciones individuales, y los blancos son los valoresmedios de las resistencias observadas /mbas graficas indican que la resistencia a la tensiónaumenta con el contenido de algodón, hasta un valor aproximado de este ultimo de 287. "!s all!del 287 de algodón, ocurre un notable decremento en la resistencia. Oo hay una fuerte evidenciaque sugiera que la variabilidad en la resistencia alrededor del promedio dependa del porcentaje dealgodón. Aon base en este sencillo an!lisis gr!fico, sospechamos fuertemente que

    -( el porcentaje de algodón influye en la resistencia y la tensión y

  • 8/18/2019 Modulo Optimización

    25/130

    0( un porcentaje aproximado de 287, de algodón dar#a por resultado la m!xima resistencia.

    Supóngase que deseamos ser m!s objetivos en nuestros an!lisis de los datos. Espec#ficamente,supóngase que deseamos probar en busca de diferencias entre las resistencias medias a las a';

  • 8/18/2019 Modulo Optimización

    26/130

    niveles de porcentaje de algodón. =or tanto, nos interesa probar la igualdad de las cinco medias./l parecer la solución a este problema consiste en realizar pruebas t para todos los posibles paresde medias. Sin embargo, esta solución no es correcta ya que produce una gran distorsión en elerror tipo 9. =or ejemplo, Supongamos que se desea probar la igualdad de ; medias usandocomparaciones por pares. Existir! -8 posibles pares, y si la probabilidad de aceptar correctamente

    la hipótesis nula en cada prueba individual es - T ' 8. ;, entonces la probabilidad de aceptarcorrectamente la hipótesis nula en las -8 pruebas es &8. ;(-8' 8.

  • 8/18/2019 Modulo Optimización

    27/130

    /dem!s, ser! un requisito que el experimento se lleve a cabo en orden aleatorio paraque el ambiente en el que se apliquen los tratamiento &llamados con frecuenciaunidades experimentales( sea lo m!s uniforme posible. =or lo tanto, el dise%oexperimental es undiseño completamente aleatorizado. Ouestro objetivo ser! probarlas hipótesis apropiadas con respecto a los efectos del tratamiento y hacer una

    estimación de ellos. =ara probar las hipótesis, se supone que los errores del modelo sonvariables aleatorias independientes con distribución normal, con media cero y varianciaN0 Se supone que esta *ltima es constante para todos los niveles del factor.

    +Factor fi o o aleatorio.El modelo estad#stico. Ecuación 2 -, describe dos situaciones con respecto al efecto delos tratamientos. =rimero, los a tratamientos podr#an haber sido seleccionadosespec#ficamente por el experimentador. En esta situación se desea probar las hipótesissobre las medias de los tratamientos y las conclusiones se aplican solo a los niveles delfactor considerados en el an!lisis. +as conclusiones no pueden hacerse extensivas a

    tratamientos similares que no hayan sido considerados, espec#ficamente. 6ambién ser#adeseable estimar los par!metros del modelo%9! 8 i ! 2 & . / este modelo se denominamodelo deefectos fi os.

    /lternativamente, los a tratamientos pueden ser una muestra aleatoria de una poblaciónmayor de tratamientos. En esta situación ser#a deseable generalizar las conclusiones&basadas en la muestra de tratamientos(, a todos los tratamientos de la población, yasea que hayan sido expl#citamente considerados, en el an!lisis o no. En este caso, las8 i son variables aleatorias y resulta relativamente in*til conocer sus, valores particularespara los tratamientos investigados. En su lugar, se prueban hipótesis con referencia a lavariabilidad de las8 i y se intenta dicha variabilidad. Esto se conoce como modelo deefectos aleatorios o de componentes de variancia.

    *@* ANA-ISIS DE- M DE- DE EFE'& S FIJ SEn esta sección se desarrolla el an!lisis de variancia para el modelo de efectos fijos declasificación en un sentido. En este modelo los efectos de tratamiento W se definenusualmente como desviaciones con respecto a la media general, por esta razón

    Sea yi el total de las observaciones bajo el i esimo tratamiento. 1ӯ, el promedio de lasobservaciones bajo el i esimo tratamiento. Similarmente sea y la suma de todas lasobservaciones yӯ la media general de la, observaciones. Expresado matem!ticamente

  • 8/18/2019 Modulo Optimización

    28/130

    2 2en donde* an es el n*mero total de observaciones. Entonces, la notación de )puntoJ en el sub #ndice implica la suma sobre el sub #ndice que reemplaza.

    +a media del j ésimo tratamiento es7%y ij 9 3 8! i 1. &'.!a. =or tanto, el valormedio del j ésimo tratamiento consta de la suma de la media general y el efecto del iésimo tratamiento. 9nteresa probar la igualdad de las medias de dos a tratamientos esdecir hay que observar

    que si 58 es verdadera, todos los tratamientos tienen la media com*n9 . Bna forma

    equivalente de expresar las hipótesis anteriores es en términos de los efectos detratamiento8 i , o sea

    =or tanto, es posiblehablarde probar la igualdad de las medias de los tratamientos,bien de probar que los efectos de tratamiento &las8 i ( son cero. El procedimientoapropiado para probar la igualdad en el nivel medio de a tratamientos en el an!lisis devariancia

    *"*"! Descomposición do la Suma &otal do 'uadrados

    +a denominación an!lisis de variancia resulta de descomponer la variabilidad total delos datos en sus partes componentes. +a suma total de cuadrados corregida

    se usa como medida de la variabilidad total de los datos. 9ntuitivamente esto parecerazonable, ya que si se divide SS6, entre el n*mero apropiado de grados de libertad &eneste caso entre%a.n ) 1 * )1(, se obtiene la variancia muestral de y. ?bviamente, lavariancia muestral es una medida est!ndar de la variabilidad.$ebe observarse que lasuma total de cuadrados corre ida SS6 &notación provenientede sum of square, SS( puede escribirse como

    .2 3

    o bien

    ..2 ;Sin embargo, el término del producto de cruz en la ecuación 2 ; es cero. ya que

    http://hah.ar/http://hah.ar/

  • 8/18/2019 Modulo Optimización

    29/130

    =or tanto, se tiene

    ..2 <

    +a Ecuación 2 < muestra que la variabilidad total de los datos, medida por la suma totalde cuadrados corregida, puede descomponerse en la suma de cuadrados de lasdiferencias entre los promedios de los tratamientos y el promedio general, y en la sumade cuadrados de las diferencias entre las observaciones dentro del tratamiento y elpromedio del mismo. +a diferencia entre los promedios observados de los tratamientos yel promedio general constituye una medida de la diferencia entre las medias detratamiento, mientras que la causa de las diferencias de las observaciones dentro de lostratamientos con respecto al promedio del tratamiento puede ser solamente el erroraleatorio. =or tanto, simbólicamente la ecuaci

  • 8/18/2019 Modulo Optimización

    30/130

    9gualmente, si no hay diferencia entre las medial de los a tratamientos, puede usarse lavariación de los promedios de los tratamientos con respecto al promedio general paraestimar2 &. Espec#ficamente.

    es una estimación de2 & si las medias de los tratamientos son iguales. 9ntuitivamente, larazón de esto se presenta a continuación una estimación para N0Ln, la variancia de lospromedios de los tratamientos es; ai 1% ӯ i .) ӯ .. & 5%a)14 por tanto,n; ai 1% ӯ i .) ӯ .. & 5%a)1debe estimar2 & si no hay diferencia en el nivel medio de los tratamientos.

    =uede observarse que la identidad del an!lisis de variancia &Ecuación 2

  • 8/18/2019 Modulo Optimización

    31/130

    y se toma su valor esperado, los términos que contienen X0ij y X0i deben remplazarse pory n2 & respectivamente, porque7%< ij =. "!s aun, todos los productos de cruz quecontienen X poseen una expectativa igual a 8. =or tanto, al elevar al cuadrado y tomarvalor esperado, la *ltima ecuación se transforma en

    ? bien

    Bsando un enfoque similar es posible mostrar que

    =or tanto, como se argumenta en forma heur#stica, una estimación para N0 es >( 7 (( 7 5 %*)a4 por otra parte, si no hay diferencia en el nivel medio de los tratamientos &lo queimplica que Wi'8(, >( ratamiento (( ratamiento 5%a)1 proporciona otra estimación para N0. Sinembargo, hay que observar que si existe diferencia en las medias de los tratamientos, elvalor esperado de la media de cuadrados de tratamiento es mayor que N0.

    @esulta claro que una prueba para la hipótesis de la igualdad en el nivel medio detratamientos puede efectuarse comparando>( ratamiento y >( 7 . / continuación se muestracomo realizarse tal comparación.

    *@*"( An5lisis Estad stico

    /hora se investiga cómo puede realizarse una prueba formal de la hipótesis de mediasde los tratamientos &- =:9 1 9 & '. 9 a , o equitativamente,- =: 8 1 8 & '.. 8 a =(

    =uesto que se ha supuesto que los errores Xij son independientes y est!n normalmentedistribuidos con media cero y variancia N0 , las observaciones y ij también sonindependientes y se encuentran normalmente distribuidos con media93 8 i y variancia2 &.Es posible demostrar que SSEL N0 tiene una distribución ji cuadrada con*)1 grados delibertad porque SS6, es una suma de cuadrados de variables aleatorias normalmentedistribuidas. 6ambién se puede mostrar que(( 7 5 9 & tiene una distribución ji cuadradacon*)a grados de libertad y que si la hipótesis nula- =:8 i = es verdadera, SS6ratamientoLN0tiene una distribución ji cuadrada con a - grados de libertad. Sin embargo, estas tres

    sumas de cuadrados no son independientes ya que SS6 es igual a SS6ratamiento m!s SSE.El siguiente teorema, que es un caso particular de otro atribuido a Aochran, es *til paraestablecer la independencia entre SSE y SS6ratamiento.

    &E %EMA *"!" &E %EMA DE ' 'H%AN Sean V variable aleatorias O9$&8,-(para i'-,0, .,v y

    en donde(?v y @i tienev grados de libertad &i'-, 0, .S(. Entonces@1! @ &!'.@ z, sonvariables aleatorias independientes con distribución ji cuadrada yv 1!v &!'.!v s grados delibertad, si solo si

  • 8/18/2019 Modulo Optimización

    32/130

    Aomo la suma de los grados de libertad de(( ratamiento y (( 7 es igual a*)1, es decir, eltotal de los grados de libertad, el teorema de Aochran implica que(( ratamiento52 & y(( 7 52 & son variables aleatorias independientes con distribución ji cuadrada. =or tanto, si

    la hipótesis nula de igualdad de medias de los tratamientos es verdadera, la razón

    ..2 >

    tiene una distribución cona)1 y *)a grados de libertad. +a Ecuación 2 > es laestad#stica para probar la hipótesis de igualdad de medias de los tratamientos.

    $el valor esperado de la media de cuadrados se observa que, en general, "SE es unestimador insesgado de N0. =or otra parte, si la hipótesis nula es verdadera, "S6ratamientosresulta ser un estimador insesgado de N0.Sinembargo, sila hipótesis nula es falsa, elvalor esperado de "S6ratamientos es mayor que N0.=or tanto, el valor esperado delnumerador en la estad#stica de prueba &Ecuación 2 >(, es mayor que el valor esperadodel denominador si la hipótesis alterna es verdadera y en consecuencia, deberechazarse 58 si el valor de tal estad#stica es demasiado grande. Esto implica una regióncr#tica unilateral superior. En otras palabras, se rechaza 58 si

    $onde 8 se calcula usando la Ecuación 2 >.Es posible obtener fórmulas de c!lculo para las sumas de cuadrados al reescribir ysimplificar las definiciones de(( ratamientos y (( en la Ecuación 2

  • 8/18/2019 Modulo Optimización

    33/130

    E emplo *"!Mas So3re el Experimento de %esistencia a la &ensión=ara ilustrar el an!lisis de variancia, volvamos al ejemplo que se abordó por primera vezen la Sec. 2 -. @ecordemos que el ingeniero de desarrollo le interesa determinar si elpeso porcentual del algodón en una fibra sintética afecta la resistencia a la tensión, y

    para ello ha realizado un experimento completamente aleatorizado con cinco niveles deporcentaje de algodón y cinco repeticiones. =or conveniencia, aqu# se reproducen losdatos de la 6abla 2 -

    +as sumas de cuadrados requeridas para el an!lisis de variancia se calculan comosigue

    El an!lisis de variancia se resume en la 6abla 2 3. 5ay que notar que la media decuadrados entre tratamientos &--D. 3-( es mucho mayor que la media de cuadradosdentro de tratamientos &D.8

  • 8/18/2019 Modulo Optimización

    34/130

    Una Ad4ertencia Acerca de los '5lculos: Seguramente el lector alerta habr! notadoque aqu# se definió la suma de cuadrados en términos de promedios4 esto es, a partir dela Ecuación 2

  • 8/18/2019 Modulo Optimización

    35/130

    y

    /l comparar estas sumas de cuadrados con las del Ejemplo 2 -, se observa que noquedan afectadas si se resta una constante a los datos originales./hora supongamos que se multiplica por 0 cada observación del Ejemplo 2 -. Es f!cilverificar que las sumas de los cuadrados en los datos transformados son(( '0;3>.D3,(( ratamientos '- 82.83, y SSE'

  • 8/18/2019 Modulo Optimización

    36/130

    UNIDAD II

    Sesión V: Diseño de 'uadrados -atinosSesión VI: Diseño de ?lo ues aleatorizadoscompletos

    Sesión VII: Diseño de ?lo ues Aleatorios Incompletos

  • 8/18/2019 Modulo Optimización

    37/130

    SESI N V

    DISE) DE 'UAD%AD -A&IN

    En un dise%o de bloques completamente aleatorizados se desea controlar una sola fuente devariación local. Ieneralmente es necesario controlar m!s de una fuente de variación. Bn dise%ode Auadrados +atinos es muy similar a un dise%o de bloques completamente aleatorizados, perocon una fuente de variación adicional.

    En el tema anterior se introdujo el dise%o aleatorizado por bloques completos como un dise%opara reducir el error de los residuos de experimento, al sustraer la variabilidad debida a lasunidades experimentales. 5ay otros dise%os que usan el principio de an!lisis por bloques. =orejemplo, supongamos que un experimentador est! estudiando el efecto de cinco formulasdiferentes de la mezcla de dinamita sobre la fuerza explosiva observada. Aada ormula seprepara usando un lote de materia prima, lo suficientemente grande para solo se haga cincomezclas. "!s aun, las mezclas las preparan varios operadores, pudiendo existir una diferenciasustancial en la habilidad y experiencia entre ellos. /l parecer hay dos efectos extra%os que sedeben FcancelarJ en el dise%o lotes de materia prima y operadores. El dise%o apropiado pareste problema consiste, en probar, cada fórmula exactamente una vez, utilizando cada lote demateria prima, y en que cada formula sea preparada exactamente una vez por cada uno de cincooperadores. El dise%o que resulta aparece en la 6abla ; y se llama dise%o de cuadros latinos.5ay que notar que este dise%o es un arreglo cuadrado y que las cinco formulas &o tratamientos(se representan mediante las letras latinas /, H, A, $ y E. de ah# el hombre de cuadrado latino.Se observa que tanto los lotes de materia prima &renglones( como los operadores &columna( sonortogonales a los tratamientos.

    El dise%o de cuadrado latino se usa para eliminar dos fuentes de variabilidad problem!tica4 enotras palabras, permite analizar sistem!ticamente por bloques en dos direcciones. En estedise%o, los reglones y columnas representan, en realidad, dos restricciones a la aleatorización.En general, un cuadrado latino para p factores, o un cuadrado latino p x p, es un cuadrado quecontiene p renglones y p columnas. Aada una de las p0 celdas contiene una de las p letras quecorresponde a un tratamiento, y cada letra aparece una sola vez en cada reglón y columna. /continuación, se presenta algunos ejemplos de cuadrados latinos.

    El modelo estad#stico de cuadrado latino es

    3 00

  • 8/18/2019 Modulo Optimización

    38/130

    en donde 1ijK es la observación correspondiente al i ésimo reglón, K ésima columna y el j ésimotratamiento Y es la media general, Ti, es el i ésimo efecto de renglón, W j es el j ésimo efecto detratamiento,' K es el K ésimo efecto de columna yijK es el error aleatorio. El modelo escompletamenteaditi4o, en otras palabras, no existe interacción entre los reglones, las columnasy los tratamientos. Solo 0 de los tres sub#ndices i, j, y K se requieren para especificar unaobservación en particular porque *nicamente hay una observación en cada celda. =or ejemplo,haciendo referencia al problema de la fórmula de la dinamita en la 6abla 3 , si i ' 0 y K ' 2,autom!ticamente j ' 3 &formula $(, y si i ' - y j ' 2 &formula A(, K ' 2. Est! es una consecuenciade que cada tratamiento aparece exactamente una vez en cada reglón y en cada columna.

    El an!lisis de variancia consiste en descomponer la suma total de cuadrados de la O ' p0observaciones en sus componentes de reglón, columna, tratamiento y error, por ejemplo.

    Auyos grados de libertad son

    Hajo la suposición usual de queijKes O9$&8,N0(, cada una de las sumas decuadrados del miembro derecho de la Ecuación 3 02 son, al dividir entre N0,variables aleatorias independientes con distribución ji cuadrada. El estad#sticoapropiado para probar la igualdad de medias en los tratamientos

    que tiene una distribución p -,&p 0(&p -(si la hipótesis nula es verdadera. Es posible probar que noexisten efectos de reglones o de columnas si se toma la razón de "S@eglones y "SAolumnas contra la"S E. Sin embargo, posiblemente estas pruebas no sean apropiadas por que los reglones y lascolumnas representan restricciones de aleatorización.

    El procedimiento de c!lculo para el an!lisis de variancia se muestra en la tabla 3 -8. /l analizarlas fórmulas para el c!lculo de la suma de cuadrados, puede observarse que este an!lisis es unasimple extensión del dise%o aleatorizado por bloques, con la suma de cuadrados de reglonescalculada usando a los totales por reglones.

    7jemplo ZAonsidérese el problema de las formulas de la dinamita descrito anteriormente. Se supone quetanto los lotes de materia prima como los operadores representan restricciones en laaleatorización. El dise%o para este experimento mostrado en la tabla 3 es un cuadrado latino ;x ;. $espués de codificar las observaciones, restando 0;, se obtuvieron los datos de la tabla 3--. +as sumas de cuadrados para los totales, lotes &renglones( y operadores &columnas( secalculan a continuación.

    3 02

  • 8/18/2019 Modulo Optimización

    39/130

    6abla 3 . +as sumas de cuadrados para los totales, lotes o &renglones( y operadores &columnasse calculan a continuación.

    +os totales de tratamiento &letras +atinas( se presentan a continuación

  • 8/18/2019 Modulo Optimización

    40/130

    Bsando estos, totales se calcula que la suma de cuadrados de las fórmulas es

    la suma de cuadrados delerror se calcula por diferencia,

    En la 6abla 3 -0 de datos codificado se resume el an!lisis de variancia. Se concluye que existeuna diferencia significativa en la fuerza explosiva media debido a las cinco formulas diferentes.6ambién hay una indicación de diferencia entre los operadores, por lo tanto, controlar estefactor fue una buena precaución. Oo existe una evidencia fuerte de que haya una diferencia entrelos lotes de materia prima, y al parecer, en este experimento hubo una inquietud innecesaria en

    cuanto a esta fuente de variabilidad. Sin embargo controlar localmente los lotes de materia primasiempre resulta adecuado.

    El lector debe determinar los residuos del ejemplo y construir las gr!ficas apropiadas.

    =@?H+E"/ -.Bn 9ng. Mu#mico desea probar el efecto que tienen cuatro agentes qu#micos sobre la resistenciade un tipo particular de tela. Aomo puede haber variabilidad entre un rollo de tela y otro, decideutilizar un dise%o aleatorizado por bloques, considerando los rollos de tela como bloques. Ellaselecciona cinco rollos y les aplica los cuatro agentes qu#micos en orden aleatorio. /

    continuación, se proporcionan los resultados de la resistencia a la tensión.

    Se pide-. /nalice estos datos y haga las conclusiones apropiadas.

    0. 9dentificar los Elementos del experimento variable dependiente, independiente yvariable respuesta, factores bloques, etc.

  • 8/18/2019 Modulo Optimización

    41/130

    =@?H+E"/ 0.Se encuentra bajo estudio el efecto que tiene cinco reactivos distintos &/, H, A, $ y E( sobre eltiempo de reacción de un proceso qu#mico. Aada lote de material nuevo es lo suficientementegrande para permitir que solo se realice cinco ensayos. "!s a*n, cada ensayo tarda,

    aproximadamente, una hora y media, por lo que solo pueden realizarse cinco ensayos por d#as,la investigadora decide efectuar el experimento usando un dise%o de cuadrado latino, con el finde controlar sistem!ticamente las variables lote material y d#a. Ella recolecta los siguientesdatos. /nalice y obtenga las conclusiones.

    Bn ingeniero industrial est! investigando el efecto que tienen cuatro métodos de ensamblaje &/,H, A y $( sobre el tiempo de ensamblaje de un componente para televisores a color. Seseleccionan cuatro operadores para realizar este estudio. =or otra parte, el ingeniero sabe quecada método de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el *ltimoensamblaje puede ser mayor que el primero, independientemente del método. En otras palabras,se produce un patrón en el tiempo de ensamblaje. =ara controlar esta posible fuente devariabilidad, el ingeniero utiliza el dise%o de cuadrados latinos que aparece a continuación./nalice y haga las conclusiones apropiadas.

    Se realiza un estudio para comparar los #ndices de monóxido de carbono en ; puntosestratégicos de una ciudad. &O norte, S sur, E este, ? oeste, A centro(. +os conjuntos dbloques involucrados son determinados d#as de la semana y distintos horarios del d#a. Elcuadrado obtenido y los datos &ppm( registrados se presenta a continuación. @ealizar lacomparación.

    Lunes Miércoles Viernes Sábado Domingo08:00 N (12 ! S (12 ! " (12 ! # (122! $ (12 !11:00 $ (112! " (100! N (1%0! S (1%1! # (11 !1 :00 S (12%! N (1%%! # (112! $ (121! " (1%%!1&:00 # (118! $ (112! S (1%%! " (12 ! N (1% !

    20:00 " (102! # (122! $ (118! N (1%1! S (1%%!

  • 8/18/2019 Modulo Optimización

    42/130

    Se tiene un experimento para observar el rendimiento de ; variedades de garbanzo &/, H, A, $ yE(. +as filas fueron definidas como niveles de riego cm2Lparcela. +as columnas fueron definidascomo gradientes de fertilidad del suelo.

    Bn investigador quiere evaluar la productividad de cuatro variedades de aguacates y deciderealizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente yadem!s, diferencias en la disponibilidad de Oitrógeno de norte a sur, para controlar los efectosde la pendiente y la disponibilidad de Oitrógeno, utilizó un dise%o de cuadrado latino, lasvariables son /, H, A y $, &los datos correspondientes a la producción a KgLparcela(.

    SESI N VI

  • 8/18/2019 Modulo Optimización

    43/130

    ?- ,UES A-EA& %IGAD S

    DISE) A-EA& %IGAD $ % ?- ,UES ' M$-E& S

    Este es el m!s simple y quiz!s el ampliamente usado de los dise%os de bloques al azar que esdefinido por 5inKelman &- 3( as# El material experimental es dividido ena gruposdeb unidades experimentales &BE( cada uno, dondea es el n*mero de tratamientos, tales quelas BE dentro de cada grupo son lo m!s homogénea posible y las diferencias entre las BE seadada por estar en diferentes grupos. +os conjuntos son llamados bloques. $entro de cada bloquelas BE son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en unbloque.

    Si la variación entre las BE dentro de los bloques es apreciablemente peque%a en comparación

    con la variación entre bloques, un dise%o de bloque completo al azar es m!s potente que undise%o completo al azar.

    En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar losresultados. En general, unfactor pertur3ador puede dividirse como un factor del dise%o queprobablemente tenga un efecto sobre la respuesta, pero en el que no existe un interésespec#fico. En ocasiones un factor perturbador esdesconocido 2 no controla3le4 es decir4 sedesconoce la existencia de ese factor e incluso puede tener niveles variables mientras se est!realizando el experimento. +aaleatorización es la técnica de dise%o que se utiliza paraprotegerse contra estos factores perturbadores Fque est!n al acechoJ. En otros casos, el factorperturbador esconocido pero no controla3le. Si por lo menos puede observarse el valor queasume el factor perturbador en cada corrida del experimento, es posible hacer la compensacióncorrespondiente en el an!lisis estad#stico mediante el uso delan5lisis de co4arianza. Auando lafuente de variabilidad perturbadora es conocida y controlable, puede usarse una técnica dedise%o llamadaformación de 3lo ues para eliminar de manera sistem!tica su efecto sobre lascomparaciones estad#sticas entre los tratamientos. +a formación de bloques es una técnica dedise%o en extremo importante que se utiliza ampliamente en la experimentación industrial, y es lamateria de esta sesión.

    =ara ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentesproducen o no lecturas diferentes en una m!quina para probar la dureza. Bn experimento comoeste podr#a ser parte de un estudio de la aptitud en la calibración de los instrumentos. +am!quina funciona presionando la punta sobre una probeta de metal y determinando la dureza dela probeta a partir de la profundidad de la marca que se produce. El experimentador ha decididoobtener cuatro observaciones para cada punta. Solo existe un factor [ tipo de punta , y el dise%ode un factor completamente aleatorizado consiste en asignar aleatoriamente cada uno de los 3 x3 ' -< ensayos a unaunidad experimental, o sea a una probeta de metal, y tomar las lecturasde la dureza correspondientes. =or lo tanto, se requerir#an -< probetas de metal para realizareste experimento, una para cada ensayo.

    En principio existe un problema serio con el dise%o completamente aleatorizado en estasituación. Si las probetas son ligeramente distintas en cuanto a dureza, como ser#a el caso siproviniera de diferentes vaciados, las unidades experimentales &probetas o espec#menes(

  • 8/18/2019 Modulo Optimización

    44/130

    contribuyen a la variabilidad observada en las lecturas de la dureza Aomo resultado, el errorexperimental reflejara tanto el error aleatorio como la variabilidad entre las probetas.

    Se desea que el error experimental sea lo m!s peque%o posible4 en otras palabras, se buscasustraer del error experimental la variabilidad producida por las probetas. Bn dise%o que logre

    esto requiere que el experimentador pruebe cada punta, una vez, en cada una de las cuatro probetas diferentes. Este dise%o, que aparece en la 6abla 3.-, se conoce coma dise%o aleatorizadopor bloques completos. +a respuesta observada es la dureza en la escala A de @ocK\ell menos38.

    +a palabra )completo) 9ndica que todos los tratamientos puntas son probadas en cada bloque&probetas(. Si se usa este dise%o, los bloques o probetas forman una unidad experimental m!shomogénea con la cual comparar las y puntas. Esta estrategia de dise%o mejora efectivamente laprecisión de las comparaciones al eliminar la variabilidad entre las probetas. El orden en que lascuatro puntas deben ser probadas en cada bloque se determina aleatoriamente. 5ay que notar lasimilitud que hay entre este dise%o y el presentado en el Fdise%o comparación por paresJ cuandose discutió la pruebat de diferencias aparejadas. El dise%o aleatorizado por bloques completoses una generalización de aquel concepto.

    $icho dise%o es quiz!s el dise%o experimental m!s ampliamente utilizado. En la pr!ctica, lassituaciones en las que este dise%o se aplica son muy numerosas y pueden detectarsef!cilmente. / menudo, las unidades de equipo de prueba o maquinaria son diferentes en suscaracter#sticas de operación y constituyen un factor t#pico que es necesario controlar. +otes demateria prima, personas o tiempo, también constituyen fuentes de variabilidad en unexperimento, las cuales pueden ser controladas sistem!ticamente mediante el an!lisis porbloques

    An5lisis Estad sticoSupongamos que en general se tienena tratamientos &que deben ser comparados( yb bloques.

    En la ig. 3.- aparece el dise%o aleatorizado por bloques completos. Se realiza una observaciónpor tratamiento en cada bloque, y el orden en que los tratamientos son medidos en cada bloquese determina aleatoriamente. / menudo, se dice que los bloques representan una restricción enla aleatorización por que la *nica aleatorización de los tratamientos ocurre dentro de los bloques.

    El modelo estad#stico para este dise%o es

    .3 -

    En donde Y es una media general, Wi, es el efecto del i ésimo tratamiento,' i, es el efecto del jésimo bloque yij es el termino usual O9$&8,N0( de error aleatorio. 9nicialmente se considera

  • 8/18/2019 Modulo Optimización

    45/130

    que tanto los tratamientos como los bloques son factores fijos. "!s aun, los efectos detratamiento y de bloque se consideran como desviaciones de la media general, por lo tanto

    Se desea probar la igualdad de las medias de tratamiento. /s#, la hipótesis nula de interés es.

    Aomo la media del i ésimo tratamiento es Y- ' &-Lb(]bi'- &YUWU' (' YUWij una forma equivalente deexpresar las hipótesis anteriores es en términos de los efectos de tratamiento.

    Sea y i el total de las observaciones del tratamiento i, y.i , el total de las observaciones del bloque j, y.. el total de todas las observaciones, y O ' ab el n*mero total de observaciones."atem!ticamente,

    Similarmente, ӯ i. es el promedio de las observaciones del tratamiento i, ӯ .. es elpromedio de las observaciones del bloque j, y ӯ i es el promedio de todas lasobservaciones. Esto significa que

    3 ;

    3 3

    3 2

    3 0

  • 8/18/2019 Modulo Optimización

    46/130

    +a suma total de cuadrados corregida puede expresarse como

    .. 3 <

    /l desarrollar el segundo miembro de la ecuación 3

    @epresenta una descomposición de la suma total de cuadrados. Expresando simbólicamente.+as sumas de cuadrados de la Ecuación 3 >, se tiene

    3 D

    1a que existen O observaciones, la SS6, tiene O - grados de libertad. +a SS6ratamientos y laSSHloques, tienena ) 1 y b ) 1 grados de libertad, respectivamente, porque existena tratamientos yb bloques. +asuma de cuadrados del error no es m!s que la suma de cuadrados entre lasceldas, menos la suma de cuadrados de tratamiento y de bloque. Existen ab celdas conab ) 1grados de libertad entre ellas, por lo tanto, SSE, tieneab ) 1 A %a ) 1 A %b A 1 grados de libertad."!s aun, la suma de los grados de libertad de los miembros del lado derecho de la Ecuación 3 Des igual a la de los miembros del factor 9zquierdo. Entonces, usando la suposición usual denormalidad de los errores y el 6eorema puede mostrarse que SSratamientosLN0, SSHloquesLN0, ySSELN0, son variables aleatorias independientes con distribuciones ji cuadrada. Aada suma decuadrados dividida entre sus grados de libertad es igual a una media de cuadrados.Aonsiderando que los4 tratamientos y los bloques son fijos, puede mostrarse que los valoresesperados de las medias de cuadrados son

  • 8/18/2019 Modulo Optimización

    47/130

    =or lo tanto, para probar la igualdad en las medias de tratamiento, hay que usar la estad#stica

    que tiene una distribución T,a -,&a -(&b -( si la hipótesis nula es verdadera. +a región critica es elextremo superior de la distribución y se deber#a rechazar 5o si o R T,a -,&a -(&b -(.

    6ambién puede ser de interés la comparación entre las medias de los bloques, porque si no haygran diferencia entre ellas, el an!lisis por bloques quiz!s no sea necesario en experimentosfuturos. /l analizar los valores esperados de las medias de cuadrados, puede parecer que lahipótesis 5o ' i ' 8 puede probarse comparando la estad#stica o ' con T, a -,&a -(&b -(.

    Sin embargo, debe recordarse que la aleatorización fue aplicada solo a los tratamientos dentrode los bloques4 en otras palabras, estos *ltimos representan una restricción para laaleatorización. ^Mué efecto tiene esto sobre la estad#stica o ' "S HloquesL"SE_ Existen diferentesrespuestas a esta pregunta. =or ejemplo. Hox. 5unter y 5unter &- >D( argumentan que la prueba

    del an!lisis de variancia puede justificarse solamente con base en la aleatorización sin

    necesidad de usar a su posición de normalidad. Ellos concluyen que la prueba para compararbloques no puede ser incluida bajo este argumento a consecuencia de la restricción dealeatorización4 pero que si los errores son O9$&?,N0( la estad#stica o ' "S HloquesL"SE, puedeusarse para comparar las medias de bloques.

    6abla 3 0. /n!lisis de variancia para un dise%o aleatorizado por bloques completos

    =or otra parte. /nderson y "c+ean &- >3( argumentan que la restricción de aleatorizaciónimpide que esta estad#stica pueda ser *til para comparar las medias de los bloques y que laestad#sticaF, en realidad, es una prueba para la igualdad de las medias de los bloques m!sla restricción de aleatorización a la que llaman error de restricción4 cons*ltense /nderson y

  • 8/18/2019 Modulo Optimización

    48/130

    "c+ean &- >3( para mayores detalles.

    ^Mué hay que hacer, pues, en la pr!ctica_ Aomo la suposición de normalidad a menudo quedaen tela de juicio, tomar o ' "S HloquesL"SE como una prueba exacta, engeneral, no esconveniente. =or eso, esta prueba se excluye de la tabla de an!lisis de variancia. Sin embargo,

    ciertamente el examen de la razón entre "SHloques y "SE puede ser un procedimiento aproximado para investigar el efecto del variable bloque. Bn valor grande de esa razón, implica que elfactor bloque tiene un efecto grande y que la reducción de ruido obtenida al analizar porbloques probablemente fue *til, al mejorar la precisión de las comparaciones entre las mediade tratamiento.

    Bsualmente el procedimiento se resume en una tabla de an!lisis de variancia como la queaparece en la 6abla 3 0. +as fórmulas para calcular las sumas de cuadrados pueden obtenersepara los términos de la ecuación 3 >, expres!ndolas en función de los totales de lostratamientos4 y de los bloques. +as fórmulas para estos c!lculos son

    y la suma de cuadrados del error se obtiene por diferencia

    Ejemplo -

    Aonsiderar el experimento sobre la lectura de la dureza descrita en la Secc. 3 -.5ay cuatro puntas y est!n disponibles cuatro probetas de metal. Aada puntaes probada una vez en cada probeta, resultando un dise%o aleatorizado porbloques completos. @ecordar en el orden en que se prueban las puntas sobreuna probeta en particular se determina aleatoriamente.

    =ara simplificar los c!lculos, se codifican los datos originales restando .; de cada observacióny multiplicando después por -8.

    3 --

    3 -8

    3

    3 -0

    http://general.no/http://general.no/http://general.no/

  • 8/18/2019 Modulo Optimización

    49/130

    +a suma de cuadrados tiene la siguiente manera.

    En la tabla 3 ; se presenta el an!lisis de varianza. Btilizando T ' 8.8;, el valor critico de es8.8;,2, '2.D

  • 8/18/2019 Modulo Optimización

    50/130

    =uesto que 8.8;,2,-0' 2.3 , no puede rechazarse la hipótesis de la igualdad de las mediciones dela dureza media de las cuatro puntas. =or lo tanto, el dise%o de bloques aleatorizados reduce losuficiente la cantidad de ruido en los datos para que las diferencias entre las cuatro puntas seandetectadas. Esto ilustra un punto muy importante. Si un experimentador no recurre a la formaciónde bloques cuando deber#a haberlo hecho, el efecto puede ser inflar el error experimental a talgrado que las diferencias importantes entre las medias de los tratamientos sean indetectables.

    Desarrollar el e ercicio propuesto-. Supongamos que queremos determinar si cuatro laboratorios miden la misma resistencia

    caracter#stica del hormigón a compresión. =ara ello se han considerado ; amasadasdiferentes que han sido analizadas por cada uno de los laboratorios. / los 0D d#as, se hanroto las probetas a compresión simple y los resultados son los que hemos recogido en latabla que sigue.

    En este caso, la4aria3le de respuesta es la resistencia caracter#stica del hormigón acompresión &"=a(, elfactor es el laboratorio &3 niveles(, el3lo ue es la amasada &no sonobjeto directo de motivo del estudio(.

    =or otra parte, se considera que no existe interacción entre el laboratorio y la amasada&factor y bloque(.En este tipo de experimento, la medición ser! el resultado del efecto del tratamiento&laboratorio( donde se encuentre, del efecto del bloque al que pertenece &amasada( y decierto error que se espera que sea aleatorio. +a hipótesis de que las medias son iguales seva a analizar con el an!lisis de la varianza &/O?:/(, con dos criterios de clasificación./ parte de los supuestos de normalidad, igualdad de varianzas y de independencia, aqu# sea%ade otro que es que no existe interacción entre el factor y el bloque.=ara los curiosos, después de haber analizado los datos, diremos que en este caso, conuna seguridad del ;7, se aprecian diferencias significativas entre las resistencias medidaspor los laboratorios - y 2, entre los laboratorios - y 3, y entre los laboratorios 0 y 3.

    0. Bna industria algodonera, interesada en maximizar el rendimiento de la semilla de algodón,quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado para tratar laplanta. / su disposición tiene ; tipos de fertilizantes. Aomo puede haber diferencia entre lasparcelas, el experimentador decide efectuar un dise%o en bloques aleatorizados.=ara ello, divide el terreno en 3 bloques y cada bloque en ; parcelas, fumigando dentro de

    cada bloque cada una de las parcelas con un fertilizante. /l recoger la cosecha se mide elrendimiento de la semilla, obteniéndose las siguientes observaciones.6abla 3 D. @endimiento de la semilla de algodón

  • 8/18/2019 Modulo Optimización

    51/130

    Espec#ficamente, en este experimento, se han considerado ; tipos de fertilizantes que sehan aplicado aleatoriamente a las parcelas dentro de cada bloque. +a variable de interés ovariable respuesta es el rendimiento de la semilla en peso por unidad de superficie. En esteejemplo hemos supuesto que el tipo de terreno influye en el rendimiento de la semilla dealgodón y decidimos FcontrolarJ estad#sticamente sus efectos, mediante la formación debloques. Es decir, nuestro propósito es eliminar en el estudio de los efectos del fertilizante lavariabilidad debida al terreno e intentar que de esta forma sean m!s patentes las diferenciasentre los fertilizantes, si las hay.

    SESI N VII

    DISE) S $ % ?- ,UES IN' M$-E& SEs posible que en algunos experimentos que usan discos aleatorizados por bloques no puedanrealizarse los ensayos de todas las combinaciones de tratamiento dentro de cada bloque.Situaciones como estas ocurren debido a escasez en los recursos del experimento, o por eltama%o f#sico de los bloques. =or ejemplo, supongamos que el tama%o f#sico de las probetas deexperimento de la lectura de la dureza &Ejemplo ; -(, solo alcanza para probar tres puntas. =orlo tanto, no puede probarse cada punta en cada probeta. En estos casos es posible usar dise%osaleatorizados por Hloques en los que cada tratamiento no esté presente en cada bloque. Estosdise%os se conocen comodiseño aleatorizados por 3lo ues incompletos.

    " DISE) S $ % ?- UES IN' M$-E& S ?A-AN'EAD SAuando las comparaciones entre todos los tratamientos tienen la misma importancia, estasdeben elegirse de manera que ocurran en forma balanceada dentro de cada bloque. Estosignifica que cualquier par de tratamientos ocurren juntos el mismo n*mero de veces quecualquier otro par. =or lo tanto, un d


Recommended