+ All Categories
Home > Documents > resumenes bioestadistica

resumenes bioestadistica

Date post: 08-Apr-2018
Category:
Upload: dania-andrea-di-filippo
View: 237 times
Download: 1 times
Share this document with a friend

of 36

Transcript
  • 8/7/2019 resumenes bioestadistica

    1/36

    A. MARTN ANDRSJ. de D. LUNA del CASTILLO

    RESMENES de

    BIOESTADSTICA(6 edicin)

    Medida Valoresposibles (Asociacin)Independencia

    (Asociacin+)Caso Estimacin Estudios enque es vlida

    General

    ( ) ( )11 2 12 1R = O C / O C

    11 2

    12 1

    (O + 0,5)(C +1)R =

    (O + 0,5)(C +1)

    TransversalesProspectivosR

    0 R < 1

    R = 1

    1 < R < Si P(E) O o O Retrospectivos

    Riesgo relativo (de FR para E): La probabilidad de enfermar es R veces mayor en los ...

    EDICIONES NORMA-CAPITEL (2006)

  • 8/7/2019 resumenes bioestadistica

    2/36

    RESMENES de

    BIOESTADSTICA(6 edicin)

    Estos Resmenes han sido extrados del libro publicado en esta misma Editorial

    50 10 horas de BIOESTADSTICA (1995)A. Martn Andrs y J. D. Luna del Castillo.

  • 8/7/2019 resumenes bioestadistica

    3/36

    Antonio Martn Andrs

    Juan de Dios Luna del Castillo

    EDICIONES CAPITEL, S.L.Eurpolis, Bruselas V-16B. 28230 Las Rozas (Madrid). Telfono 91-6377414.e-mail (editor): [email protected] (autor): [email protected].

    Reservados los derechos de edicin, adaptacin o reproduccin para todos los pases.No est permitida la reproduccin total o parcial de este libro, ni su tratamiento infor-mtico, ni la transmisin de ninguna forma o por cualquier medio, ya sea electrnico,mecnico, por fotocopia, por registro u otros mtodos, sin el permiso previo y por escri-to de los titulares del Copyright.

    ISBN: 84-8451-025-7Depsito legal: M-45.612-2006

  • 8/7/2019 resumenes bioestadistica

    4/36

  • 8/7/2019 resumenes bioestadistica

    5/36

    3

    RESUMEN DEL CAPTULO I

    LA ESTADSTICA EN LAS CIENCIAS DE LA SALUD

    1.1 NECESIDADLas Ciencias de la Salud son experimentales y se basan en el mtodo induc-

    tivo (extensin, al todo, de las conclusiones obtenidas en una parte). El nicomodo de validar tales inducciones es por el Mtodo Estadstico. Las dems ra-zones que siguen son reflejo de esta mayor razn:a) La variabilidad biolgica de los individuos objeto de estudio en las Cien-

    cias de la Salud origina que sus datos sean impredecibles y que el modo decontrolarlos sea a travs del Mtodo Estadstico.

    b) La naturaleza cada vez ms cuantitativa de las Ciencias de la Salud re-quiere del Mtodo Estadstico para analizar y poner orden en los datos.c)Lainvestigacin en el campo de las Ciencias de la Salud requiere de la Es-

    tadstica en sus etapas de diseo, recopilacin de datos y anlisis de los resul-tados.

    d) El volumen de la informacin que recibe el profesional de la Salud re-quiere de conocimientos estadsticos que le permitan leer crtica y compren-sivamente los resultados cientficos ajenos.

    e)Lanaturaleza del trabajo clnico es en esencia de tipo probabilstico o es-tadstico, disciplinas que dan rigor y objetividad a los clsicos procesos sub-jetivos de diagnstico, pronstico y tratamiento.

    f) La perspectiva comunitaria de las Ciencias de la Salud requiere del uso dela Estadstica para poder extrapolar las conclusiones desde la parte estudiadade la poblacin a su globalidad.

    1.2DEFINICIN DE ESTADSTICANo existe una definicin internacionalmente aceptada, pero para nuestros

    propsitos basta con esta: Es el conjunto de mtodos necesarios para recoger,clasificar, representar y resumir datos, as como para hacer inferencias (extraerconsecuencias) cientficas a partir de ellos. De ah que conste de dos partes:a) Estadstica Descriptiva, cuyo fin es la recogida, clasificacin, representa-

    cin y resumen de los datos.b) Inferencia Estadstica, cuyo fin es extender las conclusiones obtenidas en

    una parte de la poblacin de inters (la muestra) a toda ella.

    1.3 CONSIDERACIONES FINALESa) Es importante estar familiarizado con el lenguaje estadstico.

    b) El Mtodo Estadstico es un mtodo riguroso para el anlisis de datos. Su va-lidez est condicionada por la verificacin de ciertas hiptesis que no puedenser violadas.

    c) Es importante la planificacin adecuada de la experiencia. Una planificacinincorrecta puede hacer desaprovechable toda la experiencia o una gran partede ella.

    d) La Estadstica Descriptiva no tiene valor inferencial alguno. Ella slo descri-be lo que hay, no permitiendo extraer conclusiones ciertas sobre nada.

  • 8/7/2019 resumenes bioestadistica

    6/36

    LA ESTADSTICA EN LAS CIENCIAS DE LA SALUD4

    1.4 CONTENIDOS DE ESTOS RESMENESEl Cuadro R.1.1 presenta esquemticamente los contenidos y el Resumen

    del Captulo que los contiene.

    DescriptivaHerramientas

    IIEstadstica

    Intervalos de confianzay de Aceptacin

    ProbabilidadTipos y familias

    de datosInferencial

    Cunto vale una caracterstica enuna poblacin o individuo? III III

    IV y partes del VI y XI

    Test de Hiptesis

    Es cierta esta hiptesis?

    Generalidades: V

    Hiptesis que implican una caracterstica en:Hiptesis que implican dos

    caractersticas(Problemas de Asociacin)

    1 poblacin 2 poblaciones 3 o ms poblaciones

    VI VII IX

    Ensayos ClnicosAmbas nonumricas

    Ambasnumricas

    Una numricay otra no

    VIII IX X y XI XI

  • 8/7/2019 resumenes bioestadistica

    7/36

    5

    RESUMEN DEL CAPTULO II

    ESTADSTICA DESCRIPTIVA

    2.1 TIPOS DE DATOSa) Cuantitativos: Se expresan numricamente.

    i) Discretos: Toman valores numricos aislados.ii) Continuos: Toman cualquier valor (dentro de unos lmites dados).

    b)Cualitativos: No se expresan numricamente.i) Ordinales: Admiten una ordenacin lgica y ascendente. (Nominales en

    otro caso).ii) Dicotmicos: Solo aceptan dos posibilidades.

    2.2 PRESENTACIN TABULAR DE LOS DATOSa) Se les agrupa en clases (si son discretos o cualitativos) o en intervalos de cla-

    se de igual longitud (si son continuos o discretos con muchos valores posi-bles). La primera y la ltima clase pueden ser excepcin.

    b) A cada clase se le anota la frecuencia absoluta (fi), o nmero de datos en laclase, y la frecuencia relativa (hi = fi/n, con n el nmero total de datos). Su-ceder que fi = n y hi = 1. Multiplicando hi por 100, 1.000, etc se obtienenlos %, 0/00, etc.

    c) Los intervalos de clase vienen definidos por dos nmeros, el lmite inferior(LI) y el lmite superior(LS); la diferencia de ellos es la longitud de clase y lasemisuma es la marca de clase.

    2.3 PRESENTACIN GRFICA DE LOS DATOSa) Histograma: Sobre cada punto (o intervalo) de las abscisas, se levanta una

    barra (o rectngulo) de tanta altura como frecuencia haya.b) Polgono de frecuencias: Se unen por una poligonal los puntos del plano

    que tienen por abscisa la clase o marca de clase y por ordenada la frecuencia.c)Pictograma: Se define una figura-motivo y se la repite o se la ampla de mo-

    do proporcional a la frecuencia de la clase, obteniendo as un pictograma derepeticin (o de amplificacin).

    d) Diagrama de sectores: En un crculo, se asigna a cada clase un sector derea proporcional a la frecuencia de la clase. El ngulo que lo delimita es360hi (en grados).

    2.4 SNTESIS DE DATOSa) Medidas de posicin: Describen cmo se encuentra el resto de la muestra

    con respecto a ellas.i) Moda: la clase con mas frecuencia absoluta (si nominal) o relativa (resto

    de los casos).ii) Mediana: divide a la muestra ordenada (de menor a mayor) en dos partes

    iguales.iii) Percentil: El percentil pi deja a su izquierda un "i% de la muestra orde-

    nada de menor a mayor (i=1, 2, ...., 99).iv) Cuartil: c1=p25, c2=p50, c3=p75.

  • 8/7/2019 resumenes bioestadistica

    8/36

    ESTADSTICA DESCRIPTIVA6

    v) Decil: d1=p10, d2=p20, ..., d9=p90.vi) Media aritmtica:

    Datos no agrupados: x = ix

    n

    Datos agrupados: x = i if x

    n

    , con fi = n

    vii) Media ponderada: i ipi

    w xx =

    w

    , con wi los pesos de ponderacin.

    b) Medidas de dispersin: Describen cmo de variables o dispersos son los da-tos.

    i) Recorrido, rango o amplitud: Es la diferencia entre los valores ms gran-

    de y ms pequeo de la muestra.ii) Desviacin media: dm = xi x /niii) Varianza: En lo que sigue, la primera frmula es la definicin y la segun-

    da es la apropiada para el clculo:

    Datos no agrupados:2 2

    2 2i ii

    (x x) ( x )1s = x

    n 1 n 1 n

    =

    --

    - -

    Datos agrupados:2 2

    2 2i i i ii i

    f (x x) ( f x )1s = f x

    n 1 n 1 n

    =

    --

    - -,

    con fi = niv) Desviacin tpica: la raz cuadrada (s) de la varianza.v) Rango intercuartlico: c3c1

    vi) Coeficiente de variacin: CV = (s/ x )100%.

  • 8/7/2019 resumenes bioestadistica

    9/36

    7

    RESUMEN DEL CAPTULO IIIDISTRIBUCIONES DE PROBABILIDAD

    3.1 DEFINICIONESa)Fenmeno aleatorio: Aquel fenmeno cuyo resultado es impredecible.b) Probabilidad (de un resultado dado de un fenmeno aleatorio): Es el lmite

    de la frecuencia relativa del mismo cuando el nmero de experiencias (repeti-ciones del fenmeno) tiende hacia infinito. La existencia de dicho lmite sesustenta en la ley de azar (o de estabilizacin de las frecuencias relativas).

    c) Variable aleatoria: es el resultado numrico de un fenmeno aleatorio. Son:i) Discretas: se identifican por la funcin de probabilidad (regla que asocia a

    cada valor de la variable, su probabilidad).ii) Continuas: se identifican por la funcin de densidad (que indica cmo de

    probable es que la v.a. caiga en los alrededores del punto), cuya repre-sentacin grfica es la curva de densidad.

    En general a ambas funciones se les llama distribucin de probabilidad.d) Parmetros poblacionales: Por contraposicin a los parmetros muestrales

    (que, como la media, varianza, etc, describen las muestras) se definen deigual modo los parmetros poblacionales (que describen las poblaciones o lasv.a.). Los paralelos a los parmetros muestrales x , s2, s y h = p son los po-blacionales , 2, y p.

    3.2 DISTRIBUCIONES DE PROBABILIDAD TERICASLa mayora de la v.a. de la Naturaleza siguen alguna de las siguientes:

    a)Distribucin Normal:i) Definicin: xN(; ) si su curva de densidad tiene forma de campana

    con centro de simetra en (media) y dispersin (desviacin tpica).ii) Tipificacin:z = (x)/N(0; 1) llamada Normal tpica.iii) Tabla 2: Para cada da un z de una N(0; 1) con P(zz+z) = 1.iv) Teorema Central del Lmite:Si x es una v.a. cualquiera de media y des-

    viacin tpica , y si x es la media de una muestra de tamao n30, x sedistribuye aproximadamente como una Normal: x N(;/ n ), con/ n el error estndar. Si x es Normal, lo anterior se verifica exactamen-te para cualquier valor de n.

    b) Distribucin Binomial:i) Definicin: Si de una poblacin de tamao (N) infinito, cuyos individuos ve-

    rifican una cierta caracterstica dicotmica con probabilidad p, se extrae unamuestra de tamao n, el nmero x de individuos, de entre los n, que verifi-can la caracterstica sigue una distribucin Binomial (lo que se expresaabreviadamente diciendo que xB(n; p)). Cuando N, x sigue aproxima-damente una Binomial si N > 40 y n/N (fraccin de muestreo) 0,10.

    ii) Media y Varianza:Son np y npq respectivamente.iii) Propiedad: Si n es suficientemente grande se aproxima a la Normal.c) Distribucin de Poisson:

    i) Identificacin:Son distribuciones de Poisson: i) Una Binomial con n grandey p pequeo; ii) El nmero de partculas por unidad de medio (si un grannmero de partculas estn repartidas al azar en una gran cantidad de me-dio); iii) El nmero de sucesos que ocurren por unidad de tiempo (si estossuceden al azar e independientemente entre s).

    ii) Media y Varianza: en ambos casos.iii) Propiedad: Si es suficientemente grande se aproxima a la Normal.

  • 8/7/2019 resumenes bioestadistica

    10/36

    8

    RESUMEN DEL CAPTULO IVINTERVALOS DE CONFIANZA Y DE ACEPTACIN

    4.1 MUESTREO ALEATORIOLas muestras deben tomarse al azar, de modo que todo individuo de la po-

    blacin tenga igual probabilidad de ser seleccionado y que la seleccin de unode ellos no condicione la seleccin de otro. El azar puede imitarse mediante da-dos, bolas en urna, etc, pero lo mejor es hacerlo a travs de una Tabla de Nme-ros Aleatorios como la Tabla 5.

    4.2 ESTIMACINLos parmetros poblacionales no suelen ser conocidos. Se les determina a

    travs de muestras aleatorias. La Teora de la Estimacin es la parte de la Infe-rencia Estadstica que sirve para determinar el valor de los parmetros pobla-cionales en base al de los parmetros muestrales. La estimacin puede ser:a) Por punto: Si se asigna al parmetro desconocido () un nico valor ( )

    que ser su valor aproximado y que depende de la muestra. Se dice que esun estimadorde . Cuando se haya obtenido la muestra y calculado , sedice que es una estimacin de . Usualmente es el parmetro muestralhomnimo del parmetro poblacional a estimar (as, 2 2 x, s y p=h = = ).

    b) Por intervalo: Si se asigna al parmetro desconocido () un intervalo de va-lores, (a; b), entre los cuales est con una cierta confianza 1. As, siP(ab) = 1, (a; b) es el intervalo de confianza, es el errordel interva-lo y 1 la confianza del intervalo.

    4.3 INTERVALO DE CONFIANZA PARA UNA MEDIA a) Intervalo con v.a. Normales:Si xN(; ) y x1, x2, ..., xn es una muestraaleatoria de ella, con media x y desviacin s:

    i) Si 2 es conocida: x z/ n , con z en la Tabla 2.ii) Si2 es desconocida: x ts/ n , con t en la Tabla 6 con (n1) g.l. y

    s/ n el llamado error estndar.b) Intervalo con v.a. no Normales: Si, en las condiciones de antes, x es no

    Normal, lo que sigue vale aproximadamente:i) Si 2 es conocida y n30: x z/ n , con z en la Tabla 2.

    ii) Si 2 es desconocida y n60: x zs/ n , con z en la Tabla 2.En ambos casos, si la v.a. x es discreta (y saltando de 1 en 1), a las expre-

    siones anteriores hay que aadirles el trmino 1/(2n) como correccin porcontinuidad.

    c) Tamao de muestra: Si xN(; ) y se desea obtener un tamao de mues-tra n tal que la media x de esa muestra verifique que x d, entonces:

    i)Si 2 es conocida: n = (z/d)2, con z en la Tabla 2.ii) Si 2 es desconocida pero se conoce un valor mximo para ella: n ={z(Mx ) / d}2, con z en la Tabla 2.

    iii)Si 2 es desconocida pero hay una muestra piloto: n = (ts/d)2, con t en

    la Tabla 6 con (n l) g.l., n el tamao de la muestra piloto y s2 su va-rianza.

    iv) En otro caso: Hacer d=K y n = (z/K)2, con z en la Tabla 2.Los casos ii) e iii) requieren comprobar que la muestra del tamao n

    aconsejado verifica las especificaciones. Si el n resultante es grande (60),

  • 8/7/2019 resumenes bioestadistica

    11/36

    INTERVALOS DE CONFIANZA Y DE ACEPTACIN 9

    las frmulas anteriores tambin valen, aproximadamente, si x es no Normal.4.4 INTERVALO DE CONFIANZA PARA UNA PROPORCIN

    Si xB(n; p):a) Intervalo: Si x es una observacin de ella, p=x/n, q =1 p y son x, nx>5:

    2 2

    2

    z z x 0, 5(x 0,5) z (x 0,5) 1

    2 4 np

    n z

    + +

    +

    -

    expresin que se puede simplificar en esta otra si, adems, son x, nx>20:x(n x)

    x z 0,5n pq 1

    p p z =n 2n n

    +

    +

    -

    con z siempre en la Tabla 2. La expresin primera es siempre ms exactaque la segunda.

    b) Tamao de muestra: Si se desea obtener un tamao de muestra n tal que laproporcin p en ella verifique que p pd, entonces:

    i) Con informacin: Si en base a una informacin previa -bibliogrfica o demuestra piloto- se conoce que p(p1;p2), n = (z/d)2pq, con p el valor dedicho intervalo que est ms cercano a 0,5 y q=1p.

    ii) Sin informacin: n = (z/2d)2.

    con z siempre en la Tabla 2. En el primer caso hace falta comprobar que lamuestra del tamao n aconsejado verifica las especificaciones.

    4.5 GENERALIDADES SOBRE LOS INTERVALOS DE CONFIANZA

    Las siguientes observaciones son vlidas para todos los intervalos de con-fianza:a) Los intervalos de confianza construidos son de dos colas -es decir del tipo

    (1; 2)- y con una confianza de 1 (o con un error de ). Cuando sedesee un intervalo de confianza de una cola, obtener el extremo que interese(1 o 2) al error 2. El intervalo ser 2 o 1.

    b) Las frmulas de tamao de muestra son vlidas para un intervalo de confian-za de dos colas al error . Cuando se le desee de una cola, cambiar por 2.

    c) En ciertos casos del tamao de muestra se alude a que al final hay quecomprobar que la muestra del tamao aconsejado verifica las especificacio-nes. El modo de hacerlo pasa por determinar el intervalo de confianza (1; 2) a partir de dicha muestra; deber ocurrir que 1 d y 2 d, con igual a x o p segn el caso.

    4.6 INTERVALOS DE ACEPTACINSi x1, x2, ..., xn es una muestra aleatoria de una v.a. continua de parmetrosdesconocidos:a) Variables Normales:x x Ks, con x y s la media y desviacin tpica de

    la muestra y K en la Tabla 9.b) Variables cualesquiera:ordenar la muestra de menor a mayor y proceder

    como se indica en la Tabla 10.En ambos casos el intervalo obtenido contiene al menosal 100% de la pobla-cin con una confianza de (1).

  • 8/7/2019 resumenes bioestadistica

    12/36

    10

    RESUMEN DEL CAPTULO V

    CONCEPTO GENERAL DE TEST DE HIPTESIS

    5.1 OBJETIVOUn test o contraste de hiptesis es un conjunto de reglas tendentes a decidir

    cul de dos hiptesis -H0 (hiptesis nula) o H1 (hiptesis alternativa)- debeaceptarse en base al resultado obtenido en una muestra.

    5.2 TIPOSa) Test bilateral o de doscolas:Si H1 es la negacin de H0.b) Test unilateral o de una cola:Si H1 es una parte de la negacin de H0.

    5.3 ELECCIONES PREVIASAntes de realizar un test, el investigador debe decidir cuatro cosas:

    a) H0:Hiptesis formada por una igualdad o afirmacin positiva.b) H1: Es la hiptesis que se quiere demostrar fuera de toda duda. Podr ser una

    parte de la negacin de H0 si la otra parte implica una conclusin equivalentea la que proporciona H0.

    c) : Es un valor tanto ms pequeo cuantas ms garantas se precisen de queuna decisin por H1 sea correcta. Usualmente =5% .

    d) Estadstico de contraste: Es la v.a. (dependiente de los valores de la muestray que comprime toda la informacin relevante de ella) que se va a utilizar pa-ra realizar el test.

    5.4 MTODOPara tomar la decisin debe obtenerse un conjunto de valores del estadsticode contraste (intervalo) cuya probabilidad (bajo H0) sea . El intervalo -que serde dos colas en los test bilaterales y de una cola (con la desigualdad en el mismosentido que la de H1) en los unilaterales- es llamado regin de aceptacin, y lode fuera de l regin crtica o de rechazo. Obtenida la muestra, si el valor quetoma en ella el estadstico de contraste est en la regin de aceptacin se aceptaH0; si est fuera, se acepta H1. En el primer caso se dice que el test (o el resulta-do) es estadsticamente no significativo; en el segundo se dice que es test (o elresultado) es estadsticamente significativo (ambos al error ).

    5.5 ERRORESToda decisin por H1 viene acompaada de una posibilidad de error llama-

    da error, de Tipo Io nivel de significacin:

    = P(decidir H1es cierta H0).Toda decisin por H0 viene acompaada de una posibilidad de error llama-da erroro de Tipo II:

    = P(decidir H0es cierta H1).En particular:a) El error est controlado, pues se fija de antemano. Por ello las decisiones

    por H1 son siempre fiables.b) El error no est controlado de antemano y puede ser grande. Por ello las

    decisiones por H0 no son de fiar.

  • 8/7/2019 resumenes bioestadistica

    13/36

    CONCEPTO GENERAL DE TEST DE HIPTESIS 11

    c) El error es un nico nmero, pero el error depende de la alternativa quese considere.d) El error disminuye conforme aumenta , conforme H1 se aleja de H0 y con-

    forme aumenta el tamao de la muestra (si todo lo dems permanece fijo).

    5.6 POTENCIA DE UN TESTSe llama potencia a la capacidad que tiene un test para detectar las hip-

    tesis alternativas, es decir: = 1 = P(decidir H1es cierta H1)

    Como es funcin de la hiptesis alternativa, en el caso de tests acerca de par-metros su representacin grfica da la curva de potencia. Un test es tanto mejorcuanto ms potente sea.

    5.7 VALOR Pa) Al mnimo error al cual un resultado es significativo se le llama valor P onivel crtico P o nivel mnimo de significacin.

    b) P es tambin la probabilidad de obtener un resultado tan extrao o ms que elobtenido cuando H0 es cierta, midiendo por tanto las evidencias que hay encontra de H0 (pero no mide cunto de falsa es H0).

    c) En un test de una cola (en el sentido favorable) P suele ser la mitad de su va-lor en el test de dos colas.

    d) Fijado un valor de : si P se decide H1; si P se decide H0.e) Las conclusiones de un test suelen expresarse as: H0 (P>tal) o H1 (P0, 1 = 0 para H1

  • 8/7/2019 resumenes bioestadistica

    14/36

    CONCEPTO GENERAL DE TEST DE HIPTESIS12

    5.10 REGLAS PARA TOMAR LA DECISINa)Si n fue determinado de antemano:i) Si P se concluye H1 (la decisin es fiable);

    ii) Si P> se concluye H0 (la decisin es fiable).b) Si n no se determin de antemano, pero se conocen los errores y y la

    mnima diferencia de inters (o la primera alternativa de inters 1 a lahiptesis nula 0):

    i) Si P se concluye H1 (la decisin es fiable).ii) Si P> se concluye H0 =0 provisionalmente. El intervalo de confian-

    za (I; S) construido en base a lo indicado en el Resumen 5.9b) y c)permite tomar la decisin final: si la primera alternativa de inters 1 =0 (para H1 0) o alguna de las 1 =0 (para H1 0) pertenece al intervalo, la conclusin por H0 no es

    fiable (y debe ampliarse la muestra y repetir el test); en otro caso la con-clusin por H0 es fiable (y el problema finaliza).c) En otro caso (Regla Automtica de Decisin para el caso de =5%):

    i)Si P5%: Se concluye H1;ii)Si P>15% o 20% (depende de n): Se concluye H0;iii)En otro caso: Se concluye H0, indicando que hay indicios de significa-

    cin y que conviene ampliar la muestra y repetir el test.

  • 8/7/2019 resumenes bioestadistica

    15/36

    13

    RESUMEN DEL CAPTULO VI

    TESTS CON UNA MUESTRA

    6.1 CRITERIOS GENERALES PARA TODOS LOS TESTS DE HIP-TESISSalvo indicacin expresa de lo contrario, todos los tests de hiptesis se ba-

    sarn en los siguientes criterios:a) El criterio de test (dos colas):Calcular una cantidad experimental(Cexp) a

    partir de los datos y una cantidad terica (C) a partir de las tablas para unerror dado. Entonces:

    Si Cexp < C se decide H0 (al error );Si Cexp C se decide H1 (con error )b) Obtencin del valor P (dos colas):Localizar en la Tabla terica dos valores

    C tales que C < Cexp < C (con < ); en tal caso P < < . La deci-sin se toma en funcin de P y en el modo indicado en el Resumen 5.10.

    c) Test de una cola: Comprobar si lo experimental es conforme con H1 y:i) Si NO es conforme con H1: Decidir H0 sin ms.ii) SiS es conforme con H1: Actuar como en a) pero en base a 2 u obtener

    el valor de P como b) y dividirlo por 2: / 2 < P < / 2 .d) Tamao de la muestra:Las frmulas de tamao de muestra que se vern

    sirven para determinar el mnimo tamao de muestra preciso para que un testde dos colas al error d significativo el (1)100% de las veces en que laverdadera hiptesis H1 se diferencie de H0 en la cantidad que se especifique

    (o ms veces si la diferencia es mayor, o menos veces si es menor).En todo caso, cuando el test es de una cola hay que cambiar en la frmula por 2.

    6.2 TEST DE HIPTESIS PARA UNA PROPORCIN (H0 p=p0)Si xB(n; p), con p desconocido:

    a) Test:Si x es una observacin de ella y ocurre que np0>5 y nq0>5, con q0 =1p0, comparar zexp = (xnp00,5) / 0 0np q con una z de la Tabla 2.

    b)Tamao de la muestra:Para detectar alternativas p1 -con p1p0= - n ={(z 0 0p q +z2 1 1p q )/}

    2 con q1 = 1p1, las z en la Tabla 2 y:i) En tests de una cola: p1=p0 para H1pp0;

    ii) En tests de dos colas: p1 el valor ms cercano a 0,5 de entre los p0.

    6.3 TEST PARA LA MEDIA DE UNA NORMAL (H0 =0)Si xN(; ), con desconocida:

    a) Test: Si x1, x2, ..., xn es una muestra aleatoria de x de media x y varianza s2:

    i) Si 2 es conocida: zexp = x 0 / (/ n ) vs. z de la Tabla 2.ii) Si 2 es desconocida: texp = x 0/ (s/ n ) vs. t(n1 g.l.) de la Tabla 6.

    b)Tamao de la muestra: Para detectar alternativas 1 con 10=:i) Si2 es conocida: n = {(z+z2)/}2 con las z en la Tabla 2.

    ii) Si 2 es desconocida, pero se sabe el mximo valor que puede tomar: n ={(z+z2)(Mx ) /}2, con las z en la Tabla 2.

  • 8/7/2019 resumenes bioestadistica

    16/36

    TESTS CON UNA MUESTRA14

    iii) Si 2 es desconocida, pero hay una muestra piloto de tamao n y va-rianza s2: n = {(t+t2)s/}2 con las t en la Tabla 6 con ( n 1) g.l.iv) Si 2 es desconocida y no hay muestra piloto: Haciendo = K, n =

    {(z+z2)/K}2, con las z de la Tabla 2.

    6.4 TEST DE HIPTESIS PARA LA MEDIA DE UNA VARIABLECUALQUIERA (H0 =0)Si x es una variable cualquiera de media desconocida y varianza 2, el

    Resumen 6.3 es vlido aproximadamente, con las siguientes matizaciones:a) Cuando 2 es conocida: Si n30.b) Cuando 2 es desconocida: Si n60 (pero las cantidades t se miran tambin

    en la Tabla 2).c) Sila variable es discreta y saltando de 1 en 1: Al numerador de las canti-

    dades experimentales hay que restarles 1/(2n), con lo que quedan as: x 01/(2n).

    6.5 MTODOS DE MEDIDAa) Un mtodo de medida se dice que es insesgado si en promedio mide lo que

    realmente hay. Ser sesgado en otro caso.b) Un mtodo de medida se dice que es preciso si tiene poca variabilidad (va-

    rianza). Ser impreciso en otro caso.c) Un mtodo de medida se dice que es exacto si es insesgado y preciso.

    6.6 TEST DE NORMALIDAD DE DAGOSTINO (H0 La muestra provie-ne de una v.a. Normal)Si x1, x2, ..., xnes una muestra aleatoria ordenada de menor a mayor, com-

    parar con una D de la Tabla 11 (por el modo all indicado) la cantidad:

    Dexp = {ixi(n+1)(xi)/2)} / {n 2 2i in x ( x ) / n - }

    Si el test da significativo, la comprobacin de la causa de la no-Normalidadse hace calculando Fn(xi) = {n de observaciones menores o iguales que xi}/n,representando en le plano las parejas (xi; Fn(xi)) y comparando la curva obtenidacon las curvas ms usuales.

    6.7RECHAZO DE OBSERVACIONES EXTREMAS (H0 La observa-cin xS debe aceptarse)Si x1, x2, ..., xn es una muestra aleatoria de una v.a. x Normal y x es su

    media, la observacin sospechosa xS ser aquella que ms diste de x , es decirxS = Mxixi x . Comparar texp = xS x / 2 2i ix ( x ) / n - con una t dela Tabla 13 por el modo all se indicado.

    Si el test da significativo (con valor P=P1) rechazar la observacin. Con lasn1 observaciones restantes puede intentarse rechazar otra observacin (valorP2), pero ahora el valor P para la segunda es P = P1+P2.

  • 8/7/2019 resumenes bioestadistica

    17/36

    15

    RESUMEN DEL CAPTULO VII

    TESTS DE HOMOGENEIDAD CON DOS MUESTRAS

    7.1 TESTS PARAMTRICOS PARA COMPARAR DOS MEDIAS DEVARIABLES NORMALES (H0 1=2)

    a) Test para muestras independientes: Si las muestras -de tamaos n1 y n2,medias 1x y 2x y varianzas

    21s y

    22s - provienen de variables de medias 1 y

    2 y varianzas 21 y22 desconocidas, obtener Fexp =

    21s /

    22s , con

    2 21 2s s y

    compararla con F0,10 [n11; n21] de la Tabla 8; entonces:i) Si Fexp

  • 8/7/2019 resumenes bioestadistica

    18/36

    TESTS CON DOS MUESTRAS16

    2 2 22 2 22 2

    1 1 1 1 1

    z z t t z zn = (r 1) , n = (r 1)s , n =(r+1)

    K + + + + +

    la primera expresin cuando 1 (o su mximo) es conocida, la segundacuando hay una muestra piloto de tamaos in y varianzas

    2is (con f =

    (1+r2) / {(1/( 1n1)+ r2/ ( 2n 1)}), la tercera cuando = K1. Obtenido

    n1, entonces n2 = rn1.iii) Muestras apareadas:

    2

    2 2d

    z zn =

    +

    ,2

    2 2d

    t tn = s

    +

    ,2

    2z zn =K

    +

    la primera expresin cuando d (o su mximo) es conocido, la segundacuando hay una muestra piloto de tamao n y varianza 2

    d

    s (con f =n 1), la tercera cuando 12= Kd.

    7.2 TESTS PARAMTRICOS PARA COMPARAR DOS MEDIAS DEVARIABLES CUALESQUIERA (H0 1=2)

    Si, en las condiciones y notacin del Resumen 7.1, las variables implicadas(x o d) no son Normales, gran parte de lo indicado all es aproximadamente v-lido si las muestras son grandes (mayores que 30 o 60 segn lo no Normal quesea la variable). Las reglas aconsejadas son las siguientes:a) Test para muestras independientes: Comparar con una z de la Tabla 2 la

    cantidad zexp = 1 2x x /2 21 1 2 2s / n s / n+ .

    b) Test para muestras apareadas: Comparar con una z de la Tabla 2 la canti-

    dad zexp =2

    dd / s /n .c) Intervalo de confianza para la diferencia de medias: Con la notacin de a)

    y b):12(numerador de la zexp sin valor absoluto) z(denominador de la zexp)

    d) Tamao de muestra: Es vlido lo indicado en el Resumen 7.1.d) -con las tmiradas tambin en la Tabla 2- si el n final predicho es superior a 30 o 60.

    e) Variables discretas: En los casos a), b) y c), si la variable implicada es dis-creta y saltando de 1 en 1, conviene efectuar una correccin por continuidadconsistente en sumar al radio del intervalo de confianza la cantidad c o res-tar al numerador de la zexp la cantidad c, con:i) Muestras independientes: c = 1/ {2 Mx (n1; n2)}.

    ii) Muestras apareadas: c = 1/(2n).

    7.3 TESTS NO PARAMTRICOS (TEST DE WILCOXON) PARACOMPARAR DOS MUESTRAS DE VARIABLES CUALESQUIERA(H0 La primera poblacin no tiende a dar valores ms altos o ms bajosque la segunda)

    a) Asignacin de rangos:En lo que sigue se hablar de asignar rangos a unamuestra ordenada. Por tal se entiende al proceso de, dada una muestra or-denada de menor a mayor (x1x2 ... xn), asignar el rango 1 al elemento x1,el rango 2 al elemento x2, ..., el rango n al elemento xn. Cuando haya varioselementos xi consecutivos iguales (empates) a cada uno de ellos se le asigna

  • 8/7/2019 resumenes bioestadistica

    19/36

    TESTS CON DOS MUESTRAS 17

    el rango promedio que tendran si fueran distintos; por ejemplo, si x r = xr+1 =... = xs,a cada elemento se le asigna el rango promedio (r+s)/2.b) Muestras independientes (Test de Wilcoxon): Dadas dos muestras inde-

    pendientes de tamaos n1 y n2 (n1n2 por convenio), unir las dos muestras enuna sola, ordenarla de menor a mayor, asignarle rangos a sus elementos ycalcular las sumas de rangos (R1 y R2) de los elementos de cada una de lasmuestras. Deber suceder que R1+R2 = (n1+n2)(n1+n2+1)/2. Llamar por Rexpa la suma de rangos (R1) de la muestra de menor tamao y entonces:i) Si n1+n230: Comparar Rexp con una R de la Tabla 14 por el modo all

    indicado.ii) Si n1+n2>30: Comparar zexp = {RexpE(R)0,5} / V(R) con una z de

    la Tabla 2, en donde E(R) = (n1+n2+1)n1/2 y V(R) = (n1+n2+1)n1n2/12 sino hay empates, en tanto que cuando haya r grupos de t1, t2, ..., tr empates

    cada uno: { }21 2 1 2 i1 2

    1 2 1 2

    (n n ) (n n ) 1V(R)= n n

    12(n n )(n n 1)

    + +

    + +

    - - T

    -, con Ti=(ti1)ti(ti+1)= 3i it t-

    c)Muestras apareadas (Test de Wilcoxon):Dadas n' parejas de datos, obtenerlas n' diferencias entre ellas, rechazar las que sean cero, ordenar el resto (n)de menor a mayor valor de sus valores absolutos, asignarles rangos y calcularlas sumas de rangos -R(+) y R()- de las diferencias positivas y negativas.Deber suceder que R(+)+R() = n(n+1)/2. Entonces:

    i) Si n25: Comparar R(+) -o R(), es lo mismo- con una R de la Tabla 15por el modo all indicado.

    ii)Si n>25: Comparar la cantidad zexp = {R(+)E(R)0,5} / V(R) conuna z de la Tabla 2, en donde E(R) = n(n+1)/4 y V(R) = n(n+1)(2n+1) /24 cuando no hay empates, en tanto que cuando haya r grupos de t

    1, t

    2, ...,

    tr empates cada uno, V(R) = {2n(n+1)(2n+1)Ti}/48 con Ti = (ti1)ti(ti+1) = 3i it t- .

    7.4 TESTS DE COMPARACIN DE DOS PROPORCIONES (MUES-TRAS INDEPENDIENTES) (H0 p1=p2)Si xiB(ni; pi), con i=1, 2,son independientes, y si de cada una de ellas se

    obtiene una muestra en el formato de la Tabla R.7.1, entonces, llamando porip =xi/ni, p =a1/N, iq =1 ip y q 1 p= - (en lo que sigue las cantidades zx siem-

    pre en la Tabla 2, pues se utiliza la aproximacin de la Binomial a la Normal):a) Test: Si E = Mn (a1; a2)Mn (n1; n2)/N > 5, comparar

    1 21 2

    exp

    1 2

    1 2

    p px (n ; n )

    z =

    n +n pqn n

    1- -

    2 Mvs. z

    b) Intervalo de confianza para la diferencia de proporciones: Si x1, x2, y1, y2son todos mayores que 5:

    1 2p p- ( 1 2 p p- ) 1 1 2 2

    1 2 1 2

    p q p qz

    n n x (n ; n ) + +

    1

    2 M

    c) Tamao de muestra: Para detectar una diferencia = p1p2:

  • 8/7/2019 resumenes bioestadistica

    20/36

    TESTS CON DOS MUESTRAS18

    i) Con informacin:2

    2 1 1 2 2z 2pq z p q p qn= + +

    ,

    con p = (p1+p2)/2, q = 1p, qi = 1pi y las p1 y p2 lo ms cercanas posiblesa 0,5/2, compatibles con la informacin que se posea sobre ellas y talesque p1 p2 = .

    ii) Sin informacin: Cuando no hay informacin previa sobre las p i, la frmulaanterior se convierte en n = {z+z2

    21 - }2 / 22.Tabla R.7.1 Tabla R.7.2

    Presentacin de datos cuando se comparandos proporciones independientes.

    Presentacin de datos cuando se comparandos proporciones apareadas.

    Caracterstica

    MuestrasS NO Totales

    B

    AS NO Total

    1 x1 y1 n1 S n11 n122 x2 y2 n2 NO n21 n22

    Totales a1 a2 N Total n

    7.5 TEST DE COMPARACIN DE DOS PROPORCIONES (MUES-TRAS APAREADAS) (H0 p1=p2)Si los n individuos de una muestra son clasificados segn que presenten

    (S) o no (NO) una determinada caracterstica tras la aplicacin de un tratamien-to A (entendido de modo genrico: no tiene porqu ser un tratamiento mdico) y

    lo mismo tras la aplicacin de otro tratamiento B, los datos pueden presentarsecomo en la Tabla R.7.2. Si p1 y p2 son las proporciones de respuestas S a cadatratamiento (en lo que sigue zx siempre en la Tabla 2):a) Test de McNemar: Si n12+n21 > 10, comparar

    zexp = {n12n211} / 12 21n n+ vs. z.b) Intervalo de confianza para la diferencia de proporciones: Si n12, n21 > 5:

    212 21

    1 2 12 21 12 21

    (n n )p p (n n ) z (n n ) 0,5 / n

    n + +

    c)Tamao de muestra: Para detectar una diferencia p1p2= :i) Con informacin:n = {(z 12 21p p+ +z2 212 21p p+ ) /}

    2, en dondep12 (o p21) es la proporcin de individuos que responden S y NO (o NO y

    S) a los tratamientos A y B respectivamente, y con p12+p21 sustituido porlo mximo que pueda valer (sus sumandos lo ms prximos posibles a0,5 /2) compatible con la informacin y con que p1p2= .

    ii) Sin informacin: Cuando no hay informacin previa sobre las pij, la fr-mula anterior se convierte n = {(z+z2 21 - ) /}2.

    7.6 GENERALIDADES VLIDAS PARA TODO EL RESUMEN AC-TUAL

    a) Muestras: Dos muestras son independientes cuando cada individuo de lasmismas proporciona una nica observacin. Son apareadas, relacionadas o

  • 8/7/2019 resumenes bioestadistica

    21/36

    TESTS CON DOS MUESTRAS 19

    dependientes cuando cada individuo proporciona dos observaciones (los da-tos se obtienen por parejas). Cuando la asociacin entre esas parejas de datoses positiva, el muestreo apareado es preferible.

    b) Test: Las comprobaciones previas a un test de una cola (H1 1

  • 8/7/2019 resumenes bioestadistica

    22/36

    20

    RESUMEN DEL CAPTULO VIIIENSAYOS CLNICOS

    8.1 CONCEPTO DE ENSAYO CLNICOUn Ensayo Clnico es un diseo experimentalmente planificado para verifi-

    car la eficacia de un tratamiento en humanos a travs de la comparacin de losresultados obtenidos en dos grupos de pacientes que reciben, uno el tratamientoproblema, y otro un tratamiento alternativo (nuevo o clsico) o ningn trata-miento, ambos grupos tomados, tratados y seguidos durante igual perodo detiempo y obtenidos por la particin al azar en dos de un grupo inicial nico. Serigen por un protocolo.8.2 OBJETIVO

    El objetivo de un EC es que los dos grupos de individuos sean comparables

    en todo, excepto en el tratamiento. Las diferencias entre ambos pueden deberse:a) Al azar de la toma de muestras: lo controla el mtodo estadstico.b) A diferencias existentes entre los dos grupos de individuos (distintas del tra-

    tamiento y previas a su aplicacin): lo controla el diseo del EC.c) A diferencia ocurrida en la manipulacin y evaluacin de los grupos en el

    curso de la investigacin (simultneas o posteriores a la aplicacin de los tra-tamientos): lo controla el tipo de EC.

    d) A diferencias entre los efectos de los dos tratamientos: su determinacin, siexiste, es el objetivo del EC.Las causas b) y c) producen un sesgo o error sistemtico de los datos.

    8.3 TIPOS DE ENSAYOS CLNICOSa) Grupo Control: Elque no recibe tratamiento alguno.b) Grupo Placebo: El que recibe un tratamiento ficticio (aplicado con los mis-

    mos ritos que el tratamiento problema).c) Tcnica de simple ciego: Elenfermo no conoce qu tratamiento recibe.d) Tcnica de doble ciego: Ni el enfermo ni el mdico conocen qu tratamiento

    se est aplicando.e) Tcnica de triple ciego: Ni el enfermo, ni el mdico ni el comit que monito-

    riza el EC (incluyendo al bioestadstico) conocen qu tratamiento se estaplicando.

    8.4 TIPOS DE ESTUDIOS CLNICOS Y CONDICIONES PARA QUESEAN UN ENSAYO CLNICO

    a) Un estudio es experimental cuando el tratamiento est controlado, es decircuando es el investigador quien decide qu tratamiento se da a cada enfermo.En caso contrario (tratamiento no controlado) el estudio es observacional.Un EC debe ser controlado.

    b)Un estudio es concurrente cuando los dos grupos de individuos se toman,tratan y siguen durante el mismo perodo de tiempo. En otro caso el estudioes no concurrente. El grupo Control no concurrente puede ser histrico o li-terario. Un EC debe ser concurrente.

    c) Un estudio es aleatorizado si, siendo controlado, la asignacin del trata-miento se hace al azar por un mecanismo de sorteo. En otro caso es no alea-torizado. Se haga de un modo u otro, debe indicarse al final la ficha tcnicade las muestras utilizadas (incluyendo en ella toda la informacin pertinentesobre la distribucin en cada muestra de todos los posibles factores de ries-go). Un EC debe ser aleatorizado.

  • 8/7/2019 resumenes bioestadistica

    23/36

    ENSAYOS CLNICOS 21

    8.5 TIPOS DE DISEOSa) Diseo en muestras independientes o apareadas: Ver el Resumen 7.6a).b)Diseo cruzado (en muestras apareadas): Si la mitad de los individuos reci-

    ben los tratamientos en un orden y la otra mitad en el orden contrario.c)Diseo estratificado:Si se aparea parcialmente en base a una estratificacin

    en uno o ms factores de riesgo. Cada clase en que se divide un factor deriesgo se llama nivel. Cada conjuncin de niveles de los factores considera-dos se llama estrato.

    8.6 MTODOS DE ASIGNACIN ALEATORIA DEL TRATAMIENTOLa aleatorizacin debe realizarse mediante una Tabla de Nmeros Aleato-

    rios como la Tabla 5. Es preferible tener una lista aleatoria ya construida deantemano o, en ensayos doble ciego, tener introducido el orden de aplicacin delos tratamientos en unos sobres opacos numerados y cerrados.

    8.7 EL ENSAYO CLNICO IDEALa) Con respecto al tipo y diseo:Aleatorizado (con placebo, si uno de los tra-

    tamientos es un control) a doble ciegas y con diseo cruzado. El orden deimportancia es el de escritura. Si el EC es multicntrico conviene estratificarpor Centros.

    b)Hiptesis a contratar: Casi siempre el test es de una cola (excepto si los dostratamientos son nuevos o los dos son clsicos).

    c) Medida de la respuesta:Puede ser un suceso clnico (curacin, muerte, etc)o una medida indirecta (presin sangunea, nivel de colesterol, etc) y ha deser fcil de diagnosticar u observar, estar libre de errores de medida, poderser observada con independencia del tratamiento, tener relevancia clnica, serelegida antes de comenzar la recoleccin de los datos y ser lo ms informati-

    va posible.d) Tamao de muestra: Ahora es imprescindible determinarlo para evitar re-chazar tratamientos que pudieran ser efectivos. Depende del diseo, del tipode respuesta, de la hiptesis a probar, de la razn de asignacin, de si el testes de una o de dos colas, del error , del error , de la mnima diferencia adetectar, del conocimiento acerca de ciertos parmetros poblacionales y deque haya una o ms medidas de la respuesta.

    8.8 LA TICA EN LOS ENSAYOS CLNICOSSon ticamente admisibles por ser el nico mecanismo cientfico vlido pa-

    ra comprobar la eficacia de un tratamiento. Requieren del consentimiento in-formado del paciente.

    8.9 LOS ENSAYOS CLNICOS EN ESPAA

    La legislacin espaola (B.O.E. del 7-2-04) entiende por tal a toda investi-gacin efectuada en seres humanos con uno o varios medicamentos a fin de de-terminar la seguridad y/o eficacia de los mismos.

  • 8/7/2019 resumenes bioestadistica

    24/36

    22

    RESUMEN DEL CAPTULO IX

    EL TEST 2 Y SUS APLICACIONES

    9.1 TEST DE HOMOGENEIDAD DE VARIAS MUESTRAS CUALITA-TIVAS (H0 La proporcin de individuos que caen en una determinadaclase es la misma para todas las poblaciones y esto vale para todas las cla-ses Todas las muestras provienen de igual poblacin).Dadas r muestras cuyos individuos se clasifican en s clases como en la Ta-

    bla R.9.1 (muestras = filas; clases = columnas), se define:Oij = N de individuos de la muestra i que caen en la clase j;Fi = Total de la fila i = n de individuos de la muestra i = jOij;Cj = Total de la columna j = n de individuos de la clase j =iOij;T = Gran total = n total de individuos considerados = Fi = Cj =Oij.

    a) Test en Tablas rs distintas de 22: Calcular las cantidades esperadas Eij =FiCj/T (cuyos totales de fila y de columna han de ser las F i y Cj de antes) yentonces, si ninguna Eij es inferior a 1 y no mas del 20% de ellas son inferio-res o iguales que 5, comparar (la segunda expresin de las dos que siguen esla ms apropiada para el clculo)

    ( )2

    2ij ij ij2

    expi, j i, jij ij

    O E O= = T

    E E

    con 2 {g.l.=(r1)(sl)} de Tabla 7.

    Tabla R.9.1Tabla de contingencia rs

    ColumnasOij

    1 2 sTotales

    1 O11 O12 O1s F1

    2 O21 O22 O2s F2

    Filas

    r Or1 Or2 Ors Fr

    Totales C1 C2 Cs T

    b) Test en Tablas 22: Si Mn (F1 ; F2)Mn (C1; C2) / T > 5, comparar21 2

    11 22 12 212exp

    1 2 1 2

    Mn (F; F )O O O O

    2= TFF C C

    con 2 {g.l.=l} de Tabla 7.

    Si la cantidad Mn (F1; F2)/2 se cambia por T/2 se obtiene la clsica2Y (chi-cuadrado de Yates).

  • 8/7/2019 resumenes bioestadistica

    25/36

    EL TEST 2 Y SUS APLICACIONES 23

    9.2 TEST DE INDEPENDENCIA PARA VARIABLES CUALITATIVAS:TABLAS DE CONTINGENCIA (H0 Los caracteres A y B son indepen-dientes).Si en los T individuos de una muestra aleatoria se determinan dos caracteres

    cualitativos A y B, el primero dividido en r clases y el segundo en s clases, y seles clasifica en base a ello en una tabla como la Tabla R.9.1 -cambiando filasy columnas por clases del carcter A y clases del carcter B respecti-vamente- proceder como en el Resumen 9.1, salvoque en las Tablas 22:

    ( )2

    11 22 12 212exp

    1 2 1 2

    O O O O 0,5= T

    FF C C

    9.3 PARTICIN DE TABLAS

    Cuando se concluye H1, la bsqueda de las causas de la significacin seefecta mediante la particin de la tabla inicial en otras subtablas que se obtie-nen colapsando (juntando) las filas o columnas apropiadas:a) Sugerencias sobre los colapsos: Se obtienen a travs de los porcentajes de

    observaciones por filas o por columnas y, sobre todo, a travs de la contribu-cin de cada casilla a la 2exp total: residuales (OijEij)

    2 / Eij.b) Caso de Tablas 22: En las particiones no se realiza c.p.c., de modo que el

    valor de 2exp en una tabla 22 (sea cual sea su origen) es:

    ( )2

    2 11 22 12 21N exp

    1 2 1 2

    O O O O= T

    FF C C

    c) Comprobacin de la particin: La suma de los g.l. de las tablas partidas de-be ser los g.l. de la tabla original. De igual modo con las 2exp , pero la igual-

    dad es ahora solo aproximada.d) Significacin de las subtablas: Si la particin se hizo a priori (no por laregla de a)), las significaciones se obtienen del modo usual. Si la particin sehizo a posteriori (por la regla de a)), se declarar significativo un resultadocon P10% si a) lo previ como tal.

    9.4 TIPOS DE MUESTREO EN TABLAS 22, TEST APROPIADO YMEDIDAS DE ASOCIACINCon frecuencia, los dos caracteres dicotmicos estudiados (E y FR) suelen

    aludir a la presencia o no de una enfermedad o efecto indeseado (E y E ) y a lapresencia o no de un factor de riesgo (FR y FR ). En lo que sigue se supone quela enfermedad se ubica en filas, obteniendo as unos datos como los de la TablaR.9.2.

    Tabla R.9.2Formato estndar para los estudios epidemiolgicos.

    Factor de riesgoEnfermedad S FR NO FR Totales

    S ENO E

    O11O21

    O12O22

    F1F2

    Totales C1 C2 T

    a) Tipos de muestreo: Para estudiar la asociacin entre E y FR los tipos de

  • 8/7/2019 resumenes bioestadistica

    26/36

    EL TEST 2 Y SUS APLICACIONES24

    muestreo pueden ser dos, lo que da lugar a tres tipos de estudio:i) Muestreo de Tipo I(Estudio Transversal): Tomar T individuos al azar yclasificarlos en base a E y a FR.

    ii) Muestreo de Tipo II(Preferible al de Tipo I si las Fi o las Cj se planificancomo iguales):Estudio Prospectivo, Longitudinal o de Seguimiento: Tomar C1 y C2 in-

    dividuos al azar y clasificarlos en base a E.Estudio Retrospectivo o de Caso-Control: TomarF1 y F2 individuos alazar y clasificarlos en base a FR.

    Desde un punto de vista estadstico el diseo ptimo consiste en tomarmuestras de igual tamao de los niveles de la caracterstica ms infrecuente(en general la enfermedad: estudio retrospectivo).

    b) Test apropiado: Si Mn (F1 ; F2)Mn (C1; C2) / T > 5, comparar

    ( )2

    11 22 12 212exp

    1 2 1 2

    O O O O c= TFF C C

    con 2 {g.l.=l} de Tabla 7

    con c = 0,5 en los transversales, c = Mn (C1; C2)/2 en los prospectivos y c =Mn (F1; F2) / 2 en los retrospectivos. En todos los casos c = T/2 da la clsicac.p.c. de Yates.

    c) Medidas de asociacin: Una medida de asociacin es un nmero que indicael grado de dependencia existente entre los dos caracteres E y FR estudiados,pero la medida a usar depende del fin perseguido y del muestreo utilizado. ElCuadro R.9.1 las resume (pero l es aplicable solo a datos en el formato de laTabla R.9.2).

    9.5 ASIGNACIN DE VALORES CUANTITATIVOS ARBITRARIOSa) Los mtodos basados en datos cuantitativos son preferibles a los basados en

    datos cualitativos (como el mtodo 2).b) Si una caracterstica cualitativa es ordinal es posible y preferible asignarlevalores numricos a sus clases y analizar los nuevos datos por la tcnicaapropiada.

    c) La asignacin puede hacerse si el fenmeno estudiado hubiera podido medir-se en una escala continua de haber dispuesto de los instrumentos adecuados,y si las clases obtenidas pueden considerarse como un agrupamiento de talescala por medio de otra ms burda formada por sus valores redondeados.

    9.7 EVALUACIN DE UN MTODO DE DIAGNSTICOSi en la Tabla R.9.2 se entiende que FR alude a que un test diagnstico ha

    dado positivo (suceso T), el objetivo entonces es evaluar la bondad del test diag-nstico, lo que puede hacerse de dos modos (aunque es preferible el segundo).

    En lo que sigue se entiende que:p = Prevalencia = % de enfermos en la poblacin estudiadaa) Sin considerar la prevalencia: Se define

    SN = Sensibilidad= % de enfermos diagnosticados positivamente;FN = Falsos Negativos = % de enfermos diagnosticados negativamente;EP = Especificidad= % de sanos diagnosticados negativamente;FP = Falsos Positivos = % de sanos diagnosticados positivamente;

    en donde SN+FN = EP+FP = 100.

  • 8/7/2019 resumenes bioestadistica

    27/36

    EL TEST 2 Y SUS APLICACIONES 25

    Para estimar tales valores se toman F1 enfermos y F2 sanos y se anota encuntos de ellos el test da positivo (O11 y O21 respectivamente), expresandolos datos en una tabla como la Tabla R.9.2 -cambiando FR por T- y dandolugar as a un estudio retrospectivo. Entonces:

    11 12 22 21

    1 1 2 2

    O O O OSN , FN = , E P , FP

    F F F F= = =

    cantidades a las que es posible aplicarle los resultados del Resumen 4.4.a).Las conclusiones son:i) Si EP es alta, el test es til para confirmar la enfermedad (conviene apli-

    carlo a individuos sospechosos de poseerla);ii) Si SN es alta, el test es til para descartar la enfermedad (conviene apli-

    carlo como procedimiento de rutina para el diagnstico precoz de la en-fermedad).b) Considerando la prevalencia: Los porcentajes de aciertos en los diagnsti-

    cos positivos (Valor Predictivo Positivo) o negativos (Valor Predictivo Ne-gativo) sern:

    VPP = % de enfermos entre los diagnosticados positivamenteVPN = % de sanos entre los diagnosticados negativamente

    Si los datos de la Tabla R.9.2 provienen de un estudio retrospectivo, ta-les valores se pueden estimar por:

    p S (1 p) EPVPP = , VPN =

    p SN + (1 p) (1 EP) (1 p) EP + p (1 SN)

    -

    - - - -

    con S y EP como en a), cantidad que depende de la prevalencia que seasuma.

    Cuando los datos de la Tabla R.9.2 provienen de un estudio transversal,entonces:

    1Fp =T

    , 11 22

    1 2

    O OVPP , VPN =

    C C=

    Tambin, y a efectos de evaluar la ganancia obtenida en el diagnsticopor el hecho de utilizar el test, se definen:

    GP = Ganancia del Positivo = VPP pGN = Ganancia del Negativo = VPN (1p)

    Las conclusiones (para la prevalencia asumida) son:i) Si VPP es alto, el test es til para confirmar la enfermedad;

    ii) Si VPN es alto, el test es til para descartar la enfermedad.

  • 8/7/2019 resumenes bioestadistica

    28/36

    EL TEST 2 Y SUS APLICACIONES26

  • 8/7/2019 resumenes bioestadistica

    29/36

    Cuadro R.9.1

    Medidas de asociacin epidemiolgicas en tablas 22Medida Valores

    posibles

    (Asociacin)Independencia(Asociacin+)

    Caso Estimacin Estudios enque es vlida

    Intervalo de Confianza ((zen la TABLA

    General( ) ( )11 2 12 1R = O C / O C

    11 2

    12 1

    (O + 0,5)(C +1)R =

    (O + 0,5)(C +1)

    TransversalesProspectivos

    11 12

    1 R R exp z+ 0,5 O O

    +

    R

    0 R < 1

    R = 1

    1 < R < SiP(E)

    O o O Retrospectivos11 12

    1 1R O exp zO + 0,5 O + 0

    +

    Riesgo relativo (de FR para E): La probabilidad de enfermar es R veces mayor en los individuos con el FR que en los sin

    General ( ) ( )11 22 12 21O = O O / O OO

    0 O < 1O = 1

    1 < O Si algunaOij vale

    cero

    11 22

    12 21

    (O 0, 5)(O 0, 5)O =

    (O 0, 5)(O 0, 5)

    + ++ +

    TransversalesProspectivos

    Retrospectivos 11 12

    1 1O O exp zO + 0, 5 O + 0

    +

    Razn delproducto cruzado: La fraccin de individuos que enferman frente a los que no, es O veces mayor en los que individuos con el

    General 11 22 12 21FR1 2

    O O O OR =

    FC

    Transversales FR FR

    R 1 (1 R ) exp z

    RFR

    P(FR)

    1 P(FR)-

    -RFR

  • 8/7/2019 resumenes bioestadistica

    30/36

  • 8/7/2019 resumenes bioestadistica

    31/36

    27

    RESUMEN DEL CAPTULO XREGRESIN LINEAL

    10.1 CONCEPTO DE REGRESINa) Objetivo:Dadas dos v.a. cuantitativas x e y medidas en los mismos indivi-

    duos, la tcnica de regresin persigue tres objetivos:i) Estudiar si ambas variables estn relacionadas o son independientes.

    ii) Estudiar el tipo de relacin que las liga (si existe).iii) Predecir los valores de una de ellas a travs de los de la otra.

    b) Relaciones deterministas y aleatorias: En las Ciencias Exactas la relacinentre dos variables puede ser exacta: conocido el valor de una de ellas se co-noce exactamente el de la otra. En Estadstica la relacin es aleatoria: cono-

    cido el valor de una variable se conoce el de la otra slo de un modoaproximado. Ello sucede en las Ciencias de la Salud por dos motivos:i) Por la variabilidad biolgica de los objetos muestrales.

    ii) Por la variabilidad aleatoria de los mtodos de medida.c)Sobre la existencia de regresin: Dadas n parejas de valores (xi; yi) obteni-

    dos de una muestra, su representacin por puntos en el plano cartesiano dalugar a una nube de puntos. Si a ella se ajusta alguna curva, se dice que exis-te regresin, a la curva se le llama lnea de regresin y a la funcin que larepresenta se le llama funcin de regresin. A la variable ubicada en el ejehorizontal (usualmente x) se le llama variable independiente; a la ubicada enel eje vertical (usualmente y) se le llama variable dependiente.

    d) Regresin lineal simple: Aqu solo nos ocupamos del caso en que contamoscon solo dos variables, x e y, relacionadas entre s mediante una lnea recta.

    e)Asociacin y causalidad: La demostracin estadstica de que dos variables

    estn asociadas no constituye una prueba de que una de ellas sea causa de laotra. Puede ocurrir:i) Que x sea realmente causa de y.

    ii) Que ambas variables se influyan mutuamente.iii) Que ambas variables dependan de una causa comn (una tercera variable

    z no contemplada).

    10.2 MODELO Y MUESTREO EN REGRESIN LINEAL SIMPLEa) Modelo: Para cada valor de x, la variable y sigue una distribucin Normal de

    media +x y de varianza 2 (independiente de x). A yPOB = E(yx) = +xse le llama recta de regresin poblacional, a altura en el origenpoblacio-nal (altura en que corta la recta al eje vertical, es decir cuando x=0) y a pendientepoblacional (lo que aumenta y cuando x aumenta en una unidad).

    b)Tipos de muestreo: La consecucin de las n parejas (xi; yi) pueden hacersebajo dos tipos de muestreo:i) Muestreo de Tipo I: Tomar n individuos al azar y anotar sus valores x e y.ii) Muestreo de Tipo II: Tomar n valores de x elegidos de antemano y obte-

    ner un valor de y al azar en cada uno de tales x.

    10.3 ESTIMACIN DE LOS PARMETROSSi (xi; yi), con i = 1, 2, ..., n, son n parejas de valores de (x; y) obtenidos por

    alguno de los tipos de muestreo anteriores:a) Clculos intermedios: En lo que sigue la segunda expresin es la definicin,

  • 8/7/2019 resumenes bioestadistica

    32/36

    REGRESIN LINEAL28

    la tercera su mtodo de clculo abreviado y la primera su smbolo corto parareferencias:(xx) = (xi x )2 = 2ix (xi)

    2/n

    (yy) = (yi y )2 = 2iy (yi)2/n

    (xy) = (xi x )(yi y ) = xiyi (xi)(yi)/nb) Estimacin de la recta de regresin (yPOB=+x): Se determina bajo el

    principio de que (yiabxi)2 sea lo ms pequeo posible -principio de losmnimos cuadrados- obteniendo as la recta de regresin muestral (o esti-mada) y = a+bx, con y la prediccin, a la altura en el origen muestral (oestimada), b la pendiente muestral (o estimada) y:

    b = (xy) / (xx), a = y bx

    c) Estimacin de la varianza de regresin (2

    ): Mide la variabilidad de lospuntos alrededor de la recta de regresin:

    2 2i i

    1 1 xys = (y y ) = (yy)

    n 2 n 2 xx)

    2 ( ) (

    d)Comprobacin del modelo: Sean yi iy los residuos o residuales y sea la

    nube de puntos de residuales que se obtiene al representar yi iy (en el ejevertical) contra iy (en el eje horizontal):

    i) Normalidad: No se verifica si la variable y es discreta o si el test deDAgostino es significativo al aplicarlo a cada conjunto de observacio-nes y en cada x (lo que requiere de observaciones repetidas).

    ii) Linealidad: La nube de puntos ha de mostrar una tendencia exclusivamen-te lineal. La de residuales ha de ser paralela al eje horizontal. Cuando es-to no es as, a veces un cambio de escala apropiado puede convertir lacurva en recta (linealizacin): cambiar x por log x, 1/x, ,x etc y/o simi-larmente con y.

    iii) Homogeneidad de varianzas: La nube de puntos ha de ser ovalada, sinmostrar tendencia a ser ms ancha o estrecha con el aumento de x. La deresiduales igual con el aumento de y .

    e) Quin sobre quin?: Los parmetros anteriores se entiende que son ayx, byxy 2y xs i por haber sido obtenidos de la regresin de y sobre x. Los resultadosno son los mismos (axy, bxy y 2x ys i ) si en el eje horizontal se pone a la varia-ble y y en el vertical a x (regresin de x sobre y). Se hace la regresin de ysobre x cuando el objetivo es predecir y a partir de x. El muestreo de Tipo Ipermite hacer ambas; el de Tipo II slo la de y sobre x.

    f) Precauciones y consejos:i) No pueden hacerse inferencias fuera del rango de muestreo de x (el inter-

    valo de valores entre el menor y el mayor valor de x obtenidos).ii) El muestreo de Tipo II permite elegir el rango de inters de las x y, to-mndolo amplio, hace ms fiables las conclusiones.

    10.4 INFERENCIAS CON RECTAS DE REGRESINEn lo que sigue, salvo indicacin expresa de lo contrario, la cantidad t alu-

    dida implcita (en el test) o explcitamente (en los intervalos) se busca en la Ta-bla 6 con (n2) g.1.:a) Sobre la pendiente:

    i) Intervalo de confianza: bts/ (xx);

  • 8/7/2019 resumenes bioestadistica

    33/36

    REGRESIN LINEAL 29

    ii) Tets (H0 =0): texp = b0 (xx) /s;iii) Test de independencia (H0 =0): texp = b (xx) /s.b) Sobre la altura:

    i) Intervalo: at { }2 2s 1/ n +x /(xx) ;

    ii) Test(H0 =0): texp = a0/ { }2 2s 1/ n +x /(xx) .c) Sobre la media de y en un valor dado x0 de x:

    i) Intervalo: { }2 20 0 0x a+bx t s 1 /n + x x) /(xx) + (

    Para muchos intervalos, t = {2F[2; n2]}0,5 con F en la Tabla 8;ii) Test(H0 +x0=h0): texp = a+bx0h0/ { }2 20s 1/n + x x) /(xx)( .

    d) Sobre valores pronosticados:

    i)Una prediccin de y en x0: y0 (a+bx0)t { }2 20s 1 1 /n + x x) /(xx)+ ( Cambiando el 1 del interior de la raz por l/m se obtiene un intervalo parala media 0y de m observaciones de y en igual x0.

    ii) Muchas predicciones (intervalo de aceptacin) de y en diversos x:Al error y conteniendo al menos a un 100% de las observaciones

    2

    /2 1 21 / 2

    1 (x x) n 2y (a bx) s 2F (2; n 2) + z

    n (xx) (n 2)

    + +

    con F, z y 2 en Tablas 8, 2 y 7 respectivamente. Cambiando z1 por z1/ m se obtiene el intervalo para la media de m valores de y en igual x.

    iii) Una prediccin del x0 que dio un cierto y0 (calibracin lineal):

    20 00

    b(y y) t s (y y)1x x+ c 1c c n (xx)

    + +

    , con2 22 t sc = b

    (xx)

    Cambiando y0 por 0y y el 1 por l/m, se obtiene un intervalo para el x0 queprodujo la media 0y de m observaciones.

    iv) Muchas predicciones de los valores de x que ocasionaron los valoresde y (calibracin lineal): Al error , conteniendo al menos a un100% de las observaciones, y si b0 (F, z y 2 como en ii)):

    2/2s 2 F (2; n 2)b(y y A) c (y y A)x x+

    c c n (xx) +

    con

    22 /2

    1 21 / 2

    2 F (2; n 2) s n 2c b , A=z s

    (xx) (n 2)

    =

    Cuando b0, cambiar A por A . Si se disponen de medias y de mobservaciones en igual x, cambiar y por y y z1 por z1/ m .

    e)Rechazo de observaciones extremas (H0 La observacin xS debe aceptar-se): De entre todas las parejas (xi; yi), la sospechosa (xS; yS) es aquella quehace mxima la residual yi iy , aunque generalmente se la puede localizara travs de la nube de puntos. Si dS=ySabxS, comparar con una t(f=n3; K=n) de la Tabla 16 la cantidad

    { }2 2 2 2exp S S St = (n 3)d / (n 2)s 1 n (x x) /(xx) d 1/

  • 8/7/2019 resumenes bioestadistica

    34/36

    30

    RESUMEN DEL CAPTULO XI

    CORRELACIN

    11.1 COEFICIENTE DE CORRELACIN LINEAL SIMPLE (O DEPEARSON)

    a) Objetivo: Dadas dos v.a. cuantitativas x e y, se trata de medir la fuerza conque ambas estn ligadas a travs de los resultados (xi; yi), con i =1, 2,..., n,obtenidos en n individuos.

    b) Modelo, tipos de muestreo, clculos intermedios y comprobacin del

    modelo: Como en Resmenes 10.2.a) y b) y10.3.a y d).c)Estimacin: La fuerza con que las dos variables estn ligadas se mide me-diante el coeficiente de correlacin poblacional, el cual se estima (bajo elmuestreo I) por el coeficiente de correlacin muestral r = (xy)/ (xx)(yy).

    d) Propiedades: Lo que sigue es vlido tambin para r:i)es un nmero adimensional que no depende de las unidades de medida

    ni del orden en que se enuncien las variables (xy=yx).ii) 2 es la proporcin de la variabilidad total de y que est explicada por su

    regresin lineal en x.iii)1 +1.iv) El valor absoluto mide la fuerza de relacin entre x e y (a ms

    ms fuerza), en tanto que el signo de indica el tipo de la misma: positi-va si >0 (a ms x ms y), negativa si

  • 8/7/2019 resumenes bioestadistica

    35/36

    CORRELACIN 31

    c) Test de independencia: Comparar2xy z

    exp 2xy z

    (n 3)rt = vs. t (n 3) de la Tabla 6

    1 r

    i

    i

    11.3 COEFICIENTE DE CORRELACIN DE SPEARMANa) Objetivo: Medir la asociacin entre dos variables cuantitativas cualesquiera

    (verifique o no el modelo de regresin lineal).Es un mtodo no paramtrico.b)Condiciones:La asociacin ha de ser monotnica (una variable siempre cre-

    ce o siempre decrece con la otra).c)Estimacin: La fuerza de la asociacin la mide el coeficiente de correlacin

    poblacional (de Spearman) S, el cual se estima (bajo el muestreo I) por elcoeficiente de correlacin muestral rS determinado a travs de los siguientes

    pasos: (1) Obtener una muestra de n parejas de valores (xi; yi); (2) Ordenar demenor a mayor los valores de x y asignarles rangos Ri como en el Resumen7.3.a); (3) Proceder igual con las y asignando rangos iR ; (4) Anotar las pare-jas (Ri; iR ) correspondientes a las (xi; yi) originales, comprobando que Ri = iR = n(n+1)/2; (5) Obtener el coeficiente de correlacin lineal simple paralas n parejas de rangos, es decir, y con igual convenio que en el Resumen10.3.a), Sr = (RR ) / (RR)(R R ). Cuando no hay empates, la frmula sepuede simplificar en la siguiente:

    ( )2

    i iS

    R Rr = 1 6

    (n 1)n(n+1)

    d) Propiedades:Como en el Resumen 11.1.d), pero relativas a los rangos.e) Test de independencia: (H0 S=0 vs. H1 S0): Con cualquier muestreo:

    i) Si n30: Comparar rS con r de la Tabla 22 en el modo all indicado.ii) Si n>30: Comparar zexp = rS n 1 con una z de la Tabla 2.

    11.4 TEST DE INDEPENDENCIA CON VARIABLES MIXTAS (H0 Losvalores que toma un individuo con respecto a una variable cuantitativa xson independientes de la clase a que este pertenece respecto de una cuali-dad C).

    Sea x una variable cuantitativa cualquiera y Cuna cualidad con s clases. Sise toma una muestra de n individuos se obtendrn n parejas de valores (x; C) apartir de las cuales hay que contrastar H0. El mtodo para ello depende del caso:a) Si Ces una cualidad ordinal: Convertir la cualidad en cantidad asignndole

    a sus clases valores cuantitativos arbitrarios y por el mtodo del Resumen 9.6,y aplicar a las parejas (xi; yi) as obtenidas el Resumen 11.1 o el 11.3.

    b)SiCes una cualidad no ordinal:

    i) Si r=2:Comparar los valores medios de x (1 y 2) en las dos clases de Cpor el procedimiento de los Resmenes 7.1.a), 7.2.a) o 7.3.b) segn pro-ceda.

    ii) Si r>2: Comparar los valores medios de x (1, 2, ..., s) en las s clases deCpor el procedimiento del anlisis de la varianza (no contemplado en es-tos Resmenes). Alternativamente, convertir la cantidad x en cualidad(definiendo r intervalos de clase arbitrarios), formar la tabla contingenciars que ello produce y analizarla por la tcnica de 2 del Resumen 9.2(aunque ello conlleva una gran prdida de potencia).

  • 8/7/2019 resumenes bioestadistica

    36/36


Recommended