A Brief Introduction to Epidemiology(Principios de Organización y
presentación de datos epidemiológicos)
Betty C. Jung, RN, MPH, CHES
¿Quién es Betty C. Young?
Revise my sitiso Web:
<A
HREF=“http://home.beseen.com/technology/bcjung/Episites.htm”>
Epidemiology & Biostatistics</A>
<A
HREF=“http://home.beseen.com/technology/bcjung/Health.htm”>
Health Information</A>
<A
HREF=“http://home.beseen.com/technology/bcjung/Phsitea.htm”>
<A
HREF=“http://home.beseen.com/technology/bcjung/Sesites.htm”>
Search Engines</A>
Traducción realizada por Dr. Nicolás Padilla, Facultad de
Enfermería y Obstetricia de Celaya, Universidad de Guanajuato
171.bin
Objetivos de Aprendizaje
Entender los métodos apropiados para la organización y presentación
de datos epidemiológicos
Entender cuando son apropiadas tablas, gráficas y mapas
Entender los errores de presentación inadecuada de datos
Esta conferencia no es de cómo tabular, o hacer gráficas. Es
ayudarles a entender que hay formas correctas e incorrectas de
hacer eso.
Para las mecánicas actuales sobre creación de presentaciones,
revise:
<A
HREF=“http://home.beseen.com/technology/bcjung/Statsites.htm”>
Biostatistics & Statistics Resources on the Net</A>
Libros de texto usados para preparar esta conferencia pueden ser
encontrados en las siguiente bibliografía en mi sitio We:
<UL>
<LI><B><A HREF=
“http://home.beseen.com/technology/bcjung/Stats.htm”>Annotated
Statistics Bibliography
</A></B></LI></LI></UL>
La principal fuente de información es: CDC’s Principles of
Epidemiology Long Distance Learning Course: Methods for
Organization Epidemiologic Data.
172.bin
Objetivos de Ejecucción
Entendimiento básico de la importancia de presentar los hallazgos
en forma entendible
Entendimiento básico de cuáles son los métodos adecuados para la
presentación de datos.
Datos (plural de dato) no son información. Datos por sí mismos son
menos útiles. Datos deberán ser primeros analizados antes de que
puedan ser usados. Análisis de datos están proveyendo, básicamente,
un contexto con el cual observar los datos.
Cuando las personas oyen “datos” tienden a asustarse. Esto se debe,
en general, a que las personas no está cómodas con números. Las
personas se asustan con las matemáticas en cualquiera de sus
formas, desde el álgebra a las estadística. Hay varios libros
acerca del temor a la estadística que pueden ser de utilidad y
están listados en mi sitio Web.<A HREF
=“http://home.beseen.com/technology/bcjung/Stats.htm”>Annotated
Statistics Bibliography</A>
Parte del problema es que aquellos cómodos con las matemáticas
asumen que a todos les gustan las matemáticas, y comparten sus
“enumeraciones” con poca explicación, así intensificando el temor
del público en general.
Esta conferencia busca ayudarles a entender por qué es importante
presentar una forma fácilmente entendible que no nos decepciones
pero que sea verdadera de nuestros hallazgos.
173.bin
Introducción
El propósito primario de organizar y presentar datos es comunicar
información acerca de los datos.
La organización de los datos es esencial para la verificación y
análisis de los datos.
En Salud Pública, los epidemiólogos necesitar pensar acerca de
llegar al público en general debido a que las cosas que estudian
los epidemiólogos nos afectan a todos en una forma u otra.
Una de las mejores formas de llegar al público en general es a
través del uso de cuadros. A todos les gustan los cuadros debido a
que es la forma más fácil de entender.
Al mismo tiempo, sabemos que los cuadros nos pueden defraudar.
Otras veces pueden ser oscuros. Piense en las imágenes en 3-D
escondidas. Todos tienen que ver algo, especialmente si tienen
buene imaginación . Sin embargo, hay sólo una imagen real para ver
a través de los ojos. Muchos encuentran esto entretenido, mientros
que otros lo encuentran frustrante. Sin embargo, estamos procesando
datos en una forma no amenzante y no matemática.
Así, para propósitos de la Epidemiología, debemos pensar en formas
de compartir nuestros hallazgos que sean entendibles, quizá siendo
entrenida, con un mínimo de frustración, y definitivamente no
siendo oscuro ni críptico.
174.bin
Introducción
Datos son parte de observaciones que necesitan ser organizadas para
proveer información.
Los datos pueden ser organizados en:
Tablas
Cartas
Gráficas/Trazos
Mapas
Presentaciones gráficas son como trabajos de arte. Como los
trabajos de arte, lo que ves es la interpretación de las
observaciones de la vida por el artista. Similarmente, cuando los
epidemiólogos presentan sus hallazgos en tablas, gráficas, cartas y
mapas, es su interpretación de lo que ven en los datos (u
observaciones) que ellos han reunido.
Sin embargo, como científicos, los epidemiólogos no pueden tomar
las libertadaes artísticas con sus datos, debido a que sería no
ético hacerlo. A diferencia de los artistas, las contribuciones
científicas al conocimiento están hechas sobre el trabajo de otros,
por los tanto, los científicos deben registrar sus observaciones
sistemáticamente para que otros puedan repetirlo. Nadie puede
repetir el trabajo de Picasso. Pero, de nuevo, Picasso no fue un
científico, sino un artista.
Antes de que la presentación gráfica sea creada, los datos
epidemiológicos deben ser organizados. La mejor forma de organizar
los datos es con el uso de tablas.
175.bin
Cualquier información cuantitativa puede ser organizada en
tablas
Una tabla es un grupo de datos arreglados en renglones y
columnas
La suma de todos los porcentajes será = a 100%
Deberá auto-explicarse
Piense en las tablas en un contexto o una estructura con la cual
organizamos nuestros datos (u observaciones).
Tablas son útiles para demostrar patrones, excepciones, diferencias
y otras relaciones.
Todos en la tabla debe ser etiquetado- renglones, columnas deberán
tener unidades de medición y totales.
Todos los códigos, abreviaturas, símbolos, exclusiones, fuente de
datos, deberán ser explicados en una nota al pié.
Si la tabla es diseñada correctamente, puede hablar por sí misma.
Si la tabla es parte de un reporte deberá tener sentido por sí
misma, aún estando separada el reporte.
Podemos describir los datos en forma narrativa, pero tendríamos que
esperar que la udiencia digiera muchos números y palabras, mientras
que con la tabla los datos son resumidos adecuadamente.
176.bin
Tabla: Formato General 2x2
Una tabla de contingencia es un esqueleto usado para organizar
datos. Como parte del plan de análisis, muestran como los datos
será organizados. Incluya títulos, encabezados y categorías.
Este es un ejemplo de una tabla para dos variables. Statius de
enfermedad (enfermo o sano) generalmente se coloca en la parte
superior ( eje x). Status de exposición va al lado (expuesto, no
expuesto (eje y).
Enfermo
Sano
Total
Expuesto
a
b
H1
( )
Hay otro ejemplo de cómo podemos situar una tabla de contingencia
para reportar datos con más de una variable.
La mayoría de las tablas demográficas, incluyen las variables de
edad, raza y sexo. Una tabla con tres variables deberá ser la
máxima información incluída en una tabla, si queremos que el lector
la entienda.
Y, cuando organices datos en intervalos de clase intente
conservarlo entre 4-8 intervalos. Asegurese que los intervalos sean
naturales o biológicamente significativos y que no se sobrepongan.
Conserve un grupo basal natural como una categoría separada.
Observe como otros investigadores organizan tipos similares de
datos para que podamos realizar comparaciones.
178.bin
Cartas
Cartas son métodos usados para ilustrar información estadística
usando sólo una coordenada.
Cartas son más apropiadas para comparar datos con categorías
discretas.
179.bin
Pastel
Ya que es parte de mi serie “Breve introducción a la Epi” no puedo
cubrir todos los tipos de gráfica en detalle. Yo cubriré las más
populares con más detalle y spolo mencionaré las otras, de
pasada.
Así, de pasada...
Cartas de grupos de barras son usadas para ilustrar tablas de datos
de 2 o 3 variables, especialmente cuando el resultado es una
variabla con sólo dos categorías.
Cartas de barras agrupadas son difíciles de interpretar.
Carts de desviación de barras existen, pero no son comunmente
usadas.
180.bin
Barras
Usada para mostrar la frecuencia de la distribución de una variable
con categorías, discretas no contínuas (sexo, tasa)
Puede ser horizontal o vertical
Variables pueden ser discretas y no continuas (raza, sexo), o son
tratadas como si fueran discretas y no continuas (como grupo de
edad más que intervalos de edad, a lo largo del eje x).
La altura o grosor de la barra es proporcional a la frecuencia del
evento en esa categoría.
Una carta de barras verticales difiere de un histograma en que las
barras están separadas, mientras que en los histogramas, las barras
están adyacentes.
Interrupciones en la escala nunca deben usarse en las cartas de
barras, ya que puede dar lugar a una mal interpretación cuando se
comparan la magnitud de las diferentes categorías.
181.bin
100% Barra de Componentes
Usada para comparar la contribución de diferentes componentes a
cada categoría de la variable principal.
La 100% barra de componentes es una variante de la carta de barras
agrupadas. Para hacerla más fácil de interpretar, se hacen todas
las barras de la misma altura (o anchura) y muestra los
componentes, como porcentajes, del total, más que los valores
actuales.
Este tipo de carta, sin embargo, no es útil para comparar los
tamaños relativos de las varias categorías de la variable principal
(razao etnicidad)
182.bin
Tipos de Cartas:
Carta de Pastel
Utiles para mostrar los componentes de un grupo o de una
variable
El tamaño de las “rebanadas” de un gráfico de pastel representan la
contribución proporcional de cada parte.
El uso de diferentes colores o sombras de cada parte, lo hace más
fácil de diferenciar las diferentes partes.
Porcentajes para cada componentes deben mostrarse para ayudar al
lector a realizar comparaciones,
Es difícil comparar componentes entre 2 o más gráficos de
pastel.
Si queremos comparar componentes de más de un grupo de variables
usemos un 100% barra de componentes.
183.bin
Gráficas
Gráficas muestran datos cuantitativos en forma visual, usando un
sistema de coordenadas
Trazos es otra forma de mostrar visualmente los datos
Sirven como instantáneas estadísticas que nos ayudan a ver modelos,
tendencias, aberraciones, similitudes y diferencias en los
datos.
En Epidemiología, el eje horizontal (eje x) es para la variable
independiente, y el eje vertical (eje y) es para la variable
dependiente.
La variable dependiente es usualmente una medida de frecuencia como
el número de casos o la tasa de enfermedad.
Para esta conferencia, estoy incluyendo técnicas de trazado para
graficado. Trazado puede referirse como mapeo o considerado como
una categoría separada para organizar y mostrar los datos.
Cualquier forma de trazado que utilicemos es para visualizar los
datos.
184.bin
Histogramas
Buenas para el cambio actual del eje y.
Muestra patrones o tendencias de alguna variable (en el tiempo, por
ejemplo)
La razón del eje y al eje x deberá ser de 5:3.
Siempre inicie el eje y en 0.
Determine el rango de valores sobre el eje y identificando el valor
mayor.
Use interrupciones de la escala.
NOTA: Sólo use interrupciones en las gráfica de escala.
186.bin
Buenas para tasas de cambio en el eje y
Distancia igual en el eje y representa igual porcentaje de
cambio
Cada ciclo representa un orden de magnitud mayor que el
inferior.
Calores en cada ciclo son 10x mayores que aquellos en la línea
precedente.
Utiles cuando tenemos que trazar un gran rango de valores en una
gráfica.
Interpretación:
Inclinación de la línea recta - tasa constante (no cantidad) de
aumento de incremento o decremento del valor.
Línez horizontal - sin cambio.
Pendiente de la línea indica tasa de incremento o decremento.
Dos o más líneas paralelas muestran identicas tasas de
cambio.
187.bin
Histograma
Gráfica de la frecuencia de la distribución de una variable
continua
Curva Epidémica - un histograma de los casos de enfermedad durante
un brote epidémico
Aunque el histograma se observa como una gráfica de barras, es
dfierente ya que las barras están adyacentes.
El uso de columnas adyacentes representan el número de
observaciones para cada intervalo de clase en la
distribución.
El área de cada columna es proporcional al número de observaciones
en ese intervalo.
Ya que todos los intervalos de clase son iguales, la altura de cada
columna es proporcional al número de observaciones que
muestra.
188.bin
Gráfica de una frecuencia de la distribución (~ histograma)
Buenos para mostrar y comparar 2 o más distribuciones sobre el
mismo grupo de ejes.
Polígonos de frecuencia son usados para mostrar la distribución de
frecuencias completa (conteo) de una variable continua.
Marca el número de observaciones dentro de un intervalo con un
punto situado a la mitad del intervalo.
Se conectan los puntos medios de cada intervalo con una línea
recta.
189.bin
Frecuencia Acumulada
Trazos acumulados más que la frecuencia actual de cada intervalo de
una variable
Buenas para identificar mediana, cuartiles y otros
percentiles
El eje x registra los intervalos de clase.
El eje y muestra la frecuencia acumulada en una escala absoluta (#
de casos) o como una proporción del 100%.
190.bin
Tipos de Gráficas:
Curvas de Sobrevida
Usadas en estudios de seguimiento para mostrar la proporción de uno
o más grupos aún vivos en diferentes periodos de tiempo
El eje x registra los periodos de tiempo
El eje y muestra los porcentajes (de 0-100%) de quienes están aún
vivos.
La diferencia más imposrtante está en la curvas trazadas.
Estas curvas son acumuladas:
Iniciando en 0 en la extremo izquierdo (parte baja), moviendose
hacia la derecha y arriba, acercándose al 100%
Mientras que sobrevida inicia en el 100% en el extremo izqeuierdo
alto y se mueve hacia abajo a la derecha conforme los miembros del
grupo mueren.
191.bin
Usadas para trazar la relación entre dos variable continuas
Para generar una diagrama de dispersión de puntos debemos tener un
par de valores de cada persona, grupo, u otra entidad en el grupo
de datos, que sean variables continuas.
Por ejemplo, si queremos observar la relación entre estatura y
peso, debemos tener las medidas de peso y estatura de cada persona
en el grupo de datos.
El patrón en general es hecho por los puntos graficados
Interpretación - Patrón compacto, alto grado de correlación
192.bin
Traza una variable contra la otra
Una comparación visual de los puntos de los datos actuales de dos
variables no continuas
Gráficos de puntos son similares a la gráfica de dispersión de
puntos debido a que trazan una variable contra la otra.
Gráficos de puntos difieren de la gráfica de puntos dispersos en
que la variable en el en el eje x no es continua, pero representa
categorías de la enfermedad de una variable no continua.
Puntos en la misma posición son observaciones con los mismos
valores.
193.bin
Diagramas de “caja y líneas”
Diagramas de “caja y líneas” son los gráficos de caja más conocidos
por los investigadores. La “caja” representa el centro (50%) o el
rango intercuartil de los datos. Las “líneas” se extienden del
valor mínimo al máximo de los datos.
194.bin
Sistemas de Información Geográfica
Mapeo es conocido también como cartografía. Esta actividad ha
estado presente por siglos, y se convirtió muy popular a la mitad
del siglo XIX(!!!) cuando exploradores necesitaban herramientas que
les ayudaran a navegar en los mares y en la exploración de
tierras
La salud pública adoptó el uso de mapas en estudiar enfermedades.
Probablemente el “mapa epidemiológico” más famoso fue el de John
Snow, que lo trazó para caracterizar la epidemia de cólera.
195.bin
Utiles para mostrar la distribución geográfica de un evento
No toma en consideración el tamaño de la población en riesgo
Estos mapas son creados situando un punto u otro símbolo en un
sitio geográfico deonde el evento ocurrió o la condición
existe.
Mapas de puntos no muestran el riesgo de el evento ocurriendo en un
sitio en particular (riesgo de un residente de que tenga una
enfermedad particular).
Aún cuando el mapa de puntos puede mostrar un g´ran número de
puntos en un área, no es necesariamente graficar el riesgo de
adquirir la enfermedad, especialmente si esa área está densamente
poblada.
Usar símbolos codificados para indicar la ocurrencia de más de un
evento es de ayuda cuando eventos agrupados ocurren en un
sitio.
196.bin
Pueden ser usadas para mostrar números o tasas
Muestran tasas que pueden ilustrar diferencias en el riesgo de un
evento ocurriendo en diferentes áreas
Estos tipos de mapas son más útiles para estudiar enfermedades.
Sien embargo, requieren más trabajo para crearlos que los mapas de
puntos.
Con mapas de área podemos usar áreas sombreadas o codificadas para
mostrar la incidencia de un evento en sub-áreas o la distribución
de alguna condición en un área geográfica.
Debemos calcular una tasa específica por cada área de la población
en riesgo, luego dividir el número de casos en cada área entre la
población en riesgo en la misma área.
197.bin
Sistemas de Información Geográfica
GIS - “un sistema de computación capaz de reunir, almacenar,
manipular y mostrar información geográfica.” (Encuesta Geológica de
EUA)
GIS - “combina capas de información acerca del sitio para dar un
mejor entendimiento de ese sitio.” (GIS.com)
Gracias a las computadoras no tenemos más que hacer mapas a mano.
Ahora es posible tener mapas creados por la computadora con datos
basados en esos mapas.
Mientras que GIS es usado por muchos diferentes campos de estudio,
la palicación de GIS en salud pública ha sido mayormente usada en
epidemiología ambiental. Por ejemplo, epidemiólogos pueden ver si
hay una relación entre la localización de un sitio de descarga de
desechos peligrosos y la ocurrencia de cáncer.
Si quieres aprender más acerca de GIS y mapeo, revisa my página Web
<A HREF=“Episiteb.htm”>Epidemiology M - Z</A>.
198.bin
GIS está siendo usado en otras áreas de Salud Pública.
Debido a que estos sistemas pueden almacenar grandes cantidades de
datos en bases de datos que pueden ser integrados con programas de
mapeo, ellos tienen la capacidad de proveer información
oportunamente para seguir epidemias, cambios en la población,
efectividad de programas financiados en satisfacer las necesidades
de kas comunidades que sirven.
GIS provee una herramienta adicional a los practicantes de la salud
pública que pueden estudiar enfermedad, planear, implementar y
evaluar programas, asi como seguir tendencias y patrones del cambio
social.
El Censo de EUA será usando GIS para ayudar en re- distritar los
EUA con el censo del 2000. Esto puede tener un impacto en como los
programas de la salud pública serán financiados en el futuro.
199.bin
Referencias
Para recursos de Internet sobre los tópicos cubiertos en esta
conferencia, revise mi sitio Web.
Páginas específicas que pueden ser de interés:
<A
HREF=“http://home.beseen.com/technology/bcjung/Episites.htm”>Epidemiology
Index</A>
<A
HREF=“http://home.beseen.com/technology/bcjung/Practice.htm”>Public
Health Practice</A>
200.bin
Enfermo
Sano
Total
Expuesto
a
b
H1
No
expuesto
c
d
H2
Total
V1
V2
T