Você está na página 1de 8

Captulo 4

Bioestadstica bsica:
conceptos y mtodos
O. Dale Will iams
Mensajes clave
Entender los fundamentos de la epidemiologa requere conocimientos de
boestadstica.
Los cuadros y grficas de buena cal idad son tiles para presentar los
datos.
Los intervalos de confianza son instrumentos de estimacin valiosos.
Pueden utilizarse para hacer pruebas de hiptesis.
Los clculos pueden parecer complejos, pero los conceptos en los que se
basan las pruebas estadsticas suelen ser bastante simples.
Para describir y analizar datos es necesario aplicar los conceptos y los
mtodos de la En la investigacin epidemiolgica a
menudo se usan muestras a partir de las cuales se podrn inferir carac-
tersticas de las poblaciones estudiadas. Este captulo describe algunos
conceptos e instrumentos bsicos, as como los procedimientos para re-
sumir datos.
Actualmente existen muchos cursos y textos de acceso libre en
Internet. En el captulo 11 se dan algunas sugerencias.
Antes de describir los conceptos e instrumentos bsicos, es conve-
niente familiarizarse con los diferentes mtodos de interpretacin y co-
municacin de datos. El objetivo de este captulo es presentar los pro-
cedimientos ms corrientes de descripcin de datos. Se utilizan
ejemplos de otros captulos para ilustrar los principios generales.
Mtodos para resumir y presentar
los datos
Los datos pueden ser variables numricas o categricas .
Las variables numricas pueden ser recuentos, como el nmero
de nios de una edad determinada, o mediciones, como la altura
yel peso.
Las variables categricas son el resultado de una clasificacin.
Por ejemplo, los individuos pueden clasifi carse en categoras
.:
i'
,1
11' 1
segn su grupo sanguneo: A, B, O Y AB. Los datos ordinales
-que expresan rangos- son un tipo de datos categricos.
Para describir datos pueden utilizarse cuadros y grficas. Estadsticas
descriptivas son las medias,la mediana,los rangos, la desviacin estn-
dar, el error estndar y la varianza. Ms adelante se explicarn estas
estadsticas, junto con las sugerencias y precauciones para su uso
adecuado.
Cuadros y grficas
Los cuadros (o "tablas") y las grficas (o grficos, diagramas, mapas,
etc.) son importantes para describir y presentar los datos, pero a me-
nudo tienen d"fectos que perjudican que se logre su objetivo: que los
datos se comprendan rpida y fcilmente. Cada
Recuadro 4.1. Ventajas de los grficos sobre
cuadro o grfica debe contener suficiente infor-
macin para que los datos puedan ser interpre-
tados sin necesidad de remitirse al texto.
los cuadros o tablas numricos
Las ventajas de los grficos son:
la simplicidad y claridad
la presentacin de imgenes que pueden
quedarse en la memoria
la posibilidad de representacin de relacio-
nes complejas.
Los grficos hacen resaltar los valores numricos
y tienen aceptacin del pblico, como muestra su
liSO creciente en revistas y peridicos, en los que
raramente se ven cuadros numricos.
Las ventajas de las tablas son:
la posibilidad de presentacin de datos ms
complejos con precisin y fl exibilidad
la facilidad de elaboracin sin medios tcni-
cos especiales
el uso de menos espacio para presentar una
informacin dada.
El ttulo o encabezamiento es esencial para
que un cuadro o una grfica sea til. Debe descri-
bir claramente los valores numricos indicados
en las filas y columnas de un cuadro o represen-
tados en una grfica. En un cuadro, el ttulo debe
indicar claramente qu representan los valores
numricos,las filas y columnas deben estar clara-
mente definidas y debe constar la fuente de los
datos. Un problema frecuente es que el ttulo
enuncia la finalidad del cuadro o la grfica en vez
de describir su contenido.
Los epidemilogos deben decidir a menudo
cmo presentar los datos y optar por un cuadro o
una grfica. Si bien estos dos medios tienen ca-
ractersticas comunes, en algunos casos, uno
puede ser ms adecuado que el otro (vase el
recuadro 4.1).
Hay muchos tipos de grficas. A continuacin se describen algunos
de los ms corrientes, junto con algunas recomendaciones para su uso.
Diagramas de sectores circulares y diagramas de
componentes en barras
Los diagramas de sectores circulares o diagramas circulares (figura 7.1)
y los diagramas de componentes en bandas (figura 6.2) sirven para
mostrar la divisin de un todo en partes. Los diagramas de sectores cir-
culares representan el todo mediante un crculo dividido en sectores
-
'. '. L, _' Bioestadistica bsica conceptos y mtodos 83
correspondientes a los diferentes componentes; en los diagramas de
bandas cada segmento se divide en sectores o "bandas", En los diagra-
mas circnlares puede ser conveniente disponer los sectores en orden
segn su tamao, comenzando en la posicin correspondiente a las 12
y en el sentido de las agujas del reloj, En general, para comparar cmo
se dividen en sus componentes dos o ms entidades completas, los dia-
gramas de componentes en bandas son preferibles a una serie de dia-
gramas de sectores circulares,
e)
Mapas de casos y mapas de tasas
Los mapas de casos y los mapas de tasas muestran la distribucin geo-
grfica de los casos o tasas, John Snow utiliz un mapa de casos para
mostrar cmo se distribuan los casos de clera en Londres con res-
pecto a la famosa bomba de suministro de agua (figura 4,1). En los
mapas de tasas las reas geogrficas se sombrean segn los valores de
la variable representada; estos mapas se utilizan a menudo para mos-
trar tasas de prevalencia, incidencia o mortalidad. Las reas con tasas
mayores se suelen sombrear ms intensamente o con colores ms bri-
llantes (figura 4,2),
Pueden utilizarse mapas, diagramas y atlas para presentar datos de
manera esttica - como el atlas de salud mental, el atlas de tabaquismo
Figura 4. 1. Muertes por clera en el centro de Londres, septiembre de 1854
6
,7

50 50 100 150 200
\
Figure 4.2, Mortalidad de menores de 5 aos por 1000 nacidos vivos en los pases
afri canos, 2000
8
;
Burkina
Costa de Marfil
Msde 175 D 11-25
101-175 10 o menos
O 26-100 O sin dalOS
BOlswana
Yemen
o Seychelle-s
el D Mauricio
Reunin
yel atlas de cncer de la OMS- o interactiva (vase el recuadro 4.2),
pero esto no se discutir en este captulo. Un ejemplo excelente sobre
cmo usar mapas interactivos es la presentacin basada en los datos
del Informe sobre Desarrollo Humano del Programa de las Naciones
Unidas para el Desarrollo, disponible gratuitamente en http: //hdr.
undp.orgj statisticsj datajanimation.cfm.
Diagramas de barras
Los diagramas de barras son los grficos ms adecuados para presen-
tar valores absolutos o porcentajes que comparan dos o ms categoras
de datos, por ejemplo la proporcin de fumadores en varones y muje-
res. La comparacin se basa en la longitud de las barras, por lo tanto,
se recomienda evitar cualquier alteracin o distorsin de esta magni-
tud, por ejemplo, los cortes de escala (vase el recuadro 4.3).
Si las barras son horizontales (figura 2.3), en lugar de verticales (fi-
gura 3-4), se dispondr probablemente de espacio suficiente para in-
cluir rtulos claros para las diferentes categoras. En algunos casos,
tambin puede ser til ordenar las barras segn su longitud.
. BlOestadstlCa bsica. conceptos y mtodos 85
Recuadro 4.2. La salud en el mundo: mapas y grficas
Pginas de Internet como http: ((www.gapmindeLorg( o http: (fhdr.undp.org(
hdr2.oo6jstatistics/ muestran grficas y mapas fnteractivos sobre la evolucin
de la salud en el mundo. Estos grficos, que muestran diversas estadsticas, se
han desarrollado para facilitar el uso de estos datos y promover los esfuerzos de
sensibilizacin y la elaboracin de hiptesis. Los grficos muestran las tenden-
cias temporales de manera dinmica, como en un videojuego. Los grficos y
mapas sobre la salud en el mundo pueden ayudar a responder:
cmo se relacionan histricamente la riqueza y la salud
cmo ha evolucionado la salud en el mundo en los ltimos 50-100 aos
cmo han evolucionado las diferencias sanitarias entre los pases
Grficas de lnea
Las grficas de lnea (figura 6.1) son las ms adecuadas para mostrar la
variacin de una variable continua, que habitualmente se representa en
el eje vertical. Por ejemplo, puede representarse la concentracin srica
de colesterol en el eje vertical en funcin del tiempo, representado en el
eje horizontal. Cuando se lee una grfica de lnea es importante verifi-
car la escala del eje vertical. Si se utiliza una escala logaritmica, debe te-
nerse en cuenta que lo que se represent a son proporciones de variacin
en vez de valores absolutos. En las grficas de lnea los orgenes num-
ricos de ambos ejes se eligen segn convenga (no tienen por qu ser
cero) y tambin pueden utilizarse cortes de la escala del eje vertical,
siempre y cuando se indiquen claramente.
Distribuciones de frecuencia e histogramas
En una distribucin de frecuencias un conjunto de datos se organiza en
intervalos contiguos mutuamente exclusivos, de modo que se vea clara-
mente el nmero o la proporcin de observaciones que caen en cada in-
tervalo. A menudo la distribucin de frecuencias se presenta grficamente
en un histograma, que es un diagrama de barras en el que todas las barras
estn ordenadas sin espacios intennedios, o me-
diante un polgono de frecuencias (figura 6.7). La
altura de las barras representa el nmero o el por-
centaj e de observaciones dentro de cada intervalo.
El patrn general de esta grfica puede proporcio-
nar una informacin valiosa. Tambin se utilizan
mucho los polgonos de frecuencia, que se obtie-
nen trazando una lnea que une los puntos medios
de los extremos de las barras del histograma. La
curva en forma de campana de la distribucin nor-
mal es un ejemplo tpico (figura 4.3).
Recuadro 4.3. Advertencia de precaucin
Aunque los cortes de escala no son convenientes,
es frecuente emplearlos de varias maneras. A
veces se utilizan para exagerar deliberadamente
una relacin, lo que puede ser evidente solo des-
pus de un anlisis cuidadoso del eje vertical.
Cuando se lee UI) grfi co, hay que observar dete-
nidamente el eje vertical para verificar que se ha
comprendido la escala utilizada y que no hay cor-
tes de escala implcitos.
Figura 4.3. Curva de distribucin norma
68%
95%
-1,96 DE -1 DE media +1 DE +1,96 DE ,
Distribucin normal
La distribucin normal tiene caractersticas extraordinariamente ti-
les. Si las observaciones siguen una distribucin normal se pueden uti-
lizar muchas pruebas estadsticas. Es til saber que aproximadamente
dos terceras partes de las observaciones que siguen una distribucin
normal difieren en menos de una desviacin estndar de la media; y
cerca del 95% estn a menos de dos desviaciones estndar de la media.
Estadsticas descri ptivas *
Promedios o medidas de tendencia central o
centralizacin: media, mediana y moda
Los promedios (o medidas de centralizacin, o de tendencia central)
son un grupo de estadsticas descriptivas que captan la tendencia cen-
tral de una distribucin, caracterizando "el centro" de una muestra de
observaciones.
Media
Es la medida estadstica ms importante y a menudo la ms ade-
cuada. La media muestral de una variable x (por ejemplo, el peso cor-
*En castellano se utilizan los trminos estadstica y'estadstico para indicar valores nu-
mricos computados a partir de los datos de una muestra, Aqu se usar estadstica para
valores descriptivos habituales como la media o la mediana, mientras que estadistico se
usar para valores ms especficos como la t o la F utilizados en pruebas de hiptesis.
para!) , en una muestra de n valores se calcula mediante la siguiente
frmula:'
Mediana
" x.
media=x = ---.!...
;"' 1 n
La mediana se define como es el centro de la distribucin una vez orde-
nadas todas las observaciones segn su valor. La mediana resulta til
sobre todo cuando unos pocos valores son mucho mayores' que los
dems. Por esta razn, en las estadsticas de ingreso personal suele no-
tificarse la mediana de ingreso en vez del ingreso medio, ya que la me-
diana no resulta excesivamente afectada por los ingresos muy altos de
unos pocos miembros de la muestra. Ntese sin embargo que el ingreso
nacional a menudo se notifica a veces como ingreso per cpita, valor
que puede ser muy diferente de la mediana de ingreso, que corresponde
al centro de la distribucin de los ingresos individuales, la mayor parte
de los cuales representan probablemente el ingreso que sustenta a una
familia entera, mientras que el ingreso per cpita es la media de los in-
gresos de todos los habitantes del pas.
Moda
Otra estadstica importante es la moda, que es el valor ms frecuente en
una muestra de observaciones.
Medidas de dispersin: varianza, desviacin estndar y
error estndar
Las medidas de variabilidad o dispersin constituyen otro grupo de es-
tadsticas descriptivas. Las tres ms tiles son:
la varianza,
la desviacin estndar,
el error estndar.
Todas ellas indican en qu medida cada observacin difiere de las
dems en una muestra de observaciones. Estas medidas de variabilidad
pueden calcularse considerando:
las diferencia entre todos los posibles pares de observaciones, o
tEs decir, se suman (la letra griega mayscula sigma indica sumatorio ) todos los va-
lores de la variable x desde el primer valor (x) hasta el ltimo (x
n
), y se divide eJ total por
el nmero de datos (n). El smbolo x se lee x barra o (X medi a y corresponde a la
media aritmtica, que es la ms utilizada. Hay tambin otras medias (la media geom-
trica, la armnica, la media ponderada, etc.) que se calculan con otras frmulas.
*0 menores.
,
I
!
11
1,'
I
11
11:
, '
ti
,
11
I

la diferencia elevada al cuadrado entre cada observacin y la
media de' la muestra, o sea (Xi - x)2.
Estos clculos son interesantes pero engorrosos. Para calcular la va-
rianza muestral a menudo se utiliza un equivalente algebraico, cuya
frmula, una vez eliminados los subndices para simplificar, es la
siguiente:
s'
n-l
El numerador de la ecuacin anterior
se denomina a menudo suma de las desviaciones cuadrticas, o simple-
mente, suma de cuadrados, SC(x).
Ntese que la varianza es casi lo mismo que la media de los cuadra-
dos de las desviaciones. La desviacin estndar es simplemente la raz
cuadrada de la varianza: s .[52. El error estndar de la media viene
dado por la frmula siguiente:
EE s, si .;;
El error estndar de la media indica en qu medida podran ser diferen-
tes entre s todas las medias posibles de muestras de tamao n si cada
una fuera seleccionada aleatoriamente a partir de la misma poblacin,
como la muestra inicial.
Inferencia estadstica:
conceptos bsicos
El uso de una muestra para inferir acerca de una poblacin es tal vez el
aspecto ms importante de la investigacin epidemiolgica. El funda-
mento conceptual de la inferencia estadstica reside en el estudio de una
muestra aleatoria simple de una poblacin, de un tamao especfico,
para realizar estimaciones sobre la totalidad de la poblacin. N ormal-
mente, estas estimaciones se basan en medias, varianzas u otras estads-
ticas descriptivas. Las estadsticas descriptivas de una poblacin se de-
nominan parmetros y se representan por letras griegas como:
fl media,
(J desviacin estndar y
coeficiente de regresin.

Você também pode gostar