Você está na página 1de 124

Conceptos Bsicos en Estadstica

Qu es la Estadstica?

Qu es la Estadstica?

El trmino estadstica es muy utilizado en nuestros tiempos.

Lo podemos encontrar en:

Diarios Revistas Radio Televisin Etc.

Accidentes de trfico ndices de crecimiento de poblacin Turismo Tendencias polticas Etc.

Podemos decir que:

La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

O en palabras ms sencillas:

Conjunto de tcnicas que, partiendo de la observacin de fenmenos, permiten al investigador obtener conclusiones tiles sobre ellos
En general se ocupa de fenmenos observables.

Segn el estadstico Carrasco de la Pea:

La Bioestadstica ensea y ayuda a investigar en todas las reas de las ciencias de la vida donde la variabilidad no es la excepcin sino la regla.

Ms definiciones:

Es una ciencia:

Descriptiva: Recoleccin, anlisis y presentacin de datos. Inferencial: Hacer previsiones y as poder tomar decisiones u obtener conclusiones. Deducir leyes a partir de la descripcin de datos.

Algo de historia

Statistik: Fue el trmino alemn inicial introducido por Gottfried Achenwal. (1749)

Algo de historia

Su origen proviene del latn statisticum collegium (Consejo de Estado), siendo la forma en que el gobierno se informaba sobre: poblacin, produccin agrcola o ganadera entre otros.
Pero su uso es ms antiguo, encontrando registros en civilizaciones antiguas tales como:

Algo de historia

Algo de historia

Algo de historia
En el s.XIX la enfermera inglesa Florence Nigthtingale desarroll los primeras aplicaciones de estadstica en la atencin mdica.

Conceptos Bsicos de Estadstica


Recibimos informacin en forma permanente en el rea en que trabajamos Esta informacin es til para el desarrollo del trabajo

Procesamiento ADECUADO

Procesamiento INADECUADO

CONCLUSIONES CERTERAS Informacin Suficiente Informacin Buena Procesamiento Correcto

MALAS DECISIONES

Estadstica Descriptiva

La estadstica descriptiva comprende las tcnicas que se emplean para resumir y describir datos numricos. Son sencillas desde el punto de vista matemtico y su anlisis se limita a los datos coleccionados. El estudio de los datos se realiza con representaciones grficas, tablas, medidas de posicin y dispersin.

Estadstica Inferencial

El problema crucial de la estadstica inferencial es llegar a proposiciones acerca de la poblacin a partir de la observacin efectuada en muestras bajo condiciones de incertidumbre. sta comprende las tcnicas que aplicadas en una muestra sometida a observacin, permiten la toma de decisiones sobre una poblacin o proceso estadstico.

Poblacin o Universo

Es el conjunto sobre el que estamos interesados en obtener conclusiones.

Conjunto de todos los elementos que presentan una caracterstica comn determinada, observable y medible.

Muestra

Es un subconjunto de la poblacin al que tenemos acceso, y sobre el que realmente hacemos las observaciones o mediciones, ya que la poblacin normalmente suele ser demasiado grande para poder abarcarla completamente.

Muestra

Debe ser Representativa. Est formada por miembros seleccionados de la poblacin. Estos miembros reciben el nombre de individuos o unidades experimentales.

RECOLECCION DE DATOS

Cuando el investigador planifica la recoleccin de datos, se hace tres preguntas bsicas: QU RECOLECTAR? DNDE RECOLECTAR? CMO RECOLECTAR?

QU RECOLECTAR?

Esta pregunta lleva al investigador a planificar el tipo de informacin que requiere para cumplir con los objetivos de su estudio.

Tal informacin provendr de aspectos de las unidades que es necesario estudiar. Estos aspectos son conocidos como variables.

Ejemplo

En un estudio que pretende describir a los pacientes hospitalizados, aspectos de inters pueden ser: gnero, edad, procedencia, diagnstico, peso, entre otros, los que pueden variar en la forma de presentarse en esos pacientes. Por tanto, preferimos llamarlos variables.

DATOS
Cada variable se manifiesta, se expresa en una unidad estudiada, mediante uno o ms modos, que se conocen mas bien como datos. Ejemplos: Son variables: Patologa crnica: diabetes, HTA, epilepsia, otro. Severidad: leve, mediana, severa. Paridad: 0,1,2,3, ms de 3. Peso:70,5,67,2,70,8, etc.

TIPOLOGIA DE VARIABLES
Una tipologa simple y de gran utilidad para la aplicacin estadstica y computacional, referida a los datos con que se espera que se expresen las variables, es la que distingue: Variables CUALITATIVAS

Variables CUANTITATIVAS

Continua
Cuantitativa Discreta Nominal Cualitativa Ordinal Dicotmica

Variable

VARIABLES CUALITATIVAS
Son las que generan datos referidos a cualidades o atributos de las unidades en estudio. Ejemplo: Patologa crnica, expresada con datos como: diabetes, HTA, epilepsia, otra Severidad, expresada con datos: leve, mediana, severa.

Tipologa de las variables cualitativas.


Distingue entre:
NOMINALES. Si sus datos se diferencian entre s. Ejemplo: Patologa, con datos como: diabetes, epilepsia, HTA
ORDINALES. Si sus datos se ubican en un gradiente. Ejemplo: Severidad, con datos: leve, mediana, severa DICOTMICAS. Si se expresa mediante dos datos, generalmente complementarios. Ejemplo: Gnero: masculino, femenino; Fumador: s, no; HTA: presente, ausente.

DEFINICION DE UNA VARIABLE CUALITATIVA

Siempre es necesario definir una variable cualitativa en forma clara, mediante los datos que se espera recolectar con ella. As dejar clara su validez frente a los objetivos y tambin su alcance descriptivo. Ejemplo: si Patologa crnica se define con datos: Diabetes, HTA, epilepsia, otro.

Significar que al investigador no le interesaron otras patologas crnicas


Habra que ver, adems, si con esos datos bastara para cumplir los objetivos fijados.

VARIABLES CUANTITATIVAS

Son las que se manifiestan mediante datos valricos que se obtienen como resultado de algn procedimiento de cuantificacin o de medicin. Ejemplo: N de episodios: con datos como 0, 1, 2, etc. que resultan de la cuantificacin de episodios; Peso (en Kg): con datos como 65, 2, 70, 5, 80, 0 etc., que se obtienen como resultado de pesar a la unidad con un instrumento apropiado. Los nmeros usados como cdigos, no califican como datos de una variable cuantitativa sino de una cualitativa.

Tipologa de variables cuantitativas


Distingue entre:

DISCRETAS. Si sus datos son nmeros que corresponden al grupo


de los enteros, generalmente obtenidos de algn conteo. Ejemplo: N de Episodios: 0, 1, 2, 3, ; Edad (en aos cumplidos): 25, 30 25, 32,

CONTINUAS. Si sus datos son nmeros que corresponden al grupo

de los reales, que resultan del uso de algn procedimiento de medicin. Ejemplo: Peso ; Edad; ambas abiertas a todo dato posible (incluyendo decimales).

Capacidad discriminativa vs dificultad de medir.


Desde la variable nominal a la continua aumenta la capacidad discriminativa de la variable, pero en esa misma direccin aumenta la dificultad de medicin. Ejemplo. La estatura puede ser definida como Alta, media y baja. As es una variable ordinal, que discrimina solo en un gradiente de 3 niveles. La recolecta de datos se podr hacer mediante una apreciacin visual. La misma variable puede ser definida sin restricciones, indicando solo la unidad de medida. As, es una variable continua, que discrimina en un gradiente ms fino. La recolecta deber usar un instrumento de medicin adecuado (por ejemplo huincha de medir).

Cambio al nivel de discriminacin.

Una vez recolectados los datos de una variable: - Ellos no pueden ser cambiados a un nivel de discriminacin mayor.
Ejemplo: Si los datos de estatura, son recolectados a 3 niveles (como ordinal), post recoleccin no podrn llevarse a una forma continua ni cambiarse esos niveles, salvo combinaciones entre ellos.

- Pero s pueden ser cambiados a un nivel de discriminacin menor.


Ejemplo: Si la estatura fue recolectada como continua, post recoleccin sus datos podrn rebajarse a los niveles que se desee.

CODIGOS Y CODIFICADOR

CODIGOS. Son abreviaturas alfanumricas de los datos de una variable, que permiten un manejo ms seguro de estos. Generalmente se usan nmeros como cdigos. El conjunto de cdigos de todas las variables de un estudio, se llama CODIFICADOR. Este ayuda a definir las variables.

EJEMPLO DE CODIFICADOR
PARTE DEL CODIFICADOR DE UNA ENCUESTA A UNA COMUNIDAD.

Sexo: m. masculino f. femenino Estado de pareja (solo mayores de 15 aos): 1.Sin pareja estable 2.Con pareja estable 3. Ignorado Alfabetismo (solo mayores de 12 aos): 1.No lee ni escribe 2.Solo lee 3.Solo escribe 4.Lee y escribe Escolaridad (solo mayores de 8 aos): 1.Sin escolaridad 2.Bsica Incompleta 3.Bsica Completa 4.Media Incompleta 5.Media Completa 6.Superior 7.Especial.

BASE DE DATOS
Es una planilla o matriz en que se presentan ordenados los datos recolectados para las variables estudiadas. En esta planilla:

las columnas representan a las variables y reciben el nombre de campos

las filas representan a las unidades que proporcionaron los datos y reciben el nombre de registros.

Ejemplo. Base de datos (parcial) de un estudio de pacientes.

NUM

SEXO

EDAD 23 18 21

PESO 72 62 67

TALLA 1,72 1,6 1,62

IMC 24,34 24,22 25,53

1 M 2 F 3 F

4 M
5 F

22
39

70
62

1,7
1,58

24,22
24,84

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin.

Los fumadores tienen ms bajas laborales que los no fumadores. En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger:

Qu individuos pertenecen al estudio (muestra)


Fumadores y no fumadores en edad laboral Criterios de exclusin. Cmo se eligen? Descartamos los que padecen enfermedad crnica?

Pasos en un estudio estadstico

Qu datos recoger de los mismos (variables)


Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?

Recoger los datos (muestreo) Describir los datos obtenidos

Tiempo medio de baja en fumadores y no fumadores % de bajas por fumadores y sexo, grficos.

Pasos en un estudio estadstico

Realizar una inferencia sobre la poblacin.

Los fumadores estn de baja al menos 10 das/ao ms de baja que los no fumadores.

Cuantificar la confianza en la inferencia

Nivel de confianza del 95%.

Bioestadstica y Mtodo Cientfico


Conocimiento Problema Hiptesis Deduccin de consecuencias verificables Diseo de investigacin 1. 2. 3. 4. 5. Mtodo Estadstico: Recoleccin Recuento Presentacin Sntesis Anlisis Conocimiento

DONDE RECOLECTAR DATOS?

Los datos acerca de variables de inters en una investigacin, son provedos por unidades emisoras de informacin, que constituyen las fuentes de datos. Estas unidades pueden ser:
Unidades en estudio Unidades informantes

UNIDAD EN ESTUDIO
Es la unidad que es necesario estudiar para cumplir los objetivos de la investigacin.

Puede ser una persona, otro organismo, un objeto, una situacin o un hecho.

UNIDAD INFORMANTE
Es la unidad que proveer los datos acerca de la unidad en estudio. En muchos casos es la misma que la unidad en estudio. Ejemplo: En un estudio nutricional en el menor de 1 ao, el nio es unidad de estudio, pero a la vez es unidad informante porque provee datos acerca de si mismo. Su madre y quien controla al menor, no es unidad en estudio, pero s es informante, en cuanto provee otra informacin acerca del nio.

UNIVERSO
Es el conjunto de unidades informantes ubicadas en un espacio y tiempo. Constituyen el blanco del estudio por cuanto proveern informacin acerca de las unidades de inters. Debe ser claramente definido, pues servir de marco referencial a los resultados que se obtengan posteriormente, ser la agrupacin real a la que se atribuirn los resultados del anlisis de datos.

Ejemplo Para la caracterizacin nutricional del lactante bajo control en un Consultorio de APS, la unidad en estudio es el lactante, que a la vez es informante. Pero, adems, su cuidadora puede ser unidad informante. Entonces, una definicin adecuada sera: Lactantes bajo control de sano que se atienden en Consultorios de APS de la V Regin y sus cuidadoras, durante el ao 2006.

Otro ejemplo

Para estudiar reacciones adversas a medicamentos en paciente hospitalizado, la unidad en estudio y a la vez informante, es el paciente. Entonces el universo puede definirse como:

Pacientes hospitalizados en los hospitales pblicos de Valparaso y Via del Mar, durante el primer semestre del 2006.

CRITERIOS DE INCLUSION Y DE EXCLUSION

Son restricciones que a veces deben cumplir las unidades del universo, referentes a caractersticas ms especficas de estas, que deben agregarse como parte de la definicin de universo. Como su nombre lo sugiere, se puede hablar de quienes se incluyen en el estudio o bien, de quienes se excluyen. No debieran presentarse como criterios complementarios. Tampoco es necesario que haya de los dos tipos en el mismo estudio.

Ejemplo

Para estudiar la reaccin adversa hospitalizados, se puede usar como:

medicamentos

en

- criterio de inclusin: se incluyen los que hayan recibido


medicamentos por lo menos durante un perodo D, despus del ingreso a hospitalizacin.

- criterio de exclusin: se excluyen los que hayan recibido


medicamentos por un perodo de tiempo A, previo a la hospitalizacin No debieran usarse en forma complementaria. Por ejemplo, para el criterio de inclusin anterior, agregar como de exclusin: no haber recibido medicamentos al menos por un perodo D, despus de la hospitalizacin.

CENSO
Es la accin que considera a todas las unidades del universo, para proveer la informacin que se necesita en la realizacin de un estudio. Un censo por lo general provee valores verdaderos de los indicadores que se pretende estudiar en el universo.

MUESTREO
Es la accin que considera solo algunas unidades del universo, para proveer la informacin necesaria a la realizacin del estudio. A este grupo de unidades se le conoce como muestra del universo. Un muestreo proporciona solo estimaciones de los valores verdaderos de los indicadores que se estudian.

Para que una muestra proporcione buenas estimaciones de los valores verdaderos de los indicadores, debe ser altamente representativa del universo del que se obtenga.

REPRESENTATIVIDAD
Las caractersticas en estudio, se presentan en el universo con cierta Variedad y Proporcionalidad. La cuota de esa variedad y proporcionalidad que vaya en la muestra, constituye su representatividad.

VARIEDAD
Es la diversidad de caractersticas, que tienen las unidades del universo, que son consideradas de inters para el estudio. Ejemplo: En un estudio de morbilidad sobre personas de 20 a 50 aos, se debiera capturar en la muestra, similar variedad de edades a la del universo pero, adems, similar variedad de niveles socioeconmicos y de gneros de esas personas, pues se sabe que la morbilidad, tambin depende del nivel socioeconmico y gnero que ellas posean.

PROPORCIONALIDAD
Se refiere a las proporciones en que se encuentran las caractersticas de inters en las unidades del universo.
Por ejemplo, en el estudio de morbilidad, se debiera capturar en la muestra similar distribucin porcentual por edad, por gnero y por nivel socioeconmico que la presentada en el universo.

Para cautelar una alta representatividad, se suelen usar de manera combinada dos procedimientos: Azar en la seleccin de unidades y Diseos de muestreo.

AZAR EN LA SELECCION

Es un procedimiento de seleccin de unidades que descarta cualquier direccionamiento intencional en la eleccin de estas, por parte del seleccionador o de la unidad informante.
De este modo, se cautelar que todas las unidades del universo tengan una probabilidad distinta de 0, al momento de ejecutarse la seleccin.

Importancia del azar

El azar, por s solo, permite lograr una cuota de representatividad basada en probabilidades. Por eso, validar ms adelante el uso de probabilidades, en el anlisis estadstico de los datos.

DISEO DE MUESTREO.
Es un procedimiento planeado de seleccin de unidades, que eleva la representatividad. Sin embargo el uso de un diseo, puede aumentar las dificultades, el tiempo y el costo del muestreo.

Los tres diseos ms conocidos son: - Muestreo al azar simple. - Muestreo al azar estratificado proporcional - Muestreo al azar por conglomerados

MUESTREO AL AZAR SIMPLE (MAS)

Consiste en seleccionar al azar las unidades, desde un listado nico de unidades del universo. Se necesita que en este listado las unidades se encuentren numeradas, entre 1 y N, para elegir de all los n nmeros al azar que constituirn la muestra. En este diseo, solo el azar cautelar la representatividad.

Ejemplos de MAS

Seleccionar al azar 5 Consultorios, de la lista numerada de N Consultorios de la V Regin. Seleccionar al azar 4 viviendas, de la lista numerada de viviendas de una manzana. Seleccionar al azar 1 hogar, de entre los N hogares numerados de una vivienda. Seleccionar al azar 30 personas, de la lista numerada de N hospitalizados de cierto hospital.

MUESTREO AL AZAR ESTRATIFICADO PROPORCIONAL (MAEP)

Si las N unidades del universo han sido ordenadas en G grupos llamados estratos (*), de tamao Ni cada uno, siendo N=Ni (entre 1 y G), este muestreo consiste en: - Elegir al azar ni unidades de entre las Ni de cada estrato, en proporcin pi=Ni /N, de tal modo que la muestra total n sea =ni (entre 1 y G) y cada submuestra ni sea =npi

Para este muestreo no sirve un listado total, se necesita un listado separado de las Ni unidades de cada estrato, lo que implica una dificultad adicional.
(*) Cada Estrato deber ser un grupo de unidades similares entre s en algunas variables de inters, tal que, la mayor variabilidad de ellas entre unidades, se encuentre entre y no dentro de estratos.

Variable objeto y variable ndice

Variable objeto, es la que se pretende estudiar Variable ndice, es la que, estando fuertemente asociada a la objeto, es de fcil observacin.
Ejemplo: Para estudiar nivel socioeconmico (variable objeto) una variable ndice puede ser el tipo de vivienda pues es de fcil visualizacin en una visita a terreno y se encuentra fuertemente asociada al nivel socioeconmico.

En un MAEP, si no se puede o es muy difcil estratificar por la variable objeto, se puede estratificar por una o mas variables ndice, las que puedan arrastrar consigo a la variable objeto. Ejemplo: Al hacer estratos por tipo de vivienda, se habrn generado a la vez estratos por nivel socioeconmico, pues el tipo de vivienda arrastrar consigo al nivel socioeconmico.

Ejemplos de MAEP

1. En un estudio acerca de resolutividad de la Atencin Primaria en Chile, se hacen 3 estratos de Consultorios refirindose cada uno solo a un nivel de gestin, entre bien gestionados, regular y mal gestionados. Luego se seleccionan al azar ni Consultorios desde cada estrato, en proporcin al tamao de este en el universo de consultorios del pas y se suman, constituyendo la muestra estratificada de consultorios.

MUESTREO AL AZAR POR CONGLOMERADOS (MAC)

Si las N unidades del universo han sido ordenadas en G grupos llamados conglomerados (*), de tamao aproximado k=N/G cada uno, siendo N=k (entre 1 y G), este muestreo consiste en:

- Seleccionar al azar g conglomerados desde el universo.


Se necesita listado numerado de los G conglomerados

(*) Conglomerado: es un grupo de unidades con alta variabilidad interna respecto a la variable objeto, tal que esa variabilidad sea similar a la del universo mismo. A diferencia de un estrato, la variabilidad de la variable objeto deber encontrarse dentro y no entre conglomerados.

Ejemplos de MAC

1. Para el estudio de la resolutividad, se hacen 20 conglomerados de tamao similar con los CAP del pas, cautelando que en cada conglomerado haya CAP con todos los niveles de gestin y en iguales proporciones que en el universo. Luego se seleccionan al azar 4 de esos 20 conglomerados, que constituirn la muestra conglomerada de consultorios.

SELECCIN SISTEMATICA

Es un procedimiento de seleccin de unidades que se aplica a una serie de estas, dispuesta en forma secuencial, para cualquier diseo de muestreo que se est aplicando. Para proceder:
1 Se determina cada cuntas unidades debe ser seleccionada una, mediante: K=N/n 2 Se selecciona la primera unidad, entre 1 y k y las restantes se van seleccionando a lo largo de la serie, sumando k, a la posicin de la anteriormente elegida. Si la primera unidad fuese seleccionada al azar, su posicin en la serie es llamada comienzo aleatorio y toda la muestra resultante se considera seleccionada al azar.

Ejemplo

Desde un fichero de N=200 fichas familiares, se desea seleccionar n=20 por MAS, usando seleccin sistemtica.
1 Se determina cada cuntas se debe seleccionar una: k = 200 / 20 = 10

2 Se elige al azar un numero entre 1 y 10, resultando elegido el 4. Este es el comienzo aleatorio. Entonces la posicin de la primera ficha a seleccionar en el fichero, es la 4 y las restantes fichas estarn sucesivamente en las posiciones: 14, 24, 34, etc. hasta la ultima que ser la 194.

CLASIFICACION DE DATOS

ESCALAS DE CLASIFICACION.

Para variable cualitativa: Sus niveles son categoras (generalmente las mismas usadas para definirla). Ejemplo: Tipo de pareja, con niveles: No tiene, Inestable, Estable Para variable discreta: Sus niveles son nmeros enteros. Ejemplo: Paridad, con niveles: 0, 1, 2, 3, ms de 3 Para variable continua: Sus niveles son intervalos de valores. Ejemplo: Peso (Kg), con niveles: Menos de 60; 60 a 70, 70,1 a 80; 80,1 a 90; ms de 90

EXCLUSION DE NIVELES

Dos niveles de una misma escala son excluyentes entre s, cuando no pueden presentarse al mismo tiempo en una misma unidad. Estado nutricional Eutrfico Desnutrido grado 1 Desnutrido grado 2 Desnutrido grado 3 Como no es posible esperar que una misma persona sea calificada en el mismo momento en ms de uno de esos estados nutricionales, esos niveles de escala son excluyentes entre s. Ejemplo:

EXHAUSTIVIDAD DE NIVELES

Los niveles de una escala son exhaustivos, si permite clasificar todos los datos que se hayan recolectado para una variable en el grupo estudiado. Ejemplo. Para un estudio sobre la poblacin general:

Trastorno de salud Patologa respiratoria Trastorno digestivo Problema psicolgico Problema gineco- obsttrico Otros trastornos de salud

Edad (aos) Menor de 15 15 - 20 21 - 30 31 - 50 Mayor de 50

Los niveles en verde se han agregado para hacer exhaustivas estas dos escalas.

RESULTADOS DE UNA CLASIFICACION

Como resultado se obtienen: frecuencias y densidades. Frecuencia absoluta (f), que es la suma simple de los datos acumulados en una casilla. Se suele presentar como N Frecuencia relativa (h), que es el cuociente entre f y el total de datos: h = f / n. Se suele presentar como porcentaje (%), es decir, como h 100 Densidad (d), que es el cuociente entre la frecuencia f y la amplitud a de un intervalo: d = f / a. Se calcula cuando los niveles de escala se refieren a intervalos de valores con amplitudes distintas.

Ejemplo: Clasificacin de trastornos de salud y de edad, segn sus escalas.

Trastorno de salud Respiratorios Digestivos psicolgicos gineco- obsttrico Otros trastornos Total

f 15 5 8 2 9 39

h 0,385 0,128 0,205 0,051 0,231

Edad 10 - 15 - 20 - 30 - 50 - 80 Total

a
5 5 10 20 30

f 20 15 30 40 30 135

h 0,148 0,111 0,222 0,296 0,222

d 4 3 3 2 1

h=f/n d= f / a a = amplitud de un intervalo

DISTRIBUCION A ESCALA DE NIVELES NO EXCLUYENTES.


Tiene 2 totales que pueden generar 2 distribuciones de porcentajes.
Ejemplo: CUADRO 1. Motivo de consulta de 225 pacientes. Via del Mar.1996.

Motivo de consulta Patologa respiratoria Trastorno digestivo Problema psicolgico Problema gineco- obsttrico Otro trastorno de salud

f 180 167 17 112 106

h 0,800 0,742 0,075 0,498 0,471

% 80,0 74,2 7,5 49,8 47,1

% (*) 30,9 28,7 2,9 19,2 18,2


% sobre total de motivos de consulta n = 582

(*) sobre total de motivos de consulta: 582

% sobre total de pacientes n=225

PRESENTACIN DE UNA CLASIFICACIN

El resultado de una clasificacin, segn el objetivo que se tenga en mente, puede presentarse de 2 formas :

En tabla o cuadro estadstico, si se desea mostrar resultados en detalle.


En grfico de frecuencias, si desea mostrar slo tendencias generales.

TABLA O CUADRO ESTADSTICO


Una tabla o Cuadro expone en detalle, los resultados de una clasificacin. Debe contener:

Ttulo, que explica lo que se presenta, cmo se presenta y la fuente de datos. Distribuciones de frecuencias. Tanto absolutas como porcentajes Optativamente, un pie de tabla en que se hacen aclaraciones acerca de la tabla.

Cualquiera sea la tabla, si se presentaren solo distribuciones de porcentajes, se debe informar siempre cules fueron los totales sobre los que estos se calcularon.

Ejemplo de tabla UNIVARIADA. A. Para una variable cualitativa

CUADRO 1. Motivos de consulta de 225 pacientes. Via del Mar. 1996. Motivo N %(*) Patologa respiratoria 180 30,9 Trastorno digestivo 167 28,7 Problema psicolgico 17 2,9 Problema gineco- obsttrico 112 19,2 Otro trastorno de salud 106 18,2
(*) Usando como base el total de motivos de consulta

Ejemplo de tabla UNIVARIADA. B. Para una variable continua


CUADRO 2. EDAD DE 225 PACIENTES UROLOGICOS. SERVICIO DE UROLOGIA. CLINICA LOS AROMOS. 1990.

EDAD 10 15 16 20 21 30 31 50 51 60 61 75

N 20 33 42 77 32 21

%d

8,9 4,0 14,7

5,5 18,7 4,2 34,2 3,85 14,2 3,2 9,3 1,4

GRFICOS

GRFICOS DE DATOS
Son presentaciones realizadas en el plano cartesiano, de clasificaciones de datos o de datos aislados.

Un grfico debe ser autoexplicativo y sin detalle numrico. Debe mostrar solo las tendencias que manifiestan los datos.

GRFICOS UNIVARIADOS
(PARA DATOS DE UNA SOLA VARIABLE).

Las opciones de grficos varan segn el tipo de variable y si los datos estn o no clasificados. Las opciones ms usadas son:

A. Para datos clasificados - De variables cualitativas (barras simples, barra subdividida, sectorial) - De variables cuantitativas (histograma, polgono de frecuencias)

B. Para datos aislados de variables cuantitativas (de dispersin o correlacin)

Grfico de barras simples

Son barras separadas, una por cada nivel de la escala de clasificacin. La altura o largo de cada barra debe representar la magnitud de una frecuencia (f o h o %)

El relleno, color o ancho de cada barra no debe variar entre barras pues no representa caracterstica alguna de la clasificacin.

Ejemplo de barras simples para escala de datos a categoras

Grfico de barra subdividida


Es una barra que contiene subdivisiones, donde cada subdivisin representa la magnitud de una frecuencia. Las subdivisiones se distinguen entre s por rellenos o colores diferentes. El largo total de la barra es igual al nmero de datos o a 100, segn si las subdivisiones son frecuencias absolutas o porcentajes.

Ejemplo de barra subdividida

GRAFICO 1. MOTIVOS DE CONSULTA DE 225 PACIENTES. VIA DEL MAR. 1996.


100%

80%

Otros trastornos Problemas gineco-obstetricos Problemas psicolgicos Trastornos digestivos Patologa respiratoria

60%

40%

20%

0%

Grfico sectorial, o de torta (pie)

Es un crculo que contiene tajadas o subdivisiones. Cada tajada representa la magnitud de una frecuencia y se determina en grados. Como en el grfico de barra subdividida, las tajadas llevan distintos rellenos o colores. El rea total representa al N de datos o a 100, segn si las tajadas representan frecuencias absolutas o porcentajes.

Ejemplo de grfico sectorial

GRAFICO 1. MOTIVOS DE CONSULTA DE 225 PACIENTES. VIA DEL MAR. 1996.

Patologa respiratoria Problemas psicolgicos Otros trastornos de salud

Trastornos digestivos Problemas gineco- obsttricos

Histograma de frecuencias para escala a niveles de intervalos

Est compuesto por rectngulos yuxtapuestos en que cada rectngulo tiene por base la amplitud del intervalo (a), por altura la densidad (d) y por rea la frecuencia (f).

Ejemplo de clasificacin de escala a intervalos


Para los 225 pacientes del Cuadro 2, la escala, frecuencias y densidades fueron:

EDAD 10 15 16 20 21 30 31 50 51 60 61 75

a 5 5

10
20 10

15

N (f) 20 33 42 77 32 21

d 4,0 6,6 5,5 4,2 3,85 3,2 1,4

EL HISTOGRAMA ES EL SIGUIENTE: d

10 15 20

30

50

60

75

Edad (aos)

Polgono de frecuencias.
Es otra opcin, alternativa al histograma.

Se traza uniendo mediante rectas los puntos centro de las aristas superiores de los rectngulos del histograma y terminando en el eje horizontal a ambos lados, a media amplitud del primero y ltimo intervalo.

CONSTRUCCION DEL POLIGONO: d

10 15 20

30

50

60

75

Edad (aos)

EL POLIGONO

Histograma y polgono pueden hacerse contra la frecuencia, solo cuando los intervalos son de amplitud igual. En caso contrario se produce un error en la presentacin.

INDICADORES ESTADISTICOS

Se utilizan para resumir con un solo valor, la informacin proveda por grupos de datos. Entre los ms conocidos y usados estn:

Los Univariados: Indicadores para datos de una variable CUALITATIVA: los CATEGORICOS Indicadores para datos de una variable CUANTITATIVA: de POSICION, de DISPERSION y de ASIMETRIA.
Los Bivariados y Multivariados: Indicadores de ASOCIACION entre variables CUALITATIVAS o entre CUANTITATIVAS o entre MIXTAS

INDICADORES CATEGORICOS

Son los que se refieren a datos cualitativos que, como son categoras, suelen llamarse tambin categricos.

Siempre muestran la frecuencia con que se presenta una categora de una variable. De este modo se refiere siempre a grupos de unidades. Clsicamente se distinguen los tipos siguientes:

Medida ABSOLUTA. Medida RELATIVA. Se refiere a una frecuencia ajustada por otre que se usa de referencia. Se distinguen: a) RAZONES ESTADISTICAS. b) PROPORCIONES ESTADISTICAS c) TASAS

Medida Absoluta
Es la suma de la presencia de un evento en un grupo de unidades. Corresponde a la frecuencia absoluta que resulta al clasificar un grupo de datos segn una escala. Ejemplo: N de personas que presentan TBC. Esta medida es muy til a la hora de administrar recursos. No permite comparar la importancia o el riesgo de la presentacin de esa categora entre grupos.

Medida Relativa
Es un cuociente que relaciona la frecuencia de presentacin de una categora C con otra usada de referencia. As, indica la importancia de la categora C frente a la referencia o bien, expresa cuntas unidades que presentan C hay por cada unidad del grupo de referencia. Ejemplo. Si la categora fuese presentar TBC en cierto grupo:
Sujetos con TBC 20 --------------------------------- = ---- = 0,25 Total de sujetos del grupo 80 Expresa que la importancia de la TBC en el grupo es de 0,25. Multiplicada por 100, expresara que hay 25 tuberculosos por cada 100 sujetos en ese grupo.

Una medida relativa puede ser: Razn estadstica, Proporcin estadstica o Tasa

RAZN ESTADSTICA
Es un cuociente en que el grupo de unidades que presentan la categora en estudio (numerador) no puede considerarse subconjunto del grupo de unidades de referencia (denominador). Ejemplo. La TBC relacionada con otras enfermedades. N de sujetos con TBC Razn = --------------------------------------------------N de sujetos con otras enfermedades Expresa cuntos sujetos con TBC hay por cada sujeto con otra enfermedad. Si se multiplicara por 100, expresara cuantos por cada 100 que tienen otra enfermedad. Aqu, los tuberculosos no son subconjunto de los que padecen otras enfermedades.

PROPORCIN ESTADSTICA

Es un cuociente en que las unidades poseedoras de la categora de inters (el numerador), se pueden considerar subconjunto de las unidades del grupo de referencia (el denominador). Esta medida, matemticamente, solo puede variar entre 0 y 1. Ejemplo: La TBC en relacin a todas las enfermedades, en G.

N de sujetos con TBC en G, 2010 Proporcin = ------------------------------------------------N de sujetos enfermos en G, 2010


Expresa cuantos sujetos con TBC hay por cada sujeto enfermo en G el ao 2010 (o por cada 1000 si se ha multiplicado por 1000).

Aqu, los tuberculosos son subconjunto de todos los enfermos

TASA.
Es un cuociente que, adems de ser una proporcin, es capaz de expresar el riesgo de presentar la categora de inters. En el numerador se ubican los casos, (los que presentan la categora de inters, llamada el RIESGO) y en el denominador los expuestos, (los que podran presentar el riesgo dentro de un perodo de exposicin informado). Ejemplo: La TBC en relacin con los expuestos a padecerla en un grupo G, durante el ao 2010. Tasa de TBC= N de sujetos con TBC en G, durante 2010 ----------------------------------------------------- x 1000 N de sujetos de G, durante 2010

Expresa cuantos tuberculosos se presentan en G por cada 1000 sujetos de ese grupo durante el ao 2010. Generalmente se multiplica por una potencia de 10 que alcance a dejar uno o mas enteros.

Construccin de una tasa

1. Se fija el numerador. Este se compone de las unidades que sufrieron el RIESGO. Este le dar el nombre a la tasa y ella debe ser definida en espacio y tiempo. 2. Se elige el denominador. Fijado el numerador se busca el mejor grupo de expuestos a sufrir el riesgo del evento, dentro de la delimitacin espacio-temporal dada en el numerador. Ejemplo. La tasa de mortalidad de Valparaso en 1996: Tendr por numerador el N de muertos en Valparaso en 1996 y por denominador los habitantes de esa localidad (que son los expuestos a morir durante ese ao).

INDICADORES PARA UNA VARIABLE CUANTITATIVA

Caractersticas de un grupo de datos cuantitativos.


Un grupo de datos de una variable cuantitativa posee caractersticas que lo distinguen de otros grupos y que, por tanto, pueden ser usadas para describirlos. Entre las caractersticas mas destacadas se encuentran: La tendencia central o posicin del grupo de datos La asimetra del grupo de datos

La variabilidad del grupo de datos


Para cada una de estas caractersticas se puede contar con un indicador estadstico apropiado.

INDICADORES DE TENDENCIA CENTRAL. o DE POSICION


Se refieren a valores de una variable cuantitativa que se pueden usar como puntos de referencia o centros destacados para un grupo de datos. Los mas conocidos:

MEDIA ARITMETICA o PROMEDIO. Posicionado en el centro de gravedad del grupo de datos


MEDIANA. Posicionado en el centro dimidiador del grupo de datos

MODA. Posicionado en el(los) centro(s) en que mas se concentran los datos


PERCENTILES. Posicionados en puntos que superan distintos porcentajes de los datos.

MEDIA ARITMETICA o PROMEDIO


Se simboliza por

Los pesos de 30 recin nacidos se distribuyeron asi:

3,0 3,1 3,2 3,3

3,4 3,5 3,6 3,7 3,8 3,9

Kg

su centro de gravedad o de equilibrio fue


3,37

Este valor es la Media aritmtica

Su clculo :

1 Se suman los datos. 2 Esa suma se divide entre el nmero de datos. Ejemplo. Peso (Kg) de 5 personas: 57,8 57,2 58,5 52,8 92,5 1 Suma = 318,8 Kg 2 318,8 / 5 = 63,8 Kg por persona

MEDIANA o EJE DE SIMETRIA.


En los misma distribucin de los 30 datos de recin nacidos:

3,0 3,1 3,2

3,3 3,4 3,5 3,6 3,7 3,8 3,9 Kg

Su centro dimidiador es: 3,3 Esta es la Mediana Ella no siempre coincide con el promedio.

Su clculo:
1 Se ordenan los datos de menor a mayor 2 Se ubica el centro de ellos con: U = (n+1) / 2 3 Mediana = valor del dato encontrado en esa ubicacin (o el centro
entre los 2 vecinos si la serie es par)
Ejemplo. Para los mismos 5 datos de peso: 1 Se ordenan de menor a mayor: 52,8 57,2 57,8 58,5 92,5 2 Se ubica el centro de ellos: U = 6/2 = 3

3 Mediana = 57,8 Kg por persona

MODA

3,0 3,1 3,2

3,3 3,4

3,5

3,6 3,7 3,8 3,9 Kg

Sus centros de mayor concentracin

3,1 3,2 3,7 Estas son las Modas La distribucin es entonces, trimodal

Su clculo:

Se busca el o los datos que se repiten claramente ms veces en un grupo grande de datos. En el ejemplo de solo 5 datos de peso, no se puede determinar Moda porque el grupo es muy pequeo.

PERCENTILES.

Un percentil es un indicador de posicin en una serie de datos, que indica el porcentaje de ellos que est bajo esa posicin. Ejemplo: Percentil 50 (P50) indica la posicin que supera al 50% de los datos (a su vez es superado por el 50% restante); el Percentil 25 (P25) indica la posicin que supera al 25% de los datos (a su vez es superado por el 75% restante). En particular, el P50 corresponde a la Mediana. Los percentiles que dividen a la serie de datos en cuatro partes iguales, son llamados cuartiles y corresponden a los percentiles: P25, P50 y P75.

Su clculo:
1 Se ordenan los datos de la serie, de menor a mayor

2 Se fija el orden del percentil y se ubica su posicin mediante: UP = P (n+1) / 100 = E,D
3 Se interpola el Percentil a partir del dato indicado en la parte entera de U (E), agregando la distancia entre ese dato y el siguiente, ponderada por la parte decimal de U (D). Ejemplo: Para calcular el percentil 20 de los 5 datos de peso. 1 se ordenan de menor a mayor: 52,8 57,2 57,8 58,5 92,5

2 Se ubica la posicin del P20 en la serie: U20 = 20 6 / 100 = 1,2


3 Se interpola el valor del P20: P20 = 52,8 + 0,2 (57,2 52,8 ) = 53,68 Kg

INDICADORES DE DISPERSION
Miden el grado de heterogeneidad del grupo de datos de una variable, lo que se conoce como variabilidad de los datos. Entre los ms usados destacamos los 3 siguientes: El Rango La Desviacin estndar El Coeficiente de variabilidad La Distancia relativa interpercentiles (DRI)

RANGO
Es, simplemente, la diferencia entre el dato Mximo y el Mnimo. Es fcil de calcular. Su gran problema es que toma en cuenta solo dos datos del grupo: los extremos. Si estos son nicos, dar una idea errada acerca de la variabilidad.

DESVIACION ESTANDAR
Se simboliza por s y a veces es llamada tambin desviacin tpica. Es, aproximadamente, la distancia promedio de cada dato de una variable, respecto a su media aritmtica en el grupo. Expresa a cuntas unidades de la variable, se encuentra distanciado cada dato, de su centro de equilibrio. Es decir, representa la unidad de dispersin al centro de equilibrio, que tiene el grupo de datos.

Su clculo:
1 Se calculan las diferencias entre cada dato y su promedio (x x) 2 Se eleva al cuadrado cada una de esas diferencias: (x x)2 3 Se suman esas diferencias al cuadrado y se dividen por el total de datos menos 1. El resultado es conocido como varianza: s2 = (x x )2 / (n 1) 4 Se obtiene la raz cuadrada del valor de la varianza: s = s2 Esta es la desviacin estandar

Ejemplo. Para los 5 datos de peso: 57,8 57,2 58,5 52,8 92,5 su promedio fue: 63,8 Kg 1 Sus diferencias al promedio (x - x) son: -6 -6,6 -5,3 -11 28,7 2 Los cuadrados de esas diferencias (x - x )2 son: 36 43,56 28,09 121 823,69 3 La suma de estos cuadrados es: 952,34 que dividida por 4 es: 238,05 o Varianza 4 Finalmente: s = 238,05 = 15,4 Kg.

Es decir, cada peso de este grupo se distancia en 15,4 Kg de su centro de equilibrio (el promedio).

Você também pode gostar