Escolar Documentos
Profissional Documentos
Cultura Documentos
Qu es la Estadstica?
Qu es la Estadstica?
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
O en palabras ms sencillas:
Conjunto de tcnicas que, partiendo de la observacin de fenmenos, permiten al investigador obtener conclusiones tiles sobre ellos
En general se ocupa de fenmenos observables.
La Bioestadstica ensea y ayuda a investigar en todas las reas de las ciencias de la vida donde la variabilidad no es la excepcin sino la regla.
Ms definiciones:
Es una ciencia:
Descriptiva: Recoleccin, anlisis y presentacin de datos. Inferencial: Hacer previsiones y as poder tomar decisiones u obtener conclusiones. Deducir leyes a partir de la descripcin de datos.
Algo de historia
Statistik: Fue el trmino alemn inicial introducido por Gottfried Achenwal. (1749)
Algo de historia
Su origen proviene del latn statisticum collegium (Consejo de Estado), siendo la forma en que el gobierno se informaba sobre: poblacin, produccin agrcola o ganadera entre otros.
Pero su uso es ms antiguo, encontrando registros en civilizaciones antiguas tales como:
Algo de historia
Algo de historia
Algo de historia
En el s.XIX la enfermera inglesa Florence Nigthtingale desarroll los primeras aplicaciones de estadstica en la atencin mdica.
Procesamiento ADECUADO
Procesamiento INADECUADO
MALAS DECISIONES
Estadstica Descriptiva
La estadstica descriptiva comprende las tcnicas que se emplean para resumir y describir datos numricos. Son sencillas desde el punto de vista matemtico y su anlisis se limita a los datos coleccionados. El estudio de los datos se realiza con representaciones grficas, tablas, medidas de posicin y dispersin.
Estadstica Inferencial
El problema crucial de la estadstica inferencial es llegar a proposiciones acerca de la poblacin a partir de la observacin efectuada en muestras bajo condiciones de incertidumbre. sta comprende las tcnicas que aplicadas en una muestra sometida a observacin, permiten la toma de decisiones sobre una poblacin o proceso estadstico.
Poblacin o Universo
Conjunto de todos los elementos que presentan una caracterstica comn determinada, observable y medible.
Muestra
Es un subconjunto de la poblacin al que tenemos acceso, y sobre el que realmente hacemos las observaciones o mediciones, ya que la poblacin normalmente suele ser demasiado grande para poder abarcarla completamente.
Muestra
Debe ser Representativa. Est formada por miembros seleccionados de la poblacin. Estos miembros reciben el nombre de individuos o unidades experimentales.
RECOLECCION DE DATOS
Cuando el investigador planifica la recoleccin de datos, se hace tres preguntas bsicas: QU RECOLECTAR? DNDE RECOLECTAR? CMO RECOLECTAR?
QU RECOLECTAR?
Esta pregunta lleva al investigador a planificar el tipo de informacin que requiere para cumplir con los objetivos de su estudio.
Tal informacin provendr de aspectos de las unidades que es necesario estudiar. Estos aspectos son conocidos como variables.
Ejemplo
En un estudio que pretende describir a los pacientes hospitalizados, aspectos de inters pueden ser: gnero, edad, procedencia, diagnstico, peso, entre otros, los que pueden variar en la forma de presentarse en esos pacientes. Por tanto, preferimos llamarlos variables.
DATOS
Cada variable se manifiesta, se expresa en una unidad estudiada, mediante uno o ms modos, que se conocen mas bien como datos. Ejemplos: Son variables: Patologa crnica: diabetes, HTA, epilepsia, otro. Severidad: leve, mediana, severa. Paridad: 0,1,2,3, ms de 3. Peso:70,5,67,2,70,8, etc.
TIPOLOGIA DE VARIABLES
Una tipologa simple y de gran utilidad para la aplicacin estadstica y computacional, referida a los datos con que se espera que se expresen las variables, es la que distingue: Variables CUALITATIVAS
Variables CUANTITATIVAS
Continua
Cuantitativa Discreta Nominal Cualitativa Ordinal Dicotmica
Variable
VARIABLES CUALITATIVAS
Son las que generan datos referidos a cualidades o atributos de las unidades en estudio. Ejemplo: Patologa crnica, expresada con datos como: diabetes, HTA, epilepsia, otra Severidad, expresada con datos: leve, mediana, severa.
Siempre es necesario definir una variable cualitativa en forma clara, mediante los datos que se espera recolectar con ella. As dejar clara su validez frente a los objetivos y tambin su alcance descriptivo. Ejemplo: si Patologa crnica se define con datos: Diabetes, HTA, epilepsia, otro.
VARIABLES CUANTITATIVAS
Son las que se manifiestan mediante datos valricos que se obtienen como resultado de algn procedimiento de cuantificacin o de medicin. Ejemplo: N de episodios: con datos como 0, 1, 2, etc. que resultan de la cuantificacin de episodios; Peso (en Kg): con datos como 65, 2, 70, 5, 80, 0 etc., que se obtienen como resultado de pesar a la unidad con un instrumento apropiado. Los nmeros usados como cdigos, no califican como datos de una variable cuantitativa sino de una cualitativa.
de los reales, que resultan del uso de algn procedimiento de medicin. Ejemplo: Peso ; Edad; ambas abiertas a todo dato posible (incluyendo decimales).
Una vez recolectados los datos de una variable: - Ellos no pueden ser cambiados a un nivel de discriminacin mayor.
Ejemplo: Si los datos de estatura, son recolectados a 3 niveles (como ordinal), post recoleccin no podrn llevarse a una forma continua ni cambiarse esos niveles, salvo combinaciones entre ellos.
CODIGOS Y CODIFICADOR
CODIGOS. Son abreviaturas alfanumricas de los datos de una variable, que permiten un manejo ms seguro de estos. Generalmente se usan nmeros como cdigos. El conjunto de cdigos de todas las variables de un estudio, se llama CODIFICADOR. Este ayuda a definir las variables.
EJEMPLO DE CODIFICADOR
PARTE DEL CODIFICADOR DE UNA ENCUESTA A UNA COMUNIDAD.
Sexo: m. masculino f. femenino Estado de pareja (solo mayores de 15 aos): 1.Sin pareja estable 2.Con pareja estable 3. Ignorado Alfabetismo (solo mayores de 12 aos): 1.No lee ni escribe 2.Solo lee 3.Solo escribe 4.Lee y escribe Escolaridad (solo mayores de 8 aos): 1.Sin escolaridad 2.Bsica Incompleta 3.Bsica Completa 4.Media Incompleta 5.Media Completa 6.Superior 7.Especial.
BASE DE DATOS
Es una planilla o matriz en que se presentan ordenados los datos recolectados para las variables estudiadas. En esta planilla:
las filas representan a las unidades que proporcionaron los datos y reciben el nombre de registros.
NUM
SEXO
EDAD 23 18 21
PESO 72 62 67
1 M 2 F 3 F
4 M
5 F
22
39
70
62
1,7
1,58
24,22
24,84
Los fumadores tienen ms bajas laborales que los no fumadores. En qu sentido? Mayor nmero? Tiempo medio?
Fumadores y no fumadores en edad laboral Criterios de exclusin. Cmo se eligen? Descartamos los que padecen enfermedad crnica?
Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?
Tiempo medio de baja en fumadores y no fumadores % de bajas por fumadores y sexo, grficos.
Los fumadores estn de baja al menos 10 das/ao ms de baja que los no fumadores.
Los datos acerca de variables de inters en una investigacin, son provedos por unidades emisoras de informacin, que constituyen las fuentes de datos. Estas unidades pueden ser:
Unidades en estudio Unidades informantes
UNIDAD EN ESTUDIO
Es la unidad que es necesario estudiar para cumplir los objetivos de la investigacin.
Puede ser una persona, otro organismo, un objeto, una situacin o un hecho.
UNIDAD INFORMANTE
Es la unidad que proveer los datos acerca de la unidad en estudio. En muchos casos es la misma que la unidad en estudio. Ejemplo: En un estudio nutricional en el menor de 1 ao, el nio es unidad de estudio, pero a la vez es unidad informante porque provee datos acerca de si mismo. Su madre y quien controla al menor, no es unidad en estudio, pero s es informante, en cuanto provee otra informacin acerca del nio.
UNIVERSO
Es el conjunto de unidades informantes ubicadas en un espacio y tiempo. Constituyen el blanco del estudio por cuanto proveern informacin acerca de las unidades de inters. Debe ser claramente definido, pues servir de marco referencial a los resultados que se obtengan posteriormente, ser la agrupacin real a la que se atribuirn los resultados del anlisis de datos.
Ejemplo Para la caracterizacin nutricional del lactante bajo control en un Consultorio de APS, la unidad en estudio es el lactante, que a la vez es informante. Pero, adems, su cuidadora puede ser unidad informante. Entonces, una definicin adecuada sera: Lactantes bajo control de sano que se atienden en Consultorios de APS de la V Regin y sus cuidadoras, durante el ao 2006.
Otro ejemplo
Para estudiar reacciones adversas a medicamentos en paciente hospitalizado, la unidad en estudio y a la vez informante, es el paciente. Entonces el universo puede definirse como:
Pacientes hospitalizados en los hospitales pblicos de Valparaso y Via del Mar, durante el primer semestre del 2006.
Son restricciones que a veces deben cumplir las unidades del universo, referentes a caractersticas ms especficas de estas, que deben agregarse como parte de la definicin de universo. Como su nombre lo sugiere, se puede hablar de quienes se incluyen en el estudio o bien, de quienes se excluyen. No debieran presentarse como criterios complementarios. Tampoco es necesario que haya de los dos tipos en el mismo estudio.
Ejemplo
medicamentos
en
CENSO
Es la accin que considera a todas las unidades del universo, para proveer la informacin que se necesita en la realizacin de un estudio. Un censo por lo general provee valores verdaderos de los indicadores que se pretende estudiar en el universo.
MUESTREO
Es la accin que considera solo algunas unidades del universo, para proveer la informacin necesaria a la realizacin del estudio. A este grupo de unidades se le conoce como muestra del universo. Un muestreo proporciona solo estimaciones de los valores verdaderos de los indicadores que se estudian.
Para que una muestra proporcione buenas estimaciones de los valores verdaderos de los indicadores, debe ser altamente representativa del universo del que se obtenga.
REPRESENTATIVIDAD
Las caractersticas en estudio, se presentan en el universo con cierta Variedad y Proporcionalidad. La cuota de esa variedad y proporcionalidad que vaya en la muestra, constituye su representatividad.
VARIEDAD
Es la diversidad de caractersticas, que tienen las unidades del universo, que son consideradas de inters para el estudio. Ejemplo: En un estudio de morbilidad sobre personas de 20 a 50 aos, se debiera capturar en la muestra, similar variedad de edades a la del universo pero, adems, similar variedad de niveles socioeconmicos y de gneros de esas personas, pues se sabe que la morbilidad, tambin depende del nivel socioeconmico y gnero que ellas posean.
PROPORCIONALIDAD
Se refiere a las proporciones en que se encuentran las caractersticas de inters en las unidades del universo.
Por ejemplo, en el estudio de morbilidad, se debiera capturar en la muestra similar distribucin porcentual por edad, por gnero y por nivel socioeconmico que la presentada en el universo.
Para cautelar una alta representatividad, se suelen usar de manera combinada dos procedimientos: Azar en la seleccin de unidades y Diseos de muestreo.
AZAR EN LA SELECCION
Es un procedimiento de seleccin de unidades que descarta cualquier direccionamiento intencional en la eleccin de estas, por parte del seleccionador o de la unidad informante.
De este modo, se cautelar que todas las unidades del universo tengan una probabilidad distinta de 0, al momento de ejecutarse la seleccin.
El azar, por s solo, permite lograr una cuota de representatividad basada en probabilidades. Por eso, validar ms adelante el uso de probabilidades, en el anlisis estadstico de los datos.
DISEO DE MUESTREO.
Es un procedimiento planeado de seleccin de unidades, que eleva la representatividad. Sin embargo el uso de un diseo, puede aumentar las dificultades, el tiempo y el costo del muestreo.
Los tres diseos ms conocidos son: - Muestreo al azar simple. - Muestreo al azar estratificado proporcional - Muestreo al azar por conglomerados
Consiste en seleccionar al azar las unidades, desde un listado nico de unidades del universo. Se necesita que en este listado las unidades se encuentren numeradas, entre 1 y N, para elegir de all los n nmeros al azar que constituirn la muestra. En este diseo, solo el azar cautelar la representatividad.
Ejemplos de MAS
Seleccionar al azar 5 Consultorios, de la lista numerada de N Consultorios de la V Regin. Seleccionar al azar 4 viviendas, de la lista numerada de viviendas de una manzana. Seleccionar al azar 1 hogar, de entre los N hogares numerados de una vivienda. Seleccionar al azar 30 personas, de la lista numerada de N hospitalizados de cierto hospital.
Si las N unidades del universo han sido ordenadas en G grupos llamados estratos (*), de tamao Ni cada uno, siendo N=Ni (entre 1 y G), este muestreo consiste en: - Elegir al azar ni unidades de entre las Ni de cada estrato, en proporcin pi=Ni /N, de tal modo que la muestra total n sea =ni (entre 1 y G) y cada submuestra ni sea =npi
Para este muestreo no sirve un listado total, se necesita un listado separado de las Ni unidades de cada estrato, lo que implica una dificultad adicional.
(*) Cada Estrato deber ser un grupo de unidades similares entre s en algunas variables de inters, tal que, la mayor variabilidad de ellas entre unidades, se encuentre entre y no dentro de estratos.
Variable objeto, es la que se pretende estudiar Variable ndice, es la que, estando fuertemente asociada a la objeto, es de fcil observacin.
Ejemplo: Para estudiar nivel socioeconmico (variable objeto) una variable ndice puede ser el tipo de vivienda pues es de fcil visualizacin en una visita a terreno y se encuentra fuertemente asociada al nivel socioeconmico.
En un MAEP, si no se puede o es muy difcil estratificar por la variable objeto, se puede estratificar por una o mas variables ndice, las que puedan arrastrar consigo a la variable objeto. Ejemplo: Al hacer estratos por tipo de vivienda, se habrn generado a la vez estratos por nivel socioeconmico, pues el tipo de vivienda arrastrar consigo al nivel socioeconmico.
Ejemplos de MAEP
1. En un estudio acerca de resolutividad de la Atencin Primaria en Chile, se hacen 3 estratos de Consultorios refirindose cada uno solo a un nivel de gestin, entre bien gestionados, regular y mal gestionados. Luego se seleccionan al azar ni Consultorios desde cada estrato, en proporcin al tamao de este en el universo de consultorios del pas y se suman, constituyendo la muestra estratificada de consultorios.
Si las N unidades del universo han sido ordenadas en G grupos llamados conglomerados (*), de tamao aproximado k=N/G cada uno, siendo N=k (entre 1 y G), este muestreo consiste en:
(*) Conglomerado: es un grupo de unidades con alta variabilidad interna respecto a la variable objeto, tal que esa variabilidad sea similar a la del universo mismo. A diferencia de un estrato, la variabilidad de la variable objeto deber encontrarse dentro y no entre conglomerados.
Ejemplos de MAC
1. Para el estudio de la resolutividad, se hacen 20 conglomerados de tamao similar con los CAP del pas, cautelando que en cada conglomerado haya CAP con todos los niveles de gestin y en iguales proporciones que en el universo. Luego se seleccionan al azar 4 de esos 20 conglomerados, que constituirn la muestra conglomerada de consultorios.
SELECCIN SISTEMATICA
Es un procedimiento de seleccin de unidades que se aplica a una serie de estas, dispuesta en forma secuencial, para cualquier diseo de muestreo que se est aplicando. Para proceder:
1 Se determina cada cuntas unidades debe ser seleccionada una, mediante: K=N/n 2 Se selecciona la primera unidad, entre 1 y k y las restantes se van seleccionando a lo largo de la serie, sumando k, a la posicin de la anteriormente elegida. Si la primera unidad fuese seleccionada al azar, su posicin en la serie es llamada comienzo aleatorio y toda la muestra resultante se considera seleccionada al azar.
Ejemplo
Desde un fichero de N=200 fichas familiares, se desea seleccionar n=20 por MAS, usando seleccin sistemtica.
1 Se determina cada cuntas se debe seleccionar una: k = 200 / 20 = 10
2 Se elige al azar un numero entre 1 y 10, resultando elegido el 4. Este es el comienzo aleatorio. Entonces la posicin de la primera ficha a seleccionar en el fichero, es la 4 y las restantes fichas estarn sucesivamente en las posiciones: 14, 24, 34, etc. hasta la ultima que ser la 194.
CLASIFICACION DE DATOS
ESCALAS DE CLASIFICACION.
Para variable cualitativa: Sus niveles son categoras (generalmente las mismas usadas para definirla). Ejemplo: Tipo de pareja, con niveles: No tiene, Inestable, Estable Para variable discreta: Sus niveles son nmeros enteros. Ejemplo: Paridad, con niveles: 0, 1, 2, 3, ms de 3 Para variable continua: Sus niveles son intervalos de valores. Ejemplo: Peso (Kg), con niveles: Menos de 60; 60 a 70, 70,1 a 80; 80,1 a 90; ms de 90
EXCLUSION DE NIVELES
Dos niveles de una misma escala son excluyentes entre s, cuando no pueden presentarse al mismo tiempo en una misma unidad. Estado nutricional Eutrfico Desnutrido grado 1 Desnutrido grado 2 Desnutrido grado 3 Como no es posible esperar que una misma persona sea calificada en el mismo momento en ms de uno de esos estados nutricionales, esos niveles de escala son excluyentes entre s. Ejemplo:
EXHAUSTIVIDAD DE NIVELES
Los niveles de una escala son exhaustivos, si permite clasificar todos los datos que se hayan recolectado para una variable en el grupo estudiado. Ejemplo. Para un estudio sobre la poblacin general:
Trastorno de salud Patologa respiratoria Trastorno digestivo Problema psicolgico Problema gineco- obsttrico Otros trastornos de salud
Los niveles en verde se han agregado para hacer exhaustivas estas dos escalas.
Como resultado se obtienen: frecuencias y densidades. Frecuencia absoluta (f), que es la suma simple de los datos acumulados en una casilla. Se suele presentar como N Frecuencia relativa (h), que es el cuociente entre f y el total de datos: h = f / n. Se suele presentar como porcentaje (%), es decir, como h 100 Densidad (d), que es el cuociente entre la frecuencia f y la amplitud a de un intervalo: d = f / a. Se calcula cuando los niveles de escala se refieren a intervalos de valores con amplitudes distintas.
Trastorno de salud Respiratorios Digestivos psicolgicos gineco- obsttrico Otros trastornos Total
f 15 5 8 2 9 39
Edad 10 - 15 - 20 - 30 - 50 - 80 Total
a
5 5 10 20 30
f 20 15 30 40 30 135
d 4 3 3 2 1
Motivo de consulta Patologa respiratoria Trastorno digestivo Problema psicolgico Problema gineco- obsttrico Otro trastorno de salud
El resultado de una clasificacin, segn el objetivo que se tenga en mente, puede presentarse de 2 formas :
Ttulo, que explica lo que se presenta, cmo se presenta y la fuente de datos. Distribuciones de frecuencias. Tanto absolutas como porcentajes Optativamente, un pie de tabla en que se hacen aclaraciones acerca de la tabla.
Cualquiera sea la tabla, si se presentaren solo distribuciones de porcentajes, se debe informar siempre cules fueron los totales sobre los que estos se calcularon.
CUADRO 1. Motivos de consulta de 225 pacientes. Via del Mar. 1996. Motivo N %(*) Patologa respiratoria 180 30,9 Trastorno digestivo 167 28,7 Problema psicolgico 17 2,9 Problema gineco- obsttrico 112 19,2 Otro trastorno de salud 106 18,2
(*) Usando como base el total de motivos de consulta
EDAD 10 15 16 20 21 30 31 50 51 60 61 75
N 20 33 42 77 32 21
%d
GRFICOS
GRFICOS DE DATOS
Son presentaciones realizadas en el plano cartesiano, de clasificaciones de datos o de datos aislados.
Un grfico debe ser autoexplicativo y sin detalle numrico. Debe mostrar solo las tendencias que manifiestan los datos.
GRFICOS UNIVARIADOS
(PARA DATOS DE UNA SOLA VARIABLE).
Las opciones de grficos varan segn el tipo de variable y si los datos estn o no clasificados. Las opciones ms usadas son:
A. Para datos clasificados - De variables cualitativas (barras simples, barra subdividida, sectorial) - De variables cuantitativas (histograma, polgono de frecuencias)
Son barras separadas, una por cada nivel de la escala de clasificacin. La altura o largo de cada barra debe representar la magnitud de una frecuencia (f o h o %)
El relleno, color o ancho de cada barra no debe variar entre barras pues no representa caracterstica alguna de la clasificacin.
80%
Otros trastornos Problemas gineco-obstetricos Problemas psicolgicos Trastornos digestivos Patologa respiratoria
60%
40%
20%
0%
Es un crculo que contiene tajadas o subdivisiones. Cada tajada representa la magnitud de una frecuencia y se determina en grados. Como en el grfico de barra subdividida, las tajadas llevan distintos rellenos o colores. El rea total representa al N de datos o a 100, segn si las tajadas representan frecuencias absolutas o porcentajes.
Est compuesto por rectngulos yuxtapuestos en que cada rectngulo tiene por base la amplitud del intervalo (a), por altura la densidad (d) y por rea la frecuencia (f).
EDAD 10 15 16 20 21 30 31 50 51 60 61 75
a 5 5
10
20 10
15
N (f) 20 33 42 77 32 21
EL HISTOGRAMA ES EL SIGUIENTE: d
10 15 20
30
50
60
75
Edad (aos)
Polgono de frecuencias.
Es otra opcin, alternativa al histograma.
Se traza uniendo mediante rectas los puntos centro de las aristas superiores de los rectngulos del histograma y terminando en el eje horizontal a ambos lados, a media amplitud del primero y ltimo intervalo.
10 15 20
30
50
60
75
Edad (aos)
EL POLIGONO
Histograma y polgono pueden hacerse contra la frecuencia, solo cuando los intervalos son de amplitud igual. En caso contrario se produce un error en la presentacin.
INDICADORES ESTADISTICOS
Se utilizan para resumir con un solo valor, la informacin proveda por grupos de datos. Entre los ms conocidos y usados estn:
Los Univariados: Indicadores para datos de una variable CUALITATIVA: los CATEGORICOS Indicadores para datos de una variable CUANTITATIVA: de POSICION, de DISPERSION y de ASIMETRIA.
Los Bivariados y Multivariados: Indicadores de ASOCIACION entre variables CUALITATIVAS o entre CUANTITATIVAS o entre MIXTAS
INDICADORES CATEGORICOS
Son los que se refieren a datos cualitativos que, como son categoras, suelen llamarse tambin categricos.
Siempre muestran la frecuencia con que se presenta una categora de una variable. De este modo se refiere siempre a grupos de unidades. Clsicamente se distinguen los tipos siguientes:
Medida ABSOLUTA. Medida RELATIVA. Se refiere a una frecuencia ajustada por otre que se usa de referencia. Se distinguen: a) RAZONES ESTADISTICAS. b) PROPORCIONES ESTADISTICAS c) TASAS
Medida Absoluta
Es la suma de la presencia de un evento en un grupo de unidades. Corresponde a la frecuencia absoluta que resulta al clasificar un grupo de datos segn una escala. Ejemplo: N de personas que presentan TBC. Esta medida es muy til a la hora de administrar recursos. No permite comparar la importancia o el riesgo de la presentacin de esa categora entre grupos.
Medida Relativa
Es un cuociente que relaciona la frecuencia de presentacin de una categora C con otra usada de referencia. As, indica la importancia de la categora C frente a la referencia o bien, expresa cuntas unidades que presentan C hay por cada unidad del grupo de referencia. Ejemplo. Si la categora fuese presentar TBC en cierto grupo:
Sujetos con TBC 20 --------------------------------- = ---- = 0,25 Total de sujetos del grupo 80 Expresa que la importancia de la TBC en el grupo es de 0,25. Multiplicada por 100, expresara que hay 25 tuberculosos por cada 100 sujetos en ese grupo.
Una medida relativa puede ser: Razn estadstica, Proporcin estadstica o Tasa
RAZN ESTADSTICA
Es un cuociente en que el grupo de unidades que presentan la categora en estudio (numerador) no puede considerarse subconjunto del grupo de unidades de referencia (denominador). Ejemplo. La TBC relacionada con otras enfermedades. N de sujetos con TBC Razn = --------------------------------------------------N de sujetos con otras enfermedades Expresa cuntos sujetos con TBC hay por cada sujeto con otra enfermedad. Si se multiplicara por 100, expresara cuantos por cada 100 que tienen otra enfermedad. Aqu, los tuberculosos no son subconjunto de los que padecen otras enfermedades.
PROPORCIN ESTADSTICA
Es un cuociente en que las unidades poseedoras de la categora de inters (el numerador), se pueden considerar subconjunto de las unidades del grupo de referencia (el denominador). Esta medida, matemticamente, solo puede variar entre 0 y 1. Ejemplo: La TBC en relacin a todas las enfermedades, en G.
TASA.
Es un cuociente que, adems de ser una proporcin, es capaz de expresar el riesgo de presentar la categora de inters. En el numerador se ubican los casos, (los que presentan la categora de inters, llamada el RIESGO) y en el denominador los expuestos, (los que podran presentar el riesgo dentro de un perodo de exposicin informado). Ejemplo: La TBC en relacin con los expuestos a padecerla en un grupo G, durante el ao 2010. Tasa de TBC= N de sujetos con TBC en G, durante 2010 ----------------------------------------------------- x 1000 N de sujetos de G, durante 2010
Expresa cuantos tuberculosos se presentan en G por cada 1000 sujetos de ese grupo durante el ao 2010. Generalmente se multiplica por una potencia de 10 que alcance a dejar uno o mas enteros.
1. Se fija el numerador. Este se compone de las unidades que sufrieron el RIESGO. Este le dar el nombre a la tasa y ella debe ser definida en espacio y tiempo. 2. Se elige el denominador. Fijado el numerador se busca el mejor grupo de expuestos a sufrir el riesgo del evento, dentro de la delimitacin espacio-temporal dada en el numerador. Ejemplo. La tasa de mortalidad de Valparaso en 1996: Tendr por numerador el N de muertos en Valparaso en 1996 y por denominador los habitantes de esa localidad (que son los expuestos a morir durante ese ao).
Kg
Su clculo :
1 Se suman los datos. 2 Esa suma se divide entre el nmero de datos. Ejemplo. Peso (Kg) de 5 personas: 57,8 57,2 58,5 52,8 92,5 1 Suma = 318,8 Kg 2 318,8 / 5 = 63,8 Kg por persona
Su centro dimidiador es: 3,3 Esta es la Mediana Ella no siempre coincide con el promedio.
Su clculo:
1 Se ordenan los datos de menor a mayor 2 Se ubica el centro de ellos con: U = (n+1) / 2 3 Mediana = valor del dato encontrado en esa ubicacin (o el centro
entre los 2 vecinos si la serie es par)
Ejemplo. Para los mismos 5 datos de peso: 1 Se ordenan de menor a mayor: 52,8 57,2 57,8 58,5 92,5 2 Se ubica el centro de ellos: U = 6/2 = 3
MODA
3,3 3,4
3,5
3,1 3,2 3,7 Estas son las Modas La distribucin es entonces, trimodal
Su clculo:
Se busca el o los datos que se repiten claramente ms veces en un grupo grande de datos. En el ejemplo de solo 5 datos de peso, no se puede determinar Moda porque el grupo es muy pequeo.
PERCENTILES.
Un percentil es un indicador de posicin en una serie de datos, que indica el porcentaje de ellos que est bajo esa posicin. Ejemplo: Percentil 50 (P50) indica la posicin que supera al 50% de los datos (a su vez es superado por el 50% restante); el Percentil 25 (P25) indica la posicin que supera al 25% de los datos (a su vez es superado por el 75% restante). En particular, el P50 corresponde a la Mediana. Los percentiles que dividen a la serie de datos en cuatro partes iguales, son llamados cuartiles y corresponden a los percentiles: P25, P50 y P75.
Su clculo:
1 Se ordenan los datos de la serie, de menor a mayor
2 Se fija el orden del percentil y se ubica su posicin mediante: UP = P (n+1) / 100 = E,D
3 Se interpola el Percentil a partir del dato indicado en la parte entera de U (E), agregando la distancia entre ese dato y el siguiente, ponderada por la parte decimal de U (D). Ejemplo: Para calcular el percentil 20 de los 5 datos de peso. 1 se ordenan de menor a mayor: 52,8 57,2 57,8 58,5 92,5
INDICADORES DE DISPERSION
Miden el grado de heterogeneidad del grupo de datos de una variable, lo que se conoce como variabilidad de los datos. Entre los ms usados destacamos los 3 siguientes: El Rango La Desviacin estndar El Coeficiente de variabilidad La Distancia relativa interpercentiles (DRI)
RANGO
Es, simplemente, la diferencia entre el dato Mximo y el Mnimo. Es fcil de calcular. Su gran problema es que toma en cuenta solo dos datos del grupo: los extremos. Si estos son nicos, dar una idea errada acerca de la variabilidad.
DESVIACION ESTANDAR
Se simboliza por s y a veces es llamada tambin desviacin tpica. Es, aproximadamente, la distancia promedio de cada dato de una variable, respecto a su media aritmtica en el grupo. Expresa a cuntas unidades de la variable, se encuentra distanciado cada dato, de su centro de equilibrio. Es decir, representa la unidad de dispersin al centro de equilibrio, que tiene el grupo de datos.
Su clculo:
1 Se calculan las diferencias entre cada dato y su promedio (x x) 2 Se eleva al cuadrado cada una de esas diferencias: (x x)2 3 Se suman esas diferencias al cuadrado y se dividen por el total de datos menos 1. El resultado es conocido como varianza: s2 = (x x )2 / (n 1) 4 Se obtiene la raz cuadrada del valor de la varianza: s = s2 Esta es la desviacin estandar
Ejemplo. Para los 5 datos de peso: 57,8 57,2 58,5 52,8 92,5 su promedio fue: 63,8 Kg 1 Sus diferencias al promedio (x - x) son: -6 -6,6 -5,3 -11 28,7 2 Los cuadrados de esas diferencias (x - x )2 son: 36 43,56 28,09 121 823,69 3 La suma de estos cuadrados es: 952,34 que dividida por 4 es: 238,05 o Varianza 4 Finalmente: s = 238,05 = 15,4 Kg.
Es decir, cada peso de este grupo se distancia en 15,4 Kg de su centro de equilibrio (el promedio).