Você está na página 1de 34

UNIVERSIDAD NACIONAL DE PIURA

Trabajo encargado de Bioestadstica

DOCENTE

: ALFREDO SULLN LEN

INTEGRANTES : ALVA SANDOVAL DANIEL ASCATE SAAVEDRA MICHAEL AYALA NUNURA DEYVI CASTILLO GARAGATE RICARDO TRELLES COVEAS DENNIS ZAPATA MASIAS LOURDES

CICLO

: III SEMESTRE

FECHA

: PIURA, JULIO DE 2010

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

INTRODUCCION
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. En tal sentido iniciamos la temtica del curso de Bioestadstica con algunos conceptos bsicos: poblacin, promedios, variable estadstica, etc. Los cuales nos servirn a travs del desarrollo de la asignatura.

Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

TABLA DE CONTENIDOS
PRESENTACIN.......................................................................................2 TABLA DE CONTENIDOS.......................................................................3 1. ESTADISTICA........................................................................................5
HISTORIA DE LA ESTADISTICA..................................................................5 DEFINICION.....................................................................................................5
BIOESTADISTICA .......................................................................................................6

2. POBLACIN...........................................................................................7
CONCEPTO......................................................................................................7 MUESTRA........................................................................................................7
Muestra aleatoria........................................................................................................8 Muestra no aleatoria...................................................................................................8

3. VARIABLES ESTADISTICAS ............................................................8


DEFINICION.....................................................................................................8 CLASIFICACION.............................................................................................8

4. REPRESENTACIONES GRAFICAS.................................................10
GRAFICAS PARA VARIABLES CUALITATIVAS.....................................10 GRAFICAS PARA VARIABLES CUANTITATIVAS..................................13 GRAFICAS PARA VARIABLES DISCRETAS.............................................13 GRAFICAS PARA VARIABLES CONTINUAS...........................................16

5. DISTRIBUCION DE FRECUENCIAS...............................................19
ELEMENTOS FUNDAMENTALES..............................................................19
Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

TIPOS DE FRECUENCIAS............................................................................20 DISTRIBUCION DE FRECUENCIAS AGRUPADAS..................................22

6. PROMEDIOS........................................................................................22
MEDIA............................................................................................................22 MEDIANA.......................................................................................................24 MODA O VALOR MODAL...........................................................................25

7. MEDIDAS DE DISPERCION O VARIABILIDAD..........................26


RANGO O RECORRIDO................................................................................27 VARIANZA.....................................................................................................27 DESVIACION ESTANDAR...........................................................................30 DESVIACION MEDIA...................................................................................31 COEFICIENTE DE VARIACION..................................................................32

BIBLIOGRAFA.......................................................................................34

Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

1.ESTADSTICA
1.1. HISTORIA DE LA ESTADSTICA

Como dijera Huntsberger: "La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, crditos y as sucesivamente. Huntsberger tiene razn pues al instante de escuchar esta palabra estas son las imgenes que llegan a nuestra cabeza. La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias. Los mercados, la medicina, la ingeniera, los gobiernos, etc. Se nombran entre los ms destacados clientes de sta. La ausencia de sta conllevara a un caos generalizado, dejando a los administradores y ejecutivos sin informacin vital a la hora de tomar decisiones en tiempos de incertidumbre. La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los trabajos matemticos de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri a la Estadstica a las ciencias formales. En este breve material se expone los conceptos, la historia, la divisin as como algunos errores bsicos cometidos al momento de analizar datos Estadsticos. 1.2. DEFINICION

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con e fin de realizar una toma de decisin ms efectiva. Otros autores tienen definiciones de la Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo de los colectivos; otros la definen como la expresin cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y anlisis.
Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana La ms aceptada, sin embargo, es la de Minguez, que define la Estadstica como La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima. Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y en masculino, se refiere a una medida derivada de una muestra. 1.3. BIOESTADISTICA

La bioestadstica una rama de la estadstica que se ocupa de problemas plantados dentro de las ciencias de la vida, como la biologa, la medicina, etc. Debido a que las cuestiones a investigar en biologa son de naturaleza muy variada, por ejemplo, la medicina, ciencias agropecuarias y forestales, la bioestadstica ha expandido sus dominios para incluir cualquier modelo cuantitativo, no slo estadstico, que pueda ser usado para responder a estas necesidades. La bioestadstica puede ser considerada como una rama, altamente especializada, de la informtica mdica que puede ser, a su vez, complementada por la bioinformtica. Los primeros trabajos bioestadsticos los realiz, a mediados del siglo XIX la enfermera inglesa Florence Nightingale. Durante la guerra de Crimea, Florence Nightingale observ que eran mucho ms numerosas las bajas producidas en el hospital que en el frente. Por lo tanto, recopil informacin y dedujo que la causa de la elevada tasa de mortalidad se deba a la precariedad higinica existente. As, gracias a sus anlisis estadsticos, se comenz a tomar conciencia de la importancia y la necesidad de unas buenas condiciones higinicas en los hospitales.

2.POBLACION
2.1. CONCEPTO 6
Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana En estadstica, se identifica el trmino poblacin al de variable aleatoria, o magnitud numrica de naturaleza aleatoria, X, asociada a los objetos (individuos) sobre los que se desarrolla una experiencia, cuyo resultado depende del azar. La repeticin n veces, en idnticas condiciones, de la citada experiencia aleatoria, afectar a una muestra de n objetos u individuos de la poblacin, y tendr asociada una sucesin de n variables aleatorias, independientes, X1 , X2 ,..., Xn , rplicas de X. Un ejemplo obvio de poblacin y muestra surgira al considerar una urna de bolas blancas y negras, con independencia de su nmero. Si la experiencia consistir en extraer al azar una bola y nuestro inters se centra en el color de la bola, nuestra poblacin, desde el punto de vista estadstico, es una variable dicotmica, por ejemplo, una variable de Bernoulli, que toma dos nicos valores: X=1 si la bola extrada es blanca, X=0 si es negra. Una muestra de tamao n, una vez extrada de la poblacin, y observado el color de las correspondientes bolas, no ser otra cosa que una secuencia de unos y ceros, n en total. (Las idnticas condiciones a las que se alude anteriormente, pueden asegurarse reintroduciendo la bola despus de cada extraccin, o bien considerando que el tamao de la muestra es pequeo respecto al "gran nmero" de bolas de la urna. 2.2. MUESTRA

Es un subconjunto de unidades de anlisis de una poblacin dada, destinado a suministrar informacin sobre la poblacin. Para que este subconjunto de unidades de anlisis sea de utilidad estadstica, deben reunirse ciertos requisitos en la seleccin de los elementos. Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la poblacin que se defina tenga tamao infinito, y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observacin exhaustiva puede ser muy elevado, el tiempo de recoleccin de la informacin muy extenso, o ms an, la observacin de los elementos puede ser destructiva. Por ejemplo, si quisiramos hacer un estudio de la calidad de una partida de fsforos, no podramos probarlos a todos pues los destruiramos.

2.2.1.

MUESTRA ALEATORIA

En que el azar determina que elementos se seleccionan. Una muestra aleatoria de tamao n de una poblacin X , es una sucesin de n variables aleatorias, independientes, X1 , X2 ,..., Xn ,
Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana con idntica ley de probabilidad que X . Una muestra de tamao n est constituida por n rplicas de X. Una vez que la muestra se haya realizado, es decir, se hayan extrado los n individuos de la poblacin y "medido" la variable X en cada uno de ellos, se dispondrn de n datos u observaciones: x1 , x2 ,..., xn. Para que una variable aleatoria, definida a partir de una muestra aleatoria de tamao n, tome valores, es necesario disponer de los n datos de la realizacin de tal muestra. 2.2.2. MUESTRA NO ALEATORIA

En que un criterio particular o un procedimiento no aleatorico selecciona los objetos para ser estudiados. Es tambin posible que el investigador elija deliberadamente los casos que han de ser estudiados

3.VARIABLES ESTADISTICAS
3.1. DEFINICIN

Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. 3.2. CLASIFICACIN

Los tipos de variables son: a) VARIABLE CUALITATIVA Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa cuantitativa ordinal o variable cuasi

Una variable cualitativa ordinal presenta modalidades no numricas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3,... Bioestadstica 8
Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana Medallas de una prueba deportiva: oro, plata, bronce. b) VARIABLE CUANTITATIVA Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: - Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales. RESUMEN - Variable cualitativa: Aquella cuyas modalidades son de tipo nominal. Variable cuasi cuantitativa: Modalidades de tipo nominal, en las que existe un orden. Variable cuantitativa discreta: Sus modalidades son valores enteros. Variable cuantitativa continua: Sus modalidades son valores reales.

4.REPRESENTACIONES GRAFICAS
Hemos visto que la tabla estadstica resume los datos que disponemos de una poblacin, de forma que esta se puede analizar de una manera ms sistemtica y resumida. Para darnos cuenta de un solo vistazo de las caractersticas de la poblacin resulta aun ms
Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana esclarecedor el uso de grficos y diagramas, cuya construccin abordamos en esta seccin. 4.1. Grficos para variables cualitativas

Los grficos ms usuales para representar variables de tipo nominal son los siguientes: Diagramas de barras En la figura 1.1, representamos en el eje de ordenadas las modalidades en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el grafico, se intenta comparar varias poblaciones entre s, existen otras modalidades, como las mostradas en la figura 1.2. Cuando los tamaos de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podran resultar engaosas.

Diagramas de sectores (tambin llamados tartas). Se divide un crculo en tantas porciones como clases existan, de modo que a cada clase le
Bioestadstica Prof. Alfredo Sulln Len

10

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa (figura 1.3).

El arco de cada porcin se calcula usando la regla de tres:

Como en la situacin anterior, puede interesar comparar dos poblaciones. En este caso tambin es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre grficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular, al igual que en la figura 1.4. Sean n1 < n2 los tamaos respectivos de las 2 poblaciones. La poblacin ms pequea se representa con un semicrculo de radio r1 y la mayor con otro de radio r2. La relacin existente entre los radios, es la que se obtiene de suponer que la relacin entre las areas de las circunferencias es igual a la de los tamaos de las poblaciones respectivas, es decir:

Bioestadstica Prof. Alfredo Sulln Len

11

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

Pictogramas Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. Estos grficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la figura 1.5. El escalamiento de los dibujos debe ser tal que el rea (Es un error hacer la representacin con una escala tal que el permetro del dibujo sea proporcional a la frecuencia, ya que a frecuencia doble, correspondera un dibujo de rea cudruple, lo que da un efecto visual engaoso.) de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de grficos suele usarse en los medios de comunicacin, para que sean comprendidos por el pblico no especializado, sin que sea necesaria una explicacin compleja.

4.2.

Grficos para variables cuantitativas 12

Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana Para las variables cuantitativas, consideraremos dos tipos de grficos, en funcin de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas: Diagramas diferenciales Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el nmero o porcentaje de elementos que presenta una modalidad dada. Diagramas integrales Son aquellos en los que se representan el nmero de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a grficos crecientes, y es obvio que este tipo de grficos no tiene sentido para variables cualitativas. Segn hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuacin las diferentes representaciones graficas que pueden realizarse para cada una de ellas as como los nombres especficos que reciben. 4.3. Grficos para variables discretas Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una grafica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras as como su diagrama integral correspondiente estn representados en la figura 1.6. Ejemplo de variable discreta Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el numero de caras, X, obtenindose los siguientes resultados: 2,1,0,1,3,2,1,2 Representar grficamente el resultado. Solucin: En primer lugar observamos que la variable X es cuantitativa discreta,
Bioestadstica Prof. Alfredo Sulln Len

presentando 13

las

modalidades:

0,1,2,3.

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana Ordenamos a continuacin los datos en una tabla estadstica, y se representa la misma en la figura 1.6.

Ejemplo de representacin grafica Clasificadas 12 familias por su numero de hijos se obtuvo:

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente. Solucin: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:

Bioestadstica Prof. Alfredo Sulln Len

14

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

Con las columnas relativas a xi y ni realizamos el diagrama de barra para frecuencias absolutas, lo que se muestra en la figura 1.7. Como puede verse es idntico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la informacin procedente de las columnas xi y Ni.

4.4.

Grficos para variables continuas

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polgonos de frecuencias. Un histograma se construye a partir de la tabla estadstica, representando sobre cada intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular la altura de cada
Bioestadstica Prof. Alfredo Sulln Len

15

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana rectngulo es el de mantener la proporcionalidad entre las

frecuencias absolutas (o relativas) de cada intervalo y el rea de los mismos. Vase la figura 1.8. El polgono de frecuencias se construye fcilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lneas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polgono de frecuencias en el primer y ultimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del histograma que corresponden a sus marcas de clase. Obsrvese que de este modo, el polgono de frecuencias tiene en comn con el histograma el que las reas de la graficas sobre un intervalo son idnticas. Vanse ambas graficas diferenciales representadas en la parte superior de la figura 1.9.

Bioestadstica Prof. Alfredo Sulln Len

16

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

El diagrama integral para una variable continua se denomina tambin polgono de frecuencias acumulado, y se obtiene como la poligonal definida en abscisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polgono de frecuencias absolutas es una primitiva del histograma. Vase la parte inferior de la figura 1.9, en la que se representa a modo de ilustracin los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente:

Bioestadstica Prof. Alfredo Sulln Len

17

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

5.DISTRIBUCIN DE FRECUENCIAS
Bioestadstica Prof. Alfredo Sulln Len

18

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana Distribucin de frecuencias es como se denomina en estadstica a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto significa una de las cosas ms importantes de la matemtica, su estadstica con la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. 5.1. ELEMENTOS FUNDAMENTALES a) RANGO. Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y el nmero menor de los datos. R = N_max - N_min Ejemplo. Dados los nmeros: 5, 10, 12, 8, 13, 9, 15 R= 15- 5 b) AMPLITUD TOTAL. Simplemente se obtiene sumndole 1 al rango. AT = (R+1) c) LAS CLASES. Estn formadas por dos extremos. el menor se llama lmite inferior el mayor se llama lmite superior. hay distintos tipos de clases. Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99) d) EL NUMERO DE CLASES. Se determina a travs de la formula de Sturges, la cual es vlida cuando el No de observaciones sea menor o igual a 500. Formula. Nc= 1 + 3.33log ( N ) Donde: Nc es el nmero de clases. N es la cantidad de muestras tomadas. e) VALOR DEL INTERVALO O AMPLITUD
Bioestadstica Prof. Alfredo Sulln Len

19

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana Se Obtiene por medio de la ecuacin de dicta: Vi = AT / Nc Donde: Vi es el valor de intervalo AT es la amplitud total Nc es el nmero de clase

5.2. TIPOS DE FRECUENCIA Frecuencia absoluta

La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por n i .

La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Bioestadstica Prof. Alfredo Sulln Len

20

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana Se representa por F i . Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi

Recue n to

fi

Fi

ni

Ni

2 7 2 8 2 9 3 0 3 1

0. 03 2

0. 03 2

II

0. 06 5

0. 09 7

0. 19 4

0. 29 0

1 6 0. 22 6

0. 05 16

2 4 0. 25 8

0. 77 4

Bioestadstica Prof. Alfredo Sulln Len

21

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

3 2 3 3 3 4

II I

2 7 0. 09 7

0. 87 1

II I

3 0 0. 09 7

0. 96 8

3 1 0. 03 2

31

5.3. DISTRIBUCIN DE FRECUENCIAS AGRUPADAS La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase

Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase

La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.

6. PROMEDIOS:
6.1. MEDIA
Bioestadstica Prof. Alfredo Sulln Len

22

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana


Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valores observados, dividido por el nmero total de observaciones.

Ecuacin 5-1 Cuando los valores representan una poblacin la ecuacin se define como:

Ecuacin 5- 2 Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern representativas para las muestras. La media aritmtica para una muestra est determinada como

Ecuacin 5-3 Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los valores observados. Esta frmula nicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la informacin; es decir,

Ecuacin 5-4 Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase. Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y
Bioestadstica Prof. Alfredo Sulln Len

23

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana


41). Para facilitar su interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos datos se representan en la tabla [5-1].

Figura 5-1 Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si a estos mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los valores individuales, obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados. Es importante resaltar que existe una gran variedad de medias como la Media geomtrica, la Media ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas.

6.2. MEDIANA
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la mediana se utiliza la frmula
Bioestadstica Prof. Alfredo Sulln Len

24

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

Ecuacin 5-5 Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale al nmero (8). Si por el contrario contamos con un conjunto de datos que contiene un nmero par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendramos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor. En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta por ciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o datos, la mediana dar como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un nmero par de observaciones se debe promediar los valores de las dos posiciones centrales.

6.3. MODA
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2 quien sera la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos ms de dos valores, lo que se conoce como multimodal. En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor que ms se repite dentro de los datos.
Bioestadstica Prof. Alfredo Sulln Len

25

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

**CUADRO RESUMEN DE FORMULAS**

7. Medidas de dispersin o variabilidad


Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es Bioestadstica 26
Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).

7.1. RANGO O RECORRIDO


El rango o recorrido estadstico es la diferencia entre el valor mnimo y el valor mximo en un grupo de nmeros aleatorios. Se le suele simbolizar con R. Requisitos del rango

Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo.

Ejemplo Para una muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es 100 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de: Rango = (100-0) =100 Propiedades del Rango o Recorrido: - El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que simplemente es la distancia entre los valores extremos (mximo y mnimo) en una distribucin. Puesto que el recorrido se basa en los valores extremos ste tiende a ser errtico. No es extrao que en una distribucin de datos econmicos o comerciales incluya a unos pocos valores en extremo pequeos o grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersin con respecto a esos valores anormales, ignorando a los dems valores de la variable. La principal desventaja del recorrido es que slo est influenciado por los valores extremos, puesto que no cuenta con los dems valores de la variable. Por tal razn, siempre existe el peligro de que el recorrido ofrezca una descripcin distorsionada de la dispersin.

Bioestadstica Prof. Alfredo Sulln Len

27

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana En el control de la calidad se hace un uso extenso del recorrido cuando la distribucin a utilizarse no la distorsionan y cuando el ahorro del tiempo al hacer los clculos es un factor de importancia.

7.2. Varianza
La varianza es una medida de dispersin relativa a algn punto de referencia. Ese punto de referencia es la media aritmtica de la distribucin. Ms especficamente, la varianza es una medida de que tan cerca, o que tan lejos estn los diferentes valores de su propia media aritmtica. Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es la varianza; cuando ms cerca estn las X i a su media menos es la varianza. Y se define y expresa matemticamente de la siguiente manera:

La varianza para datos no agrupados Dado un conjunto de observaciones, tales como X1, X2, , Xn, la varianza denotada usualmente por la letra minscula griega (sigma) elevada al cuadrado (2)y en otros casos S2 segn otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmtica Matemticamente, se expresa como:

Ejemplo N 1: Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4 aos, encontrar la varianza de las edades de estos estudiantes: Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:
Bioestadstica Prof. Alfredo Sulln Len

28

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

Xi 18 23 25 27 34 Total

( Xi - ) (18 25.5)=-7.4 (23 25.5)=-2.4 (25 25.5)=-0.4 (27 25.5)= 1.6 (34 25.5)= 8.6

( Xi - )2 (-7.4)2=54.76 (-2.4)2= 5.76 (-0.4)2= 0.16 ( 1.64)2= 2.16 ( 8.6)2 =73.96 137. 20

(XI-)2 137.20 2 = ------------ = ----------- = 27.4 aos n 5 Respuesta: la varianza de las edades es de 27.4 aos Ejemplo N 2: T y tus amigos habis medido las alturas de vuestros perros (en milmetros):

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm. Calcula la media, la varianza y la desviacin estndar. Respuesta: Media = 600 + 470 + 170 + 29 = 1970 =

Bioestadstica Prof. Alfredo Sulln Len

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana 430 + 300 394 5 5 as que la altura media es 394 mm. Vamos a dibujar esto en el grfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media: Varianza: 2 = 2062 + 762 + (-224)2 + 362 108,520 = = + (-94)2 21,704
5 5

As que la varianza es 21,704.

Bioestadstica Prof. Alfredo Sulln Len

30

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana As que usando la desviacin estndar tenemos una manera "estndar" de saber qu es normal, o extra grande o extra pequeo.

7.3. Desviacin estndar


Es una medida de la cantidad tpica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersin ms utilizada, se le llama tambin desviacin tpica. La desviacin estndar siempre se calcula con respecto a la media y es un mnimo cuando se estima con respecto a este valor. Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raz cuadrada positiva de esta. A la desviacin se le representa por la letra minscula griega sigma ( ) por la letra S mayscula, segn otros analistas.

Clculo de la Desviacin Estndar = 2 S = S2

Ejemplo: Del clculo de la varianza de las edades de cinco estudiantes universitarios de primer ao se obtuvo 2=27.44, como la desviacin estndar es la raz cuadrada positiva, entonces = 27.44 = 5.29 aos. Igual procedimiento se aplica para encontrar le desviacin estndar de las cuentas por cobrar de la Tienda Cabreras y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviacin estndar es igual a =721.645 = 26.86 balboas. PROPIEDADES DE LA DESVIACIN ESTNDAR A su vez la desviacin estndar, tambin tiene una serie de propiedades que se deducen fcilmente de las de la varianza (ya que la desviacin tpica es la raz cuadrada positiva de la varianza): - La desviacin estndar es siempre un valor no negativo S ser siempre 0 por definicin. Cuando S = 0 X = xi (para todo i). - Es la medida de dispersin ptima por ser la ms pequea. - La desviacin estndar toma en cuenta las desviaciones de todos los valores de la variable - Si a todos los valores de la variable se le suma una misma constante la desviacin estndar no vara. - Si a todos los valores de la variable se multiplican por una misma constante, la desviacin estndar queda multiplicada por el valor absoluto de dicha constante.

7.4. Desviacin media


Bioestadstica Prof. Alfredo Sulln Len

31

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana La desviacin media es la media de las diferencias en valor absoluto de los valores a la media.

Este valor estadstico no es de mucha utilidad en estadstica debido a que no es fcil manipular dicha funcin al no ser derivable. Siendo ms formales, la desviacin media debera llamarse desviacin absoluta respecto a la media, para evitar confusiones con otra medida de dispersin, la desviacin absoluta respecto a la mediana, DM, cuya frmula es la misma, sustituyendo la media aritmtica por la mediana M. Pero tal precisin no es relevante, porque la desviacin absoluta respecto a la mediana es de uso todava menos frecuente. La desviacin absoluta respecto a la media, Dm, la desviacin absoluta respecto a la mediana, DM, y la desviacin tpica, , de un mismo conjunto de valores verifican la desigualdad:

Siempre ocurre que

Donde el Rango es igual a Rango = valor mximo valor mnimo Dm = 0 cuando los datos son exactamente iguales (e iguales a la media aritmtica) justo slo hay dos valores en los datos, :a,b, y hay exactamente la mitad de datos igual a :a y :b

7.5. El Coeficiente de Variacin


Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre
Bioestadstica Prof. Alfredo Sulln Len

32

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana diferentes muestras y las relativas que nos permitirn comparar varias muestras. El problema de las medidas de dispersin absolutas es que normalmente son un indicador que nos da problemas a la hora de comparar. Comparar muestras de variables que entre s no tienen cantidades en las mismas unidades, de ah que en ocasiones se recurra a medidas de dispersin relativas. Un problema que se plantea, tanto la varianza como la desviacin estndar, especialmente a efectos de comparaciones entre distribuciones, es el de la dependencia respecto a las unidades de medida de la variable. Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variacin de Pearson", del que se demuestra que nos da un nmero independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersin aquella cuyo coeficiente de variacin sea menor., y que se define como la relacin por cociente entre la desviacin estndar y la media aritmtica; o en otras palabras es la desviacin estndar expresada como porcentaje de la media aritmtica. Definicin del Coeficiente de Variacin

Donde: C.V. representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

Bioestadstica Prof. Alfredo Sulln Len

33

UNIVERSIDAD NACIONAL DE PIURA

Facultad de Medicina Humana

BIBLIOGRAFIA
http://www.seh-lelha.org/stat1.htm http://es.wikipedia.org/wiki/Bioestad%C3%ADstica http://www.vitutor.com/estadistica/descriptiva/a_2.html http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1u-punt11.html#seccion2 http://es.wikipedia.org/wiki/Representaci%C3%B3n_gr %C3%A1fica http://www.ing.unp.edu.ar/estadisitio/index.html http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias" http://www.vitutor.net/2/11/distribucion_frecuencias.html http://www.ucv.cl/web/estadistica/promedio.htm http://www.aaamatematicas.com/sta.htm http://www.disfrutalasmatematicas.com/datos/desviacionestandar.html http://es.wikipedia.org/wiki/Desviaci%C3%B3n_est%C3%A1ndar

Bioestadstica Prof. Alfredo Sulln Len

34

Você também pode gostar