Você está na página 1de 14

ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

UNIDAD I: ESTADSTICA
DESCRIPTIVA
La Estadstica hoy

La Estadstica es una ciencia la cual aporta habilidades bsicas para que un ciudadano
pueda desenvolverse en la era de la informacin. Es una poderosa herramienta de apoyo
en la toma de decisiones, a travs de la recoleccin, organizacin, resumen y anlisis de
datos.

Hoy en da la gran mayora de los estudiantes tienen acceso a un computador ya sea


personal o en la institucin en donde estudia, por lo cual tener acceso a procesar datos es
casi instantneo, a travs de software de apoyo en anlisis estadstico, por ejemplo Excel,
que no siendo un software estadstico es un gran apoyo, SPSS, Minitab, entre otros.

A.1. Estadstica descriptiva.

La estadstica descriptiva se aplica cuando estudiamos una nica caracterstica sobre un


conjunto de elementos. Los registros que efectuamos de este estudio son datos brutos
puesto que an no han sido procesados.

A.1.1. Conceptos de uso cotidiano.

Individuo o elemento: Personas u objetos que tienen informacin que se desea estudiar.
Variable: Propiedades, rasgos o cualidades con respecto a la cual difieren los elementos
de la poblacin.
Poblacin: Conjunto de elementos en los que se observa alguna caracterstica comn. Se
denota como .
Muestra: Subconjunto de la poblacin, la cual se recolecta y analiza con el objetivo de
hacer inferencias. Se denota como .
Parmetro: Caracterstica numrica que describe y resume la variable aleatoria observada
en la poblacin.
Estadstico: Caracterstica numrica que describe y resume la variable aleatoria observada
en la muestra.

A.1.2. Tipos de variable.

Variables cualitativas, presentan una caracterstica observada de un atributo o cualidad y


tienen por valores cantidades no numricas. Se clasifican en:
1. Ordinal: El orden de las categoras denotan una jerarqua.
2. Nominal: El orden de las categoras no denotan una jerarqua.

Variables cuantitativas, tienen por valores cantidades numricas a cada caracterstica de


una unidad de observacin. Se clasifican en:
1. Discretas: Los valores no toman valores decimales.

1|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

2. Continuas: Los valores toman valores decimales.

A.2. Tablas de distribucin de frecuencias.

Una vez definida la variable de inters es necesario clasificar y ordenar los elementos de la
poblacin o muestra. As, una tabla de distribucin de frecuencias lista valores de datos u
observaciones, ya sea de manera individual o por grupos.

Una tabla de distribucin de frecuencias est compuesta por:

xi : Categora, nmero o intervalo que toma la variable.


ni : Frecuencia absoluta (n de elementos de cada clase).
fi : Frecuencia relativa porcentual (cociente entre ni y n total, en porcentaje).
Ni : Frecuencia absoluta acumulada (suma de ni).
Fi : Frecuencia relativa porcentual acumulada (suma de fi).

Se cumple que:
n n
ni
ni = n fi = 100% fi = 100%
n
i=1 i=1

A.2.1. Tipos de tablas de distribucin de frecuencias.

Para variables cualitativas, los valores que toma la variable x corresponden a cada una
de las categoras de dicha variable.

Ejemplo 1. Se realiz una encuesta a los 12 trabajadores de una empresa, acerca de la


frecuencia con la que toman desayuno, respondieron lo siguiente:

A veces Nunca Todos los das Todos los das


A veces Todos los das Todos los das Todos los das
Todos los das A veces Nunca Todos los das

Construir tabla de distribucin de frecuencias.

Para datos individuales, la variable asociada es del tipo cuantitativa y se utiliza cuando el
nmero de datos distintos entre s es pequeo. Aqu los valores que toma la variable indica
la frecuencia con que aparecen los datos, desde el menor de ellos hasta el mayor de ese
conjunto.

Ejemplo 2. Los siguientes son los puntajes de un grupo de adolescentes en un test de


agudeza visual:

23 22 21 24 25 23 22 21 23 21
22 23 25 21 22 22 21 23 24 22

Construir tabla de distribucin de frecuencias.

2|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Para datos agrupados en intervalos, se debe tener presente en las variables cuantitativas
que si el nmero de datos poblacionales distintos entre s es grande podemos obtener un
gran nmero de clases con frecuencia absoluta igual a 1 que estadsticamente no resulta
relevante. En tal situacin podemos agrupar las clases en intervalos. Se recomienda entre
5 y 20 intervalos de clase o utilizar la regla de Sturger.

Los pasos que conforman la elaboracin de la distribucin de frecuencias por intervalos son
los siguientes:

xmin : Valor mnimo que toman los datos


xmax : Valor mximo que toman los datos
Rx : Recorrido de la variable x (Rx = xmax - xmin)
K : N de intervalos (Regla de Sturge: k = 1+3,3 log n)
A : Amplitud del intervalo (A = Rx/K)

El primer lmite inferior (Linf) de la tabla de frecuencia por intervalo corresponder al valor
mnimo que toman los datos (xmin), luego para encontrar el primer lmite superior (Lsup), al
valor del lmite inferior se le sumar la amplitud (a). Los restantes lmites inferiores
coincidirn con los lmites superiores de las clases anteriores.

Una vez definidas las clases de la tabla de frecuencia por intervalo, se procede a calcular
las restantes frecuencias de la tabla, agregando la siguiente informacin:

mi : Marca de clase del intervalo i (punto medio: mi = (Linf + Lsup)/2)

Obs.: Como criterio para facilitar la interpretacin, la amplitud debe presentarse con la
misma cantidad de decimales que los datos originales.

Ejemplo 3. Los datos que se presentan a continuacin son las edades de un grupo de
mujeres diabticas, que concurren a controles peridicos en un centro especializado:

66 74 75 69 65 63 60 62 64 73
67 63 74 73 69 68 75 71 70 67

Construir tabla de distribucin de frecuencias.

A.3. Representaciones grficas.

La representacin grfica permite visualizar el comportamiento de un conjunto de datos,


como tambin conocer caractersticas especiales de la distribucin a la cual pertenecen. La
utilizacin adecuada de un grfico, al igual que la distribucin de frecuencias, depende del
tipo de variable. A continuacin se presentan los diferentes tipos de grficos:

1. Grfico de barras: Asociado a tablas de distribucin de frecuencia de variables


cualitativas y/o cuantitativas en clases individuales. Sobre cada clase se levanta una
barra de altura igual a la frecuencia de la clase.

Eje horizontal (x) : Categora o valores xi que toma la variable x.


Eje vertical (y) : Frecuencia absoluta ni o relativa porcentual fi.

3|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Grfico de barras Grafico de barras


variable cualitativa variable cuantitativa
5 6
4 5
4
3
3
2
2
1 1
0 0
A B C D E F 0 2 4 6 8 10

Ejemplo. Construir el grafico de barras asociado a los ejemplo 1 y 2.

2. Histograma: Asociado a tablas de distribucin de frecuencia por intervalos. Consiste en


un conjunto de rectngulos cada uno de los cuales representa un intervalo de
agrupacin o clase. Sus bases son iguales a la amplitud del intervalo y la altura se
determinan de manera que su rea sea proporcional a la frecuencia de cada clase.

Eje horizontal (x) : Intervalo de frontera Linf -Lsup de la variable x.


Eje vertical (y) : Frecuencia absoluta ni o relativa porcentual fi.

Histograma
5
4
3
2
1
0
[1-2[ [2-3[ [3-4[ [4-5[ [5-6[ [6-7[

Ejemplo. Construir histograma asociado al ejemplo 3.

3. Polgono de frecuencias: Es aplicable a tablas de distribucin de frecuencia por


intervalos. El tipo de representacin es un grfico de lnea. Se construye uniendo con
segmentos de recta las marcas de clase de los intervalos adyacentes. El objetivo de
este es determinar la forma que sigue la distribucin de frecuencias.

Eje horizontal (x) : Marcas de clases mi de cada intervalo de la variable x.


Eje vertical (y) : Frecuencia absoluta ni o relativa porcentual fi.

4|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Polgono de frecuencias en el Polgono de frecuencias


histograma
5
5
4
4
3
3
2
2
1 1
0 0
[1-2[ [2-3[ [3-4[ [4-5[ [5-6[ [6-7[ 1,5 2,5 3,5 4,5 5,5 6,5

Ejemplo. Construir polgono de frecuencia asociado al ejemplo 3.

4. Ojiva: Se utiliza para variables cuantitativas resumidas en clases individuales o


intervalos y es un polgono de frecuencias acumulativas.

Eje horizontal (x) : Valores xi o marca de clase mi de la variable x.


Eje vertical (y) : Frecuencia absoluta acumulada Ni o relativa acumulada Fi.

Ojiva
20

15

10

0
1,5 2,5 3,5 4,5 5,5 6,5

Ejemplo. Construir ojiva asociado a los ejemplos 2 y 3.

5. Grfico circular: Es usado para variables cualitativas y cuantitativas y permite


representar las frecuencias absolutas o relativas porcentuales en un crculo. Se debe
determinar la cantidad de grados del crculo correspondiente a cada frecuencia como:

360 ni
xi =
N

5|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Grfico circular

20%
30%
A
B
C
10% D
40%

Ejemplo. Construir grafico circular de los ejemplos 1 y 2.

A.4. Medidas estadsticas.

En la distribucin de frecuencias de una variable numrica, es necesario recurrir a ciertos


valores numricos que permiten cuantificar caractersticas de la distribucin. Estas son las
llamadas Estadsticos descriptivos o Estadgrafos y se presentan a continuacin:

A.4.1. Medidas de tendencia central.

Medidas estadsticas que pretenden resumir en un solo valor a un conjunto de valores.


Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las
medidas de tendencia central ms utilizadas son:

Media aritmtica: Es un promedio, el cual se denota por y se calcula segn la forma en


que se entreguen los datos o la distribucin de frecuencia.

Para datos individuales sin agrupar:


n
1
x = xi
n
i=1

Ejemplo 4. A continuacin se tienen los pesos de 10 nias de 8 aos, participantes de una


escuela de ballet. Calcular el peso promedio de estas nias.

21 25 24 23 30 27 22 23 22 23

Para datos agrupados en clases individuales:


n
1
x = xi ni
n
i=1

6|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Ejemplo 5. Un profesor aplica una prueba de diagnstico de matemticas a 20 alumnos, a


los que evala en puntaje de 1 a 10. El resume de los datos se muestra a continuacin:

Calificacin N alumnos
2 3
4 6
5 5
6 3
8 1
10 2
Total 20

Calcular el puntaje promedio de los alumnos y comentar.

Para datos agrupados en intervalos de clases:


n
1
x = mi ni
n
i=1

Ejemplo 6. En la siguiente tabla se muestran las edades de un grupo de personas.

Edad mi ni
[0 - 10[ 5 3
[10 - 20[ 15 6
[20 - 30[ 25 7
[30 - 40[ 35 12
[40 - 50[ 45 3
Total - 31

Calcular la edad promedio de estas personas y comentar.

Propiedades de la Media Aritmtica

1. Si cada valor xi se multiplica por una constante c y se calcula la media aritmtica de


estos nuevos valores el resultado es igual al producto de la constante por la media
aritmtica de los datos originales, es decir:

cx
= cx

2. Si cada valor xi se le suma o se le resta una constante c y se calcula la media aritmtica


de estos nuevos valores el resultado es igual al promedio original ms o menos la
constante c, es decir:


x c = x c

7|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Mediana: La media aritmtica no resulta ser adecuado cuando existe una concentracin de
valores en algunos de los extremos. En este caso es preferible utilizar la mediana como
estadgrafo de posicin, este valor divide a la distribucin de frecuencia en dos partes
iguales cada una conteniendo el 50% de los datos. Se denota por Me.

Para datos individuales sin agrupar:

Paso 1: Los datos se ordenan de menor a mayor

Paso 2: Si el nmero de datos n es impar, la mediana es el valor que ocupa el centro


de la ordenacin. Si el nmero de datos n es par, la mediana es el promedio
de los dos valores que ocupan el centro de la ordenacin, es decir:
Xn +Xn
+1
2 2
n es impar: Me = X n n es par: Me = 2
2

Ejemplo. Calcular la mediana de los datos del ejemplo 4.

Para datos agrupados en clases individuales:


n
Me = xi asociado al Ni que supera por primera vez
2

Ejemplo. Calcular la mediana de los datos del ejemplo 5.

Para datos agrupados en intervalos de clases:

Paso 1: Identificar intervalo mediano i, que corresponde al intervalo asociado al Ni


n
que supera por primera vez
2

Paso 2: Reemplazar los datos en la siguiente formula:

n
Ni1
Me = FIi + (2 )A
ni

Donde:

FIi : Lmite inferior del intervalo mediano


Ni-1 : Frecuencia absoluta acumulada anterior a clase del intervalo mediano
ni : Frecuencia absoluta del intervalo mediano
A : Amplitud del intervalo

Ejemplo. Calcular la mediana de los datos del ejemplo 6.

Obs.: Si no hay Ni-1 se reemplaza por 0.

8|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Moda: Valor ms frecuente de todo el conjunto de datos. Es posible que una poblacin
tenga dos o ms modas. En esos casos se suelen llamar distribuciones bimodales o
multimodales. Se denota por Mo.

Para datos individuales sin agrupar:

Mo = Valor (es) que ms se repite

Ejemplo. Calcular la mediana de los datos del ejemplo 4.

Para datos agrupados en clases individuales:

Mo = xi asociado al ni ms alto

Ejemplo. Calcular la moda de los datos del ejemplo 5.

Para datos agrupados en intervalos de clases:

Paso 1: Identificar intervalo modal i, que corresponde al intervalo asociado al ni ms


alto.

Paso 2: Reemplazar los datos en la siguiente formula:

ni+1
Mo = FIi + ( )A
ni1 + ni+1

Donde:

FIi : Lmite inferior del intervalo modal


ni+1 : Frecuencia absoluta de la clase posterior a la del intervalo modal
ni-1 : Frecuencia absoluta de la clase anterior a la del intervalo modal
a : Amplitud del intervalo

Ejemplo. Calcular la moda de los datos del ejemplo 6.

Obs.: Si no hay ni+1 o ni-1 se reemplaza por 0.

Simetra de los datos

Las medidas de tendencia central nos proporcionan una idea de la forma de la distribucin.
Una distribucin de datos est sesgada si no es simtrica y se extiende ms hacia un lado
que hacia el otro. Una distribucin de datos es simtrica si la mitad izquierda de su
histograma es aproximadamente una imagen en espejo de su mitad derecha.

1. Sesgada a la izquierda (sesgo negativo): La media y la mediana estn a la izquierda


de la moda, es decir, x Me < Mo.

9|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

2. Simtrica (sesgo cero): La media, la mediana y la moda son iguales, es decir, x =


Me = Mo.

3. Sesgada a la derecha (sesgo positivo): La media y la mediana estn a la derecha


de la moda, es decir, x Me > Mo.

Ejemplo. Analizar la simetra de los ejemplos 4, 5 y 6.

A.4.2. Medidas de dispersin.

La media aritmtica es la ms representativa como medida de tendencia central en


distribuciones simtrica, sin embargo no es suficiente si queremos comparar dos
distribuciones. Las medidas estadsticas de variabilidad cuantifican la dispersin de los
datos en torno al centro de los datos. Miden cun esparcidos se encuentran stos o qu tan
heterogneos son. Las ms usuales son:

Varianza: Es la de mayor utilidad en aplicaciones estadsticas y se define como V(x)

Para datos individuales sin agrupar:


n
1
V(x) = (xi x)2
n
i=1

Ejemplo. Calcular la varianza de los datos del ejemplo 4.

Para datos agrupados en clases individuales:


n
1
V(x) = (xi x)2 ni
n
i=1

Ejemplo. Calcular la varianza de los datos del ejemplo 5.

Para datos agrupados en intervalos de clases:


n
1
V(x) = mi 2 ni x 2
n
i=1

Ejemplo. Calcular la varianza de los datos del ejemplo 6.

Desviacin estndar: Se define y es la raz cuadrada positiva de la varianza (desviacin


promedio de los datos originales con respecto a su media aritmtica), es decir:

S(x) = V(x)

10 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Ejemplo. Calcular la desviacin estndar de los ejemplos 4, 5 y 6.

Coeficiente de variacin: Se define como CV y entrega el grado de variabilidad de los


datos. Es utilizado mayormente para comparar dos distribuciones en que pueden tener
distinta unidad de medida. Se tiene:

S(x)
CV = 100%
x

Datos homogneos : CV 35%


Datos heterogneos : CV > 35%

Ejemplo. Calcular el coeficiente de variacin de los ejemplos 4, 5 y 6.

A.4.3. Medidas de posicin.

Las medidas de posicin dividen todo el conjunto de datos en grupos con el mismo nmero
de individuos y son los siguientes:

Cuartiles: Dividen la distribucin de frecuencias en 4 partes, donde:

Qi: Punto tal que el 25i% de las observaciones son a este valor. i = 1,2, 3.

Para datos individuales sin agrupar:

Paso 1: Los datos se ordenan de menor a mayor

Paso 2: Se busca el lugar que ocupa cada cuartil mediante la expresin:


Xin +Xin
+1
4 4
n es impar: Q i = in n es par: Qi = 2
4

Ejemplo. Calcular Q1 de los datos del ejemplo 4.

Para datos agrupados en clases individuales:

in
Q i = xi asociado al Ni que supera por primera vez
4

Ejemplo. Calcular Q2 de los datos del ejemplo 5.

11 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Para datos agrupados en intervalos de clases:

Paso 1: Identificar intervalo que contiene el cuartil solicitado i, que corresponde al


iN
intervalo asociado al Ni que supera por primera vez 4

Paso 2: Reemplazar los datos en la siguiente formula:

in
Ni1
Q i = FIi + ( 4 )A
ni

Donde:

FIi : Lmite inferior del intervalo mediano


Ni-1 : Frecuencia absoluta acumulada anterior a clase del intervalo mediano
ni : Frecuencia absoluta del intervalo mediano
a : Amplitud del intervalo

Ejemplo. Calcular Q3 de los datos del ejemplo 6.

Deciles: Dividen la distribucin de frecuencias en 10 partes, donde:

Di: Punto tal que el 10i% de las observaciones son a este valor. i = 1 a 9.

Para datos individuales sin agrupar:

Paso 1: Los datos se ordenan de menor a mayor

Paso 2: Se busca el lugar que ocupa cada decil mediante la expresin:


Xin +Xin
+1
10 10
n es impar: Di = in n es par: Di = 2
10

Ejemplo. Calcular D3 de los datos del ejemplo 4.

Para datos agrupados en clases individuales:

in
Di = xi asociado al Ni que supera por primera vez
10

Ejemplo. Calcular D6 de los datos del ejemplo 5.

Para datos agrupados en intervalos de clases:

Paso 1: Identificar intervalo que contiene el decil solicitado i, que corresponde al


in
intervalo asociado al Ni que supera por primera vez 10

12 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

Paso 2: Reemplazar los datos en la siguiente formula:

in
Ni1
Di = FIi + ( 10 )A
ni

Donde:

FIi : Lmite inferior del intervalo mediano


Ni-1 : Frecuencia absoluta acumulada anterior a clase del intervalo mediano
ni : Frecuencia absoluta del intervalo mediano
a : Amplitud del intervalo

Ejemplo. Calcular D9 de los datos del ejemplo 6.

Percentiles: Dividen la distribucin de frecuencias en 100 partes, donde:

Pi: Punto tal que el i% de las observaciones son a este valor. i = 1 a 99.

Para datos individuales sin agrupar:

Paso 1: Los datos se ordenan de menor a mayor

Paso 2: Se busca el lugar que ocupa cada decil mediante la expresin:


X in +X in
+1
100 100
n es impar Pi = in n es par: Pi = 2
100

Ejemplo. Calcular P40 de los datos del ejemplo 4.

Para datos agrupados en clases individuales:

in
Pi = xi asociado al Ni que supera por primera vez
100

Ejemplo. Calcular P55 de los datos del ejemplo 5.

Para datos agrupados en intervalos de clases:

Paso 1: Identificar intervalo que contiene el percentil solicitado i, corresponde al


in
intervalo asociado al Ni que supera por primera vez 100

Paso 2: Reemplazar los datos en la siguiente formula:

13 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA

in
100 Ni1
Pi = FIi + ( )A
ni

Donde:

FIi : Lmite inferior del intervalo mediano


Ni-1 : Frecuencia absoluta acumulada anterior a clase del intervalo mediano
ni : Frecuencia absoluta del intervalo mediano
a : Amplitud del intervalo

Ejemplo. Calcular P77 de los datos del ejemplo 6.

Obs.: Q1=P25; Q2=Me=P50=D5; Q3=P75

No est dems saber!!

Grfico de tallo y hoja: Procedimiento semi-grfico de variables cuantitativas. Los dgitos


se separan en dos partes, el tallo que corresponde a un cierto nmero de dgitos de una
clase contados de izquierda a derecha, y la hoja que define la frecuencia absoluta de la
clase y corresponde al siguiente dgito desechando los restantes, si existen. La
representacin de los datos se realiza usando una columna para los tallos, ordenados en
forma ascendente y sin repetir y otra para las correspondientes hojas.

Tallo Hoja
0 45
1 23455
2 223456
3 23457
4 1234678
5 1256
6 2467
7 135

Grfico de caja y bigotes (Box Plot): Un grfico de cajas con patillas muestra las
posiciones relativas de los cuartiles, porcin central y valores extremos de una distribucin
de frecuencias. Esta grfica encierra el rango intercuartil Q3-Q1 de los datos en una caja
que tiene la mediana dibujada dentro. Adems, podemos identificar el tipo de asimetra de
la distribucin de frecuencias. Ser simtrica si la posicin de la mediana se encuentra en
la mitad de la caja y las antenas tienen la misma distribucin.

14 | P g i n a

Você também pode gostar