Você está na página 1de 41

ESTADISTICA

DESCRIPTIVA
Tablas y grficos de
frecuencias.
Medidas de resumen para
variables cuantitativas.
Anlisis Exploratorio de
Datos

Resmen de datos:
variables cuantitativas.
Al resumir datos cuando la variable es
cuantitativa, surgen preguntas como:
Existen valores extraos?
Los datos siguen una distribucin simtrica o
no?
Cul es el valor central , alrededor del cual
se concentran los datos?
Cun dispersos se encuentran los datos
respecto al valor central?
Cules son las medidas de resumen que se
utilizarn?
2

PASOS A SEGUIR EN EL ANLISIS


DESCRIPTIVO DE VARIABLES CUANTITATIVAS.

Anlisis exploratorio de los datos para:


1. Identificar datos faltantes, datos
extraos en los formatos o cuestionarios
aplicados.
2. Identificar la simetra de los datos
3. Identificar la variabilidad
4. Decidir que medidas de resumen utilizar

Edad de 100
padres de
familia
20
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
42
43
44
45
46
47
48
50
52
53
54
55
60
Total

Fr
1
2
1
2
5
5
3
4
6
5
4
5
4
6
6
2
3
4
2
6
5
2
1
2
1
1
3
2
1
1
1
1
3
100

Los cuartiles son medidas de posicin.

Cajas

Cuartil 1 = Q1 Representa el 25% inferior


Cuartil 2 = Q2 Representa el 50% (mediana)
Cuartil 3 = Q3 Representa el 25% superior

Grfico 2.- Edad de 100 padres de familia


Datos discordantes

60

IQ = Intervalo cuartilar
Representa el 50% central

Valor mximo

50

Es igual al Cuartil 3 Cuartil 1


40

Cuartil 3
Cuartil 2

30

Cuartil 1

IC

Datos discordantes,
extraos u outliers

Valor mnimo

20

Un dato es discordante si:


10
Edad

< Cuartil 1 - 1.5*IQ


> Cuartil 3 + 1.5*IQ

EJEMPLO:
Se tienen las edades de 35 madres:
35

32

21

43

39

28

28

36

12

54

45

37

53

26

45

23

64

21

34

22

29

36

45

55

20

38

46

27

22

38

35

56

45

33

28

DIAGRAMA DE CAJAS
EDAD DE 35 MADRES
70
60

Valor mximo

Valor Mximo

Edad

50
40
30

Q3
Me
Q1

20
10

Valor
mnimo
6

http://www.efdeportes.com/efd104/futbol-formacion.htm

Estudio comparativo del desarrollo fsico en nios que


practican la disciplina del ftbol en etapa de formacin
OBJETIVO: Comparar el Desarrollo Fsico en nios que practican la disciplina del ftbol en etapa
de formaciones pertenecientes a la escuela de ftbol menor del "Luis Ghersy Govea" del
Municipio Libertador y la escuela de ftbol menor "Carlos Guilln" del Municipio Pueblo Llano
ambas del Estado Mrida.

En cuanto al Peso no hay diferencias


significativas con respecto a la edad de los
dos grupos de edades del Municipio
Libertador, esto porque ambas cajas estn
contenidas en la otra, lo que si se puede
observar es que para la Edad =10 el Peso
tiene mayor dispersin. El punto marcado
con 51 en el grfico representa un valor

Con respecto a la variable talla no hay


diferencias significativas entre los dos
grupos de edades de los nios del
Municipio Libertador, lo que si se deduce
es que para la Edad =11 la talla est mas
dispersa.

Mtodos para la deteccin de la variacin


estacional en Cuba aplicados a la vigilancia en
salud

Revista Cubana de Salud Pblica vol.33no.1La HabanaJan./Mar.2007

.. la mortalidad infantil
alcanz los mayores
valores de las tasas
mensuales en los
primeros siete meses del
ao, con un gran pico en
julio, y despus descendi
con el menor valor en el
mes de diciembre.

http://www.scielosp.org/scielo.php?pid=S086434662007000100006&script=sci_arttext&tlng=es

LA INTEGRACIN DE LA TECNOLOGA EDUCATIVA


COMO ALTERNATIVA PARA AMPLIAR
LA COBERTURA EN LA EDUCACIN SUPERIOR
se busca utilizar un modelo de
organizacin de las actividades de
los cursos que, al integrar
tecnologa educativa y considerar el
conocimiento explcito, disminuya
los requerimientos
de tiempo aula y optimice el tiempo
de atencin a los estudiantes.

Se obtuvo informacin de 161


cursos: 60 de ciencias
naturales y exactas, 63 de
sociales y polticas y, 38 de
tecnologas e ingeniera. La
consideracin del profesor en
cuanto a su percepcin del
tiempo de exposicin
excluyendo talleres y
laboratorios (EETL) se obtuvo
para 42 cursos y 119 para
estimaciones globales (EG).
http://www.comie.org.mx/documentos/rmie/v11/n28/pdf/rmiev11n28scB02n01es.pdf

DIAGRAMA DE TALLOS Y HOJAS


Stem-and-leaf of Edad N = 35
13 madres
tienen 29 aos
o menos

11 madres
tiene 43 aos o
ms

1
1
7
13
16
(8)
11
10
5
3
1

1
1
2
2
3
3
4
4
5
5
6

2
011223
667889
234
55667889
3
55556
34
56
4

Un conjunto de datos
de una variable
cuantitativa se
descompone en dos
partes:

TALLO: Uno o
ms dgitos
iniciales.
HOJA: Cada
dgito
representa un
valor
10

Edad de 100
padres de
f amilia
20
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
42
43
44
45
46
47
48
50
52
53
54
55
60
Total

Fr
1
2
1
2
5
5
3
4
6
5
4
5
4
6
6
2
3
4
2
6
5
2
1
2
1
1
3
2
1
1
1
1
3
100

Datos originales: Edades 100 padres


1.00
2. 0
3.00
2 . 223
7.00
2 . 4455555
8.00
2 . 66666777
10.00
2 . 8888999999
9.00
3 . 000001111
9.00
3 . 222223333
12.00
3 . 444444555555
5.00
3 . 66777
6.00
3 . 888899
6.00
4 . 000000
7.00
4 . 2222233
3.00
4 . 455
2.00
4 . 67
3.00
4 . 888
2.00
5 . 00
2.00
5 . 23
2.00
5 . 45
3.00 Extremes (>=60)

TALLO Y HOJAS
Un conjunto de datos
de una variable
cuantitativa se
descompone en dos
partes:

TALLO: Uno o
ms dgitos
iniciales.
HOJA: Cada
dgito
representa un
valor

Edad de los Ingresantes EAP Medicina


UNMSM, Julio 2008
26 1 6666666 77777777777777777 7 7
75

1 8888888888888888888899999999999999999999999999999

(58) 2
0000000000000000000000000000000000111111111111111111111111
127 2
2222222222222222222222222222222233333333333333333333333333333
66

2 4444444444444444444444444444455555555555555555555555

14

2 66666777

2 888

3 00

39

cada dato se representa por si mismo.

ASIMETRA

Distribucin simtrica: Cuando su curva de


frecuencia es simtrica con respecto al centro
de los datos, en este caso =Me=Mo.
CURVA NORMAL

Distribucion simetrica

3.0

Mean 0
StDev 1
N
7

2.5

Frecuencia

Frequency

5
4
3
2

2.0
1.5
1.0

1
0

0.5
1

0.0

-3

-2

-1

0
1
Me=Mo= I

13

Distribucin
>Me>Mo

asimtrica

positiva

Distribucion asimetrica positiva

8
7

Frequency

6
5
4
3
2
1
0
1

Distribucin

asimtrica negativa <Me<Mo

Distribucion asimetrica negartiva


8
7

Frequency

6
5
4
3
2
1
0
1

14

Decidir que medidas de


resumen utilizar
Medidas de
tendencia
central

Media aritmtica
Mediana
Moda
Otras medidas de
posicin: Cuartiles
y percentiles.

Medidas de
dispersin

Rango
Varianza
Desviacin
estndar
Coeficiente de
variabilidad

15

MEDIDAS DE POSICIN
Llamadas tambin de ubicacin, nos
permite determinar en qu parte de la
escala de medicin tiende a agruparse
un conjunto de valores obtenidos de
una variable cuantitativa.
Las medidas de posicin ms usadas
son la media, la mediana, la moda y los
percentiles y cuantiles.

Media aritmtica o promedio :


Es la medida que representa al conjunto de
datos. Se obtiene de sumar todos los valores
de una muestra y la sumatoria resultante se
divide entre el nmero de valores que( xse
)
sumaron. Se ve afectada por valores extremos

Frmula
:

x 1 x 2 ... x n
x

n
n
i 1

es la media

x i valores de la var iable


n

nmero de observaiones la muestra

Ejemplo 1
Se tienen los pesos de 10 recin nacidos:
3300 2800 ... 3400
x
3288 gramos
10
Nro
1
2
3
4
5
6
7
8
9
10

Peso
2800
2950
2960
3100
3300
3400
3400
3520
3650
3800

La edad promedio de los


recin nacidos es de 3 288
gramos.
gramos

Nro
1
2
3
4
5
6
7
8
9
10

Peso
1200
2950
2960
3100
3300
3400
3400
3520
3650
3800

La edad promedio de los


recin nacidos es de 3 128
gramos

Mediana:
Valor central que divide al conjunto de
datos ordenados de menor a mayor, en
dos grupos de igual tamao. El 50% es
igual o menor a la mediana, mientras
que el 50% restante es igual o mayor.
Frmulas:

x
Me

n
( )
2

n
( 1)
2

Cuando es par

Me x

n 1
)
2

Cuando es impar

Ejemplo:
A continuacin se presentan las
edades en aos correspondientes a los
pacientes atendidos en un hospital un
viernes por la noche. Diga cul es el
valor de la mediana de estas edades?

Posicin de la mediana

n 1
15 ;
2

Me

Me X n 1 43 aos
2

20

Pesos de 10 recin nacidos:

A
Nro
1
2
3
4
5
6
7
8
9
10
11

B
Peso
2800
2950
2960
3100
3300
3400
3400
3520
3650
3650
3800

Nro
1
2
3
4
5
6
7
8
9
10
11

Peso
1200
2950
Me
2960
3100
3300
3400
3400
3520
3650
3650
4200

En ambos casos
la Mediana se
encuentra en la
posicin 6.
No se ve
afectada por
valores
extremos.
extremos

Moda
Valor que se repite con ms
frecuencia dentro de un conjunto de
datos.
B
A

El valor
modal es
3400
(el valor
se repite
dos
veces)

Nro
1
2
3
4
5
6
7
8
9
10
11

Peso
2800
2950
2960
3100
3300
3400
3400
3520
3650
3670
3800

Nro
1
2
3
4
5
6
7
8
9
10
11

Peso
1200
2950
2960
3100
3300
3400
3500
3520
3650
3670
4200

Otras medidas de posicin


Cuartiles:
Son tres valores (Q1, Q2 , Q3)
que dividen a un conjunto de
datos, ordenados en forma
creciente, en 4 partes iguales.
Cada cuartil contiene el 25% de
datos.
Percentiles: Son 99 valores que
dividen 100 partes iguales a un
conjunto de datos.
El percentil 25 es el cuartril 1 y
el 75 es el cuartil 3.

25%

Q1

25%

Q2

RIC

25%

Q3

25%

Desigualdades en salud y desigualdades sociales: un


abordaje epidemiolgico en un municipio urbano de
Argentina

Antropometra del
trabajador minero
de la altura
Objetivo: Caracterizar
antropomtricamente a una
poblacin andina de
trabajadores mineros en la
sierra central del Per.

An Fac Med Lima 2006; 67(4)

TTULO INVESTIGACIN:
Aptitud clnica en estudiantes de enfermera ante situaciones clnicas complejas
Objetivo: Evaluar la aptitud clnica en estudiantes de licenciatura en enfermera y obstetricia, antes y
despus de iniciar la etapa prctica en el rea de pediatra
Aptitud clnica: Conjunto de acciones y conocimientos del estudiante de enfermera, aunados a la
reflexin y la crtica que tienen como finalidad el restablecimiento del paciente peditrico. Indicadores
1. Reconocimiento de signos y sntomas clnicos: Capacidad del estudiante para identificar, valorar e
integrar los datos clnicos del paciente en base a la reflexin.
2. Fundamentacin de acciones de enfermera: Grado de mayor o menor informacin que sustentan
las acciones de enfermera.
3. Implementacin de las acciones de enfermera: Es la relacin de intervenciones de enfermera no
rutinarias, que al ser llevadas a cabo, contribuyen a una evolucin favorable en el paciente.

La Desnutricin Crnica, el Sobrepeso y la Obesidad


en Nios de Areas Rurales del Per
OBJETIVO: Determinar prevalencia de desnutricin crnica
(DC), sobrepeso y obesidad en nios de reas rurales

TABLA N2.- PROMEDIO Y DESVIACIN ESTNDAR DE LOS DIFERENTES


INDICADORES POR EDAD Y SEXO
Peso (kg)
Edad
(aos

Femenino
Promedio
(DE)

Talla (m)

Masculino
Promedio
(DE)

Femenino
Promedio
(DE)

IMC (kg/m2)

Masculino
Promedio
(DE)

Femenino
Promedio
(DE)

Masculino
Promedio
(DE)

18.3

(2.3)

18.7

(2.2)

1.08

(0.05)

1.09

(0.07)

15.6

(1.3)

15.7

(1.3)

19.7

(2.4)

20.3

(2.6)

1.12

(0.05)

1.13

(0.05)

15.6

(1.3)

15.9

(1.5)

22.3
24.1

(2.6)

22.2

(2.8)

1.17

(0.05)

1.17

(0.05)

16.1

(1.4)

16.2

(1.4)

(3.1)

24.3

(2.9)

1.22

(0.05)

1.21

(0.05)

16.3

(1.4)

16.4

(1.2)

MEDIDAS DE DISPERSION O
VARIABILIDAD

Estas medidas pueden ser absolutas, si


estn expresadas en unidades de la
variable, como la varianza (desviacin
estndar, rango, rango intercuartlico) o
pueden ser relativas si no se expresan en
unidades de la variable (coeficiente de
variacin).

Medidas de dispersin
Rango (R)
Diferencia entre el valor mximo y el
mnimo de un conjunto de datos.
Ejemplo:
Sean las edades de pacientes segn sexo:

La dispersin es mayor en el grupo de las


mujeres.

Varianza
Medida que
cuantifica la
cantidad de
variabilidad de los
datos respecto a
la media. Tambin
se define como el
cuadrado de la
desviacin
estndar.
( xi x)2 ( x1 x)2 ( x 2 x)2 ... ( xn x)

n 1

n 1

Desviacin
estndar
Mide la
variabilidad de los
datos en unidades
en que estos
fueron medidos
originalmente.
Medida obtenida
de sacar la raz
cuadrada de la
varianza.
2

Nro
1
2
3
4
5
6
7
8
9
10
Prom edio

Peso

25
23
22
34
32
45
33
21
22
38

Cada valor menos


el promedio

25 - 29,5 =
23 - 29,5 =
22 - 29,5 =
34 - 29,5 =
32 - 29,5 =
45 - 29,5 =
33 - 29,5 =
21 - 29,5 =
22 - 29,5 =
38 - 29,5 =

-4,5
-6,5
-7,5
4,5
2,5
15,5
3,5
-8,5
-7,5
8,5

Elevamos
al cuadrado

20
42,25
56,25
20,25
6,25
240,25
12,25
72,25
56,25
72,25

599,00

29,5

Varianza
Desviacin estndar

66,56
Dividimos
entre "n"
599,0/9
= 66,56
66,56 8,16
8,16

Usos
Varianza:

Desviacin
Estndar:

En inferencia

estadstica
Clculo de la

desviacin
estndar
Clculo del tamao
de muestra.

Es un valor
positivo
Est influenciada
por valores
extremos
Se emplea en
numerosas
pruebas
estadsticas

95% del rea bajo la curva:


1.96

Siempre es un valor positivo


Est influenciada por todos los valores de la muestra o poblacin.
Sirve para definir la dispersin de los datos alrededor de la
media.

Coeficiente de variacin:

Relaciona la desviacin estndar de


un conjunto de datos con su media.
Es una medida de variacin
relativa. til para comparar dos o
ms grupos medidos en la misma
unidad de medida o no.
S
3.1
100
100 12.4%Si el coeficiente es:
< 10 % poca dispersin
x
25
10 33% aceptable
7.8

100 31.2%
34 50% alta dispersin
25
> 50%
muy alta

CVhom bres
CVmujeres

Estudio epidemiolgico del tabaquismo en mdicos


rea de Investigacin, Sociedad Argentina de Cardiologa

Factores de riesgo asociados con la


tensin arterial en adolescentes

estudio descriptivo,
transversal y analtico a
355 estudiantes cuyas
edades se encontraban
comprendidas entre los
11 y 15 aos y que
cursaban desde el 7mo.
al 9no. grados. Se
evaluaron las variables
antropomtricas, los
antecedentes
patolgicos familiares de
hipertensin arterial
(HTA), el hbito de fumar
y su relacin con la
http://scielo.sld.cu/scielo.php?pid=S0864-21252001000500005&script=sci_arttext&tlng=es
tensin arterial (TA).

Ginecol Obstet Mex 2008;76(8):476-82

Curvas de crecimiento fetal de nios


peruanos
Objetivo:
Manuel Ticona Rendn,* Diana Huanco
obtener curvas
de crecimiento
fetal propias de
un grupo
seleccionado de
recin nacidos
peruanos

Apaza**

La talla
promedio de
nacimiento a
las 39 y 40
semanas de
gestacin fue
de 49.7 cm
2.3 y 50.1 cm
2.3,
respectivament
e. El permetro
ceflico fue de
343 mm 16 y
345 mm 16,
respectivament
e (cuadro 2).
http://nietoeditores.com.mx/download/gineco/2008/agosto2008/gineco476-82.pdf

Las semanas 39
y 40 de la
gestacin son las
ms
representativas
y corresponden,
respectivamente,
a 29.6 y 26.2%
de los recin
nacidos; es decir,
ms de la mitad
del total de
recin nacidos
(55.8%).

http://redalyc.uaemex.mx/redalyc/pdf/487/48712302.pdf

Gracias
Gracias
41

Você também pode gostar