Você está na página 1de 56

Nada en esta maravillosa vida es 100% seguro.

En
todo lo que hacemos, siempre estamos estimando los
chances de resultados exitosos: en los negocios, en la
medicina, en el clima y principalmente en los juegos
de azar.
s! el estudio de las leyes "ormales de lo aleatorio es
la Probabilidad
Estadstica
Estadstica
es la ciencia,
es la ciencia,
pura y aplicada, de creacin,
pura y aplicada, de creacin,
desarrollo y de aplicacin de
desarrollo y de aplicacin de
tcnicas tales que la
tcnicas tales que la
incertidumbre de la
incertidumbre de la
inferencia inductiva pueda
inferencia inductiva pueda
ser evaluada
ser evaluada
Tomar decisiones es una gran
responsabilidad
responsabilidad.
Para tomar decisiones se requiere
INFORMACIN
INFORMACIN
disponible
disponible,
esperanadamente
con!iable
con!iable "
#til
#til.
$eneralmente se necesita una porci%n
de la base de datos o
muestra
muestra para
re&elar un
patr%n
patr%n
l%gico
l%gico o realiar un
an'lisis
an'lisis
estad(stico
estad(stico
.
.
Poblaci%n
Muestra
Estadstica
Probabilidad Probabilidad
Objetivo Objetivo de la Estadstica Descriptiva de la Estadstica Descriptiva
Conocer la informacin que se tiene
Conocer la informacin que se tiene
para poder identificar
para poder identificar
e interpretar
e interpretar
aspectos relevantes de un
aspectos relevantes de un
a muestra.
a muestra.
Utilizar esta informacin para obtener
Utilizar esta informacin para obtener
resultados
resultados
, planear o acer inferencia
, planear o acer inferencia
acerca de la poblacin bajo estudio
acerca de la poblacin bajo estudio.
#os
datos
datos son la materia prima del estad!stico. $sa
los n%meros para interpretar la realidad.
&odos los pro'lemas estad!sticos involucran o la
recolecta, la descripci(n y el an)lisis de los datos, o
pensar c(mo recolectar, descri'ir y hacer el an)lisis
de los datos.
*
+
,
-
,
+
.
1
0
/ ,
*
0
0
1
1
1
0
-
+
+
.
*
*
,
0
/
1
0
-
*
,
-
.
0 1
0
1
+
+
0
0
/
Poblaci%n
Muestra
Trans!ormaci%n
)umariaci%n
Ilustraci%n
*
e
s
c
r
i
p
c
i
%
n
*
e
s
c
r
i
p
c
i
%
n
I
n
!
e
r
e
n
c
i
a
I
n
!
e
r
e
n
c
i
a
An'lisis
+stimaci%n
,ip%tesis
&engo un /,% de pro'a'ilidad
de hacer algo que tenga sentido
con estos n%meros.
*
+
,
-
,
+
.
1
0
/
,
*
0
0
1
1
1
0
-
+
+
.
*
*
,
0
/
1
0
-
*
,
-
.
0 1
0
1
+
+
0
0
/
+l con-unto de datos que describen un
!en%meno .nuestro ob-eti&o/ constitu"en lo
que se llama
Poblaci%n
Poblaci%n
0na
Muestra
Muestra es un subcon-unto de la
poblaci%n sobre la cual &amos a realiar
las medidas sobre una o mas
caracter(sticas de inter1s
2Por qu1 muestreamos3
4 Poblaciones mu" grandes
4 Respuesta r'pida
4 *estrucci%n de la muestra
muestreo ...
0na caracter(stica importante de una
muestra es que sea
!epresentativa
!epresentativa
de la poblaci%n de inter1s.
Cualquiera que sea nuestro ob-eti&o5
describir a la poblaci%n, analiar o
pronosticar el comportamiento de la
poblaci%n, la muestra, al ser
representati&a, ser'
Confiable
Confiable
muestreo ...
2uestreo leatorio
- 3ada unidad tiene la misma
oportunidad de ser elegida
4 #a selecci(n de una unidad
no tiene in"luencia so're la
elecci(n de otra unidad
muestreo ...
2uestreo Estrati"icado
- 5ivide a la po'laci(n en
grupos homog6neos
4 7e extrae una muestra
aleatoria simple de cada
grupo o estrato
2uestreo por
3onglomerado
- 5ivide a la po'laci(n en
grupos
-7e extrae una muestra
aleatoria simple de los grupos
-7e muestrean todos los
elementos del grupo
seleccionado
muestreo ...
2uestreo 7istem)tico
- 7e elige aleatoriamente a
una unidad
4 partir de 6sta se selecciona
cada 846sima unidad que se
encuentra despu6s de la
elegida
2uestreo
9portunista
-7e muestrean los n primeros
elementos que se presentan
muestreo ...
0n
par'metro
par'metro es una medida num1rica de
un aspecto de la poblaci%n , o, v, u
0na
estad(stica
estad(stica es una medida num1rica de
un aspecto de la muestra X, S, n,

0na estad(stica consiste de un con-unto de
mediciones de dic6a caracter(stica que &ar(a
de una obser&aci%n .
unidad e7perimental
unidad e7perimental/ a
otra, " a estas mediciones las llamaremos
&ariable
&ariable
X
~
No todas las &ariables son num1ricas
entonces podemos clasi!icarlas de acuerdo a
su tipo en5
Cualitati&as
Cualitati&as5 )on &ariables que denotan una
cualidad o atributo " solo pueden ser
clasi!icadas en categor(as o clases
mutuamente e7clu"entes " e76austi&as
Cuantitati&as
Cuantitati&as5 )on aquellas &ariables que se
obtu&ieron de un proceso de conteo
.
discretas
discretas/ o medici%n .
contnuas
contnuas/
Clasificacin de las variables
Cualitativas de acuerdo a su escala de
medicin"
#ominal
#ominal" $on clasificadas en cate%oras, sin
importar el orden. #o tiene sentido acer
operaciones aritm&ticas con ellas '%&nero, %rupo
san%uneo, (uma 'si)no**
Ordinal
Ordinal" +as cate%oras se pueden arre%lar en
orden, pero las distancias entre las clases no son
i%uales 'intensidad del dolor, escolaridad, nivel
socioeconmico*
Clasificacin de las variables
Cuantitativas de acuerdo a su escala de
medicin"
,ntervalo
,ntervalo" $on medidas en las que las distancias
entre los valores es si%nificativa pero no e-iste un
cero absoluto 'el cero no es ausencia de atributo* . #o
tiene sentido acer cociente o producto 'temperatura,
usos orarios*
!azn
!azn" +as proporciones . razones tienen sentido
al determinar cu/nto mas tiene una unidad que otra de
al%una caracterstica. 'peso, in%reso, rendimiento*
+l an'lisis de cada &ariable se 6ace de
acuerdo a su escala de medici%n
:odemos
hacer
diagramas,
ta'las y
res%menes
num6ricos
de los datos
recopilados
2C%mo presentar los datos3
8a
!recuencia absoluta
!recuencia absoluta para una clase
particular es el n#mero de obser&aciones
que caen en cada clase.
8a
!recuencia relati&a
!recuencia relati&a o
porcenta-e
porcenta-e para
una clase particular es su !recuencia
absoluta entre el n#mero total de
obser&aciones
n
f
p
i
i
=
i
f
+sta !recuencia a"uda a sumariar en !orma
ordenada la in!ormaci%n contenida en la
muestra tanto en tablas como en gr'!icas.
tabla de distribuci%n de tabla de distribuci%n de
!recuencias !recuencias
diagrama de barras diagrama de barras
gnero frecuencia porcentaje
0 19 0.63
1 11 0.37
Total 30 1
Histograma
0.00
0.25
0.50
0.75
M F
Gnero
F
r
e
c
u
e
n
c
i
a
)i las &ariables son cuantitati&as discretas las
tablas de !recuencias se realian con la creaci%n
de di!erentes clases en base a los datos que
toma la &ariable.
edad frecuenci a porcentaje
38 3 0.10
39 3 0.10
40 6 0.20
41 1 0.03
42 3 0.10
43 2 0.07
44 4 0.13
45 3 0.10
46 4 0.13
47 0 0.00
48 0 0.00
49 1 0.03
Total 30 1.00
Histograma e Frecuencias !ara "a
0
1
2
3
4
5
6
7
38 39 40 41 42 43 44 45 46 47 48 49
"a
F
r
e
c
u
e
n
c
i
a
)i las &ariables son cuantitati&as continuas
las tablas de !recuencias se realian con la
creaci%n de inter&alos num1ricos que !ormar'n
las di!erentes clases.
t i e m p o f r e c u e n c i a p o r c e n t a j e
9 3 3 1 # 9 9 3 1 1 0 . 0 3
9 9 3 1 # 1 0 5 3 1 1 0 . 0 3
1 0 5 3 1 # 1 1 1 3 1 3 0 . 1 0
1 1 1 3 1 # 1 1 7 3 1 6 0 . 2 0
1 1 7 3 1 # 1 2 3 3 1 5 0 . 1 7
1 2 3 3 1 # 1 2 9 3 1 5 0 . 1 7
1 2 9 3 1 # 1 3 5 3 1 6 0 . 2 0
1 3 5 3 1 # 1 4 1 3 1 3 0 . 1 0
T o t a l 3 0 1 . 0 0
H i s t o g r a m a
0 . 0 0
0 . 0 5
0 . 1 0
0 . 1 5
0 . 2 0
0 . 2 5


9
3
3
1
#

9
9
3
1


9
9
3
1
#
1
0
5
3
1
1
0
5
3
1
#
1
1
1
3
1
1
1
1
3
1
#
1
1
7
3
1
1
1
7
3
1
#
1
2
3
3
1
1
2
3
3
1
#
1
2
9
3
1
1
2
9
3
1
#
1
3
5
3
1
1
3
5
3
1
#
1
4
1
3
1
T i e m ! o
F
r
e
c
u
e
n
c
i
a
Histograma
0.00
0.10
0.20
0.30
9631 10231 10831 11431 12031 12631 13231 13831
Tiem!o
F
r
e
c
u
e
n
c
i
a
t i e m p o ( se g ) f r e c u e n c i a p o r c e n t a j e F r e c . A c u m .
9 6 3 1 1 0 . 0 3 3 0 . 0 3 3
1 0 2 3 1 1 0 . 0 3 3 0 . 0 6 7
1 0 8 3 1 3 0 . 1 0 0 0 . 1 6 7
1 1 4 3 1 6 0 . 2 0 0 0 . 3 6 7
1 2 0 3 1 5 0 . 1 6 7 0 . 5 3 3
1 2 6 3 1 5 0 . 1 6 7 0 . 7 0 0
1 3 2 3 1 6 0 . 2 0 0 0 . 9 0 0
1 3 8 3 1 3 0 . 1 0 0 1 . 0 0 0
T o t a l 3 0 1 . 0 0
H i s t o g r a m a
9 6 3 1 1 0 2 3 1 1 0 8 3 1 1 1 4 3 1 1 2 0 3 1 1 2 6 3 1 1 3 2 3 1 1 3 8 3 1
T i e m ! o
F
r
e
c
u
e
n
c
i
a
Podemos completar esta tabla de !recuencias con una
columna que nos de las Frecuencias Acumuladas 2qu1
uso tienen3
a/ a/ 2qu1 !recuencia de indi&iduos tu&ieron un tiempo menor a 2qu1 !recuencia de indi&iduos tu&ieron un tiempo menor a
99,:;9 seg3 99,:;9 seg3
b/ b/ 2qu1 porcenta-e de indi&iduos tu&ieron un tiempo ma"or o igual 2qu1 porcenta-e de indi&iduos tu&ieron un tiempo ma"or o igual
a 9<,=;9 seg3 a 9<,=;9 seg3
c/ c/ 2qu1 tiempo m'7imo es el que al menos el >?@ de las personas 2qu1 tiempo m'7imo es el que al menos el >?@ de las personas
tu&ieron3 tu&ieron3
a* a* 0.123 0.123
c/ c/ :=.A@ :=.A@
e/ e/ 9<,?;9 seg 9<,?;9 seg
Otros diagramas de utilidad5
diagrama de tallo " 6o-as
para la &ariable edad ;BC?
D ;B.?
3 38 0 0 0
6 39 0 0 0
12 40 0 0 0 0 0 0
13 41 0
(3) 42 0 0 0
14 43 0 0
12 44 0 0 0 0
8 45 0 0 0
5 46 0 0 0 0
1 47
1 48
1 49 0
4se usa con pocos &alores
4los datos est'n ordenados
4encontramos !'cilmente
m(nimo " m'7imo
4encontramos !'cilmente los
porcentiles
4da una &isi%n gr'!ica de la
distribuci%n de los datos
*iagrama de puntos. Etil para cuando tenemos
pocos datos discretos
:
. . : . : . :
: : : . : : : : : .
+---------+---------+---------+---------+---------+-------Edad
38.0 40.0 42.0 44.0 46.0 48.0
Pol(gono de Frecuencias
O-i&a
$ol%gono e Frecuencia
0
2
4
6
8
9000 10000 11000 12000 13000 14000
Tiem!o
F
r
e
c
u
e
n
c
i
a
&'i(a
0.00
0.25
0.50
0.75
1.00
9000 10000 11000 12000 13000 14000
Tiem!o
$
o
r
c
e
n
t
a
'
e

)
c
u
m
u
l
a

o
M1todos Num1ricos
.&'lidos solo para datos cuantitati&os/
)i pudi1ramos escoger entre dos n#meros que nos
a"uden a construir una imagen mental burda de la
distribuci%n de un bonc6e de datos 2Cu'les
escoger(amos3
*
+
,
-
,
+
. 1
0
/ ,
*
0
0
1
1
1
0
-
+
+
.
* *
,
0
/
1
0
-
*
,
-
.
0
1
0 1
+
+
0
0
/
*
+
,
-
,
+
.
1
0 /
,
*
0
0
1
1
1
0
-
+
+
.
*
*
,
0
/
1
0
-
*
,
-
.
0
1
0
1
+
+
0
0
/
*
+
,
-
,
+
. 1
0
/ ,
*
0
0
1
1
1
0
-
+
+
.
* *
,
0
/
1
0
-
*
,
-
.
0
1
0 1
+
+
0
0
/
*
,
-
,
+
.
1
0 /
*
0
0
1
1
1
0
-
+
+
.
*
*
,
0
/
1
0
-
*
,
-
.
0
1
0
1
+
+
0
0
/
4un n#mero que est1
localiado cerca del centro
de la distribuci%n
*
+
,
-
,
+
. 1
0
/ ,
*
0
0
1
1
1
0
-
+
+
.
* *
,
0
/
1
0
-
*
,
-
.
0
1
0 1
+
+
0
0
/
*
,
-
,
+
.
1
0 /
*
0
0
1
1
1
0
-
+
+
.
*
*
,
0
/
1
0
-
*
,
-
.
0
1
0
1
+
+
0
0
/
*
+
,
-
,
+
. 1
0
/ ,
*
0
0
1
1
1
0
-
+
+
.
* *
,
0
/
1
0
-
*
,
-
.
0
1
0 1
+
+
0
0
/
*
,
-
,
+
.
1
0 /
*
0
0
1
1
1
0
-
+
+
.
*
*
,
0
/
1
0
-
*
,
-
.
0
1
0
1
+
+
0
0
/
4un n#mero que mida la
dispersi%n de la
distribuci%n
Medidas de *ispersi%n
)on n#meros que indican qu1 tan separados est'n los
datos entre si5
rango, des&iaci%n est'ndar, rango
rango, des&iaci%n est'ndar, rango
intercuartil
intercuartil
$ol%gono e Frecuencia
0
2
4
6
8
9000 10000 11000 12000 13000 14000
Tiem!o
F
r
e
c
u
e
n
c
i
a
Medidas de Tendencia Central
)on n#meros que se localian cerca del centro o cerca
de donde se encuentran los datos con ma"or !recuencia5

media, mediana, moda
media, mediana, moda
Medidas de tendencia central

=
=
n
i
i n
x X
1
1

=
|
.
|

\
|
=
k
i
i
a
n
i
f
m X
1
t i e m p o ( se g ) f r e c u e n c i a p o r c e n t a j e F r e c . A c u m .
9 6 3 1 1 0 . 0 3 0 . 0 3
1 0 2 3 1 1 0 . 0 3 0 . 0 7
1 0 8 3 1 3 0 . 1 0 0 . 1 7
1 1 4 3 1 6 0 . 2 0 0 . 3 7
1 2 0 3 1 5 0 . 1 7 0 . 5 3
1 2 6 3 1 5 0 . 1 7 0 . 7 0
1 3 2 3 1 6 0 . 2 0 0 . 9 0
1 3 8 3 1 3 0 . 1 0 1 . 0 0
T o t a l 3 0 1
H i s t o g r a m a
9 6 3 1 1 0 2 3 1 1 0 8 3 1 1 1 4 3 1 1 2 0 3 1 1 2 6 3 1 1 3 2 3 1 1 3 8 3 1
T i e m ! o
F
r
e
c
u
e
n
c
i
a
en el caso en que los datos est1n agrupados5
media
media
187 , 12
) 10 . 0 ( 13831 ) 10 . 0 ( 10831
) 03 . 0 ( 10231 ) 03 . 0 ( 9631
=
+ +
+ + =
a
X
mediana
mediana
se localia el &alor central " se obser&a
el &alor que toma
( )
2
~
1 +
=
n
X l
3 38 0 0 0
6 39 0 0 0
12 40 0 0 0 0 0 0
13 41 0
(3) 42 0 0 0
14 43 0 0
12 44 0 0 0 0
8 45 0 0 0
5 46 0 0 0 0
1 47
1 48
1 49 0
( ) 5 . 15
2
30
~
1
=
+
= X l
el valor que toma la
variable es 42.0 aos
medidas de tendencia central ...
( ) A B A X
m
m
p a
+ =

1
5 . 0 ~
donde A " B son los l(mites in!erior " superior de la clase que
contiene a la mediana, :
m-1
es la !recuencia acumulada 6asta la
clase anterior a la que contien la mediana " p
m
es la !recuencia
relati&a de la clase que contiene a la mediana
para datos agrupados se estima como
t i e m p o f r e c . p o r c . F r e c A c u m
9 3 3 1 # 9 9 3 1 1 0 . 0 3 3 0 . 0 3 3
9 9 3 1 # 1 0 5 3 1 1 0 . 0 3 3 0 . 0 6 7
1 0 5 3 1 # 1 1 1 3 1 3 0 . 1 0 0 0 . 1 6 7
1 1 1 3 1 # 1 1 7 3 1 6 0 . 2 0 0 0 . 3 6 7
1 1 7 3 1 # 1 2 3 3 1 5 0 . 1 6 7 0 . 5 3 3
1 2 3 3 1 # 1 2 9 3 1 5 0 . 1 6 7 0 . 7 0 0
1 2 9 3 1 # 1 3 5 3 1 6 0 . 2 0 0 0 . 9 0 0
1 3 5 3 1 # 1 4 1 3 1 3 0 . 1 0 0 1 . 0 0 0
T o t a l 3 0 1
H i s t o g r a m a
0 . 0 0 0
0 . 0 5 0
0 . 1 0 0
0 . 1 5 0
0 . 2 0 0
0 . 2 5 0


9
3
3
1
#

9
9
3
1


9
9
3
1
#
1
0
5
3
1
1
0
5
3
1
#
1
1
1
3
1
1
1
1
3
1
#
1
1
7
3
1
1
1
7
3
1
#
1
2
3
3
1
1
2
3
3
1
#
1
2
9
3
1
1
2
9
3
1
#
1
3
5
3
1
1
3
5
3
1
#
1
4
1
3
1
T i e m ! o
F
r
e
c
u
e
n
c
i
a
medidas de tendencia central ...
( ) 600 11731
~
167 . 0
367 . 0 5 . 0
+ =
a
X
moda
moda
es el &alor con la !recuencia mas alta.
8a distribuci%n puede ser unimodar, multimodal
cuando los datos est)n agrupados
podemos ha'lar de una clase modal o
estimar la moda:
donde A A " B B son los l(mites in!erior " superior
de la clase modal, d d
1 1
D D f f
mo mo
F F f f
mo-1 mo-1
" d d
2 2
D D f f
mo mo
F F f f
mo+1 mo+1
( ) ( ) A B A Mo
d d
d
+ =
+
2 1
1
medidas de tendencia central ...
Medidas de *ispersi%n
rango
rango se de!ine como la di!erencia entre el &alor
m'7imo " el m(nimo5
Rango = max - min
+s una medida sensible sensible a &alores e7tremos " no es mu"
in!ormati&a "a que es insensible insensible a datos intermedios
amplitud intercuart(lica
amplitud intercuart(lica es la distancia entre
el porcentil A> " el porcentil <>5
AI = P
75
- P
25
Nos da una idea de la distancia entre los &alores que
determinan el >?@ de los datos centrales
Gariana es una &ariaci%n promedio alrededor de
la media, de!inida como
( )
1
1
2
2


=

=
n
X X
S
n
i
i
un problema de la &ariana es que tiene las unidades al
cuadrado " su interpretaci%n no es !'cil, por lo que usamos
su rai5
des&iaci%n
des&iaci%n
est'ndar
est'ndar
( )
1
1
2


=

=
n
X X
S
n
i
i
es sensible a &alores e7tremos.
)i los datos est'n agrupados en k inter&alos, la &ariana se
estima como5
( )
1
1
2
2


=

=
n
X m f
S
k
i
a
i i
a
para nuestro ejemplo 4qu& valor toma
2
a
S
5
medidas de dispersin...
,a" algunas !ormas de poner -untos a la des&iaci%n
est'ndar " a la media muestrales
Coe!iciente de Gariaci%n
Coe!iciente de Gariaci%n5 es una medida de
&ariaci%n relati&a " e7presa la des&iaci%n est'ndar
como un porcenta-e de la media aritm1tica. )e
obtiene como
100 !
X
S
CV =
por su !alta de dimensiones es mu" #til para
comparar &ariaci%n entre di!erentes poblaciones,
que a simple &ista ser(an di!(ciles de comparar.
medidas de dispersin...
Creacin de ,ntervalos
Creacin de ,ntervalos5
con " se pueden !ormar inter&alos de la !orma
" obtener el n#mero de
obser&aciones que caen dentro de ese inter&alo.
)i nuestra distribuci%n muestral tiene una !orma mas o menos
sim1trica " acampanada podemos usar la regla emp(rica5
alrededor del =H@ de las obser&aciones cae dentro de una alrededor del =H@ de las obser&aciones cae dentro de una
des&iaci%n est'ndar de la media des&iaci%n est'ndar de la media
alrededor del H>@ de las obser&aciones cae dentro de dos alrededor del H>@ de las obser&aciones cae dentro de dos
des&iaciones est'ndar de la media des&iaciones est'ndar de la media
alrededor del HA.A@ de las obser&aciones cae dentro de tres alrededor del HA.A@ de las obser&aciones cae dentro de tres
des&iaciones est'ndar de la media
des&iaciones est'ndar de la media
S
X
kS X
medidas de dispersin...
0
5
10
15
20
25
1 3 5 7 9 11 13 15 17 19 21
F
r
e
c
u
e
n
c
i
a
s s
2s 2s
3s 3s
X
,ntervalos
,ntervalos
alrededor
alrededor
de la media
de la media
s X
s X
s X
3
2
'3.63 , 16.36*
'7.89 , 1:.98*
';0.21 , <7.:7*
n = 73<
X = 11.22
s = 8.09:
<28 obs. 30.:2>
767 obs. :8.9:>
73< obs. 100.00>
?on-ido de Carbono en
el umo de los ci%arros
medidas de dispersin...
Medidas de Posici%n Relati&a
)on medidas descripti&as que localian la
posici%n de una medici%n en relaci%n a otras
mediciones.
0na medida que e7presa esta posici%n en
t1rminos de un porcenta-e es llamado
porcentil
porcentil
+l
porcentil
porcentil de orden .P

/ es el &alor de la
&ariable por deba-o del cual se encuentra una
!recuencia acumulada .
+l porcetil <> o primer
cuartil I
9
D 4 ?.=A> de-a a
su iquierda el <>@ de
las obser&aciones
+l porcetil A?, es decir,
P
A?
D ?.><> de-a a su
iquierda el A?@ de las
obser&aciones
medidas de posicin relativa...
+l diagrama de tallo " 6o-as, nos a"uda a
localiarlos r'pidamente
3 38 0 0 0
6 39 0 0 0
12 40 0 0 0 0 0 0
13 41 0
(3) 42 0 0 0
14 43 0 0
12 44 0 0 0 0
8 45 0 0 0
5 46 0 0 0 0
1 47
1 48
1 49 0
4los datos se ordenan de menor a
ma"or
4se encuentra la localiaci%n de los
porcentiles5

4se lee el &alor de dic6a obser&aci%n
4si la localiaci%n es !raccionaria se
toma el promedio del &alor en la
localiaci%n anterior " posterior
los porcentiles no los porcentiles no
necesariamente son necesariamente son
n#meros obser&ados n#meros obser&ados
) (
100
) ( n P l
|
.
|

\
|
=
o
o
medidas de posicin relativa...
1 9 6
3 10 2 3
6 10 6 7 9
11 11 0 1 3 3 3
(5) 11 7 7 8 8 8
14 12 0 0 1 2 3
9 12 6 6 9 9
5 13 0 2 3 3 4
l.I
9
/ D .<>J9??/;9 D A.A>

I
9
D P
<>
D 11.05 11.05
l.I
;
/ D .A>J9??/;9 D <;.<>
@
7
= P
36
= 12.65 12.65
l.I
<
/ D .>?J9??/;9 D 9>.>
I
<
D P
>?
D 11.8 11.8
+os cuartiles I
9
. I
;
son mu. Atiles para
construir lo que llamamos
dia%rama de
dia%rama de
caja . brazos
caja . brazos.
medidas de posicin relativa...
10000
15000
20000
25000
T
i
e
m
p
o
Dia%rama de Caja . Brazos
Dia%rama de Caja . Brazos
#os permite ver la distribucin de los datos, el
m/-imo, el mnimo, la localizacin de los
Cuartiles, . la dispersin por cuartiles. #os
permitir/ ver si e-iste un ses%o as como
puntos e-tremos.
Para acer estadstica diferente a la descriptiva,
podemos usar todas las t&cnicas asta aora
aprendidas . acer al%An an/lisis comparativo o
asociativo.
El problema de comparacin consiste en
contrastar
contrastar las distribuciones de frecuencia de
una variable de inter&s para dos o mas
subpoblaciones
subpoblaciones bas/ndose en los datos de la
muestra.
Cn/lisis E-ploratorio de Datos
4Da. al%una diferencia en las distribuciones
poblacionales5
4Cu/l es la naturaleza de esas diferencias5
4@u& tan %randes son esas diferencias5
En el problema de
comparacin
comparacin sur%en
al%unas pre%untas"
El an/lisis e-ploratorio nos a.udar/ a darnos una El an/lisis e-ploratorio nos a.udar/ a darnos una
idea de las respuestas a estas pre%untas idea de las respuestas a estas pre%untas
+a comparacin de las distribuciones de
frecuencia entre subpoblaciones cuando la
variable de inter&s es
cualitativa
cualitativa se ace con
una tabla de contin%encias o tabulacin
cruzada
Gnero
*unca +a
,umao
-e'. e
,umar
Fuma
actualmente
Total
Masculino 154 25 185 364
Femenino 127 11 38 176
Total 281 36 223 540
H/0itos e ta0a1uismo
las frecuencias pueden ser realtivas o absolutas . nos dan una idea de
qu& tan frecuente se presentan simult/neamente ambos atributos en
una poblacin
comparacin...
El objetivo de la comparacin es ver si una
caracterstica determinada vara relativo a
al%una subclase, por lo que se calculan las
frecuencias relativas condicionales f
ij
/
/ f
i

p
ij
/
/ p
i
'de &sta manera compensamos por
diferencias de tamaEos* ...
Gnero
*unca +a
,umao
-e'. e
,umar
Fuma
actualmente
Total
Masculino 28.5 4.6 34.3 67.4
Femenino 23.5 2.1 7.0 32.6
Total 52.0 6.7 41.3 100
H/0itos e ta0a1uismo 234
comparacin...
... . calculamos las frecuencias relativas
condicionadas a %&nero
4el /bito de
tabaquismo
difiere si se es
ombre o
mujer5
Gnero
*unca +a
,umao
-e'. e
,umar
Fuma
actualmente
Total
Masculino 42.3 6.8 50.9 100
Femenino 72.1 6.5 21.5 100
Total 52.0 6.7 41.3 100
H/0itos e ta0a1uismo conicionaas a gnero 234
H/0ito e Ta0a1uismo !or Gnero
0.0
20.0
40.0
60.0
80.0
Nunca ha f umado De! de fuma" Fuma ac#ualmen#e
F
r
e
c
u
e
n
c
i
a
Masculino Femenino
comparacin...
0.00
15.00
30.00
45.00
-istri0uci.n e "a !or Gnero
Masculino
Femenino
$i la variable a analizar es
discreta
discreta se puede
tratar como si fuera cualitativa.
comparacin...
Gnero 39 40 41 42 Total
Masculino 10.53 21.05 42.11 26.32 100
Femenino 36.36 18.18 18.18 27.27 100
Total 20.00 20.00 33.33 26.67 100
"a en a5os conicionaa a gnero 234
7:
80
81 8<
4a. al%una
diferencia entre
%&neros con
respecto a la
edad5
F M
0
10000
20000
30000
$%ne"o
&
"
d
e
n

l
l
e
'
a
d
a
Tiempos po" $%ne"o
En el caso de que la variable a analizar sea
contnua
contnua podemos estar interesados en
comparar tanto la localizacin como la
dispersin entre las distribuciones de
frecuencia de las subpoblaciones. Una
manera de acerlo es por medio de un
dia%rama esquem/tico
comparacin...
4@ui&n tiene
tiempos m/s
altos5
4qui&n tiene
ma.or
dispersin5
?ucas veces es importante saber si una
variable influ.e sobre el comportaminto de otra
variable. Con ello estudiamos el problema de
asociacin
asociacin.
Cmbas Fariables Ordinales
El uso de la tabla de contin%encia . su
correspondiente dia%rama de barras es de %ran
utilidad para asociar variables cualitativas en
escala ordinal.
Gsta tabla se presenta con las frecuencias
relativas condicionadas a las clases de una de
las variables
$osici.n res!ecto al +orario e (erano
0.00
15.00
30.00
45.00
60.00
(ao Medio )l#o
Desacue"do *ndife"en#e )cue"do
-esacuero 6ni,erente )cuero Total
7a'o 23.90 49.02 27.07 100.00
Meio 47.02 31.93 21.05 100.00
)lto 20.69 36.21 43.10 100.00
*i(el
8ocioecon.mico
$osici.n res!ecto al +orario e (erano
4C ma.or nivel
socioeconmico,
ma.or aceptacin5
asociacin ...
asociacin ...
Una Fariable Ordinal . otra Cuantitativa
Una manera de evidenciar la posible asociacin
entre las variables es a trav&s del dia%rama
esquem/tico.
Gste dia%rama nos da una idea de cmo
dependen la variable cuantitativa, no solo en
localizacin sino tambi&n en dispersin con
respecto al aumento o disminucin en escala de
la variable cualitativa ordinal.
Maternal 9iner 6 9iner 66
68 255 425
35 202 370
145 317 380
173 327 476
190 247 410
225 100 358
340 448 338
123 412 373
228 228 377
192 467
297 388
Grao "scolar
+inde" ** +i nde" * Ma#e"nal
500
400
300
200
100
0
,
a
-
i
l
i
d
a
d

d
e

.
e
n
'
u
a

e
4@u& nos dice
este dia%rama
esquem/tico5
asociacin ...
Cmbas Fariables Cuantitativas
Para este caso el dia%rama de dispersin es mu.
usado para asociar variables cuantitativas.
Consiste en %raficar parejas de valores x
i
! "
i
#
correapondientes a un solo individuo, sobre un
plano cartesiano.
Una medida de asociacin que complementa este
dia%rama es el coeficiente de correlacin 'medida
de relacin lineal relacin lineal entre las variables* obtenido
como
asociacin...
( ) ( )
( ) ( )
y x
xy
n
i
i
n
i
i
n
i
i i
S S
S
n Y Y n X X
n Y Y X X
y x r =


=


= =
=
1
2
1
2
1
) 1 ( ) 1 (
) 1 (
) , (
" "
"
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
30
80
130
180
230
280
330
140 150 160 170 180 190 200
r = 0.9
r = 0.1
r = 0.::
r = ; 0.3
4$e puede decir que si r es cero, las variables son independientes5
asociacin ...
"a (ersus Tiem!o
0
15
30
45
60
75
0 10000 20000 30000 40000
Tiem!o
"

r
r
= 0.170 = 0.170
4E-iste al%una relacin lineal 4E-iste al%una relacin lineal
entre el tiempo que tom entre el tiempo que tom
correr el maratn . la edad de correr el maratn . la edad de
los participantes5 4Confirma los participantes5 4Confirma
el valor de el valor de
r
r esta relacin5 esta relacin5
asociacin ...

Você também pode gostar