Escolar Documentos
Profissional Documentos
Cultura Documentos
atica
Estadstica
Roco Raya Miranda
rraya@ugr.es
Curso 2013/2014
Introducci
on: Conceptos b
asicos
INTRODUCCION:
CONCEPTOS BASICOS
La observaci
on de fen
omenos que acontecen en la vida real permiten establecer una
clasificaci
on de los mismos:
Fen
omeno determinista: Un fen
omeno es determinista si al repetirlo en id
enticas
condiciones se obtiene el mismo resultado.
Fen
omeno aleatorio: Un fen
omeno es aleatorio si al repetirlo en an
alogas condiciones puede
presentar resultados diferentes.
La estadstica se ocupa principalmente de los fen
omenos aleatorios, encontr
andose ante un
conjunto de observaciones que presentan una variabilidad difcil de explicar y que requieren un
tratamiento especial (tratamiento estadstico) para poder efectuar conclusiones. Por lo tanto,
la estadstica es una rama de las matem
aticas que trata de la recopilaci
on, el an
alisis, la
interpretaci
on y la representaci
on de una gran cantidad de datos num
ericos.
Las etapas de un estudio estadstico son las siguientes:
1. Recogida de datos
Estadstica descriptiva
2. Ordenaci
on, tabulaci
on y gr
aficos
3. Descripci
on de caractersticas
o
Inferencia estadstica
4. An
alisis formal
R. Raya (Dpto. Estadstica e I.O.)
Curso 2013/2014
2 / 122
Introducci
on: Conceptos b
asicos
Definici
on
Se denomina poblaci
on al conjunto objeto de estudio, es decir, cualquier conjunto de unidades
con ciertas caractersticas comunes, sobre las que se desea informaci
on.
Definici
on
Cada uno de los elementos de la poblaci
on se denomina unidad estadstica o individuo.
La poblaci
on puede ser finita o infinita, seg
un que los elementos que la formen se presenten en
n
umero finito o infinito.
Definici
on
Se denomina muestra a un subconjunto representativo de la poblaci
on.
Definici
on
Se llaman caracteres a las propiedades que se desean observar en los elementos de la poblaci
on y
que han de tener todos y cada uno de ellos.
En un estudio particular pueden considerarse una sola caracterstica o varias a la vez.
Definici
on
Las modalidades son cada una de las formas en que puede presentarse un car
acter.
Para estar bien definidas deben cumplir dos requisitos: exhaustividad e incompatibilidad.
R. Raya (Dpto. Estadstica e I.O.)
Curso 2013/2014
3 / 122
Introducci
on: Conceptos b
asicos
Curso 2013/2014
4 / 122
Distribuci
on de frecuencias
DE FRECUENCIAS
DISTRIBUCION
Definici
on
La distribuci
on de frecuencias de una variable estadstica es el conjunto de valores ordenados de
la variable con sus frecuencias correspondientes.
Variable cuantitativa
Discreta
Continua
{(xi ; ni )}ki=1
{(Ii ; ni )}ki=1
o
o
{(xi ; fi )}ki=1
{(Ii ; fi )}ki=1
Curso 2013/2014
5 / 122
Distribuci
on de frecuencias
Se considera un car
acter X con k modalidades, x1 , x2 , . . . , xk . Las frecuencias asociadas a la
modalidad xi son:
Definici
on
Frecuencia absoluta (ni ): N
umero de individuos de la poblaci
on que presentan dicha modalidad,
es decir, el n
umero de veces que se repite. Como las modalidades deben ser incompatibles y
exhaustivas se verifica que
k
X
N =
ni
i=1
siendo N el n
umero total de observaciones.
Definici
on
Frecuencia relativa (fi ): Proporci
on de individuos de la poblaci
on que presentan dicha
modalidad. Es decir,
ni
fi =
N
Se verifica que
k
X
fi = 1
i=1
Curso 2013/2014
6 / 122
Distribuci
on de frecuencias
Definici
on
Frecuencia absoluta acumulada (Ni ): N
umero de individuos que presentan un valor de la variable
menor o igual que el considerado, por lo tanto, es la suma de las frecuencias absolutas hasta la
i-
esima modalidad,
Ni = n1 + n2 + ... + ni =
i
X
nj Nk = N =
j=1
k
X
ni
i=1
Definici
on
Frecuencia relativa acumulada (Fi ): Proporci
on de individuos de la poblaci
on que presentan un
valor de la variable menor o igual que el considerado, por lo tanto, es la suma de las frecuencias
relativas hasta la i-
esima modalidad,
Fi = f1 + f2 + ... + fi =
i
X
fj Fk = 1 =
j=1
Tambi
en puede calcularse como Fi =
k
X
fi
i=1
Ni
N
Curso 2013/2014
7 / 122
Tablas de frecuencias
ni
n1
n2
..
.
ni
..
.
nk
N
Ni
N1
N2
..
.
Ni
..
.
Nk = N
fi
f1
f2
..
.
fi
..
.
fk
1
Fi
F1
F2
..
.
Fi
..
.
Fk = 1
Curso 2013/2014
8 / 122
Tablas de frecuencias
ei1 + ei
2
Se define amplitud del intervalo a la diferencia entre los extremos del intervalo,
ai = ei ei1
Los intervalos de una poblaci
on pueden elegirse de igual o distinta amplitud.
El n
umero de intervalos, k, a utilizar no est
a determinado de forma fija y por tanto, se usa un
k que permita trabajar c
omodamente y represente bien la estructura de los datos.
Curso 2013/2014
9 / 122
Tablas de frecuencias
La tabla de frecuencias correspondiente a las variables estadsticas de tipo continuo con las
frecuencias estudiadas es la siguiente:
Ii = (ei1 , ei ]
[e0 , e1 ]
..
.
(ei1 , ei ]
..
.
(ek1 , ek ]
Total
xi
x1
..
.
xi
..
.
xk
ni
n1
..
.
ni
..
.
nk
N
Ni
N1
..
.
Ni
..
.
Nk = N
1
fi
f1
..
.
fi
..
.
fk
Fi
F1
..
.
Fi
..
.
Fk = 1
ai
a1
..
.
ai
..
.
ak
Curso 2013/2014
10 / 122
Representaciones gr
aficas
La representaci
on gr
afica tiene por objeto proporcionar una sntesis visual de la distribuci
on de
frecuencias, haciendo resaltar detalles que no resultan f
acilmente perceptibles directamente en la
tabla estadstica.
REPRESENTACIONES GRAFICAS
DE VARIABLES ESTADISTICAS DISCRETAS
Curso 2013/2014
11 / 122
Representaciones gr
aficas
REPRESENTACIONES GRAFICAS
DE VARIABLES ESTADISTICAS CONTINUAS
Histograma: El histograma se construye representando los
intervalos en el eje de abscisas y la densidad de frecuencia en
el eje de ordenadas. Se dibujan rect
angulos de base la
amplitud ai y de altura la densidad de frecuencia, hi , siendo
fi
ni
o hi =
.
hi =
ai
ai
Polgono de frecuencias: Es la lnea que se obtiene uniendo
con segmentos, los puntos medios de los extremos superiores
de los rect
angulos que forman el histograma.
Curso 2013/2014
12 / 122
Representaciones gr
aficas
REPRESENTACIONES GRAFICAS
DE VARIABLES ESTADISTICAS CUALITATIVAS
Diagrama de barras: En unos ejes cartesianos se representan
sobre el eje de abscisas las distintas modalidades del car
acter y
sobre el eje de ordenadas los valores de las frecuencias
absolutas. A continuaci
on, en el eje de abscisas se levantan
rect
angulos de base constante y de altura proporcional a la
frecuencia absoluta correspondiente.
Gr
afico de sectores: En esta representaci
on un crculo se divide
en tantos sectores circulares como modalidades tenga el
car
acter, teniendo cada sector el
area proporcional a la
frecuencia absoluta correspondiente. Los grados de cada sector
i o
se obtienen resolviendo la proporci
on nNi = 360
o
Curso 2013/2014
13 / 122
CENTRAL
MEDIDAS DE POSICION
Definici
on
Las medidas de posici
on tratan de resumir y sintetizar el conjunto de datos mediante un valor
num
erico.
Si este valor num
erico se sit
ua hacia el centro de la distribuci
on se habla, entonces, de medidas
de posici
on central. Las principales medidas de posici
on central son: la media, la mediana y la
moda. Se estudiar
an tambi
en otras medidas de posici
on no central llamadas cuantiles. En cada
medida se distingue para su c
alculo entre los casos discreto y continuo.
Definici
on
Media aritm
etica: Sea una variable X, con valores x1 , x2 , . . . , xk y frecuencias absolutas
n1 , n2 , . . . , nk . Entonces, se define la media, y se denota por x
, como la suma ponderada de los
valores de la variable por sus frecuencias.
- Caso discreto: x
=
Pk
i=1
x i fi =
1
N
Pk
i=1
xi ni siendo N el n
umero total de
observaciones.
- Caso continuo: En este caso los intervalos se representan por su marca de clase,
defini
endose la media de forma an
aloga al caso de variable estadstica discreta.
Curso 2013/2014
14 / 122
Definici
on
Mediana: Se define la mediana y se denota por Me, como aquel valor de la variable estadstica
que divide en dos conjuntos iguales a los valores de la variable supuestos ordenados de forma
ascendente seg
un el car
acter.
- Caso discreto:
1
- Caso continuo:
1
2
Si existe alg
un intervalo Ii , tal que Fi = 0.5, entonces M e = ei
Si no existe un intervalo Ii , tal que Fi = 0.5, se selecciona el primer intervalo en el
que Fi > 0.5. A este intervalo se le denomina intervalo mediano, se denota por IM e .
El valor exacto de la mediana se obtiene aplicando al intervalo mediano la siguiente
f
ormula:
0.5 Fi1
ai
M e = ei1 +
fi
Curso 2013/2014
15 / 122
Definici
on
Moda: Se define la moda y se nota por Mo, como el valor m
as frecuente de la distribuci
on, o lo
que es lo mismo, el que m
as se repite.
La moda puede no ser u
nica (m
as de una modalidad tienen igual frecuencia m
axima) o incluso
no existir (cuando todos las modalidades de la variable tengan igual frecuencia).
- Caso discreto: En este caso, la moda es el valor de la variable que corresponde a la m
axima
frecuencia absoluta.
M o = xi tal que ni = maxj nj
- Caso continuo: En primer lugar, se elige el intervalo modal, IM o = (ei1 , ei ], que es aquel
que tenga m
axima altura o densidad de frecuencia hi = max hj . El valor exacto de la moda
j
(hi hi1 )
ai
(hi hi1 ) + (hi hi+1 )
Curso 2013/2014
16 / 122
Curso 2013/2014
17 / 122
C
alculo de un cuantil
Para calcular un cuantil C() se razona de manera an
aloga al c
alculo de la mediana.
- Caso discreto:
1
- Caso continuo:
1
2
Si existe alg
un intervalo Ii , tal que Fi = , entonces C() = ei
Si no existe un intervalo Ii , tal que Fi = , se selecciona el primer intervalo en el
Fi > . Dicho intervalo contiene el cuantil y para determinar el valor exacto se utiliza
la interpolaci
on con la siguiente f
ormula:
C() = ei1 +
Fi1
ai
fi
Curso 2013/2014
18 / 122
MEDIDAS DE DISPERSION
Las medidas de dispersi
on informan de lo pr
oximas o alejadas que est
an las observaciones entre
s o en relaci
on con un valor de referencia que normalmente es una medida de centralizaci
on. De
esta forma, se pueden considerar las medidas de tendencia central como muy representativas del
conjunto, poco representativas, o en algunos casos, nada representativas, dependiendo de los
valores adoptados por las medidas de dispersi
on.
Se considera la variable estadstica X que toma los valores x1 , x2 , . . . , xk (con variable
estadstica continua se consideran las marcas de clase de los intervalos) y frecuencias
n1 , n2 , . . . , nk .
Definici
on
Rango o recorrido: Es la medida de dispersi
on m
as simple y se calcula como la diferencia entre el
valor m
aximo y el mnimo de la variable.
R=
max {xi }
i=1,...,k
min {xi }
i=1,...,k
Definici
on
Recorrido Intercuartlico: Es la diferencia entre el tercer y primer cuartil. Presenta la ventaja de
que elimina el efecto distorsionante de los valores extremos.
RIQ = Q3 Q1
R. Raya (Dpto. Estadstica e I.O.)
Curso 2013/2014
19 / 122
Definici
on
Varianza: Se define la varianza y se denota por 2 , como la media aritm
etica de los cuadrados de
las desviaciones entre los valores de la variable estadstica y la media aritm
etica.
2 =
k
X
(xi x
)2 fi =
i=1
k
1 X
(xi x
)2 ni
N i=1
k
X
i=1
x2i fi x
2 =
k
1 X 2
x ni x
2
N i=1 i
Curso 2013/2014
20 / 122
Definici
on
Desviaci
on Tpica: La varianza es una medida de dispersi
on que viene dada en unidades al
cuadrado. Para mantener la misma unidad de medida de las observaciones, se define la
desviaci
on tpica, y se denota por , como la raz cuadrada positiva de la varianza,
v
v
v
u
u
u k
k
k
u1 X
u1 X
uX
2
2
(xi x
) fi = t
(xi x
) ni = t
x2i ni x
2
=t
N
N
i=1
i=1
i=1
Definici
on
Coeficiente de variaci
on de Pearson: Se define el coeficiente de variaci
on de Pearson de una
variable estadstica X, y se denota por CVx , como el cociente entre la desviaci
on tpica y la
media aritm
etica,
x
CVx =
x
Curso 2013/2014
21 / 122