Escolar Documentos
Profissional Documentos
Cultura Documentos
TEMA 5
INTRODUCCIN A LA INFERENCIA ESTADSTICA
1. INTRODUCCIN
1.1 CONCEPTOS BSICOS
2. DISTRIBUCIONES EN EL MUESTREO
2.1 MODELOS DE DISTRIBUCIN DE PROBABILIDAD EN EL MUESTREO
2.1.1 DISTRIBUCIN CHI-CUADRADO DE PEARSON.
2.1.2 DISTRIBUCIN t DE STUDENT
2.1.3 DISTRIBUCIN F DE SNEDECOR
2.1.4 TEOREMA CENTRAL DEL LMITE
2.2 DISTRIBUCIONES MUESTRALES DE LOS PRINCIPALES
ESTADSTICOS
2.2.1 EN UNA POBLACIN CUALQUIERA
2.2.2 EN UNA POBLACIN NORMAL
Curso 02-03
2
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
TEMA 5
INTRODUCCIN A LA INFERENCIA ESTADSTICA
1. INTRODUCCIN
Inferir es, en general, establecer un nuevo conocimiento a partir de uno ya
dado. En nuestro contexto, nos interesa, basndonos en la informacin
contenida en una muestra, i!"#i# informacin sobre una poblacin.
La I!"#"$i% E&t%'(&ti$% es la parte de la Estadstica que incluye los
mtodos utiliados para tomar decisiones o para obtener conclusiones sobre
una caracterstica desconocida de la poblacin a partir de la informacin
contenida en una o ms muestras representativas de esa poblacin. La
!erramienta terica que utilia es la teora de la probabilidad.
E"emplo# $n ingeniero !a dise%ado un nuevo tipo de &'$ y desea obtener
conclusiones sobre la forma en que funcionar una ve que se produca a gran
escala. 'ara ello toma una muestra de () &'$, y de las conclusiones que
obtenga podr inferir el funcionamiento de toda la produccin prevista.
La Inferencia Estadstica, estudia principalmente dos tipos de problemas#
a* La E&ti)%$i*# consiste en determinar una caracterstica desconocida
de la poblacin. E"emplo# +veriguar la velocidad media de las &'$.
'uede ser#
+,t,%-# determinar el valor concreto.
+.# it"#/%-.&# determinar un intervalo en el que est contenida con
cierto grado de probabilidad.
b* El C.t#%&t" '" 0i+*t"&i&1 determinar si es aceptable, a partir de los
datos muestrales, que la caracterstica estudiada tome un valor
predeterminado o perteneca a un intervalo concreto. E"emplo# ,Es la
velocidad media mayor que - millones de flops. ,La velocidad media de las
&'$ tiene una distribucin normal.
1.1 CONCEPTOS BSICOS
%2 P.3-%$i*# es el con"unto de todos los individuos su"etos a estudio.
32 M,"&t#%# es el subcon"unto finito de elementos selecionados de la
poblacin.
'ara que las inferencias sean vlidas, las muestras deben ser
representativas de la poblacin.
$2 M,"&t#".1 procedimiento de obtencin de una muestra. 'odemos
describir los sigientes tipos#
Curso 02-03
3
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
M,"&t#". O+i4ti$.1 la seleccin de los elementos muestrales se realia
seg/n el criterio del investigador. la muestra no es representativa de la
poblacin.
M,"&t#". A-"%t.#i.# se seleciona de forma que cada elemento de la
poblacin tiene una probabilidad positiva de ser elegido.
0uestreo +leatorio 1imple# &ada elemento de la poblacin tiene la
misma probabilidad de ser elegido y esta probabilidad se mantiene
constante a lo largo del proceso. La tcnica del muestreo puede asimilarse
a un modelo de extraccin con reemplaamiento. $n mismo dato puede ser
muestreado ms de una ve. Los datos muestrales sern estocasticamente
independientes .
0uestreo +leatorio Irrestricto# &ada elemento de la poblacin tiene en
un principio la misma probabilidad de ser elegido, pero posteriormente, la
probabilidad de obtener un valor en cada seleccin viene influida por los
resultados anteriores. 1e corresponde con un modelo de extraccin sin
reemplaamiento.
M,"&t#". E&t#%ti!i$%'.# 1e divide a la poblacin en estratos, niveles o
grupos seg/n criterios prefi"ados y la muestra se toma asignando una
proporcin de miembros a cada estrato y escogiendo los elementos dentro de
cada estrato por muestreo aleatorio simple 2m.a.s.*
El muestreo aleatorio debe utiliarse cuando los elementos de la poblacin
son !omogneos respecto a la caracterstica a estudiar. &uando dispongamos
de informacin sobre la poblacin conviene tenerla en cuenta al seleccionar la
muestra. $n e"emplo son las encuestas de opinin, donde los elementos
2personas* son !etereogneos en ran a su sexo, edad, profesin,etc.
Interesa en estos casos que la muestra tenga composicin anloga a la
poblacin y esto se consigue con un muestreo estratificado.
M,"&t#". +.# $.5-.)"#%'.&1 cuando los elementos de la poblacin se
encuentran 3de manera natural3 agrupados en conglomerados, cuyo n/mero
se conoce, y podamos suponer que cada uno de estos conglemerados es una
muestra representativa de la poblacin respecto de la variable que se estudia.
El muestreo consiste en seleccionar uno de estos conglomerados al aar y,
dentro de ellos, analiar todos sus elementos o una muestra aleatoria simple.
En este curso vamos a suponer que la muestra !a sido obtenida por
muestreo aleatorio simple 2m.a.s.* puesto que la teora ba"o este tipo de
muestreo es la ms sencilla. 1in embargo, en la prctica se suele realiar el
muestreo irrestricto. 4e todas formas, si la poblacin tiene un n/mero grande
de elementos, la probabilidad de que un elemento salga repetido es muy
peque%a y los dos tipos de muestreo sern equivalentes.
1i el muestreo es aleatorio, seleccionar un elemento de la poblacin es
realiar un experimento aleatorio y cada observacin de la muestra es el valor
observado de una variable aleatoria. La distribucin de probabilidad de cada
Curso 02-03
4
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
una de estas variables aleatorias viene determinada por la distribucin de los
elementos de la poblacin. +s podemos definir#
M,"&t#% %-"%t.#i% &i)+-" '" t%)%6. 1 es una variable aleatoria n5
dimensional
X = ( x
1
, x
2
, . . . , x
n
)
donde cada
x
i
representa el valor observado
en la i5sima extraccin y podr tomar cualquier valor de la poblacin. 'or
tanto, una muestra concreta realiada, ser un valor particular, una realiacin
de la muestra genrica.
En la medida en el que el m.a. cada elemento de la poblacin tiene una
probabilidad de ser elegido, cada dato muestral genrico ser una variable
aleatoria que tendr asociada una funcin de probabilidad 2de cuanta o de
densidad* seg/n una determinada distribucin que llamaremos 'i&t#i3,$i*
'" -% +.3-%$i*. 1i traba"amos con un m.a.s. cada
x
i
es estocsticamente
independiente y entonces la !,$i* '" +#.3%3i-i'%' . '" '"&i'%'
$.7,t% de la muestra ser#
f ( X ) = f ( x
1
, x
2
, . . . , x
n
) = f ( x
i
)
i = 1
n
6a !emos mencionado en la introduccin que uno de los propsitos del
tema es estimar cantidades desconocidas de la poblacin 2tales como la media
poblacional, la variana, etc.* llamadas parmetros poblacionales, o ms
brevemente +%#4)"t#.&, a partir del conocimiento de las correspondientes
cantidades muestrales 2tales como la media muestral, la variana muestral,
etc.* llamadas estadsticos muestrales, o ms brevemente "&t%'(&ti$.&.
+s pues "&t%'(&ti$. es cualquier funcin de los valores muestrales que
depende exclusivamente de stos. &omo los valores muestrales son variables
aleatorias, tambin lo son los estadsticos.
7odas las medidas descriptivas que veamos en el tema 8 son e"emplos de
estadsticos como la media muestral
x
, la variana muestral
s
2
,
x
4
x
1
9
pero no es estadstico
n
2
s
2
porque
2
es la variana poblacional, y por
tanto, no depende exclusivamente de los valores muestrales.
&onsideremos todas las posibles muestras que pueden extraerse de una
poblacin dada. 'ara cada muestra se puede calcular un estadstico, tal como
la media, la desviacin tpica, etc. que variar de una muestra a otra. 4e esta
forma se obtiene una distribucin del estadstico que se conoce como
'i&t#i3,$i* ),"&t#%- . 'i&t#i3,$i."& " "- ),"&t#"..
:uestro ob"etivo es dedicar el resto del tema al estudio de las
distribuciones muestrales de los principales estadsticos# media muestral,
variana muestral, diferencia de medias muestrales y cociente de varianas
muestrales, pues son practicamente los /nicos estadsticos que vamos a usar
en este curso. 'ara ello, necesitamos previamente introducir otros modelos de
Curso 02-03
5
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
distribucin de probabilidad, que tienen su principal papel en el muestreo. +
diferencia de los modelos estudiados en el tema anterior, en este caso
definimos cada una de las distribuciones de probabilidad a partir de su relacin
con una muestra aleatoria simple de una poblacin normal. 7ambin damos
una idea de su representacin grfica y sus caractersticas 2medias y
varianas*.
2. DISTRIBUCIONES EN EL MUESTREO
2.1 MODELOS DE DISTRIBUCIN DE PROBABILIDAD EN EL
MUESTREO.
2.1.1 DISTRIBUCIN CHI-CUADRADO DE PEARSON.
La distribucin
2
de 'earson con n grados de libertad se define como la
distribucin que sigue la variable definida como suma de los cuadrados de n
variables normales tipificadas independientes.
1ean
Z
1
, Z
2
, . . . , Z
n
un con"unto de variables aleatorias indepen5dientes
Z
i
N ( 0 , 1 )
, entonces
X = Z
i
2
i = 1
n
n
2
C%#%$t"#(&ti$%&
E X [ ] = n Var X [ ] = 2 n
'ara el clculo de probabilidades, en las tablas podremos encontrar el valor
de x tal que P ( X x ) = p
P#.+i"'%' 8T".#")% '" %'i$i*2
4adas { }
X
i i
k
n
i
=
1
2
independientes
X
i
i = 1
k
n
1
+ n
2
+ . . . + n
k
2
R"-%$i* $. -% .#)%-
1i X
n
2
, entonces Y = 2 X
N ( 2 n 1 , 1 ) si n es grande.
2.1.2. DISTRIBUCIN t DE STUDENT
4adas las variables aleatorias independientes X e Y tales que
X N ( 0 , 1 ) e Y
n
2
, la nueva variable aleatoria definida como
T =
X
Y
n
Curso 02-03
6
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
sigue una distribucin t de 1tudent con n grados de libertad, que denotamos
por
t
n
.
C%#%$t"#(&ti$%&
E T [ ] = 0 para n;<9 si n=8 no existe media
Var T [ ] =
n
n 2
para n;>
'ara el clculo de probabilidades, en las tablas podremos encontrar el
valor de x tal que P ( T x ) = p
Es una distribucin simtrica y por tanto se cumple que
f2x*=f25x*. &on lo cual se deduce que P ( T x ) = 85 P ( T x )
La distribucin t de 1tudent converge a una normal cuando los grados de
libertad tienden a infinito 2sirve para n;>)*.
2.1.3. DISTRIBUCIN F DE SNEDECOR
1us principales usos son los de la contrastacin de la igualdad de varianas
de dos poblaciones normales y, fundamentalmente, el anlisis de la variana y
el dise%o de experimentos, tcnicas que permiten detectar la existencia o
inexistencia de diferencias significativas entre muestras diferentes.
4adas dos variables aleatorias independientes
X
1
, X
2
tales que sus
distribuciones son X
1
n
2
y X
2
m
2
, definimos la nueva variable
F =
X
1
n
X
2
m
que sigue una distribucin ? de 1nedecor con n grados de libertad en
el numerador y m grados de libertad en el denominador, que denotamos por
F
n , m
.
'ara el clculo de probabilidades, en las tablas podremos encontrar el valor
de x tal que
P ( F
n , m
x ) = p
para p=).@ y ).@@.
1e cumple que P ( F
n , m
x ) = P ( F
n , m
1
x
) = 1 P ( F
n , m
1
x
)
$n resultado particular interesante es que si
X t
n
X
2
F
1 , n
.
2.1.4. TEOREMA CENTRAL DEL LMITE
Curso 02-03
7
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
1ean
X
1
, X
2
, . . . , X
n
variables aleatorias independientes con la misma
distribucin y con media
y variana
2
. Entonces
X
X X X
n
n
n
aprox
N
n
=
+ + +
1 2
2 ...
( )
( , )