Você está na página 1de 11

TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA

TEMA 5
INTRODUCCIN A LA INFERENCIA ESTADSTICA
1. INTRODUCCIN
1.1 CONCEPTOS BSICOS
2. DISTRIBUCIONES EN EL MUESTREO
2.1 MODELOS DE DISTRIBUCIN DE PROBABILIDAD EN EL MUESTREO
2.1.1 DISTRIBUCIN CHI-CUADRADO DE PEARSON.
2.1.2 DISTRIBUCIN t DE STUDENT
2.1.3 DISTRIBUCIN F DE SNEDECOR
2.1.4 TEOREMA CENTRAL DEL LMITE
2.2 DISTRIBUCIONES MUESTRALES DE LOS PRINCIPALES
ESTADSTICOS
2.2.1 EN UNA POBLACIN CUALQUIERA
2.2.2 EN UNA POBLACIN NORMAL
Curso 02-03
2
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
TEMA 5
INTRODUCCIN A LA INFERENCIA ESTADSTICA
1. INTRODUCCIN
Inferir es, en general, establecer un nuevo conocimiento a partir de uno ya
dado. En nuestro contexto, nos interesa, basndonos en la informacin
contenida en una muestra, i!"#i# informacin sobre una poblacin.
La I!"#"$i% E&t%'(&ti$% es la parte de la Estadstica que incluye los
mtodos utiliados para tomar decisiones o para obtener conclusiones sobre
una caracterstica desconocida de la poblacin a partir de la informacin
contenida en una o ms muestras representativas de esa poblacin. La
!erramienta terica que utilia es la teora de la probabilidad.
E"emplo# $n ingeniero !a dise%ado un nuevo tipo de &'$ y desea obtener
conclusiones sobre la forma en que funcionar una ve que se produca a gran
escala. 'ara ello toma una muestra de () &'$, y de las conclusiones que
obtenga podr inferir el funcionamiento de toda la produccin prevista.
La Inferencia Estadstica, estudia principalmente dos tipos de problemas#
a* La E&ti)%$i*# consiste en determinar una caracterstica desconocida
de la poblacin. E"emplo# +veriguar la velocidad media de las &'$.
'uede ser#
+,t,%-# determinar el valor concreto.
+.# it"#/%-.&# determinar un intervalo en el que est contenida con
cierto grado de probabilidad.
b* El C.t#%&t" '" 0i+*t"&i&1 determinar si es aceptable, a partir de los
datos muestrales, que la caracterstica estudiada tome un valor
predeterminado o perteneca a un intervalo concreto. E"emplo# ,Es la
velocidad media mayor que - millones de flops. ,La velocidad media de las
&'$ tiene una distribucin normal.
1.1 CONCEPTOS BSICOS
%2 P.3-%$i*# es el con"unto de todos los individuos su"etos a estudio.
32 M,"&t#%# es el subcon"unto finito de elementos selecionados de la
poblacin.
'ara que las inferencias sean vlidas, las muestras deben ser
representativas de la poblacin.
$2 M,"&t#".1 procedimiento de obtencin de una muestra. 'odemos
describir los sigientes tipos#
Curso 02-03
3
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
M,"&t#". O+i4ti$.1 la seleccin de los elementos muestrales se realia
seg/n el criterio del investigador. la muestra no es representativa de la
poblacin.
M,"&t#". A-"%t.#i.# se seleciona de forma que cada elemento de la
poblacin tiene una probabilidad positiva de ser elegido.
0uestreo +leatorio 1imple# &ada elemento de la poblacin tiene la
misma probabilidad de ser elegido y esta probabilidad se mantiene
constante a lo largo del proceso. La tcnica del muestreo puede asimilarse
a un modelo de extraccin con reemplaamiento. $n mismo dato puede ser
muestreado ms de una ve. Los datos muestrales sern estocasticamente
independientes .
0uestreo +leatorio Irrestricto# &ada elemento de la poblacin tiene en
un principio la misma probabilidad de ser elegido, pero posteriormente, la
probabilidad de obtener un valor en cada seleccin viene influida por los
resultados anteriores. 1e corresponde con un modelo de extraccin sin
reemplaamiento.
M,"&t#". E&t#%ti!i$%'.# 1e divide a la poblacin en estratos, niveles o
grupos seg/n criterios prefi"ados y la muestra se toma asignando una
proporcin de miembros a cada estrato y escogiendo los elementos dentro de
cada estrato por muestreo aleatorio simple 2m.a.s.*
El muestreo aleatorio debe utiliarse cuando los elementos de la poblacin
son !omogneos respecto a la caracterstica a estudiar. &uando dispongamos
de informacin sobre la poblacin conviene tenerla en cuenta al seleccionar la
muestra. $n e"emplo son las encuestas de opinin, donde los elementos
2personas* son !etereogneos en ran a su sexo, edad, profesin,etc.
Interesa en estos casos que la muestra tenga composicin anloga a la
poblacin y esto se consigue con un muestreo estratificado.
M,"&t#". +.# $.5-.)"#%'.&1 cuando los elementos de la poblacin se
encuentran 3de manera natural3 agrupados en conglomerados, cuyo n/mero
se conoce, y podamos suponer que cada uno de estos conglemerados es una
muestra representativa de la poblacin respecto de la variable que se estudia.
El muestreo consiste en seleccionar uno de estos conglomerados al aar y,
dentro de ellos, analiar todos sus elementos o una muestra aleatoria simple.
En este curso vamos a suponer que la muestra !a sido obtenida por
muestreo aleatorio simple 2m.a.s.* puesto que la teora ba"o este tipo de
muestreo es la ms sencilla. 1in embargo, en la prctica se suele realiar el
muestreo irrestricto. 4e todas formas, si la poblacin tiene un n/mero grande
de elementos, la probabilidad de que un elemento salga repetido es muy
peque%a y los dos tipos de muestreo sern equivalentes.
1i el muestreo es aleatorio, seleccionar un elemento de la poblacin es
realiar un experimento aleatorio y cada observacin de la muestra es el valor
observado de una variable aleatoria. La distribucin de probabilidad de cada
Curso 02-03
4
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
una de estas variables aleatorias viene determinada por la distribucin de los
elementos de la poblacin. +s podemos definir#
M,"&t#% %-"%t.#i% &i)+-" '" t%)%6. 1 es una variable aleatoria n5
dimensional
X = ( x
1
, x
2
, . . . , x
n
)
donde cada
x
i
representa el valor observado
en la i5sima extraccin y podr tomar cualquier valor de la poblacin. 'or
tanto, una muestra concreta realiada, ser un valor particular, una realiacin
de la muestra genrica.
En la medida en el que el m.a. cada elemento de la poblacin tiene una
probabilidad de ser elegido, cada dato muestral genrico ser una variable
aleatoria que tendr asociada una funcin de probabilidad 2de cuanta o de
densidad* seg/n una determinada distribucin que llamaremos 'i&t#i3,$i*
'" -% +.3-%$i*. 1i traba"amos con un m.a.s. cada
x
i
es estocsticamente
independiente y entonces la !,$i* '" +#.3%3i-i'%' . '" '"&i'%'
$.7,t% de la muestra ser#
f ( X ) = f ( x
1
, x
2
, . . . , x
n
) = f ( x
i
)
i = 1
n

6a !emos mencionado en la introduccin que uno de los propsitos del
tema es estimar cantidades desconocidas de la poblacin 2tales como la media
poblacional, la variana, etc.* llamadas parmetros poblacionales, o ms
brevemente +%#4)"t#.&, a partir del conocimiento de las correspondientes
cantidades muestrales 2tales como la media muestral, la variana muestral,
etc.* llamadas estadsticos muestrales, o ms brevemente "&t%'(&ti$.&.
+s pues "&t%'(&ti$. es cualquier funcin de los valores muestrales que
depende exclusivamente de stos. &omo los valores muestrales son variables
aleatorias, tambin lo son los estadsticos.
7odas las medidas descriptivas que veamos en el tema 8 son e"emplos de
estadsticos como la media muestral
x
, la variana muestral
s
2
,
x
4
x
1
9
pero no es estadstico
n
2
s
2
porque

2
es la variana poblacional, y por
tanto, no depende exclusivamente de los valores muestrales.

&onsideremos todas las posibles muestras que pueden extraerse de una
poblacin dada. 'ara cada muestra se puede calcular un estadstico, tal como
la media, la desviacin tpica, etc. que variar de una muestra a otra. 4e esta
forma se obtiene una distribucin del estadstico que se conoce como
'i&t#i3,$i* ),"&t#%- . 'i&t#i3,$i."& " "- ),"&t#"..
:uestro ob"etivo es dedicar el resto del tema al estudio de las
distribuciones muestrales de los principales estadsticos# media muestral,
variana muestral, diferencia de medias muestrales y cociente de varianas
muestrales, pues son practicamente los /nicos estadsticos que vamos a usar
en este curso. 'ara ello, necesitamos previamente introducir otros modelos de
Curso 02-03
5
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
distribucin de probabilidad, que tienen su principal papel en el muestreo. +
diferencia de los modelos estudiados en el tema anterior, en este caso
definimos cada una de las distribuciones de probabilidad a partir de su relacin
con una muestra aleatoria simple de una poblacin normal. 7ambin damos
una idea de su representacin grfica y sus caractersticas 2medias y
varianas*.
2. DISTRIBUCIONES EN EL MUESTREO
2.1 MODELOS DE DISTRIBUCIN DE PROBABILIDAD EN EL
MUESTREO.
2.1.1 DISTRIBUCIN CHI-CUADRADO DE PEARSON.
La distribucin

2
de 'earson con n grados de libertad se define como la
distribucin que sigue la variable definida como suma de los cuadrados de n
variables normales tipificadas independientes.
1ean
Z
1
, Z
2
, . . . , Z
n
un con"unto de variables aleatorias indepen5dientes
Z
i
N ( 0 , 1 )
, entonces
X = Z
i
2
i = 1
n

n
2
C%#%$t"#(&ti$%&
E X [ ] = n Var X [ ] = 2 n
'ara el clculo de probabilidades, en las tablas podremos encontrar el valor
de x tal que P ( X x ) = p
P#.+i"'%' 8T".#")% '" %'i$i*2
4adas { }
X
i i
k
n
i
=

1
2

independientes
X
i
i = 1
k

n
1
+ n
2
+ . . . + n
k
2
R"-%$i* $. -% .#)%-
1i X
n
2
, entonces Y = 2 X

N ( 2 n 1 , 1 ) si n es grande.
2.1.2. DISTRIBUCIN t DE STUDENT
4adas las variables aleatorias independientes X e Y tales que
X N ( 0 , 1 ) e Y
n
2
, la nueva variable aleatoria definida como
T =
X
Y
n

Curso 02-03
6
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
sigue una distribucin t de 1tudent con n grados de libertad, que denotamos
por
t
n
.
C%#%$t"#(&ti$%&
E T [ ] = 0 para n;<9 si n=8 no existe media
Var T [ ] =
n
n 2
para n;>
'ara el clculo de probabilidades, en las tablas podremos encontrar el
valor de x tal que P ( T x ) = p
Es una distribucin simtrica y por tanto se cumple que
f2x*=f25x*. &on lo cual se deduce que P ( T x ) = 85 P ( T x )
La distribucin t de 1tudent converge a una normal cuando los grados de
libertad tienden a infinito 2sirve para n;>)*.
2.1.3. DISTRIBUCIN F DE SNEDECOR
1us principales usos son los de la contrastacin de la igualdad de varianas
de dos poblaciones normales y, fundamentalmente, el anlisis de la variana y
el dise%o de experimentos, tcnicas que permiten detectar la existencia o
inexistencia de diferencias significativas entre muestras diferentes.
4adas dos variables aleatorias independientes
X
1
, X
2
tales que sus
distribuciones son X
1

n
2
y X
2

m
2
, definimos la nueva variable
F =
X
1
n
X
2
m
que sigue una distribucin ? de 1nedecor con n grados de libertad en
el numerador y m grados de libertad en el denominador, que denotamos por
F
n , m
.
'ara el clculo de probabilidades, en las tablas podremos encontrar el valor
de x tal que
P ( F
n , m
x ) = p
para p=).@ y ).@@.
1e cumple que P ( F
n , m
x ) = P ( F
n , m

1
x
) = 1 P ( F
n , m

1
x
)
$n resultado particular interesante es que si
X t
n
X
2
F
1 , n
.
2.1.4. TEOREMA CENTRAL DEL LMITE
Curso 02-03
7
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
1ean
X
1
, X
2
, . . . , X
n
variables aleatorias independientes con la misma
distribucin y con media

y variana

2
. Entonces
X
X X X
n
n
n
aprox
N
n
=
+ + +


1 2
2 ...
( )
( , )

$n enunciado ms riguroso sera# Lim


n
P ( X x ) =
x

n





2.2 DISTRIBUCIONES MUESTRALES DE LOS PRINCIPALES


ESTADSTICOS.
2.2.1 EN UNA POBLACIN CUALQUIERA.
1ean
X
1
, X
2
, . . . , X
n
una muestra aleatoria de variables aleatorias
identicamente distribuidas con E X
i
[ ]
= y Var X
i
[ ]
=
2
. 1i no conocemos la
distribucin de la poblacin, no podemos, en general, calcular la distribucin de
los estadsticos, pero s se podr, en cualquier caso, determinar la esperana y
variana de los principales estadsticos en funcin de los parmetros de la
distribucin de la poblacin.
A.M"'i% ),"&t#%-


2tanto para muestreo simple como irrestricto*

2para m.a.s.*

2para irrestricto*
1iempre que n sea muy grande 2n;>)* podemos aplicar el 7&L#


B.9%#i%:% ),"&t#%-

Los siguientes resultados sern para m.a.s#

Llamando

tenemos

Curso 02-03
8
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
2.2.2 EN UNA POBLACIN NORMAL.
+ partir de a!ora supondremos que la poblacin tiene una distribucin
normal, ya que los resultados que vamos a obtener por el 7eorema &entral del
Lmite, lo requieren. 1i ni lo tuviera seran una aproximacin cuando la muestra
que tomemos sea de tama%o grande.
En estas circunstancias, ya no slo podr averiguar los valores de la
esperana y variana, sino que podremos !ablar de sus modelos de
distribucin.
A. UNA MUESTRA
1ean

una muestra aleatoria simple de variables aleatorias tales que

%.M"'i% ),"&t#%-


'odemos ver que




ya que si

, por el teorema de la adicin del tema anterior se cumple que

, y
por las transformaciones lineales

3.9%#i%:% ),"&t#%-
:o conocemos exactamente la distribucin de

, solamente#


pero podemos calcular

4ebemos recordar que una distribucin c!i5cuadrado se defina como una
suma de normales tipificadas elevadas al cuadrado.
$.M"'i% ),"&t#%- $. /%#i%:% '"&$..$i'%
1i no conocemos el valor de

, la distribucin que !emos deducido
anteriormente para el estadstico media muestral no nos sirve, podemos utiliar
entonces#

Aecordemos que la distribucin t de 1tudent se defina como el cociente
entre una normal tipificada y la rai cuadrada de una c!i5cuadrado dividida por
sus grados de libertad.
'.P#.+.#$i* ),"&t#%-.
Curso 02-03
9
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
7enemos una poblacin Bernouilli y elegimos una muestra

donde

.
&onsideremos la variable aleatoria C= 3nD de xitos en la muestra3, que
sigue una distribucin Bi2n,p*. 4efinimos '=3proporcin de xitos en n
extracciones3 entonces '=CEn


B. DOS MUESTRAS INDEPENDIENTES
1upongamos a!ora que queremos comparar dos variables o dos
poblaciones. 'ara ello necesitamos tomar dos muestras y vamos a suponer
que estas muestras se toman independientemente. E"emplo# Felocidad de las
&'$ del fabricante + y velocidad de las &'$ del fabricante B.
1eguimos suponiendo que la distribucin de las dos poblaciones es :ormal.
1ean

una muestra aleatoria de variables aleatorias independientes tales que
e
Y Y Y
m 1 2
, ,...,
una muestra aleatoria de variables aleatorias tales que



.
%.Di!"#"$i% '" )"'i%& ),"&t#%-"& $. /%#i%:%& $..$i'%&.

$n caso particular sera la diferencia de proporciones

3.Di!"#"$i% '" )"'i%& ),"&t#%-"& $. /%#i%:%& '"&$..$i'%& +"#.
i5,%-"&.

$.C.$i"t" '" /%#i%:%& ),"&t#%-"&
:o conocemos la distribucin de


exactamente, solo#

C. DOS MUESTRAS RELACIONADAS
1upongamos a!ora que queremos comparar dos variables pero que las dos
muestras que se toman no son independientes 2los datos estn apareados*.
E"emplo# Felocidad de las &'$ antes y despus de a%adir una componente.
1ean

una muestra aleatoria de variables aleatorias tales que


e

una
muestra aleatoria de variables aleatorias tales que



. Las muestras estn
relacionadas. :otar que en este caso n=m.
Curso 02-03
10
TEMA 5:INTRODUCCIN A LA INFERENCIA ESTADSTICA
%.Di!"#"$i% '" )"'i%& ),"&t#%-"&.
1ea

y sea

su desviacin tpica muestral. podemos usar el siguiente
resultado#

Curso 02-03
11

Você também pode gostar