Escolar Documentos
Profissional Documentos
Cultura Documentos
Introducción
A inferencia estatística é o proceso que nos permite establecer conclusións sobre unha
poboación a partir das conclusións obtidas dunha parte representativa dela (unha mostra
representativa).
Neste proceso vai existir unha marxe de incerteza, debido a estar traballando con
fenómenos aleatorios. Por esa razón, as conclusións mostrais adoitan variar cando varía
a mostra, polo cal, o que se obtén en realidade non son conclusións únicas se non un
intervalo de conclusións nos que probablemente (con alta probabilidade) estarán as
verdadeiras conclusións sobre a poboación.
Para respostar a esa pregunta con certeza absoluta teríamos que analizar os datos de
tódalas persoas que non fuman1. Dado que iso é pouco factible, faise a análise cunha
mostra.
Se a mostra foi ben seleccionada teremos os resultados diranos que o verdadeiro valor da
esperanza de vida de quen non fuma estará cercano a eses resultados cunha certeza
determinada.
A Inferencia é tamén unha importante ferramenta para o método científico, por que sirve
para contrastar, e diranos se a “realidade” permite manter as afirmacións feitas nunha
teoría ou debemos rexeitalas.
1 En realidade a esperanza de vida ven sendo un promedio da idade na cal morren as persoas, polo cal
necesitaríamos analizar a tódalas persoas non fumadoras que morreron.
De maneira moi simplificada os pasos do método científico serían:
– Non?: Debemos rexeitala, non podemos sostela coas evidencias que nos
proporciana a “análise da realidade”
Exemplo: Viven o mesmo tempo as persoas que fuman cás persoas que non fuman?
Proposta teórica: Si, o tabaco non afecta a esperanza de vida das persoas.
é cero?
2 Os resultados verdadeiros, os da poboación, que non coñeceremos por que para facelo sería necesario
analizar tódolos individuos da poboación.
Os resultado mostral danos a coñecer un rango de valores probable para a diferencia
entre as esperanzas de vida dos dous colectivos: está o cero dentro dese rango:
– Si? Podemos seguir afirmando que non hai diferencias entre as esperanzas de vida
de fumadores e non fumadores
– Non? Debemos considerar esa proposta teórica como falsa e afirmar que sí existen
diferencias na esperanza de vida dos dous colectivos
O proceso de inferencia
Conceptos.
Estatístico: Calquera función das observacións mostrais que non contén ningún
parámetro descoñecido.
O comportamento dese fenómeno aleatorio será descrito mediante unha variable aleatoria
, a cal terá asociada unha función de distribución F(x).
Para obter información sobre eses parámetros vaise traballar cunha mostra da
poboación. No ámbito deste curso considerarase que esta mostra é unha mostra
aleatoria simple4, así tódolos individuos da poboación terán a mesma probabilidade de
seren seleccionados, e o valor que lles corresponda vai ser independente do valor que
lles corresponda ós demais individuos da mostra.
Para un individuo i da mostra, imos ter un valor que pode ser considerado como un
resultado dunha variable aleatora i, que se comporta segundo unha distribución F(x), do
mesmo tipo cá variable aleatoria .
3 Tamén se poden estudar varias variables, pero referirémonos unicamente a 1 por simplicidade
Ao ser unha mostra aleatoria simple, cada un deses valores será independente dos
demais, polo tanto, calquera función que apliquemos a eses valores poderemos tratala
como unha función aplicada a variables aleatorias independentes. Veremos o caso xeral
da media aritmética, da varianza e da cuasevarianza.
Media mostral.
n
Dado que se traballa cunha m.a.s., o estatístico media aritmética x será unha función
de variables aleatorias independentes. Cada unha delas por separado coas mesmas
propiedades cá variable aleatoria poboacional. O estatístico media aritmética vai cumprir
sempre, independentemente do tipo de distribución, as seguintes propiedades:
2
Esperanza : E[ x ]=; Varianza: V( x )=
n
Demostración:
[ ]
n
∑ xi
[ ]
n n n
- 1 1 1 1
E [ x ] =
1
E i=1
n
=
2 n
·E ∑ xi =
3 n
·∑ E [ xi ] =
4 n
· ∑ =5 n
· n ·=
6
i=1 i=1 i=1
(1) definición de media aritmética (2) cambio de escala nunha media aritmética: a constante sae para fora
(3) esperanza dunha suma de variables = suma das esperanzas (4) A esperanza da poboación é , polo tanto é a
esperanza de cada xi tamén
(5) suma n veces unha constante = n· constante (6) simplificando
[ ]
n
∑ xi
[ ]
n n n
- 1 1 1 1 2
Var [ x ] =
1
Var i=1
n
=
2
n
2
· Var ∑ x i =3 2 ∑
·
n i=1
Var [ i ] 4 2 ∑ 5 2
x = ·
n i=1
2
=
n
· n· 2
=
6 n
i=1
(1) definición de media aritmética (2) cambio de escala nunha varianza: a constante sae elevada ao cadrado
(3) varianza dunha suma de variables INDEPENDENTES = suma das varianzas (4) A varianza da poboación é 2,
polo tanto é a varianza de cada xi tamén
(5) suma n veces unha constante = n· constante (6) simplificando
Varianza mostral.
n
2
Varianza mostral:
∑ x i− x
S 2= i=1
n
n−1 2
E[S2]= ;
n
A esperanza deste estatístico non coincide co parámetro poboacional (), polo que é
frecuente sustituilo pola cuasevarianza:
n
2
∑ x i− x
S 2c = i=1
n−1
E[Sc2]= E [ n
n−1 ]
· E [ S2 ] =
n
·
n−1 n
n−1 2 2
= ;
Resultados para poboacións normais. Unha mostra
Nos casos nos que o fenómeno se comporta como unha distribución N(,),
poderemos aplicar as propiedades das distribucións normais para averiguar que tipo de
distribución describe o comportamento dos anteriores estatísticos:
Cos datos obtidos nesa mostra aplicamos diferentes funcións para calcular os
parámetros nos que esteamos interesados.
Dado que a mostra pode ser considerada unha variable aleatoria n-dimensional:
Calquera función que apliquemos aos datos procedentes desa mostra vai ser tamén
unha variable aleatoria: por exemplo medias aritméticas ou varianzas.
Media mostral:
No caso da media aritmética mostral temos dúas situacions diferentes, xa que podemos
coñecer ou non a varianza poboacional. Se a coñecemos o seu valor será unha
constante, e integrarase como constante na fórmula da distribución, pero se non a
coñecemos teremos que estimala a partir dos datos e, como consecuencia diso, a fórmula
que empreguemos afectará a distribución da media aritmética, cambiando a súa
distribución.
– Media mostral coa varianza coñecida: ~ N(, )
n
– Media mostral coa varianza descoñecida:
Varianza mostral:
n· S2
2
~2n−1
Cuasevarianza mostral:
n−1 S 2c
2
~ 2n−1
σ1 σ2
medias aritméticas será: ξ ~N(1, ), η ~N(2, ),.
m n
Se queremos comparar esas dúas medias podemos restalas, e á diferencia aplicarlle a
aditividade da Normal.
ξ − η ~N(1-2,
21 22
m n
)
Para aplicar estas fórmulas é necesario considerar supoñer que as varianzas, ainda
que descoñecidas, son iguais nas dúas poboacións.
− − 1 −2
– Usando a cuasevarianzamostral: 1 1
m n
~ t mn−2
− − 1−2
m· S21n· S22
mn−2
Cociente de varianzas.
S 21 22
– Empregando a varianza mostral: · ~ F m−1,n−1
S 22 21
Sería unha proporción para unha característica que se representa mediante unha
variable aleatoria Binomial: contamos 1 se o individuo entrevistado consume o producto,
e 0 se non o consume.
Como nos interesa estimar a proporción tomaremos unha mostra de tamaño n. A media
p · 1− p
E[ ξ ]=p; V( ξ )=
n
sen saber a súa distribución. Sen embargo, para mostras grandes, (n>30), podería
Temos logo un experimento que da lugar a unha variable aleatoria con dous resultados
(compra, non compra), aplicado en dúas poboacións diferentes.
Para cada individuo da primeira localidade teríamos unha v.a. ~Bi(1,p1), e outra v.a.
~Bi(1,p2),para os individuos da outra localidade.
Como nos interesa estimar a diferencia entre esas proporcións tomaremos unha mostra
en cada poboación, de tamaños m e n.
=
nº que responderon si na 2ª localidade
n
= nº que responderon si na 2ª localidade
n
e servirannos como estimadores de p1 e p2
p 1 · 1− p1 p 2 · 1− p2
E[ ]=p1; V( )= E[
]=p2; V( )=
m n
Sen embargo, para mostras grandes, (n>30), podería aplicarse o Th. de De Moivre e
p1− p2 ~ N p1− p2 ;
p1 · 1− p1 p 2 · 1− p 2
m
n
ESTIMACIÓN PUNTUAL
á súa vez o comportamento desta variable será descrito por unha función de distribución
F(x), da cal existirán algúns aspectos que descoñezamos e sobre os que será necesario
a algunhas características que se poden asociar con diferentes parámetros 1, 2, ... k,
(inferencia paramétrica).
Inferencia paramétrica.
Para poder dar un valor para un parámetro que non coñecemos necesitamos calculalo
a partir dunha función dunha mostra (que neste caso será denominada estimador). O
valor que se obtén é unha estimación, e teremos unha por cada mostra diferente dunha
poboación.
embargo non todos serán igual de interesantes para esa estimación en particular.
considerar unha serie de propiedades desexables, de xeito que, canto mellor as cumpla,
PROPIEDADES DUN ESTIMADOR.
Sexa unha variable aleatoria , con función de distribución F(x,), sendo o parámetro
descoñecido que desexamos estimar empregando un estimador = T(x1, x2, ... , xn), o cal
por ser tamén un estatístico é unha variable aleatoria, e pode tomar valores diferentes
para mostras diferentes da mesma poboación. Interesaríanos que estes diferentes valores
parámetro:
variabilidade que ten , como variable aleatoria que é e o erro que se comete cando o
O ideal para un estimador sería que fixese mínimo o ECM, sen embargo isto non
por que non existe, xa que dependera dos valores que tome o parámetro. Isto obriganos a
Insesgadez.
Def.:Sexa = T(x1, x2, ... , xn) un estimador dun parámetro . Dise que é un estimador
Def.: Sexa n = T(x1, x2, ... , xn) un estimador dun parámetro . Dise que é un
Consistencia.
Def.: Sexa n = T(x1, x2, ... , xn) un estimador dun parámetro . Dise que é un
P
n cando n ∞
Este teorema é unha condición suficiente, pero non necesaria, para a consistencia.
Eficiencia.
Unha avantaxe dos estimadores insesgados é que o seu ECM queda reducido á súa
varianza. Por esta razón, dentro deste tipo de estimadores será mellor aquel que teña
menor varianza.
Th.: (Cota de Cramer-Rao) Sexa n = T(x1, x2, ... , xn) un estimador insesgado dun
1 1
Var ≥ =
[ ] [ ]
2 2
∂ Ln L ∂Ln f x ,
E n· E
∂ ∂
Sendo L(x1, x2, ... , xn) a función de verosimilitude, e f(x,) a función de densidade da
Var( 1)<Var( 2)
Suficiencia.
Intuitivamente, un estimador suficiente dun parámetro sería aquel que recolle toda a
Def.: Sexa θ = T(x1, x2, ... , xn) un estimador dun parámetro . Ese estimador é
Th.: (Factorización de Fisher-Neyman) Sexa x1, x2, ... , xn unha m.a.s. dunha poboación
con función de distribución F(x,), e sexa L(x1, x2, ..., xn; ) a función de verosimilitude da
L(x1, x2, ..., xn; ) = g(T(x1, x2, ..., xn), )· h(x1, x2, ..., xn)
Sendo g(T, ) unha función que depende da mostra unicamente a traves do estatístico
dispoñamos, unha vez aplicados estes métodos, duns estimadores que van cumprir
unhas propiedades determinadas, que serán as que cumplan tódolos estimadores dun
tipo determinado.
Consideremos unha m.a.s. x1, x2, ... , xn, pertencente a unha poboación con función de
O estimador de máxima verosimilitude do parámetro será aquel valor para o cal sexa
n
Se L()=L(x1, x2, ... , xn,)= ∏ f x i∣ é a función de verosimilitude. O estimador de
i=1
máxima verosimilitude será aquel valor de para o cal a función de verosimilitude toma o
igualándoa cero, tendo en conta ademais que a segunda derivada neste punto non debe
ser negativa.
Propiedades.
[ ]
2
sendo Var( )= ∂ Ln L
E
∂θ
3) é asintóticamente insesgado
4) é asintóticamente eficiente
5) é consistente
Método dos Momentos
Propiedades
1) É consistente
2) É asintóticamente normal
Os métodos explicados ata agora indicaban como estimar un valor para un parámetro
Sen embargo, con frecuencia, o que interesa é buscar un entorno no que se atope o
función de densidade f(x|), pódese construir un intervalo (t1, t2) de xeito que conteña ó
parámetro cunha probabilidade (Isto quere dicir que o % dos intervalos construidos
de confianza () que nos interesa. Despois, escóllese o estimador ( ) máis apropiado
P(t1' θ t2')=
Dado que existen infinitos valores que cumpren esa condición, entre todos eles
P(h(t1') h(t2'))=
tomando t1=h(t1'); t2=h(t2'), (t1, t2) sería o intervalo de confianza para o parámetro , cun
nivel de confianza .
O intervalo de confianza pode ser tamén da forma (-, t), (t, ). Neste caso dise que
son intervalos dunha soa cola, mentres que o anterior era un intervalo de dúas colas.
parámetros serían:
Neste caso soe empregarse como estimador a media aritmética, , o cal, cando é
2
coñecida a varianza poboacional segue unha distribución N(, ). Logo, para unha
n
mostra de tamaño n tense que:
−
~N(0,1)
n
Para un nivel de confianza (e polo tanto para un nivel de significación ), e para un
intervalo con dúas colas, buscaríase un valor z/2 tal que P(N(0,1)> z/2 )= . Ou o que é
2
o mesmo:
De aí dedúcese que:
−
P(-z/2 < < z/2) = 1- =
n
P( −z / 2 · << z /2 · ) = 1- =
n n
O intervalo de confianza para o parámetro con coñecido, con nivel de confianza ,
sería:
Varianza.
nS2
A varianza mostral: ~ 2n
2
(n-1)S2c
A cuasevarianza mostral: 2
~ 2n−1
2
P( 2n−1 > 2n−1,α /2 )= ; e P( 2n−1 > n−1,1−α /2 )= 1- ;.
2 2
2
Tense logo que: P( n−1,1−α /2 < 2n−1 < 2n−1,α /2 ) = 1- =
2 (n-1)S2c
E polo tanto: P( n−1,1−α /2 < 2 < 2n−1,α /2 ) = 1- =
2
(n-1)S2c (n-1)Sc
P( 2 < 2 < 2 ) = 1- =
n−1,α/ 2 n−1,1− α / 2
2 2
n·S n·S
P( 2 < 2 < 2 ) = 1- =
n−1, α / 2 n−1,1− α / 2
Media con varianza descoñecida
n
−
S2c
~ t n−1
Para un nivel de confianza (nivel de significación ), e para un intervalo con dúas
colas, buscaríase un valor tn-1,/2 tal que:
P(tn-1> tn-1,/2)= .
2
P(
−t n−1, /2 ·
S 2
c
<<
t n−1, /2 ·
S 2
c
= 1- =
n n
±t n−1, /2 ·
S 2c
, sendo tn-1,/2 un valor tal que P(tn-1> tn-1,/2)= ;
n 2
±t n−1, /2 · S
2
, sendo tn-1,/2 un valor tal que P(tn-1> tn-1,/2)= ;
n−1 2
Diferencia de medias poboacionais, con varianzas coñecidas.
1−2n ±z /2 ·
21 22
n1 n2
,sendo z/2 t.q. P(N(0,1)> z/2 )=
2
; e =1-.
Polo tanto:
P( 1−2n −z /2 ·
21 22
n1 n2
<(1-2)< 1−2n z /2 ·
21 22
) = 1- =
n1 n2
Diferencia de medias poboacionais, con varianzas descoñecidas.
tal que P( t n n −2 > t n n −2, /2 )= ; e =1-.
1 2 1
2 2
Cociente de varianzas
P F n −1,n −1F n −1,n −1,1− / 2 =1−
1 2 1 2
2
2 2 2
S c2 2 S c2
Polo tanto: P( F n −1,n −1,1− /2 · 2 < 2 <
F n −1,n −1, /2 · 2 ) = 1- =
1 2
S c1 1 1 2
S c1
MOSTRAS GRANDES.
Cando a distribución coa que se traballa non é N(,), en xeral non se dispon das
fórmulas exactas para os seus intervalos de confianza. Sen embargo, pódense aproximar
−
con nivel de confianza , farémolo tendo en conta que N(0,1).
DT
Así teríase que: P( −z · DT << z
· DT =
/ 2 /2
quedaría:
p±z /2 ·
p · 1− p
n
sendo z/2 un valor tal que P(N(0,1)> z/2 )=
2
;