Escolar Documentos
Profissional Documentos
Cultura Documentos
5.Testes de proporções
5.1 Testes para uma amostra
Os testes para comparação de uma amostra são utilizados para verificar se uma
determinada amostra vem de uma população especificada. Podem ser chamados de
testes de aderência ou bondade do ajuste, uma vez que comparar a distribuição
amostral com a distribuição de interesse.
É importante para uma análise, uma vez que a semelhança da amostra com a
população que a originou possibilita que os resultados da análise sejam mais fidedignos.
Requisitos:
• Cada observação é classificada como sucesso (X = 1) ou fracasso (X = 0).
• As n tentativas são independentes.
• Cada tentativa tem probabilidade p de sucesso.
Estatística de teste:
Y = número de sucessos.
Hipóteses:
H0 :p=p0
H1 : p ≠ p 0
H0 :p=p0
H1 : p < p 0
H0 :p=p0
H1 : p > p 0
• Aplicação no R
0.4572108 0.8810684
sample estimates:
probability of success
0.7
Estatística de teste:
Hipóteses:
H0 :p=p0
H1 : p ≠ p 0
H0 :p=p0
H1 : p < p 0
H0 :p=p0
H1 : p > p 0
• Aplicação no R
0.7992288 0.9147007
sample estimates:
0.8666667
A probabilidade de interesse é:
• Aplicação no R
+ "Diabetes" = c( "Sim","Não")))
> data_frame
Diabetes
Obesidade Sim Não
Sim 10 2
Não 4 7
> prop.table(data_frame,2)
Diabetes
data: data_frame
p-value = 0.03607
0.9470815 110.2262775
sample estimates:
odds ratio
7.827922
Para amostras grandes pode-se usar o teste Z para duas proporções através da
aproximação pela Normal de duas amostras com distribuição Bernoulli.
Hipóteses:
H0 :p1 −p2 =0
H1 : p 1 − p 2 ≠ 0
H0 :p1 −p2 =0
H1 : p 1 − p 2 < 0
H0 :p1 −p2 =0
H1 : p 1 − p 2 > 0
• Aplicação no R
Ex: saber se as proporções de pessoas a favor do Bolsa Família são iguais nos dois grupos
de indivíduos.
resultado
0.1408536 0.2191464
sample estimates:
prop 1 prop 2
0.98 0.80
1- Um componente aleatório
2- Um preditor linear
ηi=α+β1Xi1+β2Xi2+⋯+βkXik
3- Função de ligação
Uma função de ligação linear suave e invertível g(⋅), que transforma a
esperança da variável resposta, μi=E(Yi), no preditor linear:
g(μi)=ηi=α+β1Xi1+β2Xi2+⋯+βkXik
μi=g−1(ηi)=g−1(α+β1Xi1+β2Xi2+⋯+βkXik).
Essa função é bastante utilizada pois, além de ser própria para dados binários
auxiliando na tomada de decisões do tipo “Sim” ou “Não”, permite que sejam feitas
interpretações a partir de Odds Ratios (Razões de Chances).
• Aplicação no R
M<-read.table("mexilhao.txt",header=T)
plot(M$salinidade,M$limnoperna)
summary(modelo)
Call:
lm(formula = y ~ x)
Residuals:
Coefficients:
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
plot(M$salinidade,M$limnoperna,xlab="Salinidade",ylab="Limnoperna (0 e 1) e Prob.
Sobrevivência de Limnoperna (curva)",col="red")
curve((exp(4.7169-0.5007*x))/(1+(exp(4.7169-0.5007*x))),add=T,col="blue",lwd=2)
Características:
• Medida assimétrica.
• Se um evento ocorre com probabilidade p, a chance em favor deste evento é p 1−p
para 1.
• Desta forma, se p = 1/2, a chance é 1 para 1; p = 2/3, a chance é 2 para 1.
RR(RC) >> 1 ⇒ aumenta o risco (chance) de doença entre aqueles que foram expostos.
RR(RC) << 1 ⇒ diminue o risco (chance) de doença entre aqueles que foram expostos.
Bibliografia
Crawley, J.C. (2003). The R Book. John Wiley & Sons, Ltd.
Kinas, P.G. & Andrade, H.A. (2010). Introdução à Análise Bayesiana (com R).
MaisQnada.