Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica e Probabilidade
Correlao
Uma correlao uma relao entre duas variveis. Os dados podem ser representados por pares ordenados (x,y), onde x a varivel independente ou varivel explanatria e y a varivel dependente ou resposta. Nesta aula aprenderemos* a descrever o tipo de relao ou correlao que h entre duas variveis e a determinar se a correlao significante.
*espero...
Estatstica e Probabilidade
Correlao
Uma relao entre duas variveis.
x
Horas de treinamento Nmero do sapato Cigarros fumados por dia Nota no vestibular Altura
y
Nmero de acidentes Altura Capacidade pulmonar Mdia de notas na graduao QI
Estatstica e Probabilidade
Correlao Mapas de Disperso
Mapas de disperso podem ser usados para determinar se existe uma correlao linear (uma reta, do you know?!) entre duas variveis.
Exemplo:
60 50
Acidentes
40 30 20 10
0
Horas de treinamento
10
12
14
16
18
20
Estatstica e Probabilidade
Correlao Mapas de Disperso
Exemplo:
4,00 3,75 3,50 3,25 3,00 2,75 2,50 2,25 2,00 1,75 1,50 300 350 400 450 500 550 600 650 700 750 800
Nota no vestibular
Estatstica e Probabilidade
Correlao Mapas de Disperso
Exemplo:
x = altura
y = QI
QI
72
76
80
Na equao acima n o nmero de pares de dados. O coeficiente de correlao populacional definido por .
Lembre-se que:
( x)
Faltas (x) 8 2 5 12 15 9 6
90 80 70 60 50 40 0 2 4 6 8 10 12 14 16
92 90 58 43 74 81
Faltas
Estatstica e Probabilidade
Exemplo (cont):
Calculando r... Dica: Organize seus dados em uma tabela e calcule o que for necessrio
x 8 2 5 12 15 9 6 y 78 92 90 58 43 74 81 516 xy 624 184 450 696 645 666 486 3751 x2 64 4 25 144 225 81 36 579 y2 6.084 8.464 8.100 3.364 1.149 5.476 6.561 39.898
Soma
57
=
3.155 0,975 13.030
Como r est prximo de -1, temos uma forte correlao linear negativa
Estatstica e Probabilidade
Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um coeficiente de correlao O coeficiente de correlao para uma amostra r
O coeficiente de correlao populacional (r).
Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um coeficiente de correlao
Neste curso consideraremos apenas testes de hiptese para que seja bicaudal
Estatstica e Probabilidade
Teste t para um coeficiente de correlao
Acabamos de encontrar a correlao entre o nmero de faltas e a nota final dos alunos de estatstica da UFMA, r = 0,975. H sete pares de dados. Teste a significncia dessa correlao r. Use = 0,01.
= 0,01
Teste bicaudal
/2=0,005
/2=0,005
Estatstica e Probabilidade
Teste t para um coeficiente de correlao
t
4,032 0 4,032
0,049375
Estatstica e Probabilidade
Teste t para um coeficiente de correlao
t
8. Interprete sua deciso.
4,032 0 4,032 H, sim, uma correlao significante entre o nmero de faltas e as notas finais.
Nos testes de hiptese para correlao, rejeitar a hiptese nula sempre significa que h evidncias suficiente para provar que a correlao significante.
Estatstica e Probabilidade
Regresso linear
Encontrando a equao da reta
Estatstica e Probabilidade
Regresso linear A reta de regresso
Depois de constatar que existe uma correlao linear significante, voc pode escrever uma equao que descreva a relao entre as variveis x e y. Essa equao chama-se reta de regresso ou reta do ajuste timo. Pode-se escrever a equao de uma reta como y = mx + b, onde m a inclinao da reta e b, o intercepto y. Assim, a reta de regresso : A inclinao m : E o intercepto y :
Estatstica e Probabilidade
Regresso linear A reta de regresso
No mapa de disperso abaixo, d representa a diferena entre o valor observado de y e o valor previsto de y sobre a reta. Resduo d = (valor y observado) (valor y previsto) valor observado Receita
d4 d3
valor previsto
Investimento em publicidade A reta de regresso aquela para qual a soma dos quadrados de todos os resduos um mnimo
d 2 um mnimo
Estatstica e Probabilidade
Regresso linear A reta de regresso
Calcule m e b e escreva a equao da reta de regresso
x = nmero de faltas y = nota final.
x 8 2 5 12 15 9 6 57 y 78 92 90 58 43 74 81 516 xy 624 184 450 696 645 666 486 3751 x2 64 4 25 144 225 81 36 579 y2 6.084 8.464 8.100 3.364 1.149 5.476 6.561 39.898
(3.751)
73,714
(3,924)(8,143)
105,667
A reta de regresso :
= 3,924x + 105,667
Estatstica e Probabilidade
Regresso linear A reta de regresso
m = 3,924 e b = 105,667 A reta de regresso :
95 90 85 80 75 70 65 60 55 50 45 40 0 2 4 6 8 10 12 14 16
3,924
105,667
Nota final
Faltas
Note que o ponto = (8,143, 73,714) est na reta.
= 3,924x + 105,667
Use essa equao para prever a nota esperada de um aluno com: (a) 3 faltas (b) 12 faltas
(a) (b)
Estatstica e Probabilidade
Estatstica e Probabilidade
Medidas de regresso O Coeficiente de determinao
O coeficiente de determinao, r2, a razo entre a variao explicada em y e a variao total em y. Variao explicada Variao total
O coeficiente de correlao entre as faltas e a nota final era r = 0,975. O coeficiente de determinao r2 = (0,975)2 = 0,9506.
Interpretao: cerca de 95% da variao nas notas finais pode ser explicada pelo nmero de vezes que o aluno falta. Os outros 5% so inexplicados e podem dever-se a um erro amostral ou outras variveis, como inteligncia, tempo dedicado aos estudos, etc.
Estatstica e Probabilidade
O erro padro da estimativa
O erro padro da estimativa, se, o desvio padro dos valores yi observados em torno do valor um dado xi. Ele dado por: previsto para
Estatstica e Probabilidade
O erro padro da estimativa
Exemplo
x y
8 2 5 12 15 9 6 78 92 90 58 43 74 81 74,275 97,819 86,047 58,579 46,807 70,351 82,123
( y y) 2
13,8756 33,8608 15,6262 0,3352 14,4932 13,3152 1,2611
92,767
92,767
Estatstica e Probabilidade
Eh Eh Te ojjee Ter o a da rmiin accab da m n abo 3. ou ou 3 . ou av ho uttud ava hoj ud Da alliia jeea o.. Dat a am o .. ((02 ta d o. mat 02/0 a da o. atr aP /06/ Pr riia 6/10 rov a 10, ova Li Lis , Ok a Ok stta ?? ad ??? deee ?!! ! exe !)) xer rccc ciios os n no ossi ittee! !