Escolar Documentos
Profissional Documentos
Cultura Documentos
ç
ã
Estatística descritiva
Correlação linear: Diagrama de dispersão
Por vezes, pretende-se estudar não apenas uma característica da população, mas duas ou mais
características que se supõe relacionadas entre si.
Então, para estudar duas características conjuntas, recolhe-se uma amostra de dados
bivariados, que pode ser representada da seguinte forma:
Diagrama de dispersão: É uma representação gráfica para os dados bivariados, em que cada par
de dados é representado por um ponto de coordenadas num sistema de eixos coordenados.
Este tipo de representação é muito útil pois permite realçar algumas propriedades entre os
dados, nomeadamente no que diz respeito ao tipo de associação entre as variáveis e .
𝑋
𝑌
Estatística descritiva
Correlação linear: Diagrama de dispersão
Exemplo 1
Um grupo de investigadores está interessado em saber se nas futuras mães o nível de uma
proteína se altera (e no caso afirmativo, de que modo) ao longo da gravidez.
Podemos traçar uma reta no gráfico de modo que os pontos se encontrem próximos da reta e
bem distribuídos para um lado e outro da mesma.
Diz-se então que as variáveis estão positivamente correlacionadas. É pois de esperar que se
consiga saber, através do tempo de gestação, qual o nível provável de proteína no sangue.
Estatística descritiva
Correlação linear: Diagrama de dispersão
Exemplo 2
Se representarmos por os valores das observações correspondentes a uma das variáveis e por
os valores das observações correspondentes à outra variável, então o coeficiente obtém-se
através da expressão
Repare-se que
Observação: nos exemplos apresentados utiliza-se a segunda expressão para calcular o coeficiente de correlação linear.
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Exemplo 1
Considere-se as variáveis
: çã ( )
: í í
𝑥
𝑦
𝑛
𝑡
𝑒
𝑣
𝑚
𝑒
𝑙
𝑝
𝑑
𝑜
𝑒
𝑑
𝑝
𝑒
𝑟
𝑔
𝑜
𝑒
𝑡
𝑒
𝑠
𝑡
𝑛
𝑎
𝑎
𝑜
𝑠
𝑒
𝑚
𝑎
𝑛
𝑎
𝑠
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
A última linha da tabela (linha dos totais) indica-nos que:
Assim,
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Estamos agora em condições de calcular o valor do coeficiente de correlação:
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
O resultado obtido indica-nos a existência de uma associação linear positiva forte entre o
tempo de gestação e o nível de proteína nas grávidas porque, além do valor ser positivo,
também é superior a 0,75.
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Exemplo 2
Assim,
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Estamos agora em condições de calcular o valor do coeficiente de correlação:
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
O resultado obtido indica-nos a existência de uma associação linear negativa forte entre a
profundidade do solo e a humidade porque além do valor ser negativo também está entre
(-0,75) e (-1).
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Exemplo 3
Assim,
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
Estamos agora em condições de calcular o valor do coeficiente de correlação:
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
O resultado obtido indica-nos a existência de uma associação linear muito fraca entre o peso
do estudante e a distância alcançada no salto em cumprimento porque o valor de r está muito
próximo de zero.
Estatística descritiva
Correlação linear: Coeficiente de correlação linear de Pearson
É também importante frisar que o coeficiente de correlação traduz apenas o grau de associação
linear existente entre duas variáveis. O facto do coeficiente de correlação ser zero, não implica
que as variáveis não estejam associadas.
Assim, voltando ao exemplo do nível de proteína nas gestantes, consideremos uma senhora
grávida com 24 semanas de gestação. Qual será o valor que o nível de proteína deve
apresentar?
Estatística descritiva
Regressão linear: Reta de regressão linear
Para respondermos a esta questão podemos construir uma
reta que "melhor" aproxime os pontos que constituem a
nuvem de pontos. Claro que há muitas retas possíveis.
1 Designamos por desvio no ponto de abcissa a diferença entre o valor observado e o valor
correspondente sobre a reta.
Estatística descritiva
Regressão linear: Reta de regressão linear
Matematicamente é possível encontrar essa reta. Prova-se que ela passa pelo centro de
gravidade da distribuição, isto é, pelo ponto ( , ) e que o declive está relacionado com o
coeficiente de correlação e tem o mesmo sinal.
Assim, o modelo matemático que expressa a associação linear entre duas variáveis é a reta de
regressão linear
obtida de tal modo que os desvios (resíduos, habitualmente representados por ) quadráticos
das observações em relação à reta sejam mínimos (método dos mínimos quadrados).
𝑥
𝑦
𝑒
Estatística descritiva
Regressão linear: Reta de regressão linear
Obtêm-se então as seguintes expressões que permitem estimar o declive da reta de regressão e
a interseção da reta com o eixo das ordenadas:
( çã )
“Qual será o valor que o nível de proteína que uma senhora grávida de 24 semanas deve
apresentar?”
isto é,
Estatística descritiva
Regressão linear: Reta de regressão linear
Estatística descritiva
Regressão linear: Coeficiente de determinação
O coeficiente de determinação ( 2) corresponde ao quadrado do coeficiente de correlação (r).
Trata-se de uma medida da proporção de variação na variável dependente que pode ser
explicada pela variável independente . Note-se que 0 ≤ 2 ≤1.
E.g., se 2 = 0,9 significa que a variável independente explica 90% da variação da variável
dependente . Quando 2 = 0 significa que a variação de não contribui em nada para explicar
a variação de . Por outro lado, quando 2 = 1 a variação total de é explicada totalmente pela
variação de .
𝑟
𝑋
𝑌
𝑌
𝑟
𝑟
𝑋
𝑟
𝑋
𝑟
𝑋
𝑌
𝑌
Estatística descritiva
Regressão linear: Coeficiente de determinação
Consideremos novamente o exemplo 1 e o modelo definido pela reta: