Você está na página 1de 12

Até agora temos estudado apenas distribuições unidimensionais, ou seja,

distribuições em que estudamos cada variável isoladamente. No entanto, há


situações em que é importante investigar se uma variável tem ou não
influência sobre outra, e de que forma.

Nas distribuições bidimensionais ou bivariadas, estudamos as relações entre


dois atributos quantitativos, obtendo assim um conjunto de dados sobre a
dispersão de pares ordenados. Em cada par ordenado, o primeiro elemento
mede um atributo de uma das unidades estatísticas observadas e o segundo
elemento mede o outro atributo da mesma unidade estatística observada.

Por exemplo, o peso e a altura de uma pessoa. Genericamente,


consideraremos duas variáveis X,Y, com realizações (x1,y1), (x2, y2), …, (xn, yn).

Normalmente, o que se pretende neste caso é estudar a relação entre as duas


variáveis, que se supõe estarem relacionadas.
Indica, justificando, se existirá uma relação forte ou fraca
entre as variáveis referidas nas seguintes situações:

1. Altura e peso dos alunos de uma turma.

2. A altura de um grupo de crianças até 10 anos de


idadea
respetiva idade.
3. A altura dos adultos portugueses e a sua idade.
4. O número do Bilhete de Identidade e o número do calçado das
pessoas de uma aldeia.
5. O número de cães abandonados nas capitais europeias
e o
rendimento médio per capita dos seus habitantes.
Exemplo:
Diagrama de dispersão
Numa universidade efetuou-se um estudo para averiguar se existe relação
entre o orçamento que cada departamento de ensino recebe e o número de
alunos que frequentam os seus cursos.

Considera as variáveis X e Y que representam, respetivamente, o número de


alunos e o orçamento corrente referente a cada departamento, em
unidades monetárias (u.m.). Os dados (x, y) encontram-se na tabela seguinte:

Nº de estudantes (xi) Orçamento corrente u.m. (yi)


1500 3100
800 1900
2600 4200
1000 2300
600 1200
2800 4900
1200 2800
900 2100
400 1400
1300 2400
1200 2400
2000 3800
Designa-se por diagrama de dispersão ou nuvem de pontos o gráfico em
que se representam os pares (xi, yi) como pontos num referencial cartesiano.

Orçamento do departamento versus número de alunos


Orçamento corrente (u.m.)

6000
5000
4000
3000
2000
1000
0
0 500 1000 1500 2000 2500 3000
Número de alunos

A observação da nuvem de pontos permite, de uma forma mais simples, intuir


se existe ou não uma relação entre as variáveis. Neste exemplo é possível
observar que à medida que o número de alunos do departamento
aumenta, também aumenta o orçamento atribuído a estes
departamentos.
Neste caso, diz-se que as variáveis são positivamente correlacionadas ou que
existe correlação positiva entre as variáveis.
Quando se verifica que uma variável tem tendência a influenciar a
outra diz-se que existe uma correlação entre as duas variáveis.

Correlação positiva: quando uma das variáveis aumenta, a outra


também tende a aumentar.

Correlação negativa: quando uma das variáveis aumenta, a outra tende


a diminuir.
Sendo x e y as médias das variáveis x e y, respectivamente, designa-se por

centro de gravidade o ponto de coordenadas x , y


Servindo-nos do exemplo anterior, podemos determinar com auxílio da
calculadora gráfica o seu centro de gravidade:
.
x , y   1358,5 ; 2708,3 
Se traçarmos duas
Orçamento do departamento versus número de alunos
rectas paralelas aos
eixos coordenados que
Orçamento corrente (u.m.)

6000

5000
passam pelo centro de
gravidade, definindo
4000
um novo
3000
2708,3 x , y ortogonal, referencial
2000 que a maioria verifica-
dos
1000  pontos se situam
se no
0 1º e 3º quadrantes, o
que nos sugere
0 500 2000 2500
10001358,515
a existência de
00 3000
uma
correlação positiva.
Número de alunos
Se os pontos se situarem na sua maioria no 2º e 4º quadrantes, diz-se
que a correlação entre as variáveis é negativa ou que as variáveis estão
negativamente correlacionadas.

Quando os pontos se distribuem pelos quatro quadrantes de uma forma


equilibrada, pode-se concluir que não existe dependência entre as duas
variáveis e, nesse caso, dizemos que estamos perante uma correlação
nula, isto é, não há correlação entre as variáveis. Uma correlação
amostral muito próxima do zero, transmite-nos a ideia de que a
correlação populacional é nula, ou seja, que as variáveis são «não
correlacionadas».
Correlação positiva

Fraca Forte

Correlação negativa

Fraca Forte

Correlação irrelevante
Coeficiente de
correlação
Uma das estatísticas que permite o grau de
medidas estabelecer
duas variáveis é o denominado coeficiente de
correlação entre
correlação.
O coeficiente de correlação, que se designa por r, toma valores no
intervalo -1 , 1.
 Se -1 ≤ r ≤ 0, a correlação é negativa e tanto mais forte quanto mais
próxima de 1.
 Se 0 < r ≤ 1, a correlação é positiva e tanto mais forte quanto mais
próxima de 1.
 Se r = -1 ou r = 1, a correlação é perfeita.
 Se r = 0, significa que não existe correlação entre as duas variáveis.
De facto, em geral | r | < 0,7, indica que a associação linear entre as
duas variáveis é fraca. Se | r | < 0,5, em geral a associação linear não
faz qualquer sentido.
Reta de regressão
Quando a disposição dos pontos do diagrama de dispersão se faz «ao longo» de
uma recta, a correlação diz-se linear.

Orçamento do departamento versus número de alunos


Orçamento corrente (u.m.)

A reta de regressão de y em
6000 x pode ser representada
5000 por uma equação do tipo
4000 y = ax + b, e permite
3351
3000 y  1,455x  descrever como se refletem
2000 731,6 em y – variável resposta -,
1000 as modificações produzidas
0 na variável x – variável
1800 explicativa.
0 500 1000 1500 2000 2500 3000

Número de alunos

A reta que apresentar menores «desvios quadrados» em relação aos pontos


chama-se reta de regressão linear.
A partir da reta de regressão podemos estimar valores de uma das variáveis
conhecendo valores da outra variável.
MªJ Costa – Casa das Ciências

Você também pode gostar