Você está na página 1de 92

ASSOCIAÇÃO ENTRE 2

VARIÁVEIS

• Regressão linear
• Correlação simples
O modelo de regressão linear
simples
Para tomada de decisões é necessário prevermos e é muito mais fácil tomar
decisões quando podemos estabelecer uma relação entre uma variável e outra.
Depois de estabelecida uma possível relação casual entre as variáveis, o passo seguinte é
estudar o tipo de relação existente.
Podemos elaborar um diagrama de dispersão dos dados e observar o comportamento das
variáveis.
As relações existentes podem ser do tipo linear, exponencial, logarítmica, potência, logística, etc.

A relação mais simples é a do tipo linear e pode ser descrita pela seguinte equação:

Y=a + b x + e modelo de regressão linear simples

Onde,
• Y a variável explicada, dependente ou endógena
• X a variável explicativa, independente ou exógena
• e uma variável do tipo residual
• a e b são constantes: a é a intersecção da reta com o eixo vertical e b o declive da reta.

Esta equação descreve uma reta que, quando ajustada aos dados do diagrama de dispersão, se
chama reta de regressão ou reta ajustada.
Um bom método para descrever a relação entre variáveis será ajustar uma reta aos
dados observados.
A reta ajustada terá a forma matemática:

Resolvendo a minimização dos erros, chega-se ao seguinte resultado:

Que também pode ser dado por:


ANÁLISE DO GRAU DE ASSOCIAÇÃO ENTRE DUAS VARIÁVEIS

• O coeficiente de determinação é uma medida do poder explicativo da reta de regressão (reta obtida
pelo método dos mínimos quadrados) e é dado por 𝑟 2 . Esta medida representa a proporção da
variância de y que é explicada pela relação linear entre y e x. O valor de 𝑟 2 pode variar entre 0 e 1
e, quanto mais próximo de 1, maior é o poder explicativo da reta de regressão
• A covariância é uma medida da associação linear entre duas variáveis, calculada a partir da
expressão:

Uma forma equivalente de obter cov (x, y) , bastante mais utilizada na prática, é dada por
• O coeficiente de correlação linear de Pearson é uma medida da associação linear entre duas
variáveis, independente das unidades de medida, cujo cálculo é efetuado a partir da expressão

Uma forma equivalente de obter o coeficiente de correlação linear de Pearson, bastante mais
utilizada na prática, é dada por

O sinal de r indica o sentido da relação e o seu valor, a intensidade da associação linear


(quando mais perto de 1 ou -1, mais forte a relação linear).
O coeficiente de correlação de Pearson é mais útil e interessante pois é uma medida de
associação relativa, não influenciada pelas unidades de medida das variáveis e, tendo limites
bem definidos, torna possível distinguir entre graus de associação elevados ou reduzidos.

A covariância, por seu turno, compara variáveis com unidades de medida diferentes, sendo difícil
a sua interpretação. Do mesmo modo, como o resultado final é também influenciado por essas
unidades de medida, torna-se difícil estabelecer o que é uma covariância elevada, média ou
pequena.
• O coeficiente de correlação de Spearman, 𝒓𝑺 , mede o grau de associação entre 𝑥 e 𝑦
(amostra bivariada) ordinais ou qualitativas (quando não for adequada a aplicação do
coeficiente de correlação de Pearson).

Este coeficiente não é sensível a assimetrias nem a valores atípicos e é dado por:

onde 𝑑𝑖 é a diferença entre os valores de ordem de 𝑥 e 𝑦.


Para 𝑟𝑆 ≈ −1 existe associação negativa muito alta entre as ordenações das variáveis;
para 𝑟𝑆 ≈ 0 não existe associação entre as ordenações das variáveis;
para 𝑟𝑆 ≈ 1 existe associação positiva muito alta entre as ordenações das variáveis.
Inferência Estatística
Variável aleatória

Portanto, ao conhecer-se as probabilidades dos vários elementos 𝜔 de Ω podem-se definir as


probabilidades dos números reais 𝑥, ou seja, dos possíveis valores da variável aleatória 𝑋.
Exemplo: Considere-se a experiência aleatória que consiste em escolher aleatoriamente um
aluno que tenha realizado, no ano passado, os exames de Estatística I e II.
Então a cada aluno, é possível fazer corresponder um par de valores (𝑥, 𝑦) onde 𝑋 representa
a nota no exame de Estatística I e 𝑌 representa a nota no exame de Estatística II, com 𝑥 = 0, 1,
…, 20 e 𝑦 = 0, 1, …, 20.
Portanto, a variável aleatória a estudar será 𝑍 = (𝑋, 𝑌) – notas obtidas, pelo aluno, nos
exames de Estatística I e II, com 𝑍(Ω) = {(𝑥, 𝑦): 𝑥, 𝑦 = 0, 1,…, 20}.
Variáveis aleatórias unidimensionais

O objetivo agora é calcular probabilidades, não com base nos próprios acontecimentos, mas
sim nos valores assumidos pela variável aleatória.
• Variáveis aleatórias discretas

Função de probabilidade:
Função de distribuição
Variáveis aleatórias contínuas
Exercicio
• Variáveis aleatórias bidimensionais
Variáveis aleatórias bidimensionais discretas
Variáveis aleatórias bidimensionais continuas
Exercícios
Parâmetros de variáveis aleatórias
Determine:
Determine
Proximo slide
Relembro que K= 12/11
Principais distribuições de probabilidade
Distribuições discretas

• Distribuição Uniforme

Se os valores que a v. a. 𝑋 pode assumir ocorrem com igual probabilidade então diz-se que 𝑋 segue
uma distribuição Uniforme.
Definição: A v. a. 𝑋 segue uma distribuição Uniforme discreta em 𝑵 pontos, 𝑿 ~ 𝑼{𝟏, 𝟐, … , 𝑵}, se a
sua função de probabilidade é
: 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 1 /𝑁 , 𝑥 = 1, 2, … ,
• Distribuição de Bernoulli
• Distribuição Binomial
Exercicios
Distribuições contínuas

• Distribuição Uniforme
Φ phi

Você também pode gostar