Você está na página 1de 100

Licenciatura Engenharia Zootécnica

Métodos Biométricos

9ª AULA PRÁTICA

1
Sumário
Modelação de duas variáveis biológicas contínuas
Regressão linear simples
Aplicações técnicas do modelo
Teste de hipóteses para a associação entre duas variáveis
(significância do coeficiente de correlação)
Resolução de exercícios
Utilização dos programas Excel e JMP para:
- Estatística descritiva de duas variáveis
- Ajuste do modelo de regressão linear simples
Interpretação dos resultados
Apresentação da ficha de auto-estudo AE6 e pergunta 9
do AE5.
2
Regressão linear
Introdução
Uma das preocupações estatísticas ao analisar
dados, é a de criar modelos que explicitem
estruturas do fenómeno em observação.

O modelo de regressão é um dos métodos


estatísticos mais usados para investigar a relação
entre variáveis.

Análise de regressão:
regressão: metodologia estatística que
estuda (modela) a relação entre duas ou mais
variáveis.
3
Regressão linear
Introdução
A análise de regressão estuda o relacionamento entre uma
variável chamada variá
variável dependente e outras variáveis
chamadas variá
variáveis independentes.
independentes

Este relacionamento é representado por um modelo


matemático, isto é, por uma equação que associa a variável
dependente com as variáveis independentes.

Este modelo é designado por modelo de regressã


regressão linear
simples se define uma relação linear entre a variável
dependente e uma variável independente.

Se em vez de uma, forem incorporadas várias variáveis


independentes, o modelo passa a denominar-se modelo de
regressão linear múltipla.
múltipla
Regressão linear
A técnica da regressão linear permite descrever
a relação entre variáveis (uma variável
dependente e uma ou várias variáveis
independentes) e possibilita predizer os valores
da variável dependente a partir dos preditores.

A variável dependente tem de ser numérica


(escala); as variáveis independentes devem ser
preferencialmente numéricas, mas podem ser
dicotómicas.
5
A presença ou ausência de relação linear pode
ser investigada sob dois pontos de vista:
vista:

• Quantificando a força dessa relação:


correlação.
correlação

• Explicitando a forma dessa relação: regressão.


regressão

6
Regressão linear simples
A reta de regressão (regressão linear simples) é
uma forma de sumariar e apresentar dados
bivariados, quando existe uma variável dependente
e uma variável independente.
A reta de regressão de Y em X tem a expressão
Y = a + b X,

sendo os valores a e b (parâmetros da reta)


calculados a partir da amostra, de forma a que a
reta obtida seja a que melhor se ajusta à nuvem de
pontos.
7
Regressão linear simples

8
Parâmetros de regressão
b- Declive:
Declive o seu sinal determina a inclinação
da reta (se b for positivo, a relação entre X e Y é
positiva; se b for negativo, a relação entre X e Y
é negativa). O seu valor indica em que medida Y
muda em função de X, refletindo o grau de
associação entre ambos.

a- Constante (ordenada na origem):


origem): Indica o
valor de Y que se espera observar quando X = 0.
9
Parâmetros de regressão

10
Para traduzir uma relação linear entre duas
variáveis (avariável dependente Y e a variável
independente ou controlada X) podemos utilizar
a seguinte expressão matemática:

• Y: variável dependente
• X: variável independente
• α e β são os parâmetros da reta a ajustar (constantes
desconhecidas)
• ε: variável que permite explicar a variabilidade existente em
Y que não é explicada por X;
11
Método dos mínimos quadrados

• O método utilizado para proceder ao


ajustamento do modelo é o Método dos
Mínimos Quadrados.
Quadrados.

• Em termos gráficos estamos a minimizar a


soma dos quadrados dos resíduos ou erros
(medidos na vertical) entre cada ordenada e a
correspondente ordenada estimada pela reta.

12
Método dos mínimos quadrados
O ajustamento da reta à nuvem de pontos é feito através da
técnica dos mínimos quadrados, que minimiza o valor total das
distâncias (ao quadrado) entre todos os pontos e a reta que se
procura identificar.

13
Método do mínimos quadrados
Qual destas linhas mais minimiza
o valor total das distâncias entre
os pontos e a reta?

O método dos mínimos quadrados


vai determinar a inclinação da
reta (declive) e o ponto onde ela
cruza o eixo dos Y (constante), de
modo a garantir que a reta passe o
mais próximo possível da
totalidade dos pontos da amostra.
Trata-se de uma solução de
compromisso (uma vez que é
impossível uma reta passar perto
de todos os pontos da nuvem).

14
15
Significado dos parâmetros do modelo de regressão linear
simples

a (ordenada origem quando a região experimental inclui X=0, a é o valor da média


ordenada na origem);
da distribuição de Y em X=0, por conseguinte, não tem significado prático como um
termo separado (isolado) no modelo; b (declive
declive,
declive coeficiente de regressão ou coeficiente
angular expressa a taxa de mudança em Y, isto é, é a mudança em Y quando ocorre a
angular)
mudança de uma unidade em X. Assim, a indica a mudança na média da distribuição de
probabilidade de Y por unidade de acréscimo em X.
16
Coeficientes de regressão

17
Exemplo 1
O objetivo é analisar a relação entre a dose (mg) de um fármaco(X) e a
redução no ritmo cardíaco (bat/min) (Y) .

Analisar a possibilidade de definir um modelo que represente a relação entre


as duas variáveis ou amostras.

18
19
20
21
• O objetivo do Exemplo é ajustar uma reta a partir dos
valores das amostras retiradas da população,
considerando que a relação a dose (mg) de um fármaco é
a variável independente x, e a redução no ritmo cardíaco
(bat/min), a variável dependente y.
• Uma primeira forma de fazer isso é ajustar
manualmente essa reta tentando equilibrar os pontos
acima e abaixo dessa reta, como foi feito no gráfico do
Exemplo representado a seguir.
• Como esse procedimento permite o ajuste de diversas
retas, é necessário estabelecer um objetivo de eficiência
de ajuste possível de medir, como é mostrado a seguir.
Decisão por um tipo de relação
• Nem todas as situações são bem aproximadas por uma equação
linear.
• Por isso, em geral é necessário desenvolver um trabalho
preliminar para determinar se um modelo linear é adequado.
• O processo mais simples consiste em fazer o gráfico dos dados e
ver se uma relação linear parece razoável e após analisar o
coeficiente de correlação .

• Quando os dados não podem ser aproximados por um modelo


linear, as alternativas são procurar um modelo não-linear
conveniente, ou transformar os dados para a forma linear.
Tipos de regressão linear
Exemplo 2
• Com os dados das amostras do Exemplo 1 obter a
reta de regressão linear.

1º Pelo gráfico de dispersão e linha de tendência.


Solução
Para analisar a relação entre as duas variáveis do Exemplo 1, foi
construído o gráfico de dispersão
Linha de Tendência do Excel
Posicionando o rato sobre um dos pontos do gráfico e clicando
o botão direita do rato selecione adicionar linha de tendência
Nas opções de
linha de
tendência,
adicionar lineare
selecione exibir
equação no
gráfico e exibir r
quadrado no
gráfico
Resultado final do processo.

Com a equação obtida com o comando linha de tendência será possível


representar o comportamento da dose (mg) de um fármaco com um modelo
linear e realizar projeções
• O gráfico de dispersão mostra que entre a dose (mg) de um
fármaco e a redução no ritmo cardíaco (bat/min) estão
correlacionados de forma positiva, com um coeficiente de
correlação próximo de +1.
• Uma reta como a linha tracejada no gráfico de dispersão
acima poderá ser utilizada para realizar estimativas de
redução no ritmo cardíaco (bat/min) futuras em função da
dose (mg) de um fármaco.
– A linha tracejada foi ajustada tentando equilibrar os
pontos acima da reta com os pontos abaixo dela.
– Essa reta é uma das muitas possíveis retas que poderiam
ser ajustadas.
Exemplo 2
2º Pelo cálculo dos
coeficientes de
regressão.
regressão

No Excel, foram
construídas as
colunas necessárias
para calcular os
coeficientes de
regressão.
regressão
32
33
Função do Excel

INTERCEPTAR(val_y; val_x)
• A função estatística INTERCEPÇÃO retorna o coeficiente de regressão a da
reta de regressão linear considerando os valores das amostras informados
nos argumentos val_conhecidos_y e val_conhecidos_x.
– Ao utilizar essa função, deve-se tomar o cuidado de fornecer os
valores na ordem correta, o primeiro argumento val_conhecidos_y se
refere aos valores da variável dependente y, e o argumento
val_conhecidos_x, aos valores da variável independente x.
– Os dois argumentos desta função devem ser números ou nomes,
matrizes ou referências que contenham números.
EXEMPLO Função INTERCEPTAR
36
Função do Excel

DECLIVE(val_y; val_x)
• A função estatística DECLIVE retorna o coeficiente b da reta de regressão
linear considerando os valores das amostras informados nos argumentos
val_conhecidos_y e val_conhecidos_x.
– Ao utilizar esta função, deve-se tomar o cuidado de fornecer os
valores na ordem correta, o primeiro argumento val_conhecidos_y se
refere aos valores da variável dependente y, e o argumento
val_conhecidos_x, aos valores da variável independente x.
– Os dois argumentos desta função devem ser números ou nomes,
matrizes ou referências que contenham números.
EXEMPLO Função DECLIVE
EXEMPLO Função DECLIVE
40
Medidas para avaliar a qualidade do ajustamento:

• Coeficiente de Correlação Amostral (não


vamos abordar)

• Coeficiente de Determinação;
Determinação

41
Medida da variabilidade das observações de Y

Soma de quadrados total (SQT)


• É uma medida da variabilidade total que
existe nas observações da variável a explicar;

• Podemos decompor esta soma em duas


parcelas:

42
Soma de quadrados dos erros (SQE)

• Variabilidade de Y relativamente à reta de regressão


(parte da variabilidade de Y que permanece mesmo
quando se considera a reta ajustada)

Soma de quadrados da regressão (SQR)

Parte da variabilidade de Y que é eliminada devido


ao efeito da reta de regressão (variabilidade
explicada pela reta de regressão):
43
Quanto mais elevado for o quociente
SQR/SQT
Maior será a redução na variabilidade de Y que
se consegue devido ao ajustamento, ou seja
melhor é a qualidade do ajustamento.

44
Coeficiente de Determinação
O valor da estatística é

uma estimativa da redução relativa da


variabilidade Total devido ao uso do modelo de
regressão para prever o valor de Y.

Este coeficiente pode ser utilizado como uma


medida da qualidade do ajustamento, ou como
medida da confiança depositada na equação de
regressão como instrumento de previsão
45
Coeficiente de Determinação
O valor deste coeficiente varia entre 0 e 1:

1. Se r2 = 1 todas as observações estão sobre a


reta de regressão(o ajustamento diz‐se perfeito);

2. Se r2 = 0 o modelo de regressão não tem


qualquer utilidade na redução da variabilidade
de Y.
46
Excel – Análise de dados-
dados- Regressão

47
Excel – Análise de dados-
dados- Regressão

Também se pode
ver se a regressão
tem validade
estatística pelo F
de significância
da regressão

48
Observações finais
• O coeficiente de correlação é mais indicado para medir a força da relação
linear entre as variáveis, e o coeficiente de determinação é mais
apropriado para medir a explicação da reta de regressão. Dessa maneira,
para apreciar o ajuste de uma reta é melhor utilizar o coeficiente de
determinação que mede o sucesso da regressão em explicar y.

• O coeficiente de correlação também pode ser calculado a partir do


coeficiente de determinação. Entretanto, como o coeficiente de
determinação é sempre positivo, o sinal de r será o mesmo que o sinal do
coeficiente b da reta de regressão.

49
Observações finais

A correlação linear não sofre o efeito de escala, isto é,


mudanças na escala das variáveis não afeta o resultado
final da correlação

A regressão linear sofre o efeito da escala utilizada,


alterando os valores de a e b da reta de regressão.

50
ESTIMATIVA

• Uma das aplicações da regressão linear é estimar (ou predizer) valores da


variável dependente para valores definidos da variável independente.
• Para estimar valores de (valor estimado de y) deve-se tomar o cuidado
de escolher valores de x dentro do intervalo de valores da amostra
independente x.
– De outra maneira, as interpolações dentro do intervalo de x são
permitidas, entretanto, não devem ser realizadas estimações
extrapolando o intervalo da amostra x.
Exemplo 3

• Utilizando a reta de regressão linear do Exemplo 2, estimar a


redução no ritmo cardíaco (bat/min) para a dose de um
fármaco de 0.25, 2 e 3.5 mg.
Função do Excel

PREVISÃO(x; val_y; val_x)


• A função estatística PREVISÃO retorna o valor projetado para o valor
registrado no argumento x considerando a reta de regressão linear
simples correspondente aos valores das amostras informados nos
argumentos val_conhecidos_y e val_conhecidos_x.
– Ao utilizar esta função, deve-se tomar o cuidado de fornecer os
valores na ordem correta, o argumento val_conhecidos_y se refere aos
valores da variável dependente y, e o argumento val_conhecidos_x
aos valores da variável independente x.
– Os dois argumentos desta função devem ser números ou nomes,
matrizes ou referências que contenham números.
54
55
Função do Excel

TENDÊNCIA(val_y; val_; x; constante)


• A função estatística TENDÊNCIA retorna o valor projetado da reta de regressão
linear simples para um único ou um grupo de valores de x informados no
argumento x considerando a reta de regressão linear simples correspondente aos
valores das amostras informados nos argumentos val_conhecidos_y e
val_conhecidos_x.
– Ao utilizar esta função, deve-se tomar o cuidado de fornecer os valores na
ordem correta, o argumento val_conhecidos_y se refere aos valores da
variável dependente y, e o argumento val_conhecidos_x, aos valores da
variável independente x.
• Os dois argumentos desta função devem ser
números ou nomes, matrizes ou referências
que contenham números.

– Se o argumento constante for VERDADEIRO ou


omitido, a função retornará um único ou um
grupo de valores da reta de regressão.
– Se for FALSO, a função TENDÊNCIA fornecerá os
resultados da reta de regressão considerando a=0.
58
59
Exercícios

60
Resolução pelo Excel

61
Resolução pelo Excel

62
Resolução pelo Excel

63
Resolução pelo Excel

64
Resolução pelo Excel

65
Resolução pelo JMP

66
Resolução pelo JMP

67
Resolução pelo JMP

68
Resolução pelo JMP outra forma mais simples

69
70
Faça uma coluna nos dados e calcule a Produção de Gordura em Kg

71
Resolução pelo JMP

72
Resolução pelo JMP

73
Resolução pelo JMP

74
Resolução pelo JMP
75
Resolução pelo JMP

76
Resolução pelo JMP

77
Resolução pelo JMP

78
Resolução pelo Excel

79
Resolução pelo Excel

80
Resolução pelo Excel

81
Resolução pelo Excel

82
Resolução pelo Excel

83
Resolução pelo Excel 84
Resolução pelo Excel

Multiplicar por n e dividir por n-


n-1

85
Resolução pelo Excel

86
Resolução pelo Excel

87
Resolução pelo Excel

88
Resolução pelo Excel

89
Resolução pelo Excel

90
Resolução pelo Excel

91
92
Resolução pelo Excel

93
Resolução pelo Excel

94
Resolução pelo JMP

95
Resolução pelo JMP

96
Resolução pelo JMP

97
98
E coloque o nível de significância com *
p>0,05 ns
0,05<p-
0,05<p-value<0,01
value<0,01 *
0,01<p-
0,01<p-value<0,001
value<0,001 **
p-value<0,001
value<0,001 ***

99
100

Você também pode gostar