Você está na página 1de 12

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

ANLISE DE VARINCIA

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Parcela ou unidade experimental a poro do


material experimental a que se aplica um tratamento.

INTRODUO
i) Objetivo da Estatstica Experimental

Ex.: em um experimento que se deseja avaliar o ganho de


peso de animais, a parcela pode ser de um animal ou
de um grupo de animais (Ex. avalia-se o ganho de peso
de um nico frango ou avalia-se o ganho de peso de 3
frangos colocados em uma gaiola);

A Estatstica Experimental tem por objetivo o


planejamento, a execuo, a anlise e a interpretao de
experimentos.
ii) Conceitos
Experimento ou ensaio um trabalho experimental
planejado com o objetivo de resolver algum problema de
interesse na rea de pesquisa ou na rea
comercial/empresarial.
Tratamento o processo cujo efeito deseja-se medir ou
comparar em um experimento. Ex.: doses do adubo X,
tipos de tratamento qumico, variedades de milho, etc..

em ensaios de adubao de milho a parcela pode ser de


uma linha de 10 m;
em laboratrio pode-se considerar uma placa de petri
como uma parcela, etc..
1

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

iii) Princpios bsicos da experimentao

Variaes de acaso So variaes que ocorrem nos


experimentos atribudas a efeitos de fatores no
controlados, conhecidos ou no, que afetam os resultados
experimentais. Ex.: diferenas genticas em seres vivos;
variaes em condies ambientais; incidncia desigual de
sol; erros de medies; variaes na qualidade do material;
etc..

a) Repetio o nmero de vezes que um tratamento


ocorre no experimento
Ex.: Estamos interessados em verificar se existe diferena
significativa entre dois tratamento (A e B), a varivel em
estudo a resistncia trao de materias usados em
cirurgia, temos:
Sem repetio:

Delineamento experimental a maneira de dispor as


parcelas
no
experimento.
Como
exemplos
de
delineamentos temos: delineamento de um nico critrio ou
delineamento inteiramente ao acaso (DIC); delineamento
de dois critrios ou delineamento em blocos casualizados
(DBC); delineamento em quadrado latino (DQL).

Com repetio:
A

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

As principais funes da repetio so:

permitir uma estimativa do erro experimental

aumentar a preciso do experimento

aumentar a preciso das estimativas obtidas no


experimento

ampliar o alcance da inferncia pela repetio do


experimento no tempo ou no espao.

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Sem casualizao (com repetio)


A

Com casualizao (com repetio)

b) Casualizao

Para evitar que determinado tratamento seja favorecido,


procedemos a casualizao. Pela casualizao cada
tratamento tem a mesma probabilidade de ser destinado a
qualquer parcela, seja ela favorvel ou no.
5

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

c) Controle Local

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

O controle local consiste em restries para corrigir os


efeitos da variao conhecida ou suposta do material
experimental.

um princpio muito usado, mas no obrigatrio. Ele


consiste em distribuir os tratamentos sempre em
condies mais homogneas possveis.
Com repetio, com casualizao e com controle local
Suponha um experimento com 4 tratamentos (A, B, C, D)

Considerando o controle local temos: DIC - sem controle


local; DBC - com controle feito em uma direo e DQL com controle feito em duas direes.

BLOCO 1
BLOCO 2
BLOCO 3

B
C
D

C
A
C

A
D
A

D
B
B

A finalidade do controle local dividir um ambiente


heterogneo em sub-ambientes homogneos.

BLOCO 4
BLOCO 5
BLOCO 6

A
B
D

B
D
C

D
C
B

C
A
A

Este procedimento torna o experimento mais eficiente,


porque reduz o erro experimental.

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

iv) Variaes que ocorrem no experimento


As variao total de um experimento pode ser desmembrada
em variao devido ao tratamento (variao entre
tratamentos) e variao residual (variao dentro do
tratamento).

Yi = mdia do tratamento i

i =1

Y = mdia geral do exp erimento

VT = SQTotal = (Yij Y )

Medicina Veterinria

VE = SQEntre Trat = SQTrat = r. (Yi Y ) 2

A variao total a variao de cada observao em


relao mdia geral.
t

Prof. Dr. Ednaldo Carvalho Guimares

A variao entre tratamento aquela atribuda estritamente


variabilidade das mdias dos tratamentos em relao
mdia geral.

r = nmero de repeties
t = nmero de tratamentos

i =1 j =1

VT = Variao Total; SQTotal = Soma de quadrados Total; Yij


= Observao do tratamento i na repetio j;

SQ = soma de quadrados

Y = mdia geral
9

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

A variao dentro de tratamentos a variao de cada


observao em relao mdia do tratamento. a variao
de todas as fontes que causam variaes nos experimentos,
excetuando os tratamentos.
t

10

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Desenvolvendo as frmulas de SQ, podemos reescreve-las


como:

Ti 2
C
i =1 r j
t

SQTrat =
em que :

VD = SQDentro de trat. = SQErro = SQ Re siduo = (Yij Yi ) 2

Ti = total do trat i

i =1 j =1

em que :
Yij = valor observado na parcela que recebeu o tratamento i na repetio j

C = fator de correo =

( Yij ) 2
t.r

SQTotal = Yij C
2

Prova-se, algebricamente que:


VT = VE + VD

SQResiduo = SQTotal - SQTrat


11

12

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

EXPERIMENTO DE UM CRITRIO - DELINEAMENTO


INTEIRAMENTE CASUALIZADO

v) As hipteses do modelo de anlise de varincia


Aditividade - Os efeitos do modelo matemtico que rege o
experimento devem ser aditivos ( efeito da mdia geral,
do tratamento, do bloco (caso exista), e do erro
experimental).
Normalidade - Os dados experimentais e por conseqncia
os erros experimentais devem seguir a distribuio
normal de probabilidade.
Homocedasticidade de varincias- as varincias de
tratamentos devem ser homogneas
Independncia de erros - os efeitos aleatrios (erros
experimentais) devem ser independentes, ou seja, no
pode ocorrer correlao entre os resduos.

o mais simples de todos os delineamentos experimentais,


sendo recomendado quando todas as condies
experimentais so homogneas.
prprio para experincias de laboratrio ou recintos
similares onde se possa garantir homogeneidade.
O modelo matemtico

Yij = + ti + ij
Yij o valor da parcela que recebeu o tratamento i na
repetio j; a mdia geral do experimento; ti o efeito
do tratamento i; e ij o erro da parcela que recebeu o
tratamento i na repetio j.

13

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

14

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

A casualizao

A anlise de varincia

Considere, por exemplo, um DIC com quatro tratamentos


(A, B, C, D) e quatro repeties, portanto, tem-se 16
parcelas experimentais. Feito um sorteio aleatrio, pode-se
ter, por exemplo, o seguinte esquema:

o processo desenvolvido por Fisher para dividir a


varincia de uma varivel aleatria em partes ortogonais
(independentes) correspondentes a tratamentos e erro
experimental.

C
B
D
B

B
D
A
A

B
A
C
D

Seus objetivos so:

A
C
D
C

obter estimativas precisas das mdias dos tratamentos e


diferenas entre mdias
testar hipteses sobre igualdade de mdias de
tratamentos e sobre a existncia de interao entre fatores.
Obter estimativas dos componentes de varincia
15

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

16

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

As hipteses na anlise de varincia so:


Ho: t1= t2 = ... = tt
H1: ti tj ( no mnimo para um par)
Os quadrados mdios, obtidos na anlise de varincia, so
estimativas no tendenciosas das varincias envolvidas no
experimento. Temos:

QMTrat =

SQTrat
G. L. Trat

QM Re sduo =

Medicina Veterinria

O teste de F ao aplicarmos a anlise de varincia,


estamos utilizando o teste de F para verificarmos a validade
da hiptese Ho, descrita anteriormente. Temos:

SQ Re sduo
G. L Re sduo

Fcalc =

QMTrat
QM Re sduo

Comparamos o valor calculado na anlise de varincia com


o valor de tabela
F(v1, v2), em que v1 e v2 so,
respectivamente, os graus de liberdade de tratamentos e
de resduos.
Se Fcalc > Ftab, temos que o experimento foi significativo, ou
seja, indica que existe uma probabilidade superior a 1- de
que pelo menos um dos tratamentos difere dos demais.

17

18

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

O quadro da anlise de varincia pode ser resumido da


seguinte forma:
Anlise de varincia de um experimento inteiramente
casualizado com t tratamentos e r repeties
FonteVariao

G. L.

S. Q.

Q. M.

Fcalc

F(v1,v2)

Tratamento
Resduo

t-1
t(r-1)

SQTrat
SQResduo

QMTrat
QMResduo

F calc

F tab

Total

tr-1

SQTotal

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

EXEMPLO 1: Um experimento em DIC, foi conduzido com o


objetivo de verificar o efeito de 5 tratamentos (T1, T2, T3, T4, T5),
sobre a rea de cicatrizao (mm2) de animais submetido a
cirurgia. Foram utilizadas 3 repeties (animais) para cada
tratamento. Os dados obtidos no experimento so apresentados
a seguir:
Repeties
Tratamento
T1

G. L. = graus de liberdade

21

22

22

T2

17

22

19

T3

22

22

20

T4

15

13

16

T5

28

25

24

Verificar se existe diferena significativa para a rea de


cicatrizao dos tratamentos. Use significncia de 5%.
19

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

20

Estatstica

COMPARAES MLTIPLAS ENTRE


MDIAS

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Teste de Tukey

Vimos que a anlise de varincia significativa, nos informa


apenas que pelo menos um tratamento aplicado no
experimento mais eficiente que os demais, entretanto
esta anlise no nos informa onde est esta diferena
Para tanto usaremos os testes de comparao entre
mdias, sendo que os mais rotineiramente utilizados so:
Teste t (DMS ou LSD); Teste de Tukey; Teste de Duncan;
Teste de Dunnet; Teste de Bonferroni; Teste de StudentNewman-Keuls (SNK); Teste de Scheff, Teste de ScotKnott

o mais indicado para comparar mdias 2 a 2;


o mais rigoroso dos testes e, por esta razo, o
mais utilizado na experimentao;
Se as mdias forem estimadas com o mesmo
nmero de repeties, a diferena mnima
significativa () dada por:

= q (t , v).

Como exemplo de aplicaes veremos, neste curso, o teste


de Tukey.

QM Re sduo
r

21

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

22

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Amplitude Total Studentizada (q) para uso no teste de Tukey ( = 0,05)

r o nmero de repeties dos tratamentos, ou seja, r o


nmero de dados a partir do qual foi obtido o valor da
mdia.
q(t,v) o valor da amplitude total estudentizada, em um
nvel de significncia.
Este valor obtido na tabela de Tukey em funo do
nmero de tratamentos envolvidos no experimento e do
nmero de graus de liberdade (v) da fonte de variao
Resduo, da anlise de varincia.

23

V
2
3
4
5
1
18,00 27,00 32,80 37,10
2
6,09 8,30 9,80 10,90
3
4,50 5,91 6,82 7,50
4
3,93 5,04 5,76 6,29
5
3,64 4,60 5,22 5,67
6
3,46 4,34 4,90 5,31
7
3,34 4,16 4,68 5,06
8
3,26 4,04 4,53 4,89
9
3,20 3,95 4,42 4,76
10 3,15 3,88 4,33 4,65
11 3,11 3,82 4,26 4,57
12 3,08 3,77 4,20 4,51
13 3,06 3,73 4,15 4,45
14 3,03 3,70 4,11 4,41
15 3,01 3,67 4,08 4,37
16 3,00 3,65 4,05 4,33
17 2,98 3,63 4,02 4,30
18 2,97 3,61 4,00 4,28
19 2,96 3,59 3,98 4,25
20 2,95 3,58 3,96 4,23
24 2,92 3,53 3,90 4,17
30 2,89 3,49 3,84 4,10
60 2,83 3,40 3,74 3,98
120 2,80 3,36 3,69 3,92
K = Nmero de tratamentos
v = Graus de liberdade do resduo

6
40,40
11,70
8,04
6,71
6,03
5,63
5,36
5,17
5,02
4,91
4,82
4,75
4,69
4,64
4,60
4,56
4,52
4,49
4,47
4,45
4,37
4,30
4,16
4,10

K
7
8
43,10 45,40
12,40 13,00
8,48 8,85
7,05 7,35
6,33 6,58
5,89 6,12
5,61 5,82
5,40 5,60
5,24 5,43
5,12 5,30
5,03 5,20
4,95 5,12
4,88 5,05
4,83 4,99
4,78 4,94
4,74 4,90
4,71 4,86
4,67 4,82
4,65 4,79
4,62 4,77
4,54 4,68
4,46 4,60
4,31 4,44
4,24 4,36

9
47,40
13,50
9,18
7,60
6,80
6,32
6,00
5,77
5,60
5,46
5,35
5,27
5,19
5,13
5,08
5,03
4,99
4,96
4,92
4,90
4,81
4,72
4,55
4,48

10
49,10
14,00
9,46
7,83
6,99
6,49
6,16
5,92
5,74
5,60
5,49
5,40
5,32
5,25
5,20
5,15
5,11
5,07
5,04
5,01
4,92
4,83
4,65
4,56

12
52,00
14,70
9,95
8,21
7,32
6,79
6,43
6,18
5,98
5,83
5,71
5,62
5,53
5,46
5,40
5,35
5,31
5,27
5,23
5,20
5,10
5,00
4,81
4,72

15
55,40
15,70
10,50
8,66
7,72
7,14
6,76
6,48
6,28
6,11
5,99
5,88
5,79
5,72
5,65
5,59
5,55
5,50
5,46
5,43
5,32
5,21
5,00
4,90

20
59,60
16,80
11,20
9,23
8,21
7,59
7,17
6.87
6,64
6,47
6,33
6,21
6,11
6,03
5,96
5,90
5,84
5,79
5,75
5,71
5,59
5,48
5,24
5,13

24

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

O procedimento para verificar se existe


significativa entre os tratamentos o seguinte:

Estatstica

diferena

ordem

crescente

Medicina Veterinria

EXEMPLO 3. Em um experimento composto por 5 tratamentos e 6


repeties, cuja montagem seguiu um DIC, obteve-se anlise de
varincia significativa, conforme mostra o quadro abaixo:

Calcula-se as mdias dos tratamento;


Ordena-se estas mdias
decrescente de valores);

Prof. Dr. Ednaldo Carvalho Guimares

EXEMPLO 2. Para os dados do EXEMPLO 1, aplique o Teste de Tukey


e faa as concluses. Use significncia de 5%.

ou

Verifica-se se a diferena entre duas mdias inferior a


DMS (), em caso afirmativo, conclui-se que no h
diferena estatstica entre os tratamento.
Se a diferena entre duas mdias for superior a DMS
ento existe diferena estatstica entre os tratamentos.

FV

GL

SQ

QM

TRAT

1,4220

0,3555

21,68

RESDUO

25

0,4100

0,0164

TOTAL

29

1,8320

As mdias dos tratamentos foram:

Y 1 = 1,65; Y 2 = 1,30; Y 3 = 1,00; Y 4 = 1,15; Y 5 = 1,20


Utilize o teste de Tukey para verificar a ocorrncia das diferenas
significativas entre as mdias de tratamentos.

25

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

26

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

EXPERIMENTO DE DOIS CRITRIO - DELINEAMENTO


EM BLOCOS CASUALIZADO

O objetivo da blocagem manter a variabilidade entre


parcelas, dentro dos blocos, to pequena quanto possvel,
contribuindo para a reduo da fonte de variao residual.

So considerados os princpios bsicos de repetio,


casualizao e controle local em um sentido ( linha ou
coluna do experimento)

O modelo matemtico

Prprio para as situaes onde existe heterogeneidade do


material experimental ou do ambiente onde se realiza o
ensaio
exemplo: diferena de temperatura; diferena em
fertilidade; diferena gentica; diferena entre idades;
diferena social, etc..
Podemos associar este experimento com a idia de
amostras estratificadas, vista na estatstica bsica.

Yij = + ti + b j + ij
Yij o valor da parcela que recebeu o tratamento i no bloco
j; a mdia geral do experimento; ti o efeito do
tratamento i; bj o efeito do bloco j e ij o erro da parcela
que recebeu o tratamento i no bloco j.
Estamos introduzindo mais uma fonte de variao na
anlise de varincia, a fonte bloco.

27

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

28

Estatstica

O planejamento Experimental

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Calculo das somas de quadrados (SQ)

Suponha um DBC com 5 tratamentos (A, B, C, D, E) e 4


blocos (I, II, III, IV). Como exemplo da disposio das
parcelas no experimento, temos:
Bloco I

Bloco II

Bloco III

Bloco IV

SQTotal = Yij2 C
SQBlo cos =

B 2j
t

SQTrat =

C=

b
Yij ) 2

t.b

SQResduo = SQTotal SQTrat SQBlocos

29

30

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

Quadro de anlise de varincia

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

As hipteses na anlise de varincia so:

FV

GL

SQ

QM

Ho: t1= t2 = ... = tt

Bloco

b-1

SQBloco

QMBloco

FBloco

H1: ti tj ( no mnimo para um par)

Trat

t-1

SQTrat

QMTrat

FTrat

Resduo

(t-1).(b-1)

SQRes

QMRes

Total

tb-1

SQTotal

Ho : no existe efeito de blocos


H1 : pelo um dos blocos apresenta-se de forma
diferenciada sobre a varivel resposta

Lembre-se de que os quadrados mdios so obtidos


dividindo-se cada soma de quadrados por seu respectivo
grau de liberdade; e que os F so obtidos dividindo-se os
quadrados mdios da fonte de variao pelo quadrado
mdio do resduo.
31

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

EXEMPLO 5: Um experimento foi realizado com o objetivo de


estudar o efeito 4 tipos de dieta alimentar de um determinado
animal na converso alimentar. O delineamento experimental foi
em blocos casualizados com 4 tratamentos (dietas) e 5 blocos
(repeties).

TRATAMENTOS
Blocos

I
II

2,20
2,50

1,90
2,30

2,50
2,90

2,10
2,40

III
IV
V

2,30
2,20

1,70
1,60
1,60

2,50
2,40
2,30

1,90
2,20
2,10

2,10

32

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

EXPERIMENTOS EM ESQUEMA FATORIAL


Nas experincias cientficas, podemos estar interessados
no estudo da influncia de dois ou mais fatores sobre uma
mesma varivel resposta.
Podemos estar interessado tambm em verificar se dois ou
mais fatores controlados pelo pesquisador esto exercendo,
conjuntamente, algum tipo de influncia sobre a varivel
resposta.
Uma forma de anlise dessas interaes o esquema de
anlise conhecido como fatorial.
A grande vantagem da utilizao do esquema fatorial a
possibilidade de analisar isoladamente os fatores e tambm
simultnea desses fatores, reduzindo o nmero de anlises.

Verifique se existe diferena entre tratamentos. Use nvel de


significncia de 5%.
33

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

34

Estatstica

Nos experimentos em esquema fatorial pode-se utilizar os


delineamentos
inteiramente
ao
acaso
(DIC),
os
delineamentos em blocos casualizados (DBC) e os
quadrados latinos (DQL)
Vale ressaltar que o esquema fatorial e o esquema em
parcela subdividida (que no ser abordado neste curso) so
apenas esquemas de anlise, no se constituindo em
delineamentos experimentais.
O modelo matemtico de anlise de varincia no esquema
fatorial, para um experimento com 2 fatores (A, B) em DIC
dado por:

Yijk = + ai + b j + (a.b)ij + ijk

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

As somas de quadrados so dadas por:


SQTotal = Yijk2 C
C=

( Yijk ) 2

abr
em que : a = nmero de nveis do fator A; b = nmero de nveis do fator B;
r = nmero de repeties

T Ai
C
br
em que : T Ai o total do fator A no nvel i
SQA =

em que: ai o efeito do fator A; bj o efeito do fator B; (ab)ij o efeito


da interao entre os fatores A e B
35

36

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

TBi
C
ar
em que : TB j o total do fator B no nvel j
SQB =

SQTrat =

Medicina Veterinria

SQResduo = SQTotal SQA SQB - SQAxB


A utilizao de quadros auxiliares, tornam mais simples
os clculos das somas de quadrados.
O esquema do quadro de anlise de varincia para um
fatorial com dois fatores apresentado a seguir:

SQAxB = SQTrat SQA SQB


2
Yij

Prof. Dr. Ednaldo Carvalho Guimares

FV

GL

SQ

QM

a-1

SQA

QMA

FA

b-1

SQB

QMB

FB

AxB

(a-1).(b-1)

SQAxB

QMAxB

FAxB

Resduo

ab(r-1)

SQResiduo

QMResiduo

TOTAL

Abr-1

SQTotal

37

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

38

Estatstica

OBSERVAES:
Se as interaes apresentarem significncia, deve-se
proceder ao desdobramento das interaes e posterior
aplicao dos testes de mdias. Este procedimento ser
mostrado no desenvolvimento do exemplo.

MEDIC
M1

Se a interao for no significativa, mas os fatores so


significativos, aplica-se os testes de mdias para cada
fator isoladamente

M2

Se toda a anlise mostrar-se no significativa, conclui-se


que no existe diferena entre os tratamentos aplicados
no experimento e a anlise termina neste ponto
Note que o grau de complexidade da anlise ser cada
vez maior com a adio de novos fatores na anlise

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

EXEMPLO 6. Um experimento foi conduzido em DIC


fatorial, para verificar o tempo de recuperao (dias) de 4
raas de animais submetidos a 3 tipos medicamentos. Os
resultados foram:

M3

RAA
A
B
C
D
A
B
C
D
A
B
C
D

1
54
46
55
51
59
61
59
52
59
63
63
59

REPETIO
2
3
52
50
47
49
54
54
55
48
61
57
55
58
60
62
51
52
62
64
58
59
61
58
59
60

Total
156
142
163
154
177
174
181
155
185
180
182
178

Proceder analise de varincia e aos testes de mdias, com


significncia de 5%

39

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

40

Estatstica

CORRELAO E REGRESSO LINEAR

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Classificao dos modelos

ANLISE DE CORRELAO
Interesse em mensurar a fora da associao entre as
variveis (geralmente atravs do clculo de algum
coeficiente).
ANLISE DE REGRESSO
Interesse em realizar previses sobre os valores da
varivel dependente (resposta) a partir dos valores das
variveis independentes (preditoras).
Construir um modelo estatstico (modelo de
regresso): uma equao que mostre o relacionamento
entre as variveis.
41

Anlise de
Correlao

Regresso Linear
Simples

Anlise de
Regresso

Regresso Linear
Mltipla

Regresso No
Linear

Exponencial

Logstica

42

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

COEFICIENTES DE CORRELAO

Medicina Veterinria

Correlao linear simples

Duas variveis quantitativas

temos duas variveis quantitativas


Como medir a associao entre essas variveis?
O coeficiente utilizado o coeficiente de correlao de
Pearson (r)

Diagrama de disperso indica a possibilidade de


correlao linear.
Coeficiente de correlao linear de Pearson: medir
a fora e a direo do relacionamento LINEAR entre
as duas variveis:

r=

Obs: Existem outros coeficientes na estatstica para medir


a fora de associao entre duas variveis, como
Coeficiente de Correlao de Spearman, Coeficiente de
Contingncia, etc.. No abordaremos estes coeficientes neste
curso.

xi
yi
xi yi n

( xi ) 2
( yi ) 2
xi 2
yi 2

43

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

44

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Para verificar a significncia do r ( testar a hiptese que, na


populao, o coeficiente de correlao zero) a distribuio
utilizada a distribuio t Student com (n2) graus de
liberdade

Diagrama de Disperso

t = r
Correlao
SEM correlao
Correlao Linear
Linear Negativa
Positiva

No linear

n2
1 r2

Obs: Se pretendemos verificar se o coeficiente de correlao


estatisticamente diferente de uma constante, com essa
constante diferente de zero, devemos aplicar outro teste
(Spiegel (1993) ou Freund & Simon (2000))
45

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

40

45

50

55

60

GORD

60

77

75

80

93

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Exemplo 3. Verificar se existe relao entre idade de


pessoas adultas (anos) e renda familiar (s.m)

Exemplo 1. Verificar se existe correlao entre peso do


animal (kg) e percentagem de gordura (%). Os
resultados foram:
PESO

46

X(idade)
Y (renda)

25
5

30
3

35
8

40
4

45
4

50
7

Exemplo 2. Verificar se existe relao entre idade de ces


(meses) e reao ao estimulo (milssimo de segundos)

idade

11

reao

18

12

10

5
47

48

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

REGRESSO LINEAR SIMPLES

Objetivo: obter uma equao matemtica que


expresse o relacionamento entre a varivel
dependente (resposta) e as independentes
(explicativas, preditoras).

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Anlise de regresso simples: apenas duas


variveis.
Anlise de regresso mltipla: uma dependente e
mais de uma independente.
I) O modelo de regresso linear simples

Possibilita a realizao de previses:


Como as mudanas nos valores das variveis
independente influenciam a varivel dependente.
Tomada de decises.

Yi = + X i + ei
Melhor reta passar o mais perto possvel dos
pontos experimentais
Minimizar a distncia global dos pontos em
relao a reta

49

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

Estimativas dos parmetros


Graficamente, a anlise de regresso implica no
ajuste de uma reta que represente de uma boa
forma a estrutura dos dados.
70
60

Mas o que boa


forma de ajuste da
reta?

50
40
30

50

20

Prof. Dr. Ednaldo Carvalho Guimares

Note que a diferena


entre a reta ajustada e
a observao realizada
corresponde ao
resduo.
Logo, o ajuste ideal da
reta deve respeitar a
condio de menor
distncia possvel em
relao aos valores
observados.

Medicina Veterinria

60
55
50
45
40
35
i

30
25

E[Y|X]
20

10
5

15

51

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

52

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Logo, a idia de ajuste dos parmetros do valor


esperado condicional passa por Minimizar a
Soma dos Quadrados dos Resduos.

A equao estimada ser dada por:

O estimador de Mnimos Quadrados Ordinrios


possui propriedades interessantes, quando as
hipteses bsicas no so violadas: ele noviesado e o mais eficiente entre os estimadores
lineares.

^
ei so os erros ou residuos (yi - yi )

Yi = a + bxi + ei

MMQ determinar a e b para o menor ei2


Para minimizar a ei2 temos:
a)Derivadas parciais em relao a a e b se anulam

Dado n pares (xi, yi) que correspondem a n


pontos em um grfico, vamos estar interessados
nas estimatimas a e b dos parmetros e do
modelo de regresso linear.

b) Determinante da matriz de derivadas parciais


seja maior que zero.
53

54

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Exemplo 1. Ajustar o modelo de regresso linear para


a % de gordura (Y) em funo do Peso (X).

Ento as estimativas de a e b sero:

Xi Y i
[( X i X )(Yi Y )] SPXY X iYi

n
=
=
b=
SQX
X
(
)2
( Xi X )
X i2 n i

Peso

40

45

50

55

60

Gordura

60

77

75

80

93

1
a = [ Yi b X i ] = Y b X
n

55

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

56

Estatstica

INFERNCIA NA ANLISE DE REGRESSO


LINEAR SIMPLES
A simples determinao dos coeficientes da
equao de regresso no garante a eficincia do
modelo na realizao de estimativas de y em
funo de X
a significncia do modelo deve ser verificada por
meio da anlise estatsticas
mostraremos as principais inferncias quanto ao
modelo de regresso linear simples.

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

a) Anlise de varincia da regresso


Vamos falar sobre a anlise de varincia para
verificar a qualidade do modelo ajustado
A anlise de varincia do modelo tem o objetivo
de verificar se o modelo ajustado significativo ou
no
As hipteses so:
Ho: no existe relao linear entre X e Y
H1: existe a relao linear entre X e Y

57

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

As Somas de Quadrados: SQ

SQTotal = SQY = Y 2

Medicina Veterinria

58

Estatstica

( Y ) 2

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

SQT, SQReg e SQRes esto associadas,


respectivamente, a n-1, 1 e n-2 graus de liberdade

Por definio, os quadrados mdios, so obtidos


dividindo-se as SQ pelos respectivos GL.

X Y
( XY ) 2
( SPXY ) 2
n
=
SQREG =
2
SQX
2 ( X )
X n

QM Re g = SQ Re g E (QM Re g ) = 12 ( X i X ) 2 + 2
QM Re s =

SQ Re s = SQT SQ Re g

SQ Re s
E (QM Re s ) = 2
n2

Se fizermos a relao entre o QM RLinear e o


QM Residuo, obtemos a estatstica F
59

60

10

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

F=

Medicina Veterinria

Estatstica

QMRLinear
QM Re sduo

A partir dessa estatstica, temos a significncia do


modelo, ou seja:
Se F < Ftabela aceito Ho (modelo no
adequado)

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Fonte de
Variao
Regresso

GL

SQ

QM

F0,05

SQReg

QMReg

Fcalc

Ftab

Resduo

n-2

SQRes

QMRes

Total

n-1

SQTotal

b) Coeficiente de determinao

Se F > Ftabela rejeito Ho (modelo adequado)

r2 =

Variao exp licada SQREG


SPXY
=
=
Variao total
SQT
SQXSQY

61

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

62

Estatstica

c) Coeficiente de variao (CV)

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Um primeiro passo a determinao dos erros


padro

um indicador da qualidade de ajuste

Os erros padro das estimativas dos


coeficientes linear (bo) e de regresso (b1) do
modelo de regresso, assim como o erro padro
de um determinado valor estimado ( ^ ), so
Yi
dados por:

QM Re s
s
CV = =
Y
Y
Menor CV melhor a qualidade do ajuste

2
2
1
X
s(bo ) = +
S
2
(
X
)
n

2
i
X

d) Intervalos de Confiana
Vamos abordar agora os intervalos de confiana
para os parmetros do modelo
63

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

s(b1 ) =

Medicina Veterinria

Estatstica

s2
2

X 2 ( X i )
i

i =1

i =1

n2

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Assim, com base no erro padro de cada parmetro,


definimos os intervalos de confiana como:
Para o coeficiente linear:

bo t

s (bo )

Para o coeficiente de regresso:

Yi 2 b0 Yi b1 X iYi

s 2 = i =1

64

b1 t

= QM Re s

65

s (b1 )

66

11

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

O valor de t obtido por meio da distribuio tStudent, considerando /2 e GL = v = n-2


Este valor de t tambm usado para se testar
as hipteses a respeito dos parmetros do
modelo.
e) Testes de Hipteses
No teste de hipteses vamos verificar se as
suposies feitas a respeito dos parmetros do
modelo podem ou no serem aceitas.

Prof. Dr. Ednaldo Carvalho Guimares

H0: o= k

Ho: 1= k

H1: o k

H1: 1 k

Medicina Veterinria

O mais usual utilizar k = 0


Vamos utilizar a estatstica t e determinar a
significncia com v = n-2

t=

b0 k
s(b0 )

b1 k
s (b1 )

t=

As hipteses a serem testadas para o modelo


linear simples so:
67

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

68

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

REGRESSO LINEAR MLTIPLA


Se o modulo da estatstica t for menor que o valor
de tabela aceita-se H0, caso contrrio rejeita-se.
Usando p-valor, temos que se p-valor maior que
0,05 aceita-se H0, caso contrrio H0 rejeitada.
Fazer a anlise completa do modelo
regresso linear simples para os exemplo 1.

de

A generalizao do modelo linear com mais de uma


varivel independente chamada de regresso linear
mltipla, com modelo geral dado por:

Yi = o + 1x i 1 + 2x i 2 +...+ k x ik + i
A determinao dos coeficientes da regresso feita a
partir da soluo do sistema de equaes normais de
mnimos quadrados.
n

i =1

i =1

i =1

i =1

n o +  1 x i 1 +  2 x i 2 +...+  k x ik = y i
n

i =1

i =1

i =1

i =1

i =1

 o x i 1 +  1 x i21 + 2 x i 1x i 2 +...+ k x i 1x ik = x i 1y i
#

i =1

i =1

i =1

i =1

i =1

2
 o x ik + 1 x ik x i 1 + 2 x ik x i 2 +...+ k x ik
= x ik y i

69

Estatstica

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica

O sistema pode ser resolvido por qualquer mtodo de


resoluo de equaes algbricas lineares (mais utilizado
o mtodo matricial).
As inferncias seguem o padro daquelas feitas na
Regresso Linear Simples com as devidas adaptaes.
Vamos exemplificar com um modelo com duas variveis
preditoras resolvidas em programa computacional.
Ex. Suponha um estudo em que se deseja determinar um modelo estatstico que explique a
Creatinina em funo da idade (anos) e do peso (kg) de pessoas adultas.
Creatinina

70

0.87

1.15

1.31

1.61

1.63

1.22

1.73

1.43

0.95

1.59

1.81

idade

30

34

38

41

44

45

46

48

50

51

53

55

peso

62

73

72

80

70

69

84

85

65

58

81

87

71

Prof. Dr. Ednaldo Carvalho Guimares

Medicina Veterinria

Estatstica de regresso
R mltiplo
0.7703
R-Quadrado
0.5933
R-quadrado ajustado
0.5029
Erro padro
0.2266
Observaes
12
ANOVA
Regresso
Resduo
Total

Interseo
idade
peso

gl
2
9
11

SQ
0.6743
0.4622
1.1366

MQ
0.3372
0.0514

F
6.5645

F de significao
0.0174

CoeficientesErro padro Stat t


-0.6563
0.5813
-1.1291
0.0218
0.0095
2.3026
0.0141
0.0076
1.8527

valor-P
0.2881
0.0468
0.0969

Inferior 95.0%
-1.9713
0.0004
-0.0031

Superior 95.0%
0.6586
0.0433
0.0313

72

12