Você está na página 1de 40

1

!"#$%&'( *
+,-./012( 3, 3"3(-4 "56'0-,
708"/0"3"
nesLe caplLulo dlscuLlmos os meLodos e Lecnlcas usadas para descrever e anallsar a relao
enLre duas varlvels. Cuando se busca lnformao em uma base de dados, buscam-se,
fundamenLalmenLe, relaes enLre varlvels. L a mals prlmrla das relaes enLre varlvels e a
relao enLre duas varlvels. A esLaLlsLlca, buscando auxlllar o processo de Lransformao de
dados em lnformao LraLa o Lema sob o rLulo de dados blvarlados, produzlndo grflcos e
medldas descrlLlvas para descrever Lal relao. Mals recenLemenLe passamos a LraLar de dados
mulLlvarlados, ob[eLo fora do escopo desLe llvro.
LsLabelecer uma relao enLre duas varlvels e fundamenLalmenLe reconhecer
varlabllldades con[unLas, o que val depender, obvlamenLe, da forma como cada uma delas fol
mensurada. Asslm, o enLendlmenLo das Lecnlcas esLaLlsLlcas desenvolvldas para a anllse
blvarlada passa pelo reconheclmenLo lnlclal do nlvel de mensurao das varlvels envolvldas.
lnlclamos nossa dlscusso pelos nlvels mals elemenLares de mensurao, lsLo e, anallsando a
relao enLre duas varlvels caLegrlcas.
!"#$ &#'()&*($ +#,*-.'(+#$
A varlabllldade con[unLa de duas varlvels caLegrlcas e comumenLe e facllmenLe
represenLada usando-se Labelas e maLrlzes de dupla enLrada. lnlclamos nossa apresenLao
com a Labela de conLlngncla.
!"#$%" '$ ()*+,*-.*(,"
uma Labela de conLlngncla apresenLa as conLagens (frequncla de ocorrncla) dos
lndlvlduos da amosLra em uma classlflcao cruzada. C Lermo fol lnLroduzldo na llLeraLura em
1904 pelo maLemLlco brlLnlco karl earson (1837-1936) (ver a llgura 1 a segulr),
conslderado o pal da esLaLlsLlca maLemLlca (earson, 1904 !"#$ AgresLl, 2002).


I|gura 1: kar| earson (18S7-1936)
Ionte: http:]]www.york.ac.uk]depts]maths]h|ststat]peop|e]pearson_k.g|f. Acessado em 20]3]2011

1
a)
2

Suponha que se Lenha uma amosLra de Lamanho n cu[os lndlvlduos Lenham sldo
classlflcados segundo duas varlvels caLegrlcas, dlgamos X e , a prlmelra com o caLegorlas e
a segunda com b caLegorlas. lsLo e, cada lndlvlduo na amosLra fol classlflcado em uma das o
caLegorlas de X e em uma das b caLegorlas de . C numero necessrlo de classes para
esLabelecer o cruzamenLo e dado pela comblnao das caLegorlas de cada uma das varlvels
(comblna-se cada caLegorla de X com cada caLegorla de ), ou se[a, o produLo o b. uma
Labela de conLlngncla de X e enLo uma Labela de dupla enLrada (bldlmenslonal), com o
llnhas e b colunas, em que as comblnaes de classes so represenLadas pelas lnLersees das
respecLlvas llnhas e colunas. Cs dados lnserldos na Labela correspondem as conLagens dos
lndlvlduos da amosLra classlflcados em cada classe cruzada. A llgura 2 llusLra o concelLo.


colunas (%)
1oLal da llnha
1 2 ... &
llnhas (()
1 )
11
)
12
... )
1&
)
1.

2 )
21
)
22
... )
2&
)
2.

... ... ... ... ...
! )
!1
)
!2
... )
!&
)
!.

1oLal da coluna )
.1
)
.2
... )
.&
)
I|gura 2: 1abe|a de cont|ngnc|a com ! ||nhas e " co|unas
Ionte: e|aborado pe|o autor

As enLradas da Labela, n
]
, para i = 1, ., o e ] = 1, ., b, represenLam as conLagens dos
lndlvlduos da amosLra classlflcados em cada classe cruzada. ALenLe para a noLao uLlllzada
para os LoLals das colunas e llnhas.

1
n
.]
= _ n
]
u
=1
, para ] = 1, ., b,

e

2
n
.
= _ n
]
b
]=1
, para i = 1, ., o.

As somas dos LoLals das colunas e dos LoLals das llnhas so, evldenLemenLe, lguals a n, ou
se[a,

_ n
.]
b
]=1
= _ _ n
]
u
=1
b
]=1
= n, e _ n
.
u
=1
= _ _ n
]
b
]=1
u
=1
= n,

pols a soma de Lodas as conLagens represenLa o LoLal de lndlvlduos na amosLra.
um exemplo a[udar a enLender o concelLo.
9:,;#'( <
Comblnando-se os dados [ apresenLados no Cuadro Lrro! Ionte de refernc|a no
encontrada. e no Lrro! Ionte de refernc|a no encontrada. do CaplLulo 3, referenLes
ao sexo e ao local de Lrabalho de 406 lndlvlduos, Lem-se a Labela de conLlngncla
apresenLada a segulr.

3


Sexo 1oLal da
llnha 1 femlnlno 2 mascullno
Local de
Lrabalho
1 dlreo geral 13

28 41
2 superlnLendnclas 24 33 37
3 agnclas 89 136 223
4 rgos reglonals 33 30 83
1oLal da coluna 139 247 406
1abe|a 1: Loca| de traba|ho x Sexo somente respostas v||das
Ionte: Arqu|vo pessoa| do autor


Cbserve que os LoLals das llnhas e das colunas apresenLam as mesmas lnformaes [
apresenLadas na Lrro! Ionte de refernc|a no encontrada. e na Lrro! Ionte de refernc|a
no encontrada. do CaplLulo 3, respecLlvamenLe, a menos de excluses de resposLas lnvlldas.
no conLexLo de Labelas de conLlngncla, a coluna e a llnha de LoLals so chamadas de
frequnclas marglnals, pols se slLuam nas margens da Labela. As frequnclas marglnals
apresenLam, asslm, as dlsLrlbules de frequnclas das varlvels que esLo sendo cruzadas,
Lomadas lndlvldualmenLe. ercebe-se, porLanLo, que uma Labela de conLlngncla apresenLa
malor rlqueza de lnformaes, pols, alem de apresenLar as dlsLrlbules de frequncla de cada
uma das varlvels conslderadas, apresenLa as frequnclas cruzadas, para cada comblnao de
caLegorlas das duas varlvels.
8epare que o LoLal de lndlvlduos do sexo femlnlno e menor do que o LoLal de lndlvlduos do
sexo mascullno em nossa amosLra, represenLando mals ou menos 1 mulher para 1,3 homens
(mals preclsamenLe, as mulheres represenLam 39,2 da amosLra), de modo que a comparao
enLre as frequnclas apresenLadas no lnLerlor da Labela no e asslm Lo lmedlaLa. or
exemplo, Lome-se a sub-amosLra dos lndlvlduos que Lrabalham na dlreo geral (prlmelra llnha
da 1abela 1). v-se que o numero de lndlvlduos do sexo femlnlno e menor do que o numero
de lndlvlduos do sexo mascullno (13 < 28), acompanhando a Lendncla de Loda a amosLra de
406 lndlvlduos. Mas, e al reslde a suLlleza, a proporo de frequnclas enLre os sexos femlnlno
e mascullno e dlferenLe, pols agora Lem-se mals ou menos 1 mulher para cada 2 homens
Lrabalhando na dlreo geral (mals preclsamenLe, as mulheres represenLam 31,7 da sub-
amosLra da dlreo geral). A comparao mals relevanLe e esLa: 39,2 na amosLra LoLal conLra
31,7 na amosLra da dlreo geral. Serla esLe um lndlclo de alguma dlscrlmlnao de sexo na
dlreo geral?
/"+0,1 '$ ()00$23)*'.*(,"
Como llusLrado, a comparao e mals lnLeressanLe a parLlr de dados relaLlvos, de modo
que ser convenlenLe expressar as frequnclas de uma Labela de conLlngncla sob a forma de
frequnclas relaLlvas. As frequnclas de uma Labela de conLlngncla podem ser facllmenLe
Lransformadas em frequnclas relaLlvas, o que faclllLa sua lnLerpreLao. ueflnem-se asslm as
propores

3
p
]
=
n
i]
n
, para i = 1, ., o e ] = 1, ., b,

4
p
.]
=
n
.]
n
, para ] = 1, ., b,

e

b)
4

S
p
.
=
n
i.
n
, para i = 1, ., o.

A maLrlz de frequnclas relaLlvas e chamada de maLrlz de correspondncla, denoLada por P. A
llgura 3 a segulr llusLra uma maLrlz de correspondncla generlca, com a adlo de uma coluna
e uma llnha de LoLals.


colunas (%)
1oLal da llnha
1 2 ... &
llnhas (()
1 "
11
"
12
... "
1&
"
1.

2 "
21
"
22
... "
2&
"
2.

... ... ... ... ...
! "
!1
"
!2
... "
!&
"
!.

1oLal da coluna "
.1
"
.2
... "
.&
1
I|gura 3: Matr|z de correspondnc|a com ! ||nhas e " co|unas, ad|c|onada de uma co|una e uma ||nha
tota||zadoras
Ionte: e|aborado pe|o autor

A 1abela 2 a segulr apresenLa a maLrlz de correspondncla derlvada da Labela de
conLlngncla apresenLada na 1abela 1.


Sexo 1oLal da
llnha 1 femlnlno 2 mascullno
Local de
Lrabalho
1 dlreo geral 0,032

0,069 0,101
2 superlnLendnclas 0,039 0,081 0,140
3 agnclas 0,219 0,333 0,334
4 rgos reglonals 0,081 0,123 0,204
1oLal da coluna 0,392 0,608 1
1abe|a 2: Matr|z de correspondnc|a das var|ve|s Loca| de traba|ho x Sexo
Ionte: Arqu|vo pessoa| do autor

A ulLlma coluna da llgura 3 (e da 1abela 2, de forma mals concreLa) conLem a soma das
llnhas da maLrlz de correspondncla, represenLando o perfll da amosLra (frequnclas relaLlvas)
com respelLo a varlvel I
1
(local de Lrabalho, na 1abela 2). 1al veLor e usualmenLe denoLado
por r, podendo ser escrlLo como o produLo da maLrlz P pelo veLor 1
b
, ou se[a,

6
r = P1
b
.

SemelhanLemenLe a ulLlma llnha da llgura 3 (e da 1abela 2, de forma mals concreLa)
conLem a soma das colunas da maLrlz de correspondncla, e represenLa o perfll da amosLra
com respelLo a varlvel I
2
(sexo, na 1abela 2). 1al maLrlz llnha e usualmenLe denoLada por c
T
,
podendo ser escrlLo como o produLo da maLrlz llnha 1
u
T
pela maLrlz P, ou se[a,
1



1
noLe a uLlllzao da noLao de maLrlz LransposLa. C veLor coluna de elemenLos lguals a 1,
denoLado por 1
u
, quando LransposLo, Lransforma-se em uma maLrlz llnha de elemenLos lguals a 1. C
veLor coluna c, quando LransposLo, Lransforma-se em uma maLrlz llnha. LsLamos aqul preservando a
usual conveno de que veLores so LraLados como maLrlzes colunas. Asslm, maLrlzes llnhas so LraLadas
como LransposLas de maLrlzes colunas.
3

7
c
T
= 1
u
T
P.

8epare que esLas lnformaes [ havlam sldo descrlLas nas Labelas de frequnclas relaLlvas
apresenLadas na Lrro! Ionte de refernc|a no encontrada. e na Lrro! Ionte de refernc|a
no encontrada. do CaplLulo 3 respecLlvamenLe.
A lnformao cruzada Lorna-se mals evldenLe quando se deLermlnam os perfls das llnhas e
das colunas da maLrlz de correspondncla. Mals especlflcamenLe, deLermlna-se o i-eslmo
perfll de llnha (i = 1, ., o), slmbollzado por r

, dlvldlndo-se a i-eslma llnha da maLrlz de


correspondncla pelo LoLal marglnal, lsLo e,

8
r

=
l
l
l
l
l
l
p
i1
p
i.
p
i2
p
i.
.
p
ib
p
i.
1
1
1
1
1
1
, para i = 1, ., o.

ueflnlndo-se a maLrlz dlagonal

cu[os elemenLos de sua dlagonal so os elemenLos do veLor


r (ou se[a, os LoLals marglnals das llnhas da maLrlz de correspondncla P), ou se[a,

9

= _
p
1.
. u
. .
u . p
u.
_,

a maLrlz de perfls de llnhas, slmbollzada por R, pode ser deLermlnada pela operao
2


10
R =

-1
P.

ara a maLrlz de correspondncla derlvada da Labela de conLlngncla apresenLada na
1abela 1 Lem-se

= _
u,1u1
u
u
u
u
u,14u
u
u
u
u
u,SS4
u
u
u
u
u,2u4
_, e R =

-1
P = _
u,S17
u,421
u,S96
u,S98

u,68S
u,S79
u,6u4
u,6u2
_.

ercebe-se, asslm, que o local de Lrabalho comparaLlvamenLe mals femlnlno so as
superlnLendnclas (seu perfll de llnha e dado por 42,1 de mulheres conLra 37,9 de
homens). C local de Lrabalho menos femlnlno, ou mals mascullno, comparaLlvamenLe, e a
dlreo geral (seu perfll de llnha e dado por 31,7 de mulheres conLra 68,3 de homens). Cs
perfls de llnha das agnclas e rgos reglonals so semelhanLes enLre sl.
ueflnles semelhanLes podem ser desenvolvldas para os perfls de colunas. Mals
especlflcamenLe, deLermlna-se o ]-eslmo perfll de coluna (] = 1, ., b), slmbollzado por c
]
,
dlvldlndo-se a ]-eslma coluna da maLrlz de correspondncla pelo LoLal marglnal, lsLo e,

11
c
]
= _
p
1]
p
.]
,
p
2]
p
.]
, .,
p
c]
p
.]
], para ] = 1, ., b.

2
noLe o uso da noLao de lnverso de maLrlzes.
6


ueflnlndo-se a maLrlz dlagonal
c
cu[os elemenLos de sua dlagonal so os elemenLos do veLor
c (ou se[a, os LoLals marglnals das colunas da maLrlz de correspondncla P), ou se[a,

12

c
= _
p
.1
. u
. .
u . p
.b
_,

a maLrlz de perfls de colunas, slmbollzada por C, pode ser deLermlnada pela operao

13
C = P
c
-1
.

ara a maLrlz de correspondncla derlvada da Labela de conLlngncla apresenLada na
1abela 1 Lem-se


c
= j
u,S92 u
u u,6u8
[, e C = P
c
-1
= _
u,u82
u,1S1
u,S6u
u,2u8

u,11S
u,1S4
u,SS1
u,2u2
_.

ercebe-se asslm, que as mulheres, comparaLlvamenLe, esLo menos represenLadas na dlreo
geral e mals represenLadas nas superlnLendnclas, equlllbrando-se a represenLao nas
agnclas e rgos reglonals. C perfll de coluna das mulheres e dado por 8,2 Lrabalhando na
dlreo geral, 13,1 Lrabalhando nas superlnLendnclas, 36 Lrabalhando nas agnclas e
20,8 Lrabalhando nos rgos reglonals, conLra 11,3 dos homens Lrabalhando na dlreo
geral, 13,4 Lrabalhando nas superlnLendnclas, 33,1 Lrabalhando nas agnclas e 20,2
Lrabalhando nos rgos reglonals.
As comparaes enLre os perfls de llnhas e de colunas evldenclam alguma relao
relevanLe enLre as varlvels local de Lrabalho e sexo? Lm ouLras palavras, so lndlclos de
alguma dlscrlmlnao sexual? veremos um pouco mals Larde como encamlnhar resposLas a
esLas lndagaes, quando LraLarmos da esLaLlsLlca lnferenclal, mals especlflcamenLe de LesLes
de hlpLeses. reclsaremos concelLos um pouco mals aprofundados, especlalmenLe sobre
probabllldades, para Lals encamlnhamenLos.
Cs perfls de llnhas e de colunas podem ser represenLados graflcamenLe, oferecendo uma
represenLao vlsual lnLeressanLe para o relaclonamenLo enLre as duas varlvels. Sua
consLruo, enLreLanLo, foge ao escopo desLe llvro.
/0# &#'()&*1 +#,*-.'(+# * "0# &#'()&*1 02,'(+#
A varlabllldade con[unLa enLre uma varlvel caLegrlca e uma varlvel mensurada em
escala meLrlca (lnLervalar ou de razo) e anallsada comparando-se as dlsLrlbules da varlvel
meLrlca nas sub-amosLras represenLadas pelas caLegorlas da varlvel caLegrlca. Suponha que
se Lenha uma amosLra de Lamanho n cu[os lndlvlduos Lenham sldo mensurados em uma escala
lnLervalar ou de razo com respelLo a uma varlvel, dlgamos X, e classlflcados segundo uma
varlvel caLegrlca, dlgamos , com k caLegorlas. A varlvel , com suas k caLegorlas, lnduz
uma parLlo na amosLra, com k subcon[unLos dls[unLos, dlgamos S
1
, S
2
, ., S
k
, cu[a unlo e a
amosLra compleLa. Mals formalmenLe, Lem-se,

14
S

r S
]
= , para i = 1, ., k, ] = 1, ., k, com i = ],
2
7


e

1S
S

= S
k
=1
,

onde S represenLa a amosLra compleLa. Se n

represenLa o numero de elemenLos de S

,
i = 1, ., k, Lem-se,

16
_ n

k
=1
= n.

lsLo e, cada lndlvlduo na amosLra S faz parLe de um e somenLe um dos subcon[unLos S

,
i = 1, ., k. Cs elemenLos da parLlo, S

, i = 1, ., k, consLlLuem, asslm, sub-amosLras da


amosLra S.
ode-se enLo anallsar segmenLadamenLe a varlvel I
1
em cada uma das sub-amosLras S

,
i = 1, ., k, com um olhar comparaLlvo. Se os Lamanhos das sub-amosLras so suflclenLemenLe
grandes, pode-se, por exemplo, represenLar graflcamenLe a varlvel I
1
por melo de k
hlsLogramas, apresenLando-os em um mesmo grflco. Cu alnda represenLar graflcamenLe a
varlvel I
1
por melo de k grflcos-calxa. um exemplo a[uda a esclarecer o procedlmenLo.
9:,;#'( =
Comblnando-se os dados [ apresenLados no Lrro! Ionte de refernc|a no encontrada.
e no Lrro! Ionte de refernc|a no encontrada. do CaplLulo 3, referenLes ao sexo e a
ldade de 407 lndlvlduos (lndlvlduos com resposLas lnvlldas a qualquer uma das
varlvels foram desconslderados), produzem-se as dlsLrlbules de frequncla
apresenLadas na 1abela 3.

Idade
(anos comp|etos)
Sexo
1 femlnlno 2 mascullno
lrequncla lrequncla
20,S 23,S 9 3,7 10 4,0
23,S 26,S 12 7,3 13 3,2
26,S 29,S 3 3,1 14 3,6
29,S 32,S 11 6,9 26 10,3
32,S 3S,S 10 6,3 29 11,7
3S,S 38,S 14 8,8 24 9,7
38,S 41,S 23 13,7 33 14,1
41,S 44,S 28 17,6 39 13,7
44,S 47,S 33 20,8 30 12,1
47,S S0,S 7 4,4 22 8,9
S0,S S3,S 3 3,1 6 2,4
1ota| 139 100,0 248 100,0
1abe|a 3: D|str|bu|o de frequnc|as da var|ve| |dade (anos comp|etos) segmentada pe|o sexo
somente respostas v||das
Ionte: Arqu|vo pessoa| do autor

Cs correspondenLes hlsLogramas so apresenLados na llgura 4 a segulr.
8



I|gura 4: n|stograma da var|ve| |dade (anos comp|etos) segmentada pe|o sexo dos respondentes
Ionte: Arqu|vo pessoa| do autor

Lm prlnclplo, Lodas as medldas usadas para descrever uma varlvel mensurada em uma
escala lnLervalar em uma amosLra podem ser uLlllzadas segmenLadamenLe. As que
recebem mals aLeno, enLreLanLo, so a medla e o desvlo-padro. A 1abela 4 a segulr
apresenLa um resumo esLaLlsLlco das duas sub-amosLras, com vlsLas a sua comparao.


1 femlnlno 2 mascullno 1oLal
* 139 248 407
medla 38,7 38,1 38,3
desvlo-padro 8,0 7,7 7,8
+, 0,21 0,20 0,20
- (coeflclenLe de asslmeLrla) -0,63 -0,34 -0,46
mln 21 21 21
max 33 33 33
ampllLude 32 32 32
medlana 41 40 40
.
1
34 32 33
.
3
43 44 43
ampllLude lnLerquarLlllca 11 12 12
1abe|a 4: Lstat|st|cas descr|t|vas da var|ve| |dade (anos comp|etos) segmentada pe|o sexo
somente respostas v||das
Ionte: Arqu|vo pessoa| do autor

Cs correspondenLes grflcos-calxa so apresenLados na llgura 3 a segulr.

9


I|gura S: Grf|cos-ca|xa da var|ve| |dade (anos comp|etos) segmentada pe|o sexo dos respondentes
Ionte: Arqu|vo pessoa| do autor


C que revelam esLas esLaLlsLlcas e grflcos? C que chama a aLeno em prlmelro lugar e a
medla de ldades. A medla de ldades das mulheres e um pouco superlor a medla de ldades dos
homens. AdlclonalmenLe a dlsLrlbulo de ldades enLre as mulheres e um pouco mals
asslmeLrlca do que enLre os homens, o que Lambem pode ser depreendldo do exame dos
hlsLogramas apresenLados na llgura 4, embora no Lo claramenLe. Mas os grflcos-calxa
apresenLados na llgura 3 delxam lsLo mals claro. C faLo da medlana e dos quarLls serem mals
elevados enLre as mulheres Lambem conduz a lnformao de que o grupo de mulheres
execuLlvas, em geral, e mals velho do que o dos homens execuLlvos. Serla esLa uma evldncla
de dlscrlmlnao sexual? or ouLro lado, a comparao dos hlsLogramas parece sugerlr que h
uma nova gerao de mulheres, mals [ovens, ascendendo a poslo de execuLlvas na empresa,
anLeclpando Lalvez algumas mudanas no fuLuro perfll dos execuLlvos da empresa. Serla esLa
uma evldncla de que as mulheres esLo conqulsLando seu espao enLre os execuLlvos da
empresa?
As comparaes enLre as esLaLlsLlcas das amosLras evldenclam alguma relao relevanLe
enLre as varlvels ldade e sexo? veremos um pouco mals Larde como encamlnhar resposLas a
esLas lndagaes, quando LraLarmos da esLaLlsLlca lnferenclal, mals especlflcamenLe de LesLes
de hlpLeses. Como [ sallenLado, preclsaremos concelLos um pouco mals aprofundados,
especlalmenLe sobre probabllldades, para Lals encamlnhamenLos.
!"#$ &#'()&*($ 02,'(+#$
A varlabllldade con[unLa enLre duas varlvels mensuradas em escalas meLrlcas (lnLervalar
ou de razo) e anallsada graflcamenLe aLraves de dlagramas de dlsperso, Lambem conhecldos
como grflcos x?, e aLraves de algumas medldas de varlabllldade con[unLa. lnlclamos nossa
dlscusso apresenLando os dlagramas de dlsperso. Suponha que se Lenha uma amosLra de
Lamanho n cu[os ob[eLos Lenham sldo mensurados em uma escala lnLervalar ou de razo com
respelLo a duas varlvels, dlgamos X e . Cu se[a, dlgamos que nossa maLrlz de dados Lenha
dlmenso n 2, quer dlzer, Lenha n llnhas, correspondendo aos n ob[eLos da amosLra, e duas
colunas, correspondendo as duas varlvels de lnLeresse. Cada llnha da maLrlz e consLlLulda por
um par de numeros, correspondendo ao perfll de medldas de cada ob[eLo nas duas varlvels.
4,"-0"5" '$ ',23$026)
um dlagrama de dlsperso e Lo somenLe uma represenLao dos ob[eLos da amosLra em
um slsLema carLeslano de elxos coordenados. nesLe slsLema, os pares de numeros que
caracLerlzam cada ob[eLo so chamados de coordenadas do ob[eLo, e cada um deles ser
represenLado por um ponLo no grflco, a parLlr do poslclonamenLo de suas coordenadas em
3
a)
10

cada um dos elxos carLeslanos. Como sempre, um exemplo a[udar a enLender melhor o
concelLo.
9:,;#'( >
uados coleLados slsLemaLlcamenLe no mercado de aes permlLem esLabelecer a
renLabllldade dlrla dos papels Lransaclonados. C Cuadro 1 a segulr apresenLa a
renLabllldade dlrla (dos 247 dlas uLels do ano de 2010) das aes preferenclals
nomlnaLlvas de duas lmporLanLes companhlas brasllelras de caplLal aberLo, a eLrobrs
e a Companhla vale do 8lo uoce, respecLlvamenLe, com base nos preos de fechamenLo
dos preges.
3


0,0170 0,0308, -0,0086 0,0139, 0,0134 0,0193, -0,0094 0,0066, -0,0034 0,0033,
-0,0033 0,0044, -0,0128 0,0022, -0,0017 0,0143, -0,0173 -0,0028, 0,0022 -0,0032,
0,0221 0,0121, -0,0047 0,0117, -0,0239 -0,0179, -0,0321 -0,0362, 0,0122 -0,0228,
-0,0248 -0,0266, 0,0062 -0,0131, 0,0146 0,0043, -0,0128 -0,0002, 0,0038 0,0341,
-0,0038 0,0014, -0,0018 -0,0032, -0,0323 -0,0336, -0,0244 -0,0110, 0,0070 0,0110,
0,0136 0,0233, 0,0123 -0,0007, 0,0218 0,0188, 0,0131 -0,0061, 0,0132 0,0336,
0,0128 0,0203, -0,0098 -0,0022, 0,0087 -0,0139, -0,0134 -0,0136, -0,0073 0,0100,
0,0129 0,0072, 0,0067 -0,0022, 0,0092 0,0043, 0,0034 0,0186, 0,0009 -0,0033,
0,0014 0,0143, 0,0172 0,0289, -0,0031 -0,0030, 0,0222 0,0097, 0,0136 -0,0129,
0,0014 -0,0081, 0,0003 -0,0038, -0,0079 0,0062, 0,0119 0,0239, -0,0016 -0,0038,
-0,0033 -0,0063, -0,0216 -0,0113, 0,0003 0,0110, -0,0117 0,0237, 0,0073 -0,0010,
-0,0230 -0,0068, -0,0201 0,0079, 0,0113 0,0186, -0,0029 0,0018, 0,0168 0,0000,
0,0101 0,0080, 0,0072 -0,0032, 0,0019 0,0036, -0,0078 0,0046, 0,0003 0,0148,
-0,0163 0,0018, -0,0241 -0,0037, -0,0038 0,0039, 0,0018 0,0076, -0,0192 0,0033,
-0,0193 -0,0124, 0,0180 -0,0067, 0,0221 -0,0163, -0,0129 0,0037, 0,0116 -0,0087,
-0,0203 -0,0033, -0,0370 -0,0306, 0,0090 -0,0060, 0,0193 0,0329, -0,0067 -0,0280,
-0,0404 -0,0237, -0,0342 -0,0497, -0,0076 0,0240, -0,0133 -0,0236, -0,0020 -0,0003,
0,0134 0,0433, -0,0177 -0,0168, 0,0094 0,0000, 0,0033 -0,0139, 0,0030 -0,0304,
-0,0080 -0,0186, -0,0213 -0,0393, -0,0232 -0,0233, -0,0400 -0,0392, 0,0033 0,0718,
-0,0084 -0,0122, -0,0223 0,0100, 0,0187 -0,0148, 0,0277 0,0610, 0,0139 -0,0036,
0,0483 0,0219, -0,0326 -0,0207, 0,0136 0,0212, 0,0031 -0,0477, 0,0092 -0,0263,
0,0047 0,0107, -0,0037 0,0040, 0,0118 0,0196, -0,0094 0,0106, -0,0194 0,0010,
-0,0017 0,0119, 0,0222 -0,0093, -0,0044 -0,0140, -0,0010 -0,0134, -0,0031 0,0286,
-0,0099 -0,0067, -0,0212 0,0124, -0,0361 -0,0202, 0,0132 0,0161, -0,0177 -0,0219,
-0,0218 -0,0493, 0,0011 -0,0291, -0,0134 0,0071, 0,0120 -0,0047, -0,0086 -0,0106,
0,0190 0,0093, 0,0129 0,0260, 0,0063 0,0013, -0,0128 -0,0176, 0,0026 0,0037,
0,0000 -0,0063, -0,0070 -0,0097, -0,0100 -0,0109, 0,0041 0,0238, 0,0236 0,0603,
-0,0034 0,0061, 0,0173 0,0173, -0,0068 0,0081, 0,0040 -0,0026, 0,0029 -0,0036,
-0,0063 0,0130, -0,0022 0,0003, 0,0040 0,0033, 0,0282 0,0330, 0,0223 -0,0009,
0,0089 -0,0027, 0,0031 0,0036, -0,0116 -0,0003, -0,0090 0,0016, -0,0147 -0,0123,
-0,0326 -0,0284, 0,0011 0,0080, 0,0047 0,0040, -0,0018 0,0114, 0,0247 0,0133,
-0,0222 0,0070, -0,0331 -0,0086, 0,0000 -0,0126, -0,0043 -0,0243, -0,0197 -0,0232,
-0,0023 -0,0097, -0,0147 -0,0036, 0,0329 0,0303, -0,0427 -0,0303, 0,0237 0,0178,

3
ueflne-se renLabllldade dlrla de um LlLulo pelo logarlLmo naLural da razo enLre os preos
reglsLrados em dols dlas consecuLlvos. Mals formalmenLe, r

= ln (
p
i
p
i-1
), onde o lndlce i refere-se a um
deLermlnado dla uLll e p

refere-se ao preo do LlLulo reglsLrado no dla i.


11

0,0363 0,0441, 0,0209 -0,0104, 0,0426 -0,0030, 0,0100 -0,0049, -0,0443 -0,0190,
-0,0083 0,0014, -0,0029 -0,0077, 0,0279 0,0260, -0,0326 -0,0066, -0,0130 0,0037,
-0,0034 -0,0037, 0,0030 -0,0103, 0,0247 0,0183, -0,0281 0,0019, -0,0141 0,0136,
0,0311 0,0018, -0,0188 0,0279, 0,0076 0,0208, 0,0073 0,0066, 0,0293 0,0043,
-0,0077 0,0043, 0,0077 0,0097, -0,0044 0,0002, -0,0147 0,0123, -0,0424 0,0021,
-0,0219 0,0011, 0,0273 -0,0040, -0,0038 0,0021, -0,0034 0,0031, 0,0280 0,0096,
-0,0037 0,0049, 0,0042 0,0273, -0,0434 -0,0210, -0,0113 0,0231, -0,0338 -0,0199,
0,0021 -0,0019, 0,0148 0,0034, 0,0308 0,0143, 0,0131 -0,0098, 0,0027 -0,0170,
-0,0137 -0,0031, 0,0243 0,0123, 0,0244 -0,0021, 0,0183 0,0227, -0,0091 -0,0006,
0,0102 0,0089, -0,0130 -0,0014, 0,0004 0,0032, -0,0132 0,0028, -0,0331 -0,0178,
-0,0176 -0,0177, 0,0020 0,0012, 0,0173 0,0233, -0,0078 0,0022, -0,0232 -0,0033,
-0,0163 -0,0226, 0,0237 0,0266, -0,0136 -0,0031, -0,0101 -0,0149, 0,0041 -0,0004,
-0,0043 -0,0104, 0,0269 0,0233, 0,0033 0,0033, 0,0117 0,0090, 0,0062 0,0036,
-0,0199 -0,0006, -0,0139 -0,0191, 0,0139 0,0043, 0,0117 0,0109, 0,0081 0,0182,
-0,0031 -0,0037, -0,0180 -0,0077, -0,0008 -0,0088, 0,0230 -0,0008, -0,0144 -0,0012,
0,0078 0,0110, 0,0038 -0,0020, 0,0012 -0,0040, 0,0116 -0,0192, 0,0231 -0,0164,
0,0116 0,0043, 0,0118 -0,0002,
uadro 1: kentab|||dades d|r|as das aes L1kC e VALL em 2010 247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011

1m-se, pols, 247 pares ordenados de numeros, o prlmelro deles mensurando a
renLabllldade da ao da eLrobrs e o segundo mensurando a renLabllldade da ao da
vale, Lomados no mesmo dla uLll do ano de 2010. valores negaLlvos correspondem a
renLabllldades negaLlvas, lsLo e, perdas econmlcas para quem reLeve o papel do dla
anLerlor para o dla correnLe, pols as aes se desvalorlzaram. valores poslLlvos,
obvlamenLe, slgnlflcam ganhos econmlcas. uma boa vlsuallzao con[unLa dos dados
pode ser obLlda por um dlagrama de dlsperso, como apresenLado na llgura 6 a segulr.


I|gura 6: D|agrama de d|sperso das var|ve|s rentab|||dades d|r|as das aes L1kC e VALL em 2010
247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011

C dlagrama de dlsperso e revelador. P uma nlLlda relao enLre as varlabllldades
mensuradas, pols em geral a valores poslLlvos de renLabllldade da eLro correspondem
12

valores poslLlvos de renLabllldade da vale, o mesmo se noLando para as renLabllldades
negaLlvas. Cbserve que h mulLo mals ponLos nos quadranLes l e lll, correspondendo aos
valores de mesmo slnal nas duas varlvels (++ e --), do que nos quadranLes ll e lv,
correspondendo aos valores de slnals conLrrlos (+- e -+) nas duas varlvels.
4
A anllse
con[unLa das varlvels deve ser acompanhada, evldenLemenLe, de uma anllse
lndlvldual de cada uma das varlvels. A 1abela 3 apresenLa algumas esLaLlsLlcas
descrlLlvas das duas varlvels e a llgura 7 apresenLa seus hlsLogramas.

L1kC VALL
md|a -0,001 0,001
var|nc|a 0,000324 0,000330
desv|o-padro 0,018 0,018
# (ass|metr|a) -0,20 0,17
$ 247 247
1abe|a S: Lstat|st|cas descr|t|vas das var|ve|s rentab|||dades d|r|as das aes L1kC e VALL em 2010
247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011


I|gura 7: n|stogramas das var|ve|s rentab|||dades d|r|as das aes L1kC e VALL em 2010 247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011


4
C slsLema de elxos coordenados dlvlde o plano em quaLro quadranLes (cada elxo dlvlde o plano
em duas parLes), numerados de l a lv no senLldo conLrrlo aos ponLelros do relglo, lnlclando no
quadranLe dos ponLos com valores poslLlvos em ambas varlvels.
13

uepreende-se dos grflcos e das esLaLlsLlcas descrlLlvas que as varlvels dlsLrlbuem-se
em Lorno de zero, com razovel slmeLrla, o que e susLenLado pela Leorla flnancelra,
baseada em prlnclplos de equlllbrlo econmlco e perfelo (lnformaclonal) dos
mercados (8realey, Myers e Allen, 2008). A varlncla da renLabllldade da vale e um
pouco superlor a varlncla da renLabllldade da eLro, lndlcando um nlvel llgelramenLe
superlor de rlsco. C dlagrama de dlsperso revela que ambas varlvels varlam mals ou
menos no mesmo senLldo.


C grflco de dlsperso no exlge LanLas escolhas do anallsLa para sua elaborao, como os
hlsLogramas, de modo que e [usLo conslder-lo um grflco mals ob[eLlvo. ulferenLes pares de
varlvels, enLreLanLo, sero reLraLados por dlagramas de dlsperso com conflguraes
dlsLlnLas, e mulLas vezes sua lnLerpreLao e que flcar um LanLo quanLo sub[eLlva. ve[a, por
exemplo, a relao enLre expecLaLlva de vlda ao nascer e morLalldade lnfanLll de dlversos
palses, conforme apresenLado no Lxemplo 4 a segulr.
9:,;#'( *
uados publlcados em 2011 pelo 8anco Mundlal revelam algumas caracLerlsLlcas sclo-
econmlcas e demogrflcas enconLradas em dlversos palses em 2009. Lm parLlcular,
compllaram-se a expecLaLlva de vlda ao nasclmenLo (em anos) e a Laxa de morLalldade
lnfanLll (numero de crlanas morLas por 1.000 nascldas vlvas) das populaes dos palses
represenLados na amosLra (n = 17S). A vlsuallzao da varlabllldade con[unLa das duas
varlvels e apresenLada no dlagrama de dlsperso da llgura 8 a segulr.


I|gura 8: D|agrama de d|sperso das var|ve|s expectat|va de v|da ao nasc|mento (em anos) e taxa de morta||dade
|nfant|| (nmero de cr|anas mortas por 1.000 nasc|das v|vas) em 2009 17S pa|ses
Ionte: Wor|d 8ank, 2011

C dlagrama de dlsperso revela nlLldamenLe uma relao enLre as varlabllldades
mensuradas, mas em senLldos oposLos, lsLo e, em geral a malores expecLaLlvas de vlda
correspondem menores Laxas de morLalldade lnfanLll, e vlce-versa. Algumas esLaLlsLlcas
descrlLlvas das varlvels so apresenLadas na 1abela 6, e a llgura 9 e a llgura 10
apresenLam seus hlsLogramas.

Lxpectat|va de v|da 1axa de morta||dade |nfant||
md|a 68,89 30,9
var|nc|a 97,2696 824,04
14

desv|o-padro 9,86 28,71
# (ass|metr|a) -0,78 1,07
$ 173 173
1abe|a 6: Lstat|st|cas descr|t|vas das var|ve|s expectat|va de v|da ao nasc|mento (em anos) e taxa de morta||dade
|nfant|| (nmero de cr|anas mortas por 1.000 nasc|das v|vas) em 2009 17S pa|ses
Ionte: Wor|d 8ank, 2011


I|gura 9: n|stograma da var|ve| expectat|va de v|da ao nasc|mento (em anos) em 2009 17S pa|ses
Ionte: Wor|d 8ank, 2011


I|gura 10: n|stograma da var|ve| taxa de morta||dade |nfant|| (nmero de cr|anas mortas por 1.000 nasc|das
v|vas) em 2009 17S pa|ses
Ionte: Wor|d 8ank, 2011

uepreende-se dos grflcos e das esLaLlsLlcas descrlLlvas que as varlvels so
marcadamenLe asslmeLrlcas, desLacando-se Lambem a ampllLude de varlao enLre os
dlversos palses represenLados na amosLra. LnquanLo a lslndla apresenLa Laxa de
morLalldade lnfanLll de apenas 1,7 por 1.000 nascldos vlvos, Slerra Leone faz o mundo
envergonhar-se de suas deslgualdades, com uma Laxa lgual a 116,3. As deslgualdades
no so Lo acenLuadas quanLo a expecLaLlva de vlda ao nasclmenLo, embora no se[a
desprezlvel. LesoLo apesenLa a menor expecLaLlva de vlda, 46,67 anos, e o !apo
apresenLa a malor, 82,93. C dlagrama de dlsperso revela que ambas varlvels varlam
em senLldo lnverso.


ercebe-se que a qualldade da relao e dlsLlnLa enLre os dlsLlnLos pares de varlvels. Lm
qual delas a relao e mals lnLensa? Paver Lambem, por cerLo, pares de varlvels que no
guardaro nenhuma relao enLre sl. Asslm, desenvolveram-se medldas mals preclsas para
medlr a relao exlsLenLe enLre duas varlvels mensuradas meLrlcamenLe, o que passamos a
descrever nas prxlmas sees.
13

7)8"0,9*(,"
A varlabllldade lndlvldual de cada uma das varlvels X e e capLurada pelos desvlos das
observaes em relao a sua respecLlva medla, conforme a equao 9 do CaplLulo 3. Cu se[a,
cada lndlvlduo da amosLra possul um desvlo em relao a medla de X e ouLro em relao a
medla de . A varlabllldade con[unLa ser enLo capLurada pelo produLo desLes desvlos,
Lomados lndlvlduo a lndlvlduo. Conforme [ sallenLado, alguns desvlos sero poslLlvos, ouLros
negaLlvos, equlllbrando-se na amosLra em relao a cada uma das varlvels conslderadas
lsoladamenLe. Mas o slnal dos produLos dos desvlos depender dos slnals dos desvlos Lomados
varlvel a varlvel, e alguns lndlvlduos Lero seus produLos com slnals poslLlvos (caso seus
desvlos em relao a medla de cada varlvel forem de mesmo slnal, lsLo e, ambos poslLlvos ou
ambos negaLlvos), enquanLo ouLros Lero seus produLos com slnals negaLlvos (caso seus
desvlos em relao a medla de cada varlvel Llverem slnals dlsLlnLos, lsLo e, um deles com slnal
poslLlvo e o ouLro com slnal negaLlvo). Lm geral no haver equlllbrlo na amosLra enLre os
produLos dos desvlos lndlvlduals em relao a medla de cada varlvel.
A covarlncla enLre as duas varlvels e deflnlda pela medla desLes produLos. uLlllzaremos o
slmbolo s
X
para represenL-la. Mals formalmenLe, Lem-se:

17
s
X
=
_ (x
i
-X
)(
i
-
)
n
i=1
n
.

ara X e deflnldas como no Lxemplo 3, lsLo e, as renLabllldades dlrlas das aes L18C
e vALL em 2010 respecLlvamenLe, Lem-se que s
X
= u,uuu167. ara X e deflnldas como no
Lxemplo 4, lsLo e, a expecLaLlva de vlda ao nasclmenLo e a Laxa de morLalldade lnfanLll em
2009 dos palses represenLados na amosLra, respecLlvamenLe, s
X
= -26S,669114.
8epare que a esLruLura da frmula da covarlncla e semelhanLe a da varlncla,
apresenLada na equao 11 do CaplLulo 3. ue faLo, pode ser facllmenLe percebldo que a
covarlncla de uma varlvel com ela mesma e lgual a sua varlncla, lsLo e, s
XX
= s
X
2
, pols
nesLe caso os dols desvlos mulLlpllcados para produzlr a covarlncla so lguals, e seu produLo e
lgual ao seu quadrado. A medla dos produLos dos desvlos e, asslm, a medla dos quadrados dos
desvlos, produzlndo a varlncla da varlvel. Mals formalmenLe, Lem-se:

18
s
XX
=
_ (x
i
-X
)(x
i
-X
)
n
i=1
n
=
_ (x
i
-X
)
2 n
i=1
n
= s
X
2
.

A covarlncla no e afeLada por Lranslaes nos dados (soma dos dados com uma
consLanLe), pols como a medla e afeLada pela Lranslao, como evldenclado pela equao 3 do
CaplLulo 3, h um efelLo compensao, e os desvlos dos dados em relao a medla no so
afeLados pela Lranslao. Mas a covarlncla, asslm como a varlncla, depende da escala
uLlllzada para mensurar as varlvels, e se mulLlpllcarmos uma das varlvels por uma consLanLe,
sua covarlncla com qualquer ouLra varlvel ser Lambem mulLlpllcada pela consLanLe. Mals
formalmenLe, Lem-se:

19
s
w
=
_ (w
i
-w
)(
i
-
)
n
i=1
n
=
_ (kx
i
-kX
)(
i
-
)
n
i=1
n
=
_ k(x
i
-X
)(
i
-
)
n
i=1
n
=
k _ (x
i
-X
)(
i
-
)
n
i=1
n
=
ks
X
,

onde w = kX, como na equao 4 do CaplLulo 3.
A consequncla lmedlaLa desLa consLaLao e a dlflculdade de lnLerpreLao da
covarlncla, pols ela refleLe a escala uLlllzada para mensurar as duas varlvels. Como
comparar, por exemplo, os valores das covarlnclas enLre as varlvels do Lxemplo 3 e do
b)
16

Lxemplo 4, 0,000167 e -263,669114? Suas unldades de medldas so compleLamenLe dlsLlnLas,
a prlmelra delas expressa em quadrados de renLabllldades de LlLulos e a segunda em anos x
numero de crlanas morLas por 1.000 nascldas vlvas.
Anallsando a equao 19, Leremos, por exemplo, para s
X
> u e k > 1, s
w
> s
X
,
delxando Lransparecer que a varlabllldade con[unLa enLre w e e malor do que a
varlabllldade con[unLa enLre X e . Mas, de faLo, ao mulLlpllcarmos a varlvel X pela consLanLe
k, produzlndo a varlvel w, Lo somenLe aumenLamos arLlflclalmenLe a varlabllldade de X,
lndependenLemenLe da varlvel . uesLa forma, no parece naLural que a varlabllldade
con[unLa" Lenha se modlflcado. Se Llvessemos LraLado a Laxa de morLalldade na escala
numero de crlanas nascldas vlvas por 100 nascldas vlvas, por exemplo, Lerlamos a covarlncla
lgual a -26,366911, ou se[a, 10 vezes menor do que -263,669114. L no Lerla sldo a relao
enLre a expecLaLlva de vlda e a Laxa de morLalldade que enfraquecera...
uepreende-se, porLanLo, que a covarlncla enLre duas varlvels permlLe comparaes
adequadas quando LraLamos con[unLos de varlvels medldas nas mesmas escalas, mas como
medlda geral, ela delxa um LanLo a dese[ar. C coeflclenLe de correlao, apresenLado na
prxlma seo LenLa preencher esLa lacuna. Mas anLes vamos explorar um pouco mals as
proprledades da covarlncla.
uma de suas proprledades fundamenLals refere-se a relao enLre varlnclas e
covarlnclas quando se somam duas varlvels. Mals especlflcamenLe, a varlncla de uma soma
de varlvels e lgual a soma de suas varlnclas adlclonado do dobro de sua covarlncla. Cu,
mals formalmenLe:

20
s
X+
2
=
_ (x
i
+
i
-(X

+
))
2
n
i=1
n
=
_ (x
i
-X

+
i
-
)
2 n
i=1
n
=
_ ((x
i
-X
)
2
+2(x
i
-X
)(
i
-
)+(
i
-
)
2
)
n
i=1
n
=
_ (x
i
-X
)
2 n
i=1
n
+
_ 2(x
i
-X
)(
i
-
)
n
i=1
n
+
_ (
i
-
)
2 n
i=1
n
= s
X
2
+2s
X
+s

2
.

Como nossos Lxemplo 3 e Lxemplo 4 evldenclaram, a covarlncla pode assumlr valores
poslLlvos ou negaLlvos, dependendo do Llpo de relao exlsLenLe enLre as varlvels. A relao
enLre as varlvels do Lxemplo 3, por exemplo, e uma relao dlreLa (aumenLos de valor em
uma delas so acompanhados de aumenLos de valor na ouLra), conforme [ havlamos
percebldo pelo dlagrama de dlsperso apresenLado na llgura 6. Sua covarlncla e, pols,
poslLlva. ! a relao enLre as varlvels do Lxemplo 4 e uma relao lnversa (aumenLos de valor
em uma varlvel so acompanhados por redues de valor na ouLra), Lambem [ perceblda
pelo dlagrama de dlsperso correspondenLe, apresenLado na llgura 6. Sua covarlncla e, pols,
negaLlva. Mas, o que dlzer dos valores numerlcos das covarlnclas?
ode-se demonLrar que o valor absoluLo da covarlncla enLre duas varlvels e llmlLado
pelo produLo dos desvlos-padres de cada uma das varlvels conslderadas. Mals formalmenLe,
Lem-se que:

21
s
X
2
= [
_ (x
i
-X
)(
i
-
)
n
i=1
n

2
=
(_ (x
i
-X
)(
i
-
)
n
i=1
)
2
n
2

(_ (x
i
-X
)
2 n
i=1
)(_ (
i
-
)
2 n
i=1
)
n
2
=
_ (x
i
-X
)
2 n
i=1
n
_ (
i
-
)
2 n
i=1
n
= s
X
2
s

2
.

LnLo,

22
|s
X
| = s
X
2
2
s
X
2
s

2
2
= s
X
s

.

17

A deslgualdade na expresso 22 decorre do faLo de que para qualsquer valores o

e b

, com
i = 1, ., n, Lem-se que:

23
(_ o

n
=1
)
2
(_ o

2 n
=1
)(_ b

2 n
=1
)!

pols,

24
(_ o

n
=1
)
2
= (_ o

n
=1
)(_ o

n
=1
) = _ _ o

o
]
b
]
n
=1
n
]=1
_ _ o

b
]
b
]
n
=1
n
]=1
=
_ _ o

2
b
]
2 n
=1
n
]=1
= (_ o

2 n
=1
)(_ b

2 n
=1
).

A deslgualdade na expresso 24 decorre de:

2S
_ _ o

b
]
b
]
n
=1
n
]=1
-_ _ o

o
]
b
]
n
=1
n
]=1
= _ _ (o

b
]
b
]
-o

o
]
b
]
)
n
=1
=
n
]=1
1
2
_ _ 2(o

b
]
b
]
-o

o
]
b
]
)
n
=1
n
]=1
=
1
2
_ _ (o

b
]
b
]
+o
]
o
]
b

-2o

o
]
b
]
)
n
=1
n
]=1
=
1
2
_ _ (o

b
]
-o
]
b

)
2
n
=1
n
]=1
u,

pols e uma soma de quadrados.
A equao 23 e conheclda como deslgualdade de Cauchy, em homenagem ao maLemLlco
francs AugusLln-Louls Cauchy (1789-1837) (ve[a a llgura 11 a segulr), que apresenLou
plonelramenLe sua prova formal (Cauchy, 1821, p.373).


I|gura 11: August|n-Lou|s Cauchy (1789-18S7)
Ionte: http:]]www.york.ac.uk]depts]maths]h|ststat]peop|e]cauchy.g|f. Acessado em 7]12]2011

uepreende-se, pols, da equao 22, que a covarlncla enLre duas varlvels Lem dols
llmlLes, um, negaLlvo, ouLro poslLlvo, slmeLrlcamenLe slLuados em Lorno de zero, cu[os valores
absoluLos colncldem com o valor do produLo dos desvlos-padres das varlvels. Mals
formalmenLe,

26
-s
X
s

s
X
s
X
s

.

Cuando esLes llmlLes so aLlngldos? ode-se demosLrar que varlvels llnearmenLe
dependenLes possuem covarlnclas slLuadas em seus llmlLes, lsLo e s
X
= _s
X
s

, pols, se
Lomarmos = o1
n
+bX (dependncla llnear), Lem-se:

18

27
s
X
=
_ (x
i
-X
)(
i
-
)
n
i=1
n
=
_ (x
i
-X
)(u+bx
i
-(u+bX)

)
n
i=1
n
=
_ (x
i
-X
)(u+bx
i
-(u+bX

))
n
i=1
n
=
_ b(x
i
-X
)(x
i
-X
)
n
i=1
n
=
b _ (x
i
-X
)
2 n
i=1
n
= bs
X
2
= s
X
bs
X
= _s
X
s

,

pols s

= |b|s
X
. C slnal da covarlncla ser dado pelo slnal de b.
A reclproca Lambem e verdadelra, lsLo e, se a covarlncla enLre duas varlvels for lgual ao
produLo de seus desvlos-padres, a menos de seu slnal, enLo as duas varlvels so
dependenLes llnearmenLe. lsLo e, se s
X
= _s
X
s

, enLo exlsLem duas consLanLes, o e b, no


ambas nulas (lsLo e com o = u ou b = u), Lals que oX +b = k1
n
, onde k e uma consLanLe.
lnLulLlvamenLe, lsLo slgnlflca que as varlabllldades das duas varlvels no so lndependenLes,
pols as varlvels esLo presas uma a ouLra, pela equao llnear. Se o = u, Lem-se que
X =
k
u
1
n
-
b
u
. Se b = u, Lem-se que =
k
b
1
n
-
u
b
X. Lm ouLras palavras, a varlvel X pode
ser obLlda a parLlr da varlvel por uma mudana de escala e uma Lranslao, ou a varlvel
pode ser obLlda a parLlr da varlvel X por uma mudana de escala e uma Lranslao. Cu se[a,
as duas varlvels podem ser lnLerpreLadas como duas represenLaes dlsLlnLas de um mesmo
fenmeno. Suas varlabllldades, embora capLuradas lndependenLemenLe e paream dlsLlnLas,
represenLam, de faLo, a mesma colsa. CbvlamenLe, se LanLo o = u como b = u, as duas
observaes so vlldas.
ara evldenclar a proprledade, consldere duas varlvels, X e Lals que s
X
= _s
X
s

.
odemos supor, sem perda de generalldade, que s
X
= u, pols se s
X
= u, X e uma consLanLe
(uma no varlvel"), s
X
= u e a slLuao e anmala, sem lnLeresse (mas mesmo nesLe caso,
Lomando-se qualquer valor dlsLlnLo de zero para o, e Lomando b = u, Lem-se que oX +b =
k1
n
, e as duas varlvels so llnearmenLe dependenLes). Com s
X
= u, consldere a composlo
de varlvels w =
s
XY
s
X
2
X -. 1em-se que:

28
s
w
2
= [
s
XY
s
X
2

2
s
X
2
+2
s
XY
s
X
2
(-1)s
X
+s

2
=
s
XY
2
s
X
2
-2
s
XY
2
s
X
2
+s

2
= s

2
-
s
XY
2
s
X
2
=
s
X
2
s
Y
2
-s
XY
2
s
X
2
= u,

pols s
X
= _s
X
s

(e enLo s
X
2
= s
X
2
s

2
).
3
Mas se s
w
2
= u, w e uma consLanLe, ou se[a,
s
XY
s
X
2
X - = k1
n
, e as varlvels X e so dependenLes llnearmenLe, como se querla
demonsLrar.
So esLas duas proprledades que sero exploradas na deflnlo do coeflclenLe de
correlao, oferecendo um poderoso lnsLrumenLo de lnLerpreLao da relao llnear enLre
duas varlvels, como se ver na prxlma seo. Mas anLes de prossegulrmos vamos
desenvolver a expresso da covarlncla dada pela equao 17, como flzemos com a frmula da
varlncla, desenvolvendo uma expresso alLernaLlva:

29
s
X
=
_ (x
i
-X
)(
i
-
)
n
i=1
n
=
_ (x
i

i
-X

i
-x
i

+X

)
n
i=1
n
=
_ x
i

i
n
i=1
-X
_
i
n
i=1
-
_ x
i
n
i=1
+_ X

n
i=1
n
=
_ x
i

i
n
i=1
-X
(n
)-
(nX
)+nX

n
=
_ x
i

i
n
i=1
-nX

n
=
_ x
i

i
n
i=1
n
-X

.

Cu se[a, num [ogo de palavras, a covarlncla enLre dols con[unLos de dados e a medla de seus
produLos menos o produLo de suas medlas.

3
noLe Lambem a uLlllzao das proprledades enuncladas pela equao 12 do CaplLulo 3, asslm
como das equaes 19 e 20.
19

7)$:,(,$*+$ '$ ()00$%";6)
C coeflclenLe de correlao enLre duas varlvels, dlgamos X e , slmbollzado por r
X
, e
deflnldo pela razo enLre sua covarlncla e o produLo dos desvlos-padres de cada uma das
varlvels. Mals formalmenLe,

30
r
X
=
s
XY
s
X
s
Y
, desde que s
X
= u e s

= u.

C coeflclenLe e adlmenslonal, no sendo afeLado por mudanas de escala nas varlvels,
nem por Lranslaes nos dados. ara os dados do Lxemplo 3, r = u,S1, e para os dados do
Lxemplo 4, r = -u,9S.
C coeflclenLe e mulLas vezes chamado de correlao de earson, ou r de earson, em
homenagem ao seu crlador, o esLaLlsLlco lngls karl earson (1837-1936) (ve[a a llgura 12 a
segulr).


I|gura 12: kar| earson (18S7-1936)
Ionte: http:]]en.w|k|ped|a.org]w|k|]kar|_earson acessado em 2S]10]2011

C coeflclenLe mede o grau de dependncla llnear enLre duas varlvels, Lomando valores
enLre -1 e +1, decorrncla dlreLa da equao 26. valores negaLlvos lndlcam uma relao
lnversa enLre as varlvels, como a capLurada pelo Lxemplo 4 (aumenLos de valor em uma
varlvel so acompanhados por redues de valor na ouLra) e valores poslLlvos lndlcam uma
relao dlreLa enLre as varlvels (aumenLos de valor em uma delas so acompanhados de
aumenLos de valor na ouLra).
Mas, ressalLe-se, o coeflclenLe mede Lo somenLe o grau de dependncla llnear enLre duas
varlvels. Se duas varlvels so dependenLes, mas no llnearmenLe, o coeflclenLe no
consegulr capLurar Lal dependncla, como se depreende do exemplo a segulr.
9:,;#'( ?
Consldere duas varlvels, X e , cu[os dados so apresenLados na 1abela 7 a segulr.

su[e|to k
1 -27 9
2 -8 4
3 -1 1
4 0 0
S 1 1
c)
20

6 8 4
7 27 9
1abe|a 7: Va|ores de duas var|ve|s X e Y com dependnc|a no ||near para uma amostra de 7 |nd|v|duos
Ionte: e|aborado pe|o autor

A vlsuallzao da varlabllldade con[unLa das duas varlvels e apresenLada no dlagrama
de dlsperso da llgura 13 a segulr.


I|gura 13: D|agrama de d|sperso das var|ve|s da 1abe|a 7
Ionte: e|aborado pe|o autor

C dlagrama de dlsperso revela nlLldamenLe uma relao enLre as varlvels, embora no
llnear. C coeflclenLe de correlao e dado por r
X
= u, ou se[a, o coeflclenLe no
consegue capLurar a relao exlsLenLe enLre as varlvels, pols esLa no e llnear.


Asslm, mulLo culdado deve ser Lomado quando se lnLerpreLam relaes enLre varlvels.
Cuando usamos o coeflclenLe de correlao de earson (e quase sempre o usamos) sempre
esLaremos medlndo relaes llneares. Cuando o coeflclenLe e zero, ou prxlmo de zero, no se
pode aflrmar que no h relao enLre as varlvels. odemos, slm, aflrmar que no h relao
llnear enLre as varlvels. P Loda uma dlferena... A llgura 14 a segulr llusLra o concelLo.


I|gura 14: D|versas formas de d|agramas de d|sperso e respect|vos coef|c|entes de corre|ao de earson
Ionte: http:]]en.w|k|ped|a.org]w|k|]earson_product-moment_corre|at|on_coeff|c|ent acessado em
26]10]2011

Cbserve que o coeflclenLe de correlao refleLe a qualldade e dlreo de uma relao
llnear (llnha superlor na llgura 14), mas no refleLe a lncllnao da reLa que caracLerlza Lal
relao (llnha medla na llgura 14), nem Lampouco relaes no llneares (llnha lnferlor na
llgura 14). A relao represenLada no cenLro da llgura 14 e llnear e Lem lncllnao nula, mas
nesLe caso o coeflclenLe de correlao no e deflnldo, pols a varlncla da varlvel represenLada
no elxo verLlcal e zero.
21

C coeflclenLe de correlao de earson e mulLas vezes apresenLado em frmulas
alLernaLlvas, Lodas equlvalenLes enLre sl, obvlamenLe. Asslm, Lem-se que:

31
r
X
=
s
XY
s
X
s
Y
=
_ (x
i
-X

)(j
i
-Y

)
n
i=1
n
_
_ (x
i
-X

)
2
n
i=1
n
_
_ (j
i
-Y

)
2
n
i=1
n
=
_ (x
i
-X
)(
i
-
)
n
i=1
__ (x
i
-X
)
2 n
i=1
__ (
i
-
)
2 n
i=1
.

CuLra frmula alLernaLlva e dada por:

32
r
X
=
s
XY
s
X
s
Y
=
_ (x
i
-X

)(j
i
-Y

)
n
i=1
n
s
X
s
Y
=
_ _
x
i
-X

s
X
]_
j
i
-Y

s
Y
]
n
i=1
n
,

evldenclando que o coeflclenLe de correlao enLre duas varlvels e lgual a covarlncla de suas
varlvels padronlzadas. Alnda ouLra frmula decorre da equao 14 do CaplLulo 3 e da
equao 29:

33
r
X
=
s
XY
s
X
s
Y
=
_ x
i
n
i=1
j
i
n
-X

_
_ x
i
2 n
i=1
n
-X

2_
_ j
i
2 n
i=1
n
-

2
=
_ x
i
n
i=1
j
i
-nX

n
__ x
i
2 n
i=1
-nX
2
__ j
i
2 n
i=1
-nY
2
n
=
_ x
i
n
i=1

i
-nX

__ x
i
2 n
i=1
-nX

2
__
i
2 n
i=1
-n

2
.

<$-0$226) %,*$"0 2,53%$2
nossos comenLrlos a respelLo da llgura 14 flzeram meno que o coeflclenLe de
correlao de earson refleLe a qualldade e dlreo de uma relao llnear enLre duas varlvels,
mas no refleLe a lncllnao da reLa que caracLerlza Lal relao. A deLermlnao da reLa que
caracLerlza a relao e obLlda aLraves do procedlmenLo chamado de regresso llnear slmples,
cu[as ldelas bslcas foram desenvolvldas pelo esLaLlsLlco lngls lrancls CalLon (1822-1911)
(ve[a a llgura 13 a segulr).

I|gura 1S: Iranc|s Ga|ton (1822-1911)
Ionte: http:]]ga|ton.org acessado em 26]10]2011

CalLon, ao esLudar a heredlLarledade, relaclonando medldas Lomadas em geraes
sucesslvas, prlmelro com experlmenLaes com ervllhas, mensurando seus pesos e dlmeLros
(CalLon, 1877), e mals Larde com dados anLropomeLrlcos, mals parLlcularmenLe esLaLuras
(CalLon 1886), cunhou o Lermo Lel de 8egresso a Medla para expressar como as
caracLerlsLlcas geneLlcas das pessoas so LransmlLldas de gerao em gerao (pals para fllhos,
d)
22

neLos, blsneLos, eLc.) em propores decrescenLes, aLe no mals poderem ser dlsLlnguldas de
caracLerlsLlcas Lomadas ao acaso da populao de referncla.

Conclulu-se desLes experlmenLos que os descendenLes no Lendlam a repeLlr o
Lamanho de suas semenLes geradoras, mas sempre mals medlocres do que
elas - sendo menores do que suas geradoras, se as geradoras eram grandes,
sendo malores do que as geradoras, se as geradoras eram mulLo pequenas.
(CalLon, 1886, p. 246).

C resulLado claramenLe comprovou a 8egresso, o desvlo medlo dos
descendenLes era apenas um Lero do de suas geradoras, e os experlmenLos
Lodos converglram. A frmula que expressa a descendncla de uma gerao de
pessoas para a prxlma, mosLrou que as geraes serlam ldnLlcas se esLe Llpo
de regresso fosse permlLldo. (CalLon, 1908, p. 301)

A anllse de regresso llnear e uma ferramenLa fundamenLal em anllse de dados,
servlndo como referncla para vrlas ouLras Lecnlcas. 1raLa-se do esLudo da expllcao da
varlabllldade de uma varlvel (chamada dependenLe) pelas varlabllldades de ouLras varlvels
(chamadas lndependenLes). A nomenclaLura alnda preserva os Lermos do lnlclo do
desenvolvlmenLo da Lecnlca, que Lraem o poslclonamenLo eplsLemolglco da epoca,
lmpregnado de ldelas deLermlnlsLas. ueve ser observado, enLreLanLo, que o concelLo de
expllcao ou de dependncla e meramenLe lnformaclonal, no consLlLulndo prova lrrefuLvel
de relao de causa e efelLo enLre os fenmenos mensurados. Apenas processam-se dados a
respelLo de uma e de ouLra varlvel.
Cs ob[eLlvos da anllse compreendem, em geral:
deLermlnao da forma da relao enLre as varlvels (uma equao maLemLlca),
verlflcao de hlpLeses deduzldas de alguma Leorla anallsada,
prevlso de valores para a varlvel dependenLe a parLlr das varlvels
lndependenLes, reallzando slmulaes.
nesLa seo LraLaremos apenas do caso de regresso llnear slmples, ou se[a, buscando
uma equao maLemLlca para expressar a relao enLre duas varlvels, denoLadas
generlcamenLe por X (varlvel lndependenLe) e (varlvel dependenLe). Mas o modelo se
generallza facllmenLe para um numero malor de varlvels lndependenLes.
A equao de regresso llnear slmples Loma a forma:

34
= o1
n
+bX.

Cu alLernaLlvamenLe, conslderando cada observao lndlvldualmenLe:

3S
y

= o +bx

, para i = 1, ., n.

A consLanLe o e chamada de coeflclenLe llnear, ou Lermo lndependenLe, e a consLanLe b e
chamada de coeflclenLe angular. CeomeLrlcamenLe, o valor de o represenLa o ponLo em que a
reLa de regresso lnLercepLa o elxo verLlcal em nosso grflco carLeslano de elxos coordenados,
pols, segundo a equao 33, quando x = u, y = o. ! o valor de b relaclona-se com o ngulo
formado pela reLa de regresso com o elxo horlzonLal da reLa, sendo lgual a sua LangenLe
LrlgonomeLrlca.
Lm um senLldo emplrlco, a relao raramenLe e exaLa, LraLando-se em geral de uma
aproxlmao da realldade, em que ouLras varlvels de lmporLncla menor Lalvez Lenham sldo
omlLldas. A equao, porLanLo, merece ser escrlLa como:
23


36
y

= o +bx

+e

, para i = 1, ., n,

onde e

represenLa um Lermo de erro assoclado a i-eslma observao. Lm Lermos maLrlclals,


Lem-se:

37
= o1
n
+bX +E,

onde E represenLa o veLor de erros.
=2+,5";6) ')2 ()$:,(,$*+$2 (0,+>0,) '$ 5?*,5)2 @A"'0"')2
C problema fundamenLal da anllse de regresso slmples conslsLe em esLlmar, a parLlr de
observaes emplrlcas, os valores dos coeflclenLes o e b.
Se a relao de dependncla enLre as varlvels fosse exaLa, como na equao 34, Lodas as
observaes se allnharlam perfelLamenLe, como llusLrado na llgura 16 a segulr.


I|gura 16: Dependnc|a ||near exata entre duas var|ve|s
Ionte: e|aborado pe|o autor

nesLe caso e

= u para i = 1, ., n (ou se[a, E =


n
)
6
, e as esLlmaLlvas mals adequadas (e
bvlas) para o e b serlam, respecLlvamenLe, a ordenada na orlgem da reLa e a LangenLe
LrlgonomeLrlca do ngulo da reLa com o elxo horlzonLal. nesLe caso o coeflclenLe de correlao
de earson enLre as duas varlvels serla lgual a 1, como llusLrado na llgura 14, em seu canLo
superlor esquerdo e na esquerda de sua llnha cenLral. ela equao 27, Lerlamos s
X
= s
X
s

, e
enLo r
X
=
s
XY
s
X
s
Y
= 1.
na prLlca emplrlca, raramenLe observa-se uma relao Lo perfelLa, de modo que em
geral as observaes no esLaro perfelLamenLe allnhadas, mas formaro uma nuvem de
ponLos, como llusLrado na llgura 6 e na llgura 8. L convenlenLe, pols separarmos os valores
das observaes do veLor em duas componenLes, uma, exaLa, dada pela equao 34, e
ouLra, varlvel, dada pelo veLor no nulo E. A parLe exaLa receber o nome de esLlmaLlva de ,
a parLlr da equao 34, sendo slmbollzada por
`
. nesLes Lermos, a equao 37 pode ser
reescrlLa como:

38
=
`
+E.

Lm Lermos das observaes lndlvlduals, Lerlamos, enLo:

6

n
represenLa o veLor coluna de dlmenso n cu[os elemenLos so Lodos nulos.
e)
24


39
y

= o +bx

+e

= y +e

, para i = 1, ., n.

Cu alnda, enfaLlzando os Lermos de erros lndlvlduals:

40
e

= y

-y = y

-(o +bx

) = y

-o -bx

, para i = 1, ., n.

A llgura 17 a segulr llusLra o concelLo, represenLando a relao exlsLenLe enLre as
observaes.


I|gura 17: Dependnc|a ||near no exata entre duas var|ve|s
Ionte: e|aborado pe|o autor

nosso problema e aLrlbulr valores para o e b de modo que a reLa Lerlca se a[usLe aos
ponLos (x

, y

) da melhor forma posslvel. 8epare que cada par de coeflclenLes o e b deLermlna


uma reLa em parLlcular. varlando, alnda que levemenLe, qualquer desLes valores, a reLa se
modlflcar. or exemplo, aumenLando ou dlmlnulndo o valor de o (seu coeflclenLe llnear), a
reLa sublr ou descer verLlcalmenLe, correspondendo a uma Lranslao no veLor
`
. Mas, se
varlarmos o valor de b (seu coeflclenLe angular), a reLa modlflcar sua lncllnao em relao ao
elxo horlzonLal, pols o ngulo formado enLre a reLa e esLe elxo aumenLar ou dlmlnulr,
conforme as modlflcaes Lenham sldo de aumenLo ou dlmlnulo do valor de b,
correspondendo a uma mudana de escala no veLor
`
. Mas a maLrlz de dados, lsLo e, os pares
ordenados de valores observados, (x

, y

), no se modlflcam. ode mulLo bem aconLecer de o


valor de o ser Lo pequeno (ou Lo grande) que a correspondenLe reLa se descole
compleLamenLe do con[unLo de dados, como llusLrado na llgura 18 a segulr.

I|gura 18: Desa[uste entre reta ter|ca e dados emp|r|cos coef|c|ente ||near excess|vamente ba|xo
Ionte: e|aborado pe|o autor

A llgura 18 apresenLa claramenLe uma reLa descolada da nuvem de ponLos, com
coeflclenLe llnear mulLo balxo. Cs erros Lendem, asslm, a ser poslLlvos em sua malorla (se no
em sua LoLalldade como na llgura 18), desLacando claramenLe o vles da reLa em relao aos
23

dados observados. Aflnal, espera-se um veLor de erros equlllbrado, alguns poslLlvos, ouLros
negaLlvos, mas com medla zero.
AdlclonalmenLe, pode aconLecer de o valor de b ser Lo pequeno (ou Lo grande) que a
correspondenLe reLa no se allnhe adequadamenLe com a nuvem de ponLos que represenLa o
con[unLo de dados, como llusLrado na llgura 19 a segulr, que apresenLa claramenLe uma reLa
desallnhada em relao a nuvem de ponLos, com coeflclenLe angular mulLo balxo.


I|gura 19: Desa[uste entre reta ter|ca e dados emp|r|cos coef|c|ente angu|ar excess|vamente ba|xo
Ionte: e|aborado pe|o autor

Asslm, denLre LanLas escolhas para o e b, qual serla a melhor escolha, qual serla a melhor
reLa para represenLar LeorlcamenLe o con[unLo de dados coleLados emplrlcamenLe? Lmbora
ha[a escolhas marcadamenLe lnadequadas, como llusLrado na llgura 17 e na llgura 18, lsLo
no slgnlflca que a escolha correLa se[a slmples, pols h vrlas escolhas que parecero
adequadas aos nossos olhos. Cbservando a llgura 17, percebe-se que uma boa reLa passarla
por denLro" da nuvem de ponLos, acarreLando erros LanLo poslLlvos como negaLlvos, de modo
equlllbrado. C crlLerlo de escolha dos coeflclenLes mals uLlllzado e o crlLerlo dos mlnlmos
quadrados, aLrlbuldo a Causs (ve[a a llgura 11 do CaplLulo 2), que o Lerla desenvolvldo no
conLexLo de avallao de erros de mensuraes asLronmlcas. Cuando CalLon desenvolveu
sua Lel de 8egresso a Medla, deve Ler-lhe parecldo lnLeressanLe uLlllzar a Lecnlca que [ havla
obLldo Lo bons resulLados em ouLros ramos do conheclmenLo. no conLexLo da anllse de
regresso slmples, o crlLerlo dos mlnlmos quadrados busca coeflclenLes o e b de modo a
mlnlmlzar a soma dos quadrados dos erros. Lm ouLras palavras, o crlLerlo busca mlnlmlzar a
varlncla do veLor de erros. Mals formalmenLe, segundo esLe crlLerlo, os coeflclenLes o e b
devero ser escolhldos de modo a mlnlmlzar a expresso:

41
s
L
2
=
_ (s
i
)
2 n
i=1
n
,

pols a medla dos erros e Lomada como zero, lsLo e, assume-se que E

= u.
Como n e flxo, dado exLernamenLe ao processo de escolha dos coeflclenLes o e b, o
processo de mlnlmlzao pode se llmlLar a mlnlmlzar o numerador da equao 39, dando
orlgem ao nome da Lecnlca, mlnlmlzao da soma dos quadrados dos erros. Cu se[a, a
expresso a ser mlnlmlzada passa a ser, enLo:

42
_ (e

)
2 n
=1
= _ (y

-y
i
)
2 n
=1
= _ (y

-o -bx

)
2 n
=1
.

8epare que a expresso a ser mlnlmlzada e uma funo de duas lncgnlLas", o e b,
dependendo Lambem dos valores emplrlcamenLe observados de n e dos pares ordenados
(x

, y

), para i = 1, ., n. C problema pode ser enLo maLemaLlcamenLe esLruLurado da


26

segulnLe forma generlca: flxados valores de n e dos pares ordenados (x

, y

), para i = 1, ., n,
quals so os valores de o e b que mlnlmlzam a expresso

43
(o, b) = _ (y

-o -bx

)
2 n
=1
.

1raLa-se, porLanLo, de um problema de mlnlmlzao de uma funo real (quadrLlca) de duas
varlvels reals.
7

ara deLermlnar o mlnlmo de uma funo quadrLlca de duas varlvels reals preclsamos
apenas deLermlnar quals os valores que anulam a prlmelra derlvada da funo em relao a
cada uma das varlvels. uerlvando-se, pols, a expresso 43 em relao a o e a b, enconLra-se,
respecLlvamenLe:

44
](u,b)
u
= _ (2(y

-o -bx

)(-1))
n
=1
= -2_ (y

-o -bx

)
n
=1
= -2(_ y

n
=1
-
_ o
n
=1
-_ bx

n
=1
) = -2(_ y

n
=1
-no -b _ x

n
=1
),

e

4S
](u,b)
b
= _ (2(y

-o -bx

)(-x

))
n
=1
= -2_ (y

-o -bx

)(x

)
n
=1
= -2(_ x

n
=1
-
_ ox

n
=1
-_ bx

2 n
=1
) = -2(_ x

n
=1
-o _ x

n
=1
-b _ x

2 n
=1
).

A busca pelos valores de o e b que anulam as prlmelras derlvadas Lorna-se asslm a busca
pela soluo do slsLema llnear de duas equaes a duas lncgnlLas dado por:

46
_
_ y

n
=1
-no -b _ x

n
=1
= u
_ x

n
=1
-o _ x

n
=1
-b _ x

2 n
=1
= u.


1al slsLema e equlvalenLe a:

47
_
no +b _ x

n
=1
= _ y

n
=1
o _ x

n
=1
+b _ x

2 n
=1
= _ x

n
=1
.


Cu, em Lermos maLrlclals:

48
_
n _ x

n
=1
_ x

n
=1
_ x

2 n
=1
_ j
o
b
[ = _
_ y

n
=1
_ x

n
=1
_!

A soluo da equao maLrlclal 48 e dada por:

49
j
o
b
[ = _
n _ x

n
=1
_ x

n
=1
_ x

2 n
=1
_
-1
_
_ y

n
=1
_ x

n
=1
_#


7
A expresso funo real de duas varlvels reals slgnlflca que o domlnlo da funo e o espao R
2
e
o ob[eLo e o espao R, dos numeros reals.
27

facllmenLe auLomaLlzvel em pacoLes compuLaclonals.
uma manelra equlvalenLe de apresenLar a equao maLrlclal 48 e a chamada forma normal
de mlnlmos quadrados. Consldere a maLrlz (n 2) x, obLlda pela [usLaposlo dos veLores 1
n

e o veLor de observaes da varlvel lndependenLe, X, lsLo e,

S0
x = _
1
.
1
x
1
.
x
n
_.

A maLrlz _
n _ x

n
=1
_ x

n
=1
_ x

2 n
=1
_ e lgual ao produLo x
T
x, e a maLrlz _
_ y

n
=1
_ x

n
=1
_ e lgual ao produLo
x
T
, de modo que a equao 48 e equlvalenLe a:

S1
x
T
xj
o
b
[ = x
T
,

chamada de forma normal. Sua soluo e:

S2
j
o
b
[ = (x
T
x)
-1
x
T
!

ara os dados apresenLados no Lxemplo 3, a equao que relaclona os reLornos
flnancelros das aes da vale e da eLro e iet
v
= u,uu12 +u,S168 iet
P
, onde iet
v
e iet
P

slmbollzam, respecLlvamenLe, os reLornos das aes da vale e da eLro no ano de 2010. ara
os dados apresenLados no Lxemplo 4, a equao que relaclona as varlvels anallsadas e
EvN = 78,79 -u,S2 TNI, onde EvN e TNI slmbollzam, respecLlvamenLe, a expecLaLlva de
vlda ao nasclmenLo e a Laxa de morLalldade lnfanLll dos palses anallsados. A llgura 20 e a
llgura 21 a segulr apresenLam os dados com as correspondenLes reLas de regresso.


I|gura 20: D|agrama de d|sperso das var|ve|s rentab|||dades d|r|as das aes L1kC e VALL em 2010 e
respect|va reta de regresso 247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011
28



I|gura 21: D|agrama de d|sperso das var|ve|s expectat|va de v|da ao nasc|mento (em anos) e taxa de
morta||dade |nfant|| (nmero de cr|anas mortas por 1.000 nasc|das v|vas) em 2009 e respect|va reta de regresso
17S pa|ses
Ionte: Wor|d 8ank, 2011

Cbserve como a reLa de regresso represenLa melhor os dados na llgura 21 do que na
llgura 20. Cs dados da llgura 21 parecem mals allnhados. lsLo [ havla sldo capLado pelos
respecLlvos coeflclenLes de correlao de earson, que valem -0,93 para os dados da llgura 21
e 0,31 para os dados da llgura 20.
ara a regresso llnear slmples, no e dlflcll resolver anallLlcamenLe a equao 32. 8epare
que o deLermlnanLe da maLrlz x
T
x e dado por:

S3
|x
T
x| = __
n _ x

n
=1
_ x

n
=1
_ x

2 n
=1
__ = n _ x

2 n
=1
-(_ x

n
=1
)
2
= ns
X
2
.

L sua lnversa e dada por:

S4
x
T
x
-1
= _
n _ x

n
=1
_ x

n
=1
_ x

2 n
=1
_
-1
=
1
ns
X
2
_
X

2
+s
X
2
-X

-X

1
_, se s
X
2
= u.

Se s
X
2
= u, a maLrlz x
T
x e slngular, de modo que ela no e lnverslvel e o slsLema de equaes
represenLado pela equao 31 e lndeLermlnado, havendo mulLlplas solues para o e b. 1raLa-
se de caso lrrelevanLe, de faLo, pols se s
X
2
= u, a varlvel X e uma consLanLe, lsLo e, e uma
no varlvel", e a regresso de em funo de X no faz l mulLo senLldo. usando a equao
34 na equao 32, Lem-se que:

SS
b =
1
ns
X
2
(-X

_ y

n
=1
+_ x

n
=1
) =
-X

+
_ x
i
j
i
n
i=1
n
s
X
2
=
s
XY
s
X
2
,

e

S6
o =
1
ns
X
2
((X

2
+s
X
2
) _ y

n
=1
-X

_ x

n
=1
) =
1
s
X
2
_(X

2
+s
X
2
)

-X

_ x
i

i
n
i=1
n
_ =
1
s
X
2
[X

+s
X
2

-X

_ x
i

i
n
i=1
n
=

+
X

-X

_ x
i
j
i
n
i=1
n
s
X
2
=

+X

-
_ x
i
j
i
n
i=1
n
s
X
2
=

-X

b.

29

usando a equao 30, a expresso 33 pode alnda ser desenvolvlda:

S7
b =
s
XY
s
X
2
=

XY
s
X
s
Y
s
X
2
= r
X
s
Y
s
X
,

revelando a relao enLre o coeflclenLe de correlao de earson e a lncllnao da reLa de
regresso, lnLermedlada pela razo enLre os desvlos-padres de e de X. ara dados
padronlzados (lsLo e com medlas nulas e desvlos-padres lguals a unldade), porLanLo, a reLa de
regresso passa pela orlgem com lncllnao lgual ao coeflclenLe de correlao de earson, lsLo
e, o = u e b = r
X
.
7)$:,(,$*+$ '$ '$+$05,*";6)
uma proprledade lnLeressanLe do processo de esLlmao de coeflclenLes por mlnlmos
quadrados e a decomposlo da soma dos quadrados dos desvlos de em Lorno de sua medla

, ou se[a o numerador de sua varlncla, em duas parcelas, como demonsLrado a segulr. 1em-
se que:

S8
_ (y

)
2 n
=1
= _ (y

+y

-y

)
2 n
=1
= _ ((y

-y

) +(y

))
2
n
=1
= _ (y

-
n
=1
y

)
2
+2_ (y

-y

)(y

)
n
=1
+_ (y

)
2 n
=1
= _ (y

)
2 n
=1
+_ (y

-y

)
2 n
=1
,

pols

_ (y

-y

)(y

)
n
=1
= _ (y

-o -bx

)(o +bx

)
n
=1
= _ (y

-(

-bX

) -
n
=1
bx

)(

-bX

+bx

) = b _ (y

-b(x

-X

))(x

-X

)
n
=1
= b(_ (x

-X

)(y

-
n
=1

) -b _ (x

-X

)
2 n
=1
) = b(ns
X
-bns
X
2
) = nb [s
X
-
s
XY
s
X
2
s
X
2
= nb(s
X
-s
X
) = u!

A equao 38 evldencla que a soma dos quadrados dos desvlos de em Lorno de sua
medla e lgual a soma dos quadrados dos desvlos dos valores prevlsLos pela reLa de regresso
em Lorno da medla de adlclonado a soma dos quadrados dos erros, pols _ (y

-y

)
2 n
=1
=
_ e

2 n
=1
, sendo frequenLemenLe escrlLa como:

S9
1 =
_ (
i
-
)
2 n
i=1
_ (
i
-
)
2 n
i=1
+
_ s
i
2 n
i=1
_ (
i
-
)
2 n
i=1
.

Colocada desLa manelra, a equao evldencla que uma frao da varlabllldade de e
expllcada pela varlabllldade de uma funo llnear de X (de acordo com a reLa de regresso) e
ouLra frao, no expllcada pela funo llnear de X, e aLrlbulda a erros do modelo. As duas
fraes so frequenLemenLe expressas em percenLuals. A parcela expllcada pelo modelo e
denomlnada de coeflclenLe de deLermlnao do modelo, lsLo e:

60
coeficiente ue ueteiminao =
_ (
i
-
)
2 n
i=1
_ (
i
-
)
2 n
i=1
.

C coeflclenLe de deLermlnao relaclona-se com o coeflclenLe de correlao de earson,
pols,

f)
30

61
_ (
i
-
)
2 n
i=1
_ (
i
-
)
2 n
i=1
=
_ (u+bx
i
-
)
2 n
i=1
ns
Y
2
=
_ (

-bX

+bx
i
-
)
2 n
i=1
ns
Y
2
=
b
2
_ (x
i
-X
)
2 n
i=1
ns
Y
2
=
b
2
ns
X
2
ns
Y
2
=
[r
X
s
Y
s
X

2
s
X
2
s
Y
2
= r
X
2
.

Cu se[a, o coeflclenLe de deLermlnao e o quadrado do coeflclenLe de correlao de earson.
ode-se agora apreclar um pouco melhor a relao exlsLenLe enLre as varlvels do Lxemplo
4 e do Lxemplo 3. ara os dados de renLabllldade das aes (Lxemplo 3), Lem-se r
2
= u,26, e
para os dados demogrflcos dos palses (Lxemplo 4), Lem-se r
2
= u,87. Cu se[a, apenas 26 da
varlabllldade da renLabllldade dlrla da ao da vale e expllcada pela varlabllldade da
renLabllldade dlrla da ao da eLrobrs no ao de 2010, segundo o modelo llnear, enquanLo
que 87 da varlabllldade da expecLaLlva de vlda ao nasclmenLo enLre os palses amosLrados em
2009 e expllcada pela varlabllldade da Laxa de morLalldade lnfanLll enLre os mesmos palses. C
modelo relaclonando as varlvels demogrflcas dos palses e mals conslsLenLe.
Mals uma vez e bom lembrar que no esLamos comprovando nenhuma relao de causa e
efelLo enLre as varlvels anallsadas. Apenas esLamos processando dados coleLados de uma
forma organlzada, que permlLem relaclonar (lnformaclonalmenLe) uma varlvel a ouLra. Asslm,
se Llvessemos apenas a lnformao de que a Laxa de morLalldade lnfanLll ao nasclmenLo de um
deLermlnado pals e de 40 por 1.000 nascldos vlvos, esLlmarlamos sua expecLaLlva de vlda ao
nasclmenLo em 63,99 anos (ou se[a, 78,79 -u,S2 4u). Causa e efelLo e ouLra colsa...
BA+0"2 30)30,$'"'$2
Alem das deflnles e equaes [ apresenLadas, h ouLras proprledades da reLa de
regresso dlgnas de noLa, que passamos a enumerar. ConsLaLa-se que a reLa passa no cenLro
geomeLrlco dos dados, lsLo e, passa no ponLo de coordenadas (X

), pols, segundo a equao


61, o =

-bX

, e, porLanLo,

= o +bX

.
Cs reslduos, ou erros do modelo compensam-se arlLmeLlcamenLe, ou se[a, sua soma e
nula. ue faLo,

_ e

= _ (y

-y

)
n
=1
= _ (y

-o -bx

)
n
=1
= _ y

n
=1
-_ o
n
=1
-b _ x

n
=1
n
=1
= n

-
no -bnX

= n(

-o -bX

) = u.

A covarlncla enLre a varlvel X e o veLor de erros, E, e nula, pols:

s
XL
=
_ (x
i
-X
)(s
i
)
n
i=1
n
=
_ x
i
s
i
-X
_ c
i
n
i=1
n
i=1
n
=
_ x
i
(
i
-
i
)
n
i=1
n
=
_ x
i

i
n
i=1
-_ x
i
(u+bx
i
)
n
i=1
n
=
_ x
i

i
n
i=1
-_ x
i
(

-bX

+bx
i
)
n
i=1
n
=
_ x
i

i
n
i=1
-
_ x
i
n
i=1
+bX
_ x
i
n
i=1
-b_ x
i
2 n
i=1
n
=
_ x
i

i
n
i=1
-nX

+b(nX

2
-_ x
i
2 n
i=1
)
n
=
_ x
i

i
n
i=1
n
-X

-b [
_ x
i
2 n
i=1
n
-X

2
= s
X
-bs
X
2
= s
X
-
s
XY
s
X
2
s
X
2
= s
X
-s
X
= u.

C>0,$2 +$53)0",2
Se numa relao enLre duas varlvels meLrlcas uma delas referlr-se ao Lempo, a Lecnlca
recebe o nome parLlcular de anllse de serles Lemporals. C dlagrama de dlsperso Lransforma-
se, asslm, em um grflco de Lempo, em que o elxo horlzonLal e usado para represenLar a
varlvel Lempo, Lomada como varlvel lndependenLe da relao. C elxo verLlcal represenLa a
varlvel de lnLeresse, da qual se quer esLudar o comporLamenLo no Lempo. or exemplo, para
os preos de fechamenLo dlrlos das aes preferenclals nomlnaLlvas da eLrobrs no ano de
2010, Lem-se o grflco em llnha (serle Lemporal) apresenLado na llgura 22 a segulr.

g)
h)
31


I|gura 22: Grf|co em ||nha dos preos de fechamento d|r|os das aes preferenc|a|s nom|nat|vas da etrobrs
em 2010 247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011

1em-se asslm uma boa ldela da evoluo (passada) dos preos da ao no perlodo coberLo
pela amosLra. A evoluo da renLabllldade dlrla das aes (dados apresenLados no Cuadro 1)
pode ser observada na llgura 23 a segulr.


I|gura 23: Grf|co em ||nha das rentab|||dades d|r|as das aes preferenc|a|s nom|nat|vas da etrobrs em 2010
247 d|as te|s
Ionte: www.economat|ca.com acessado em 2S]2]2011

ercebe-se que as renLabllldades dlrlas das aes Llveram um comporLamenLo basLanLe
errLlco no ano de 2010, fluLuando em Lorno de zero (mals preclsamenLe -0,001 segundo a
1abela 3), o que e compaLlvel com a Leorla flnancelra, baseada em prlnclplos de equlllbrlo
econmlco e perfelo (lnformaclonal) dos mercados (8realey, Myers e Allen, 2008), conforme
[ sallenLado.
C LraLamenLo aprofundado do Lplco serles Lemporals foge ao escopo desLe llvro, mas
lnLroduz-se o assunLo no CaplLulo 10.
!"#$ &#'()&*($ 3'4(5#($
A relao enLre duas varlvels mensuradas ordlnalmenLe pode ser reallzada com a
uLlllzao de coeflclenLes de correlao ordlnals, como o coeflclenLe de correlao de
Spearman e o coeflclenLe de correlao de kendall. LnLreLanLo, a anllse Lambem e mulLas
vezes reallzada uLlllzando-se as Lecnlcas para anallsar varlvels caLegrlcas, com Labelas de
conLlngncla, mals populares e de malor apelo lnformaclonal, lgnorando, de cerLa forma, a
caracLerlsLlca ordlnal dos dados.
4
32

7)$:,(,$*+$ '$ ()00$%";6) '$ C3$"05"*
C coeflclenLe de correlao ordlnal enLre duas varlvels, dlgamos X e , denoLado por
r
S
X
, mas Lambem conhecldo pela leLra grega p (r), e chamado de coeflclenLe de correlao
por posLos de Spearman em homenagem ao seu crlador, o pslclogo lngls Charles Ldward
Spearman (1863-1943) (ve[a a llgura 24 a segulr).


I|gura 24: Char|es Ldward Spearman (1863-194S)
Ionte: http:]]www.york.ac.uk]depts]maths]h|ststat]peop|e]spearman.g|f acessado em 31]10]2011

Spearman (1904), em seus plonelros esLudos sobre a lnLellgncla humana, adapLou o
coeflclenLe de correlao de earson ao caso em que somenLe ordens enLre as mensuraes
fossem conslderadas, ou somenLe ordenaes enLre os ob[eLos esLlvessem dlsponlvels.

[.] Lodas as correlaes mals lmporLanLes uLlllzadas no presenLe Lrabalho
foram produzldas pelo melhor meLodo exlsLenLe aLualmenLe, o do momenLo-
produLo", como earson o chama, apenas que ao lnves de usar as reals
mensuraes obLldas pelos su[elLos de pesqulsa, empregaram-se numeros
denoLando os seus posLos relaLlvos. (Spearman, 1904, p.273)

Asslm, se duas mensuraes, embora dlsLlnLas, ordenam da mesma manelra um con[unLo
de ob[eLos (do menor ao malor, por exemplo), sua correlao de ordem deve ser lgual a 1. Cu,
dlzendo de ouLra manelra, se duas varlvels ordlnals esLo relaclonadas por uma funo
monoLnlca crescenLe,
8
enLo sua correlao de ordem deve ser lgual a 1. Se esLlverem
relaclonadas por uma funo monoLnlca decrescenLe, sua correlao de ordem deve ser lgual
a -1.
A frmula proposLa por Spearman (1904) e derlvada da frmula do coeflclenLe de
correlao de earson apllcada aos posLos ocupados pelas mensuraes quando ordenadas.
Cu se[a, subsLlLuem-se as medles obLldas por numeros correspondenLes aos seus posLos (ou
lugares) ocupados na ordenao: ao menor aLrlbul-se o numero 1, ao segundo, segulnLe na
ordenao, aLrlbul-se o numero 2, ao Lercelro, o numero 3, eLc. Mals formalmenLe, suponha
que para cada lndlvlduo i na amosLra (i = 1, ., n), r
X

e r

represenLem, respecLlvamenLe, os
numeros asslm aLrlbuldos aos posLos ocupados pelos valores x

e y

denLro do con[unLo de
valores dos veLores X e . 1m-se, asslm, dols novos veLores, que podemos roLular como R
X
e
R

, conLendo os posLos relaLlvos dos valores orlglnalmenLe enconLrados nos veLores X e .


$

Cu se[a,

8
uma funo monoLnlca crescenLe e qualquer funo que preserva a ordem enLre seus
argumenLos, lsLo e, (o) (b), se o b. uma funo monoLnlca decrescenLe e qualquer funo que
lnverLe a ordem enLre seus argumenLos, lsLo e, (o) (b), se o b.
9
Lm mulLas apllcaes, os posLos so deLermlnados dlreLamenLe a parLlr de percepes da
realldade, como quando se ordenam pessoas denLro de um grupo segundo uma deLermlnada
a)
33


62
R
X
= _
r
X
1
r
X
2
.
r
X
n
_, e R

= _
r

1
r

2
.
r

n
_,

e o coeflclenLe de correlao por posLos de Spearman pode ser deflnldo formalmenLe:

63
r
S
X
= r
R
X
R
Y
,

ou se[a, o coeflclenLe de correlao por posLos de Spearman enLre duas varlvels, X e , e
lgual ao coeflclenLe de correlao de earson enLre os posLos relaLlvos dos valores das duas
varlvels, R
X
e R

. usando a equao 33, Lem-se:



64
r
S
X
= r
R
X
R
Y
=
_
X
i

Y
i
n
i=1
-nR
X

R
Y

__
X
i
2 n
i=1
-nR
X

2
__
Y
i
2 n
i=1
-nR
Y

2
.

Como LanLo R
X
como R

conLm apenas os numeros lnLelros de 1 a n (no


necessarlamenLe em ordem), a frmula 64 pode ser slmpllflcada. ara lsLo, necesslLamos
expllclLar que:

6S
R
X

= R

=
_
n
i=1
n
=
(1+n)n
2
n
=
n+1
2
,

pela conheclda expresso da soma dos Lermos de uma progresso arlLmeLlca.
10
no Lo
obvlamenLe, Lem-se alnda:
11


66
_ r
X

2 n
=1
= _ r

2 n
=1
= _ i
2 n
=1
=
n(n+1)(2n+1)
6
.

uesenvolvendo os quadrados, Lem-se:

67
(r
X

-r

)
2
= r
X

2
-2r
X

+r

2
, para i = 1, ., n,


caracLerlsLlca de sua personalldade, por exemplo, no havendo, de faLo, um processo de mensurao
produzlndo os veLores X e . C procedlmenLo e o mesmo, [ que pressupe apenas o conheclmenLo dos
veLores R
X
e R

.
10
ulzem que Causs (ve[a a llgura 11 do CaplLulo 2) sacou" esLa frmula quando Llnha apenas 3
anos!
11
A frmula pode ser demonsLrada por lnduo. A frmula e cerLamenLe vllda para n = 1, pols
_ i
2
= 1
2
= 1
1
=1
, e
1(1+1)(21+1)
6
=
23
6
= 1. Agora suponha-se que se[a vllda para qualquer k 1, lsLo
e, _ i
2 k
=1
=
k(k+1)(2k+1)
6
. ode ser enLo demonsLrado que a frmula vale para k + 1, pols _ i
2 k+1
=1
=
_ i
2
+ (k + 1)
2 k
=1
=
k(k+1)(2k+1)
6
+ (k + 1)
2
=
k(k+1)(2k+1)+6(k+1)
2
6
=
(k+1)(k(2k+1)+6(k+1))
6
=
(k+1)(2k
2
+k+6k+6)
6
=
(k+1)(2k
2
+7k+6)
6
=
(k+1)(k+2)(2k+3)
6
=
(k+1)((k+1)+1)(2(k+1)+1)
6
. Se lsLo serve de
consolo, no h noLlclas de que Causs Lenha sacado" esLa em Lenra ldade!
34

e enLo, uLlllzando a noLao J

para represenLar a dlferena enLre os posLos da i-eslma


observao com respelLo as varlvels X e , ou se[a, J

= r
X

-r

, Lem-se:

68
_ r
X

n
=1
=
1
2
(_ r
X

2 n
=1
+_ r

2 n
=1
-_ J

2 n
=1
) =
n(n+1)(2n+1)
6
-
_ d
i
2 n
i=1
2
.

SubsLlLulndo as expresses 63, 66 e 68 em 64, Lem-se, flnalmenLe:

69
r
S
X
=
n(n+1)(2n+1)
6
-
_ d
i
2 n
i=1
2
-n
n+1
2
n+1
2
_
n(n+1)(2n+1)
6
-n[
n+1
2

2
_
n(n+1)(2n+1)
6
-n[
n+1
2

2
=
n(n+1)(2n+1)
6
-n[
n+1
2

2
-
_ d
i
2 n
i=1
2
n(n+1)(2n+1)
6
-n[
n+1
2

2
= 1 -
_ d
i
2 n
i=1
2
n(n+1)(2n+1)
6
-n[
n+1
2

2
= 1 -
_ d
i
2 n
i=1
n(n+1)(2n+1)
3
-
n(n+1)
2
2
= 1 -6
_ d
i
2 n
i=1
2n(n+1)(2n+1)-3n(n+1)
2
= 1 -
6
_ d
i
2 n
i=1
n(n+1)(4n+2-3(n+1))
= 1 -6
_ d
i
2 n
i=1
n(n+1)(n-1)
= 1 -6
_ d
i
2 n
i=1
n(n
2
-1)
.

A frmula 69 e de fcll apllcao, envolvendo apenas o clculo da soma dos quadrados das
dlferenas enLre os posLos de cada observao relaLlvamenLe a cada uma das varlvels. ueve
ser ressalLado, enLreLanLo, que a equao 69 e vllda apenas nos casos em que Lodos os
lndlvlduos possam ser ordenados expllclLamenLe com respelLo as duas varlvels, ou se[a,
quando h uma ordem esLrlLa e compleLa enLre os lndlvlduos, no havendo empaLes nas
ordenaes, pols a derlvao da frmula usou forLemenLe o faLo de LanLo R
X
como R

serem
consLlLuldos pelos numeros lnLelros de 1 a n. Lm ouLras palavras, x

= x
]
(asslm como y

= y
]
)
para qualsquer i e ], com i = 1, ., n e ] = 1, ., n, de modo que se Lenha ou r
X

> r
X
]
, ou
r
X

< r
X
]
(asslm como ou r

> r

]
, ou r

< r

]
).
uma aLeno especlal deve ser dada ao caso de haver empaLes enLre alguns ob[eLos, ou
se[a, quando dols ou mals ob[eLos no puderem ser dlsLlnguldos na ordem proposLa, o que no
e lncomum. nesLe caso, aLrlbul-se a Lodos os lndlvlduos empaLados, a medla dos numeros que
serlam aLrlbuldos caso eles no esLlvessem empaLados. or exemplo, se h dols ob[eLos
empaLados na quarLa poslo (do menor ao malor, por exemplo), aLrlbul-se a cada um deles o
numero 4,3, que e a medla enLre 4 e 3, numeros que serlam aLrlbuldos caso eles no
esLlvessem empaLados (um deles serla o quarLo e o ouLro serla o qulnLo colocado na
ordenao).
um exemplo a[uda a compreender o concelLo.
9:,;#'( @
uuas pergunLas formuladas de forma fechada em uma enqueLe com 411 lndlvlduos
referlam-se a sua escolarldade e ao seu cargo na organlzao. As resposLas, [
codlflcadas (escolarldade - 1: prlmrlo lncompleLo, 2: prlmrlo, 3: medlo, 4: superlor, 3:
ps-graduao lncompleLa, 6: ps-graduao, 9: sem resposLa, e cargo - 1:
admlnlsLrao, 2: gerncla medla, 3: assessorla/Lecnlco, 4: execuo, 9: sem resposLa)
so apresenLadas no Cuadro 2 a segulr.

6 3, 6 1, 3 2, 3 4, 3 3, 4 2, 6 3, 4 2, 3 2, 3 4, 4 2, 4 4, 4 4, 3 4, 6 1, 4 4, 6 1, 4 2, 4 2, 6 2,
3 3, 3 4, 3 4, 6 1, 4 2, 3 4, 3 3, 3 4, 2 4, 2 4, 3 4, 3 4, 6 1, 2 4, 4 4, 3 4, 3 2, 3 2, 4 3, 4 2,
4 2, 4 2, 3 3, 6 1, 3 4, 3 2, 2 3, 6 3, 3 3, 4 4, 4 2, 4 3, 3 4, 3 3, 3 4, 4 4, 3 1, 6 4, 3 1, 6 1,
33

2 4, 3 3, 3 2, 6 2, 6 1, 3 3, 2 2, 6 3, 3 2, 3 2, 3 2, 4 2, 3 4, 4 2, 4 1, 3 4, 4 2, 4 2, 3 3, 6 4,
2 2, 3 3, 3 4, 3 2, 6 3, 4 2, 6 1, 4 2, 6 2, 6 1, 6 1, 4 2, 4 3, 3 2, 4 1, 4 2, 3 4, 6 2, 4 2, 4 4,
6 3, 6 1, 4 4, 3 2, 3 4, 3 2, 3 3, 6 1, 4 2, 3 4, 6 3, 2 2, 3 2, 6 1, 4 2, 4 2, 6 1, 3 4, 3 1, 6 3,
6 1, 4 2, 3 4, 3 2, 6 3, 3 2, 3 3, 3 4, 2 2, 6 2, 6 1, 6 1, 3 2, 4 4, 4 3, 3 3, 4 3, 6 3, 6 3, 6 1,
4 1, 3 4, 4 2, 4 3, 6 3, 4 3, 6 3, 4 2, 6 4, 4 4, 3 4, 2 3, 2 4, 4 4, 3 1, 3 9, 6 1, 4 3, 6 1, 6 3,
6 3, 4 3, 6 3, 6 3, 6 3, 4 4, 6 3, 4 3, 4 3, 3 3, 4 3, 3 3, 4 2, 4 3, 4 4, 3 3, 4 3, 6 3, 4 3, 6 2,
6 3, 3 3, 4 4, 3 3, 6 3, 4 3, 6 3, 6 3, 6 3, 6 3, 6 3, 6 3, 4 3, 6 3, 6 1, 3 1, 4 9, 3 2, 4 3, 4 4,
6 3, 3 3, 4 3, 3 3, 4 2, 3 3, 4 3, 4 3, 6 2, 6 3, 3 9, 6 3, 6 3, 3 3, 4 3, 4 3, 3 4, 3 2, 6 2, 6 2,
3 3, 6 2, 3 3, 4 3, 6 3, 6 3, 4 1, 4 3, 4 4, 3 2, 3 3, 9 4, 4 3, 4 2, 4 3, 4 4, 6 4, 4 4, 4 2, 4 2,
6 2, 2 4, 2 4, 6 3, 3 3, 4 3, 3 3, 4 3, 4 2, 4 3, 4 3, 6 3, 4 3, 6 2, 4 3, 6 3, 3 3, 3 2, 3 3, 3 1,
4 3, 6 3, 6 2, 6 3, 3 4, 3 4, 6 1, 6 1, 6 3, 4 2, 3 4, 4 2, 4 4, 3 3, 6 2, 4 2, 4 2, 4 4, 2 4, 6 2,
2 2, 6 3, 3 2, 3 3, 6 3, 4 3, 6 3, 6 3, 4 1, 4 1, 4 3, 4 3, 6 1, 3 2, 2 2, 2 4, 4 4, 3 1, 4 2, 4 3,
4 2, 6 3, 3 2, 4 4, 2 3, 6 3, 4 2, 4 4, 3 1, 3 3, 3 2, 4 3, 6 3, 3 2, 6 3, 6 2, 4 2, 4 2, 4 3, 4 2,
4 2, 6 2, 3 3, 6 1, 3 3, 6 3, 4 2, 4 3, 6 3, 4 3, 6 2, 6 1, 6 1, 6 3, 6 3, 6 3, 6 3, 3 3, 6 3, 4 4,
3 2, 3 4, 3 4, 6 1, 3 4, 4 4, 3 2, 4 3, 4 2, 4 2, 4 4, 3 4, 4 1, 4 4, 4 2, 4 4, 6 4, 4 2, 4 3, 4 3,
4 4, 4 3, 3 3, 4 3, 3 2, 4 4, 4 3, 3 3, 3 4, 3 3, 3 4, 3 4, 3 2, 4 3, 6 4, 4 2, 3 1, 4 4, 6 3, 2 4,
3 2, 2 4, 6 3, 3 2, 4 2, 2 2, 3 2, 3 3, 3 2, 3 1, 6 1, 4 3, 6 4, 4 3, 4 1, 3 3, 3 4, 4 4, 4 3, 3 3,
3 1, 4 1, 4 3, 6 3, 4 2, 6 3, 6 3, 4 3, 3 2, 4 4, 4 4
uadro 2: Lsco|ar|dade (1: pr|mr|o |ncomp|eto, 2: pr|mr|o, 3: md|o, 4: super|or, S: ps-graduao |ncomp|eta,
6: ps-graduao, 9: sem resposta) e cargo (1: adm|n|strao, 2: gernc|a md|a, 3: assessor|a]tcn|co, 4:
execuo, 9: sem resposta) de 411 |nd|v|duos
Ionte: Arqu|vo pessoa| do autor

1m-se, pols, 411 pares ordenados de numeros, o prlmelro deles referlndo-se ao cdlgo
uLlllzado para classlflcar a escolarldade do lndlvlduo e o segundo com o cdlgo uLlllzado
para classlflcar o nlvel de seu cargo na organlzao. uma vlsuallzao con[unLa dos
dados vlldos e ofereclda na 1abela 8 a segulr.


Cargo
1oLal da llnha
1 2 3 4
Lscola-
rldade
2 0

7 3 11 21
3 7 29 30 34 100
4 9 30 34 34 147
3 4 6 11 2 23
6 30 18 61 7 116
1oLal da coluna 30 110 139 88 407
1abe|a 8: Lsco|ar|dade x cargo somente respostas v||das
Ionte: Arqu|vo pessoa| do autor

8epare que no h lndlvlduo com grau de escolarldade no exLremo lnferlor da
classlflcao, parecendo haver alguma relao enLre as varlvels, pols as malores
classlflcaes de escolarldade correspondem, em geral, malores classlflcaes na
varlvel cargo ocupado. ara calcular o coeflclenLe de correlao de Spearman para
esLes dados, e necessrlo prlmelro aLrlbulr numeros aos posLos de cada lndlvlduo em
cada uma das varlvels. Cbserve que h vrlos casos de empaLes na classlflcao, pols
407 lndlvlduos foram classlflcados em apenas 3 caLegorlas ordenadas para a varlvel
escolarldade e 4 caLegorlas para a varlvel cargo na organlzao, de modo que a
aLrlbulo de numeros aos posLos no e uma Larefa lmedlaLa.
CuanLo a varlvel escolarldade, repare que h 21 observaes com nlvel 2 (prlmrlo
compleLo), Lodas empaLadas na classlflcao mals balxa. LsLas ocuparlam os posLos 1 a
21 se no esLlvessem empaLadas. Asslm, o numero 11 deve ser aLrlbuldo ao posLo
36

ocupado por esLas 21 observaes [
1+21
2
. P 100 observaes com nlvel 3 (medlo),
Lodas empaLadas, com classlflcaes de 22 a 121 (21+1 a 21+100) se no esLlvessem
empaLadas. Asslm, o numero 71,3 deve ser aLrlbuldo ao posLo ocupado por esLas 100
observaes [
22+121
2
. P 147 observaes com nlvel 4 (superlor), Lodas empaLadas,
com classlflcaes de 122 a 268 (121+1 a 121+147) se no esLlvessem empaLadas.
Asslm, o numero 193 deve ser aLrlbuldo ao posLo ocupado por esLas 147 observaes
[
122+268
2
. P 23 observaes com nlvel 3 (ps-graduao lncompleLo), Lodas
empaLadas, com classlflcaes de 269 a 291 (268+1 a 268+23) se no esLlvessem
empaLadas. Asslm, o numero 280 deve ser aLrlbuldo ao posLo ocupado por esLas 100
observaes [
269+291
2
. or flm, h 116 observaes com nlvel 6 (ps-graduao
compleLo), Lodas empaLadas, com classlflcaes de 292 a 407 (291+1 a 291+116) se no
esLlvessem empaLadas. Asslm, o numero 349,3 deve ser aLrlbuldo ao posLo ocupado por
esLas 100 observaes [
292+407
2
.
L quanLo a varlvel cargo ocupado na organlzao, repare que h 88 observaes com
nlvel 4 (execuo), Lodas empaLadas na classlflcao mals balxa (a codlflcao orlglnal
classlflcou os cargos do mals elevado ao menos elevado). LsLas ocuparlam os posLos 1 a
88 se no esLlvessem empaLadas. Asslm, o numero 44,3 deve ser aLrlbuldo ao posLo
ocupado por esLas 88 observaes [
1+88
2
. P 139 observaes com nlvel 3
(assessorla/Lecnlco), Lodas empaLadas, com classlflcaes de 89 a 247 (88+1 a 88+139)
se no esLlvessem empaLadas. Asslm, o numero 168 deve ser aLrlbuldo ao posLo
ocupado por esLas 139 observaes [
89+247
2
. P 110 observaes com nlvel 2 (gerncla
medla), Lodas empaLadas, com classlflcaes de 248 a 337 (247+1 a 247+110) se no
esLlvessem empaLadas. Asslm, o numero 302,3 deve ser aLrlbuldo ao posLo ocupado por
esLas 110 observaes [
248+357
2
. or flm, h 30 observaes com nlvel 1
(admlnlsLrao), Lodas empaLadas, com classlflcaes de 338 a 407 (337+1 a 337+30) se
no esLlvessem empaLadas. Asslm, o numero 382,3 deve ser aLrlbuldo ao posLo ocupado
por esLas 30 observaes [
358+407
2
.
uma vez reallzadas esLas modlflcaes no arqulvo de dados, lsLo e subsLlLulndo-se os
cdlgos 2, 3, 4, 3 e 6 na varlvel escolarldade pelos numeros 11, 71,3, 193, 280 e 349,3
respecLlvamenLe e os cdlgos 4, 3, 2 e 1 na varlvel cargo pelos numeros 44,3, 168,
302,3 e 382,3 respecLlvamenLe, procede-se ao clculo do coeflclenLe de correlao de
Spearman conforme a equao 30 ou suas formas equlvalenLes (a equao 69,
enLreLanLo, produz resulLados dlsLorcldos, no sendo vllda nesLa slLuao em que h
empaLes na ordenao). ara os dados apresenLados, Lem-se que r
s
= u,22. A
correlao ordlnal enLre as duas varlvels e, pols, poslLlva (lsLo e a escolarldades mals
elevadas correspondem cargos mals elevados, como [ percebramos), mas no mulLo
acenLuada.


Po[e em dla, em que h abundncla de recursos compuLaclonals, uma frmula como a da
equao 69 no faz mulLo senLldo, no Lendo vanLagem em relao a equao 63. A equao
69 Lem a desvanLagem de ser apllcvel apenas quando no h empaLes na classlflcao dos
lndlvlduos. kendall (1933, !"#$ 1aylor, 1964) desenvolveu uma correo a frmula
apresenLada na equao 69 para levar em conLa empaLes nas classlflcaes.
7)$:,(,$*+$ '$ ()00$%";6) '$ D$*'"%%
b)
37

Lm 1938 o esLaLlsLlco lngls Maurlce Ceorge kendall (1907-1983) (ve[a a llgura 23 a
segulr) props uma alLernaLlva ao coeflclenLe de correlao ordlnal de Spearman, que velo a
Lomar o nome de coeflclenLe de correlao de kendall, ou (Lau) de kendall.


I|gura 2S: Maur|ce George kenda|| (1907-1983)
Ionte: http:]]www.york.ac.uk]depts]maths]h|ststat]peop|e]kenda||_m_g.g|f acessado em 1]11]2011

Ao con[ecLurar sobre o modo como as pessoas ordenam colsas, como por exemplo, suas
prefernclas, kendall (1938) desenvolveu uma manelra de compuLar a compaLlbllldade de
duas ordenaes formuladas lndependenLemenLe (ou comparando uma ordenao pre-
esLabeleclda com alguma ouLra produzlda por uma pessoa, ou comparando ordenaes
produzldas por pessoas dlsLlnLas), argumenLando vanLagens em relao ao coeflclenLe de
correlao por posLos de Spearman, especlalmenLe no que dlz respelLo ao comporLamenLo
asslnLLlco de sua dlsLrlbulo amosLral.
12

C coeflclenLe de correlao ordlnal de kendall enLre duas varlvels, dlgamos X e ,
denoLado por
X
, e deLermlnado conLablllzando-se a dlferena enLre concordnclas e
dlscordnclas nas ordenaes dos ob[eLos com respelLo a cada uma das varlvels X e ,
normallzando-se pelo LoLal de comparaes posslvels. Consldere lnlclalmenLe que no h
empaLes nas ordenaes R
X
e R

, ou se[a, LanLo R
X
como R

conLm apenas os numeros


lnLelros de 1 a n (no necessarlamenLe em ordem). As ordenaes de dols ob[eLos qualsquer, i
e ], (i e ] = 1, ., n, com i = ]), com respelLo as varlvels X e so dadas pelos pares
ordenados de posLos (r
X

, r

) e [r
X
]
, r

]
.
Consldera-se que as ordenaes dos dols ob[eLos so concordanLes enLre sl se ambas as
ordenaes lndlcam que o ob[eLo i Lem posLo mals elevado do que o ob[eLo ], ou se ambas as
ordenaes lndlcam que o ob[eLo i Lem posLo menos elevado do que o ob[eLo ], lsLo e, se
r
X

> r
X
]
e r

> r

]
, ou se r
X

< r
X
]
e r

< r

]
. or ouLro lado, consldera-se que as
ordenaes so dlscordanLes se uma das ordenaes lndlcar que o ob[eLo i Lem posLo mals
elevado do que o ob[eLo ] e a ouLra lndlcar que o ob[eLo i Lem posLo menos elevado do que o
ob[eLo ], lsLo e, se r
X

> r
X
]
e r

< r

]
, ou se r
X

< r
X
]
e r

> r

]
.
Com n ob[eLos, lsLo e, para uma amosLra de Lamanho n, Lem-se um LoLal de
n(n-1)
2

posslvels comparaes enLre dols dlsLlnLos ob[eLos, algumas sendo concordanLes enLre sl e
ouLras sendo dlscordanLes. 8epresenLemos por n
c
e por n
d
o numero de pares concordanLes e
dlscordanLes respecLlvamenLe. 1em-se:

70
n
c
+n
d
=
n(n-1)
2
.

12
veremos mals Larde como caracLerlzar dlsLrlbules amosLrals mals formalmenLe. or enquanLo
admlLa apenas que ela represenLa as varlabllldades enconLradas enLre os valores de uma esLaLlsLlca
calculada em amosLras dlsLlnLas, mas lgualmenLe represenLaLlvas da populao de lnLeresse.
38


C coeflclenLe de correlao de kendall e deflnldo por:

71

X
=
n
c
-n
d
n(n-1)
2
.

8epare que a frmula e basLanLe lnLulLlva, pols se as duas ordenaes so ldnLlcas, Lodas
as comparaes enLre dols ob[eLos qualsquer sero concordanLes, ou se[a, n
c
=
n(n-1)
2
,
n
d
= u, e enLo
X
= 1. Se, por ouLro lado, as duas ordenaes forem exaLamenLe lnverLldas
uma em relao a ouLra (lsLo e, o ob[eLo colocado como prlmelro posLo em X e colocado como
ulLlmo posLo em , o colocado no segundo posLo em X e colocado no penulLlmo posLo em ,
eLc.), Lodas as comparaes enLre dols ob[eLos qualsquer sero dlscordanLes, ou se[a, n
c
= u,
n
d
=
n(n-1)
2
, e enLo
X
= -1. L se as ordenaes forem produzldas ao acaso, lsLo e, sem
qualquer relao, espera-se que o numero de comparaes concordanLes se lguale ao numero
de comparaes dlscordanLes, ou se[a, n
c
= n
d
e enLo
X
= u.
Cuando h empaLes nas ordenaes R
X
e R

, a frmula deve ser a[usLada devldamenLe,


dando orlgem ao coeflclenLe conhecldo como Lau-b. A prlmelra consLaLao e que haver
necessldade de se deflnlr mals uma relao posslvel enLre as ordenaes dos dols ob[eLos
generlcos i e ]: quando r
X

= r
X
]
ou r

= r

]
, as ordenaes so classlflcadas como nem
concordanLes enLre sl nem dlscordanLes. A frmula e:

72

X
=
n
c
-n
d
_
n(n-1)
2
-1
X
_
n(n-1)
2
-1
Y
,

onde

73
I
X
=
_ t
k
(t
k
-1)
k
2
,

74
I

=
_ t
l
(t
l
-1)
l
2
,

onde t
k
represenLa o numero de ob[eLos empaLadas no k-eslmo grupo de ordenaes
empaLadas em R
X
e t
I
represenLa o numero de ob[eLos empaLadas no l-eslmo grupo de
ordenaes empaLadas em R

.
Cbserve que se no houver empaLes LanLo na ordenao R
X
como na ordenao R

, a
equao 72 reduz-se a equao 71.
Como se percebe, a apllcao das frmulas 71 e 72 requerem um enorme Lrabalho
comblnaLrlo, fcll de reallzar quando a amosLra e pequena, como as amosLras que kendall
uLlllzava. ara amosLras grandes o clculo e quase lmposslvel sem a a[uda de bons aparaLos
compuLaclonals, fellzmenLe ho[e basLanLe dlsponlvels. Cs pacoLes esLaLlsLlcos usualmenLe
conLm roLlnas para calcular o coeflclenLe de correlao de kendall.
ara os dados apresenLados no Lxemplo 6, Lem-se que = u,19, levemenLe lnferlor ao
coeflclenLe de correlao por posLos de Spearman.
/0# &#'()&*1 +#,*-.'(+# * "0# &#'()&*1 3'4(5#1
5
39

A varlabllldade con[unLa enLre uma varlvel caLegrlca e uma varlvel mensurada em
escala ordlnal e anallsada de forma semelhanLe ao que se faz para anallsar a relao enLre uma
varlvel caLegrlca e uma varlvel meLrlca, lsLo e, comparam-se as dlsLrlbules da varlvel
ordlnal nas sub-amosLras represenLadas pelas caLegorlas da varlvel caLegrlca. Cbserve os
procedlmenLos da seo em que anallsamos a relao enLre uma varlvel caLegrlca e uma
varlvel meLrlca e adapLe os procedlmenLos, no que couber, para reallzar a anllse. Asslm, por
exemplo, no h mulLo senLldo em comparar grflcos-calxa, pols uma varlvel ordlnal no Lem
valores assoclados. Mas e posslvel comparar hlsLogramas da varlvel ordlnal enLre as sub-
amosLras deflnldas pelas caLegorlas da varlvel caLegrlca, como l deLalhado. 1ambem faz
senLldo anallsar comparaLlvamenLe as dlversas medldas uLlllzadas para caracLerlzar varlvels
ordlnals, conforme [ apresenLado na seo correspondenLe.
AlLernaLlvamenLe, podem-se uLlllzar as Lecnlcas sugerldas para anallsar duas varlvels
caLegrlcas, LraLando a varlvel ordlnal como se caLegrlca fosse (lembre que o esquema de
classlflcao de nlvels de mensurao e hlerrqulco, de modo que uma varlvel ordlnal pode
ser LraLada como uma varlvel caLegrlca). Asslm, podem-se represenLar as duas varlvels
con[unLamenLe por melo de Labelas de conLlngncla, por exemplo. Cu alnda por melo de
maLrlzes de correspondncla.
/0# &#'()&*1 3'4(5#1 * "0# &#'()&*1 02,'(+#
A anllse da varlabllldade con[unLa enLre uma varlvel ordlnal e uma varlvel meLrlca pode
ser levada a cabo uLlllzando-se as mesmas Lecnlcas descrlLas para anallsar a varlabllldade
con[unLa de duas varlvels ordlnals, degradando, de cerLa forma, a lnformao conLlda no
processo de mensurao da varlvel meLrlca (lembre mals uma vez que o esquema de
classlflcao de nlvels de mensurao e hlerrqulco, de modo que uma varlvel meLrlca pode
ser LraLada como uma varlvel ordlnal). AlLernaLlvamenLe, pode-se degradar a lnformao
conLlda na ordenao da varlvel ordlnal, LraLando-a como se caLegrlca fosse. nesLe caso, as
Lecnlcas descrlLas para anallsar a relao enLre uma varlvel caLegrlca e uma meLrlca podem
ser Lodas apllcadas.
67*'+8+(3$
Lscolha um banco de dados qualquer em que voc esLe[a lnLeressado. ara a reallzao
dos exerclclos proposLos a segulr e recomendvel a uLlllzao de alguma planllha de
clculo ou algum pacoLe esLaLlsLlco.

1. Lscolha duas varlvels caLegrlcas do banco de dados e faa uma anllse relaclonando as
lnformaes exlsLenLes. P algum /#01234 enLre os dados anallsados? Lm caso aflrmaLlvo,
corrl[a a slLuao e refaa a anllse. Cual a correo proposLa? P necessldade de
reagrupar caLegorlas?
2. 8eplLa o exerclclo anLerlor para ouLro par de varlvels caLegrlcas.
3. Lscolha uma varlvel caLegrlca e uma varlvel meLrlca do banco de dados e faa uma
anllse relaclonando as lnformaes exlsLenLes. P algum /#01234 enLre os dados
anallsados? Lm caso aflrmaLlvo, corrl[a a slLuao e refaa a anllse. Cual a correo
proposLa? P necessldade de reagrupar caLegorlas?
4. 8eplLa o exerclclo anLerlor para ouLro par de varlvels (uma caLegrlca e ouLra meLrlca).
3. Lscolha duas varlvels meLrlcas do banco de dados e faa uma anllse relaclonando as
lnformaes exlsLenLes. P algum /#01234 enLre os dados anallsados? Lm caso aflrmaLlvo,
corrl[a a slLuao e refaa a anllse. Cual a correo proposLa?
6
40

6. 8eplLa o exerclclo anLerlor para ouLro par de varlvels meLrlcas.
7. Lscolha duas varlvels ordlnals do banco de dados e faa uma anllse relaclonando as
lnformaes exlsLenLes. P algum /#01234 enLre os dados anallsados? Lm caso aflrmaLlvo,
corrl[a a slLuao e refaa a anllse. Cual a correo proposLa?
8. 8eplLa o exerclclo anLerlor para ouLro par de varlvels ordlnals.
9. Lscolha uma varlvel caLegrlca e uma varlvel ordlnal do banco de dados e faa uma
anllse relaclonando as lnformaes exlsLenLes. P algum /#01234 enLre os dados
anallsados? Lm caso aflrmaLlvo, corrl[a a slLuao e refaa a anllse. Cual a correo
proposLa? P necessldade de reagrupar caLegorlas?
10. 8eplLa o exerclclo anLerlor para ouLro par de varlvels (uma caLegrlca e ouLra ordlnal).
11. Lscolha uma varlvel ordlnal e uma varlvel meLrlca do banco de dados e faa uma anllse
relaclonando as lnformaes exlsLenLes. P algum /#01234 enLre os dados anallsados? Lm
caso aflrmaLlvo, corrl[a a slLuao e refaa a anllse. Cual a correo proposLa?
12. 8eplLa o exerclclo anLerlor para ouLro par de varlvels (uma ordlnal e ouLra meLrlca).
9(:1(3-'#;(#
AgresLl, Alan5 +!03-/426!1 7!0! 8)!19:2:. 2
nd
Ld. Poboken: !ohn Wlley & Sons, 2002.
8realey, 8lchard A., Myers, SLewarL C., Allen, lranklln. ;42)6<"2/: $3 =2)!)>!: +/4"/4!02?!:.
8 Ld. So aulo: Mcgraw-hlll lnLeramerlcana, 2008.
Cauchy, AugusLln-Louls. coots JAoolyse Je lcole koyole lolytecbolpoe. 1
ere
parLle: Analyse
Algebrlque. arls: uebure, 1821.
hLLp://galllca.bnf.fr/ark:/12148/bpL6k90193m/f379.lmage. Acessado em 7/12/2011.
CalLon, lrancls. 1yplcal laws of heredlLy. ;4/633$2)-: /@ 0A3 B/9!1 C):020#02/) 8: 282-301,
1877.
CalLon, lrancls. 8egresslon Lowards medlocrlLy ln heredlLary sLaLure5 D/#4)!1 /@ 0A3
8)0A4/"/1/-26!1 C):020#03, 13: 246-63, 1886.
CalLon, lrancls. E3F/423: /@ F9 12@3. Londres: MeLhuen, 1908.
kendall, Maurlce C. A new measure of rank correlaLlon. G2/F3042H!, 30(1-2): 81-93, 1938.
Spearman, Charles Ldward. Ceneral lnLelllgence, ob[ecLlvely deLermlned and measured.
8F3426!) D/#4)!1 /@ ;:96A/1/-9, 13:201-293, 1904.
1aylor, Wllson L. CorrecLlng Lhe average rank correlaLlon coefflclenL for Lles ln ranklngs.
D/#4)!1 /@ 0A3 8F3426!) I0!02:026!1 8::/62!02/), 39(307):872-876, 1964.
World 8ank. World uevelopmenL lndlcaLors. WashlngLon: 1he World 8ank, 2011.
hLLp://daLa.worldbank.org/ acessado em 23/10/2011.

Você também pode gostar