Você está na página 1de 12

IMES Catanduva

Probabilidades e Estatstica

Estatstica
no Excel
Matemtica
Bertolo, L.A.

Aplicada

Verso BETA

Maio 2010

Bertolo

Estatstica Aplicada no Excel

Captulo 3 Dados Bivariados


So pares de valores correspondente a um dado indivduo ou resultado experimental.
Para ilustrar o estudo de dados bivariados, recorreu-se ao Diagramas exemplo de altura (cm) e peso (kg) de 10
alunos do curso de Cincia da Computao do IMES-FAFICA.

2.1 Diagrama de Disperso ou de Espalhamento (scatter plot)


uma representao grfica para os dados bivariados, em que cada par de dados (xi, yi) representado por um
ponto de coordenadas (xi, yi), num sistema de eixos cartesianos.
Pode-se obter com facilidade a representao grfica de dados bivariados, atravs do Assistente de Grficos [Chart
Wizard].
Comece por selecionar as clulas contendo os dados e os respectivos ttulos e clique no cone

da

Barra de ferramentas.
Na primeira Caixa de dilogo selecione a opo
(xy).
Para continuar a construo do grfico, e para passar ao
Passo seguinte, clique no boto Seguinte >.

Disperso

Estatstica Aplicada no Excel

Bertolo

No terceiro passo, a Caixa de dilogo apresenta vrias opes


que permitem formatar o grfico:
- Em Ttulos siga o exemplo apresentado.
- Em Linhas de grade, desmarque a seleo da opo de grade.
- Em Legenda, desmarque a seleo da
opo da legenda.

Para continuar a construo do grfico, e para passar ao Passo seguinte, clique no boto Seguinte >.
No ltimo passo pode escolher se o grfico colocado
numa nova folha de clculo ou numa folha j existente.

Clique em Concluir e obter o seguinte resultado:

So mltiplas as opes de formatao para os grficos de Excel,


desde o aspecto geral, aos tipos de letras, formatao dos eixos,
etc. Eis um exemplo do que poder obter.

Bertolo

Estatstica Aplicada no Excel

2.2 Covariancia e Correlao


Ns usamos regresso e correlao para descrever a variao em uma ou mais variveis.
A. A variao a soma dos desvios quadrados de
uma varivel de sua mdia.

Exemplo1: Preos de vendas de casas e ps


quadrados
Preos de venda de casas (eixo vertical) v. ps quadrados
para uma amostra de 34 casas em Setembro de 2005 em St.
Lucie County.

Variao = (x x)2
i=1

B. A variao o numerador da varincia de uma


amostra:
Varincia =

Ni=1(x x)2
N1

C. Ambas, a variao e a varincia so medidas de


disperso de uma amostra, j estudadas.

2.2.1 A Covarincia
A covarincia entre duas variveis aleatrias uma medida estatstica do grau para o qual as duas variveis se
movem juntas.
A. A covarincia captura o quanto uma varivel fica diferente da sua mdia quando a outra varivel ficar diferente da
sua mdia.
B. Uma covarincia positiva indica que as variveis tendem a se moverem juntas; uma covarincia negativa indica
que as variveis tendem a se moverem em direes opostas.
C. A covarincia calculada como a razo da co-variao pelo tamanho da amostra menos um:

Covarincia =

onde N o tamanho da amostra


xi a i-sima observao da varivel x,
a mdia das observaes da varivel x,
yi a i-sima observao da varivel y, e
a mdia das observaes da varivel y.

Ni=1(xi x )(yi y )
N1

D. O valor real da covarincia no significante porque ele no afetado pela a escala das duas variveis. Isto o
porqu de se calcular o coeficiente de correlao para tornar algo interpretvel da informao da covarincia.

2.2.2 A funo COVAR do Excel


O Excel disponibiliza uma funo embutida chamada COVAR que retorna a covarincia, a mdia dos produtos dos
desvios de cada par de ponto de dados em dois conjuntos de dados.
A sua sintaxe :
COVAR(matriz1; matriz2)
2.2.3 Exemplo 1 Usando a funo COVAR do Excel
Com os dados dos Pesos e Alturas da 10 feras do curso de Cincia da Computao (incluindo o Aderbal, por que no?
Ele uma fera ferida!!!!) encontre a covarincia entre as grandezas peso e altura. Para tanto v clula C2 e digite
=COVAR(A2:A11;B2:B11). O valor encontrado ser:

Estatstica Aplicada no Excel

Bertolo

1 Peso (kg) Altura (cm)


2
72
175
3
65
170
4
80
185
5
57
154
6
60
165
7
77
175
8
83
182
9
79
178
10
67
175
11
68
173

63,44 <--=COVAR(A2:A11;B2:B11)

2.2.4 Coeficiente de Correlao


O coeficiente de correlao, r, uma medida da intensidade da relao entre ou dentre as variveis.
Clculo:

r=

covari ncia entre x e y

Desviode padr
x

Desviode padr
y

Nota: A correlao no implica que um


causa o outro. Podemos dizer que duas
variveis X e Y esto correlacionadas, mas
no que X causa Y ou que Y causa X, na
mdia eles simplesmente esto relacionados ou associados um com o outro.

Ni=1(xi x)(yi y )
N1
r=
N
N
2
2
i=1(xi x) i=1(yi y )
N1
N1

2.2.5 Exemplo 2

x
1 Observao
1
12
2
2
13
3
3
10
4
4
9
5
5
20
6
6
7
7
7
4
8
8
22
9
9
15
10
10
23
11
Soma
135
12
13 Clculos
135/10 =
14 xMdio=

y
50
54
48
47
70
20
15
40
35
37
416

Desvio
de x
x - xMdio

E
Desvio
Quadrado
de x
(x - xMdio)2

-1,50
-0,50
-3,50
-4,50
6,50
-6,50
-9,50
8,50
1,50
9,50
0,00

2,25
0,25
12,25
20,25
42,25
42,25
90,25
72,25
2,25
90,25
374,50

F
Desvio
de y
y - yMdio

G
Desvio
Quadrado
de y
(y - yMdio)2

Produto
dos desvios
(x - xMdio)(y - yMdio)

8,40
12,40
6,40
5,40
28,40
-21,60
-26,60
-1,60
-6,60
-4,60
0,00

70,56
153,76
40,96
29,16
806,56
466,56
707,56
2,56
43,56
21,16
2342,40

-12,60
-6,20
-22,40
-24,30
184,60
140,40
252,70
-13,60
-9,90
-43,70
445,00

13,5

15 yMdio=

416/10

41,6

374,5/9

41,611

17 s y=

2.342,4/9 =

260,267

18 r =

(445/9)/((41,611) (260,267)1/2) = 49,444/(6,451*16,133) = 0,475

16 s x=

1/2

Bertolo
i.

Estatstica Aplicada no Excel

O tipo de relao est representada pelo coeficiente de correlao:


r =+1 correlao perfeitamente positiva
+1 >r > 0 relao positiva
r = 0 nenhuma relao
0 > r > 1 relao negativa
r = 1 correlao perfeitamente negativa

ii.

Voc pode determinar o grau de correlao observando o grfico de espalhamento.


Se a relao para cima existe correlao positiva.
Se a relao para baixo existe correlao negativa.

iii. O coeficiente de correlao est limitado por 1 e +1. Quanto mais prximo o coeficiente estiver de 1 ou +1, mais
forte a correlao.
iv. Com a exceo dos extremos (isto , r = 1,0 ou r = -1), ns no podemos realmente falar acerca da intensidade
de uma relao indicada pelo coeficiente de correlao sem um teste estatstico de significncia.
2.2.6 A funo CORREL do Excel
O Excel disponibiliza uma funo embutida chamada CORREL que retorna o coeficiente de correlao entre duas
variveis de dois conjuntos de dados.
A sua sintaxe :
CORREL(matriz1; matriz2)
2.2.7 Exemplo Usando a funo CORREL do Excel
Determina-se o coeficiente de correlao atravs da funo CORREL do Excel para as variveis peso e altura das
feras do truco da Computao (com o Aderbal claro!).
O valor encontrado ser:

1 Peso (kg) Altura (cm)


2
72
175
3
65
170
4
80
185 0,906819 <--=CORREL(A2:A11;B2:B11)
5
57
154
6
60
165
7
77
175
8
83
182
9
79
178
10
67
175
11
68
173
2.2.8 Exemplo Usando a ferramenta Anlise de dados do Excel
Alternativamente poderamos usar a ferramenta Anlise de dados.
Para ativ-la no Office 2007 clique no boto do Office , da em Opes do Excel. Na janela Opes do Excel, clique
em Suplementos e v at o final desta janela, na caixa de combinao Gerenciar, clique no boto Ir... para fazer
aparecer a caixa Suplementos:
6

Estatstica Aplicada no Excel

Bertolo

Assinale a caixa de verificao Ferramentas


de Anlise. Faa isto sempre para carregar os
suplementos que s vezes podem no estar
instalados.
A seguir v a guia Dados e no grupo Anlise
(que agora est ativado) clique em Anlise de
Dados para aparecer a janela:

Clicando o boto OK aparecer uma nova janela:


Configure nesta janela a Entrada dos dados, o Agrupamento, se
deseja ou no os Rtulos na primeira linha e as Opes de
sada. Faa tudo como mostra a figura. Depois aperte o boto
OK e ters:

2.3 Regresso Linear Simples


Regresso a anlise da relao entre uma varivel e alguma outra varivel(s), assumindo uma relao linear.
Tambm referida como regresso dos mnimos quadrados e mnimos quadrados ordinrios (ordinary least
squares - OLS).
Isto acontece quando a correlao entre as duas variveis elevada (quer seja positiva, quer seja negativa), isso
significa que se conhecer o valor de uma das variveis, ento possvel ter uma idia do valor que a outra varivel ir
tomar. Em linguagem estatstica, diz-se que se pode inferir o valor de outra varivel.
A. O propsito explicar a variao numa varivel (isto , como uma varivel difere do seu valor mdio) usando a
variao em uma ou outras mais variveis.
B. Suponha que queremos descrever, explicar, ou predizer porque uma varivel difere de sua mdia. Seja a isima observao desta varivel representada como Yi, e seja n indicando o nmero de observaes.
A variao nos Yi's (os quais queremos explicar) :
N

Variao
= (yi y )2 = SSTotal
do Y
i=1

C. O princpio dos mnimos quadrados que a linha de regresso determinada minimizando a soma dos
quadrados das distncias verticais entre os valores reais de Y e os valores previstos de Y.

Bertolo

Estatstica Aplicada no Excel


Uma linha um ajuste atravs dos pontos XY tal que a soma dos
resduos quadrticos (isto , a soma dos quadrados da distncia vertical
entre as observaes e a linha) seja minimizada.

Voltando ao exemplo das alturas e dos pesos das feras e ao seu diagrama
de disperso, pode-se observar uma associao linear entre o peso e a
altura. Ser que possvel prever a altura de um aluno que pese 70
kg?

Quando perante uma situao anloga, em que tenhamos um conjunto de dados bivariados (xi, yi), i=1, ..., n, que
seguem um padro linear, poder ter interesse ajustar uma reta da forma:

y = a + bx
que d a informao de como se refletem em y, as mudanas processadas em x.
2.3.1 O Exemplo 1 Brincando com os dados

Retomando o exemplo, prepare uma


tabela idntica que se apresenta. Os
valores do Ajuste, do Desvio e do
Desvio2, podero ser calculados com
as seguintes expresses:
- Ajuste (y)
1 valor (clula E2)

=$A$3+C2*$A$6
Copie esta expresso para as clulas
E3 a E11.
- Desvio
1 valor (clula F2)

=D2-E2
Copie esta expresso para as clulas F3 a F11.
- Desvio2
1 valor (clula G2)
=F2^2
Copie esta expresso para as clulas G3 a G11.

Estatstica Aplicada no Excel

Bertolo
Selecione as clulas das
trs primeiras colunas
contendo os dados e os
respectivos ttulos e clique
no cone
da Barra
de ferramentas.
Siga os procedimentos
anteriormente descritos e
construa um diagrama de
disperso.

Selecione a srie de dados correspondente ao "Ajuste


(y)" e clique duas vezes, para abrir o menu Formatar
srie de dados.

Na opo Linha, personalize de acordo com o exemplo.


Na opo Marcador, selecione: Nenhum

Experimente agora alterar os valores da "Constante(a)" e


do "Declive (b)" e observe como se comporta a reta...

2.3.2 O Exemplo 1 Fazendo a sua Regresso Linear


Um dos mtodos mais conhecidos de ajustar uma reta a um conjunto de dados o mtodo dos mnimos quadrados,
que consiste em determinar a reta que minimiza a soma dos quadrados dos desvios (ou erros) entre os verdadeiros
valores de y e os obtidos a partir da reta que se pretende ajustar.
Construa novamente o diagrama de disperso.

Bertolo

Estatstica Aplicada no Excel


Selecionando o diagrama, clique no menu Grfico,
selecione o comando Adicionar linha de tendncia e
siga as opes.

A equao desta reta traduz-se em:


Altura = 109,36 + 0,9016 x Peso
Substituindo na equao o Peso por 70, obtm-se o valor de 172,472, pelo que a altura esperada para um aluno
que pese 70 kg , de cerca de 172,5 cm.
2.3.3 Coeficiente de determinao R2
O coeficiente de determinao, R2, a porcentagem da variao da varivel dependente (variao dos Yi's ou a
soma dos quadrados total, SST) explicada pela varivel independente(s).
A. O coeficiente de determinao calculado como:
Observao
1
2
3
4
5
6
7
8
9
10

10

x
12
13
10
9
20
7
4
22
15
23

y
50
54
48
47
70
20
15
40
35
37

^y
39,82
41,01
37,44
36,25
49,32
33,88
30,31
51,70
43,38
52,89

y-^y
10,18
12,99
10,56
10,75
20,68
-13,88
-15,31
-11,70
-8,38
-15,89
0,00

e
103,63
168,74
111,51
115,56
427,66
192,65
234,40
136,89
70,22
252,49
1.813,77

R2 =

Variao explicada

Variao total
Variao total Variao explicada
SS Regresso
SS Total

Variao total

SS Total SS Residual
SS Total

Voltando ao exemplo 2.2.5 temos:


Observe que: (20-4) + (20-15) + (20 24) + (20 27) + (20
30) = 0

Estatstica Aplicada no Excel

Bertolo

B. Um R2 de 0,49 indica que as variveis independentes explicam 49% da variao da varivel dependente.

2.4 Trabalho Final

Parte A
a. Fazer a mesma coisa da seo 2.2.3 para os dados do exemplo 2
b. Faa mesma coisa da seo 22.7 para os dados do exemplo 2
c. Faa mesma coisa da seo 22.8 para os dados do exemplo 2
Parte B
Faa a mesma coisa da seo 2.3.2 Regresso Linear Simples para os dados do exemplo 2, encontrando no final a
equao da reta. Resposta yi = 25,559 + 1,188 xi
Parte C
Dada a amostra da planilha abaixo:
Anlise de precificao de casas, repita os exerccios 1 e 2 e a seco 2.3.3 (coeficiente de determinao R2)

11

Bertolo

12

Estatstica Aplicada no Excel

Você também pode gostar