Você está na página 1de 7

UNIVERSIDADE FEDERAL DE PERNAMBUCO

CENTRO ACADMICO DO AGRESTE


CURSO DE ENGENHARIA CIVIL

ESTATSTICA

Aula 06 - Estatstica Descritiva

Anlise Bidimensional
 Em algumas anlises de dados pode surgir a
necessidade de se fazer um estudo sobre o
comportamento conjunto de duas ou mais
variveis e para isso a distribuio conjunta de
frequncias de grande utilidade.
 Vamos analisar em princpio o caso de 2
variveis

Prof. Anderson Paiva


03/10/2014

Slide 2

Anlise Bidimensional
 possvel observar a ocorrncia de trs
situaes distintas que requerem tcnicas
estatsticas tambm distintas. As trs situaes
distintas que podem ocorrer so:

Prof. Anderson Paiva

Associao de duas variveis qualitativas


 Para ilustrar, analisaremos como se comportam as
variveis: regio de procedncia (X) e grau de instruo
(Y ) cuja distribuio de frequncias pode ser
representada por uma tabela de dupla entrada abaixo:

 2 variveis so Qualitativas;
 2 variveis so Quantitativas;
 1 varivel Qualitativa e 1 varivel Quantitativa.

Slide 3

Prof. Anderson Paiva

Slide 4

Prof. Anderson Paiva

Associao de duas variveis qualitativas

Associao de duas variveis qualitativas

Observaes:
1. Cada clula do corpo da tabela apresenta o nmero de ocorrncia
simultnea dos valores (x; y) de X e Y , constituindo a distribuio
conjunta;
2. A coluna dos totais (frequncias marginais de X) constitui a
distribuio marginal de X;

Observaes:
3. A linha dos totais (frequncias marginais de Y ) constitui a
distribuio marginal de Y ;
4. Idntico ao caso de uma varivel, as frequncias absolutas podem
ser expressas em termos de frequncias relativas e/ou porcentagens,
sendo que, estas medidas podem ser obtidas em relao ao total
geral, em relao ao total de cada linha ou em relao ao total de
cada coluna, de acordo com o objetivo de cada anlise;

Slide 5

Prof. Anderson Paiva

Associao de duas variveis qualitativas


Questes:
a) O percentual de pessoas que possuem o 2 grau e que so do
interior.
Resp: 19,4%;
b) Dentre os que possuem o 2 grau, qual o percentual de pessoas
provenientes do interior?
Resp: 38,9%;

Slide 7

Prof. Anderson Paiva

Slide 6

Prof. Anderson Paiva

Associao de duas variveis qualitativas


Questes:
c) Sabendo-se que uma pessoa veio do interior, qual a
probabilidade, em termos percentuais, de ter o 2 grau?
Resp: 58,3%.

Slide 8

Prof. Anderson Paiva

Associao de duas variveis qualitativas

Associao de duas variveis qualitativas

 Para responder estas e outras questes, torna-se til a construo


de tabelas de dupla entrada contendo as frequncias relativas em
termos de porcentagem, tendo como referncia o total geral, os
totais de cada linha ou coluna, de acordo com a questo a ser
respondida.
 Vejamos como ficam estas tabelas:

X \Y
1 Grau
Capital
11%
Interior
8%
Outra
14%
Total marginal de Y 33%

2 Grau Superior Total marginal de X


14%
6%
31%
19%
6%
33%
17%
6%
36%
50%
17%
100%

Slide 9

Prof. Anderson Paiva

Associao de duas variveis qualitativas

Slide 10

Prof. Anderson Paiva

Associao de duas variveis qualitativas


100%

X \Y
Capital
Interior
Outra
Total marginal de Y

1 Grau
36%
25%
38%
33%

2 Grau
45%
58%
46%
50%

Superior Total marginal de X


18%
100%
17%
100%
15%
100%
17%
100%

90%
80%
70%
60%

Outra

50%

Interior
Capital

40%
30%

Slide 11

Superior Total marginal de X

20%

X \Y

1 Grau

2 Grau

Capital

33%

28%

33%

31%

10%

Interior

25%

39%

33%

33%

0%

Outra

42%

33%

33%

36%

Total marginal de Y

100%

100%

100%

100%
Prof. Anderson Paiva

1 Grau

Slide 12

2 Grau

Superior

Total

Prof. Anderson Paiva

Dependncia de Variveis
 Ocorre com bastante frequncia em anlises de distribuio
conjunta o questionamento sobre a existncia de dependncia ou
no entre as variveis, alm da necessidade de se saber o grau de
dependncia entre elas, caso exista.

Dependncia de Variveis
 Existe ou no associao entre sexo e carreira, escolhido por 200
alunos?
X \Y

 De modo geral, o grau de dependncia entre duas variveis


quantificado pelos coeficientes de associao ou correlao.
Usualmente, esses coeficientes variam de zero at um, sendo que, s
vezes, variam de -1 a 1.
 Desta maneira, valores prximos de zero do indcios de
independncia entre as variveis e, valores prximos de 1 (ou -1)
indicam um alto grau de dependncia positiva (ou negativa).
Slide 13

Prof. Anderson Paiva

Dependncia de Variveis
 Existe ou no associao entre sexo e carreira, escolhido por 200
alunos?
X \Y

Masculino Feminino

Total

Fsica

100

20

120

Cincias Sociais

40

40

80

Total

140

60

200

X \Y

Masculino Feminino
71%

33%

60%

Cincias Sociais

29%

67%

40%

Total

100%

100%

100%

H disparidade entre as propores. Desta forma, sexo e carreira


so variveis associadas (dependentes).
Slide 15

Total

85

35

120

Administrao

55

25

80

Total

140

60

200

X \Y

Masculino Feminino

Total

Economia

61%

58%

60%

Administrao

39%

42%

40%

Total

100%

100%

100%

No h dependncia, pois independente do sexo mantm-se a


mesma proporo.
Slide 14

Prof. Anderson Paiva

Associao de duas variveis qualitativas


Medida de Associao entre duas Variveis Qualitativas
 Coeficiente de contingncia (C)
Qui-quadrado de Pearson

Total

Fsica

Masculino Feminino

Economia

Prof. Anderson Paiva

 oij a frequncia absoluta observada na i-sima casela;


 eij a frequncia absoluta esperada na i-sima casela, caso houvesse
independncia entre as variveis, ou seja, quando a proporo em cada categoria de
uma varivel (fixada o total em linha ou coluna) igual ou prxima a proporo
marginal.
 n o nmero mximo de observaes
 No entanto, o valor mximo de C depende de r e s, que so o nmero de categorias
das variveis X e Y , respectivamente.
 Para evitar esse inconveniente, costuma-se definir um outro coeficiente, que varia
entre 0 e 1, dado por

Slide 16

Prof. Anderson Paiva

Associao de duas variveis qualitativas

Associao de duas variveis qualitativas

Exerccio:
 Verifique se h associao entre as variveis regio de procedncia
e grau de instruo, utilizando uma medida de associao.

Exerccio:
 Verifique se h associao entre as variveis regio de procedncia
e grau de instruo, utilizando uma medida de associao.

X \Y
Capital
Interior
Outra
Total marginal de Y

1 Grau
36%
25%
38%
33%

2 Grau
45%
58%
46%
50%

Superior Total marginal de X


18%
100%
17%
100%
15%
100%
17%
100%

Slide 17

Prof. Anderson Paiva

Valores observados
X \Y
Capital
Interior
Outra
Total marginal de Y

1 Grau
36%
25%
38%
33%

2 Grau
45%
58%
46%
50%

Superior Total marginal de X


18%
100%
17%
100%
15%
100%
17%
100%

Valores esperados
X \Y
Capital
Interior
Outra
Total marginal de Y

1 Grau
33%
33%
33%
33%

2 Grau
50%
50%
50%
50%

Superior Total marginal de X


17%
100%
17%
100%
17%
100%
17%
100%

Slide 18

Prof. Anderson Paiva

Associao de duas variveis qualitativas

Associao de duas variveis qualitativas

Exerccio:
 Verifique se h associao entre as variveis regio de procedncia
e grau de instruo, utilizando uma medida de associao.

Exerccio:
 Verifique se h associao entre as variveis regio de procedncia
e grau de instruo, utilizando uma medida de associao.

Valores observados
X \Y
Capital
Interior
Outra
Total marginal de Y

1 Grau
4
3
5
12

2 Grau
5
7
6
18

Superior Total marginal de X


2
11
2
12
2
13
6
36

0,6683

C = 0,1350

N = 36

Valores esperados
X \Y
1 Grau 2 Grau
Capital
3,63
5,50
Interior
3,96
6,00
Outra
4,29
6,50
Total marginal de Y
12
18
Slide 19

Superior
1,87
2,04
2,21
6

Total marginal de X
11
12
13
36
Prof. Anderson Paiva

T = 0,0681
As variveis so basicamente independentes, pois o valor de
coeficiente prximo de 0.
Slide 20

Prof. Anderson Paiva

Associao de duas variveis quantitativas

Associao de duas variveis quantitativas

Medida de Associao entre duas Variveis Quantitativas

Medida de Associao entre duas Variveis Quantitativas

 Neste caso, pode-se aplicar um procedimento anlogo ao realizado


para a anlise de variveis qualitativas.

 Diagrama de Disperso
 O diagrama (ou grfico) de disperso nada mais que a
representao de pares dos valores observados (x; y) num sistema
cartesiano.

 E, por se tratar de variveis quantitativas, antes de construir uma


tabela de dupla entrada, os dados marginais podem ser agrupados em
intervalos de classe, assim como no caso de uma nica varivel.
 Em anlises de associao entre variveis quantitativas, so
possveis procedimentos analticos mais refinados.

Slide 21

Prof. Anderson Paiva

Slide 22

Prof. Anderson Paiva

Associao de duas variveis quantitativas

Associao de duas variveis quantitativas

Medida de Associao entre duas Variveis Quantitativas

Medida de Associao entre duas Variveis Quantitativas

 Diagrama de Disperso

 Coeficiente de Correlao
 Dados n pares de valores (x1; y1); (x2; y2); ...; (xn; yn), chama-se
coeficiente de correlao entre as variveis X e Y o valor obtido por

ou seja, a mdia dos produtos dos valores reduzidos (padronizados)


das variveis.
 Enquanto o coeficiente T para variveis qualitativas s assume
valores ente 0 e 1, o coeficiente de correlao pode assumir qualquer
valor entre -1 e 1.
 Frmula alternativa
Slide 23

Prof. Anderson Paiva

Slide 24

Prof. Anderson Paiva

Associao de duas variveis quantitativas

Associao de duas variveis quantitativas

Medida de Associao entre duas Variveis Quantitativas

Medida de Associao entre duas Variveis Quantitativas

 Coeficiente de Correlao

 Exerccio: Numa amostra de cinco operrios de uma dada empresa


foram observadas duas variveis. X: anos de experincia num dado
cargo e Y : tempo, em minutos, gasto na execuo de uma tarefa
relacionada com esse cargo. As observaes so apresentadas na
tabela abaixo.

 O numerador da expresso acima, que mede o total de concentrao


dos pontos pelos quatro quadrantes, d origem covarincia que
uma medida bastante usada.
 Covarincia

Voc diria que a varivel X pode ser usada para explicar a variao
de Y ?

 Assim, podemos dizer que:


Slide 25

Prof. Anderson Paiva

Exerccios
1.

Um pesquisador coleta os dados dispostos na tabela e suspeita que h uma


relao significante entre o tempo de propaganda na TV (em minutos por ms)
e as vendas mensais de um produto (em centenas de dlares). Os dados
amostrais confirmam a suspeita do pesquisador? Justifique sua resposta com
base em uma medida de associao linear.

2.

Um levantamento obtido, junto aos funcionrios de um pequeno escritrio,


busca relacionar as variveis: anos de estudo (X) e nmero de diferentes
empregos nos ltimos cinco anos (Y ).

a) Construa o diagrama de disperso.


b) Calcule o coeficiente de correlao e interprete o resultado encontrado.

Slide 27

Prof. Anderson Paiva

Slide 26

Prof. Anderson Paiva

Você também pode gostar