Você está na página 1de 29

EXERCCIO 1

DISTRIBUIO DE FREQUENCIA PARA VARIVEL CATEGRICA


O exerccio 1.1 consiste na construo de uma tabela de frequncia e um grfico de barras para a
varivel GRAVIDADE.
Para melhor organizao dos dados interessante separar uma planilha para cada anlise (tabela de
frequncia e grfico).

Aps inserir a varivel de interesse numa planilha separada, siga os seguintes passos:
[a] Destaque o conjunto de dados na coluna A da clula A1 at a clula A111

[b] Utilize a Tabela dinmica para contar quantas vezes aparece a cada uma das categorias (ALTA,
MDIA, BAIXA). Utilize o comando:
INSERIR > TABELA DINMICA

[c] Clique em Planilha existente e escolha uma clula para colar a TABELA DINMICA.

[d] Aps apertar o OK, mova a palavra GRAVIDADE para a janela Rtulos de linha e em seguida para
Valores.

[e] Esse procedimento far com que a tabela apresente as frequncias.

[f] Conforme discutido em sala de aula, a tabela de frequncia contem 3 colunas: a primeira coluna
contem o nome da varivel. A segunda coluna fornece a frequncia e a terceira coluna apresenta a
porcentagem. Dessa forma, a tabela deve ser formatada. Para isso, destaque a tabela e utilize os
comandos:
COPIAR > COLAR ESPECIAL

Portanto, a tabela deve ser colada em outro conjunto de clulas. Em seguida devemos construir as
colunas de frequncia e porcentagem. Para o clculo da porcentagem, digite: =G5/G$8 . Nesse caso,
o numerador deve ser o valor contido na clula e o denominador o valor total (110 no caso). Devemos
colocar um smbolo de cifro entre o G e o 8 para fixar a clula.

[g] Para transformar os nmeros da terceira coluna para o formato de porcentagem, basta destacar os
dados e em seguida clicar no smbolo %, conforme a figura.

Observe que na coluna da Porcentagem devemos dividir o valor da frequncia pelo total de
ocorrncias colocando o smbolo $ para fixar a linha 8 que contem o valor 110. Isso vai servir para
calcular as demais porcentagens automaticamente.
Em seguida a tabela formatada com a melhor apresentao possvel:
GRAVIDADE
ALTA
BAIXA
MDIA
TOTAL

FREQUNCIA
19
58
33
110

PORCENTAGEM
17,3%
52,7%
30,0%
100,0%

Observe que a fonte CALIBRI foi mudada para CAMBRIA (isso depende do gosto do analista de dados).
Alm disso, as colunas foram CENTRALIZADAS e colocadas do mesmo tamanho.

[h] Para construo do grfico de barras devemos destacar a primeira e a terceira colunas DA TABELA
DE FREQUNCIA (primeiro destaca-se a primeira coluna e em seguida aperta-se a tecla CTRL para
selecionar a ltima:

Devemos utilizar o comando:


INSERIR > COLUNAS (conforme figura acima)
O grfico deve ser formatado de forma que seja o mais didtico possvel. O comando ADICIONAR
RTULO DE DADOS servir para que os valores de porcentagem apaream sobre as barras (para isso,
clique com o boto direito numa das barras e em seguida d o comando:

Para completar a figura abaixo, foram feitas as seguintes alteraes:


[a] Troca da fonte de CALIBRI para CAMBRIA.
[b] Troca do tamanho da fonte de 10 para 12.
[c] Foram tiradas as linhas horizontais.
[d] Foi colocado fundo azul claro.
[e] Os valores das porcentagens do eixo vertical tinham uma casa decimal aps a vrgula, o que foi
retirado.
Tabela 1: Distribuio dos acidentes por GRAVIDADE
60%

52,7%

50%

40%
30,0%

30%

20%

17,3%

10%
0%

ALTA

BAIXA

Fonte: Banco de dados ACIDENTES

MDIA

EXERCCIO 2
DISTRIBUIO DE FREQUENCIA PARA VARIVEL QUANTITATIVA
- Primeiramente a varivel deve ser separada numa planilha a parte.
- Em seguida os dados devem ser ordenados utilizando o comando
> DADOS CLASSIFICAR

- Em seguida, devemos comear a construir as classes (categorias). Vamos trabalhar com intervalos de
1 em 1 quilmetro.

- Necessitamos de 3 colunas: na primeira vai o nmero que inicia a primeira classe. Na segunda coluna vai a
letra a precedida de 4 espaos em branco. Aps o nmero, devemos colocar mais 4 espaos em branco.
Na terceira coluna vai o nmero que indica o trmino da classe (categoria).
- Como a maior DISTNCIA 11,3 vamos construir a primeira coluna de 1 em 1 at o nmero 11,1.

- A letra a (da coluna D) deve ser reproduzida at a linha onde est o nmero 11,1 (ou seja at a clula D13).
- Em seguida construmos a terceira coluna de forma anloga construo da primeira.
- Aps a construo da terceira coluna hora de agrupar as informaes das trs colunas numa s coluna.
Isso ser feito com o comando CONCATENAR

- Comeamos a montar a tabela de frequncia conforme figura abaixo:

- Para contar quantos elementos pertencem a cada categoria, devemos utilizar a funo FREQUNCIA na
coluna da frequncia acumulada.

- Observe que o primeiro parmetro da funo FREQUNCIA a matriz de dados (no caso os dados de
DISTNCIA). Devemos fixar os dados utilizado o cifro ($).
- Aps expandir os resultados at a ltima linha da tabela, passamos construo da segunda coluna (da
frequncia).

- Observe que o clculo da frequncia feito subtraindo o 7 do 18 (ou seja, a linha menos a linha anterior),
conforme a frmula da clula H4 mostrada na figura acima.

- Em seguida, calculamos as porcentagens.

- Para que a tabela no apresente grades indesejadas, podemos retirar as linhas de grade desmarcando essa
opo na aba EXIBIO (conforme figura abaixo).

.
- Tabela pronta (aps algumas mudanas na formatao)
DISTNCIA

FREQUNCIA

PORCENTAGEM

1,1 a 2
2,1 a 3
3,1 a 4
4,1 a 5
5,1 a 6
6,1 a 7
7,1 a 8
8,1 a 9
9,1 a 10
10,1 a 11
11,1 a 12
TOTAL

7
11
8
10
20
23
11
7
9
2
2
110

6,4%
10,0%
7,3%
9,1%
18,2%
20,9%
10,0%
6,4%
8,2%
1,8%
1,8%
100%

FREQUNCIA
ACUMULADA
7
18
26
36
56
79
90
97
106
108
110

PORCENTAGEM
ACUMULADA
6,4%
16,4%
23,6%
32,7%
50,9%
71,8%
81,8%
88,2%
96,4%
98,2%
100,0%

- Para construir o histograma basta INSERIR>COLUNA (destacando a primeira e terceira colunas da tabela)

- Para juntar as colunas clicamos com o boto direito do mouse sobre as colunas e apertamos FORMATAR
SRIE DE DADOS

A largura do espaamento entre as barras deve ir a 0%

Clicamos em COR DA BORDA e marcamos a cor branca

O grfico deve ser editado para melhorar a visualizao do leitor:


Grfico 2 Distribuio dos acidentes por DISTNCIA
25%

20,9%
20%

18,2%

15%
10%

10,0%
7,3%

6,4%

10,0%

9,1%

6,4%

8,2%

5%

1,8% 1,8%

11,1 a 12

10,1 a 11

9,1 a 10

8,1 a 9

7,1 a 8

6,1 a 7

5,1 a 6

4,1 a 5

3,1 a 4

2,1 a 3

1,1 a 2

0%

EXERCCIO 3
TABULAO CRUZADA COM O USO DA TABELA DINMICA (EXPLORANDO DUAS VARIVEIS
CATEGRICAS)
Destaque os dados das duas variveis (inclusive o ttulo das variveis).
Em seguida clique em:
INSERIR > TABELA DINMICA > OK

Em seguida coloque uma das variveis em Rtulo de Linha e a outra em Rtulo de Colunas.

Para que os dados apaream, transporte uma das variveis para o campo valores.

O prximo passo formatar a tabela.


Segue uma sugesto de formatao de tabela de dupla entrada:
GRAVIDADE
ALTA
BAIXA
MDIA
TOTAL

MOTORISTA ALCOOLIZADO
SIM
NO
16
3
7
51
10
23
33
77

TOTAL
19
58
33
110

Utilizando a tabela de porcentagem horizontal, construa o grfico

Aps a formatao, segue uma sugesto de grfico:


100%
90%

15,8%

80%
70%
60%

50%
40%

69,7%

70,0%

30,3%

30,0%

MDIA

TOTAL

87,9%
84,2%

30%
20%
10%

12,1%

0%
ALTA

BAIXA

MOTORISTA ALCOOLIZADO NO
MOTORISTA ALCOOLIZADO SIM

EXERCCIO 4
OBTENDO ESTATSTICAS DESCRITIVAS (MDIA, MEDIANA, MODA, VARINCIA, DESVIO
PADRO)
Instale primeiramente o mdulo ANLISE DE DADOS:
ARQUIVO > OPES > SUPLEMENTOS > FERRAMENTAS DE ANLISE

Para obteno das estatsticas de interesse, clique em:


DADOS > ANLISE DE DADOS > ESTATSTICA DESCRITIVA

Devemos definir o INTERVALO DE ENTRADA (basta destacar os dados) e o INTERVALO DE SADA


(basta escolher alguma clula na mesma planilha).

Aps clicar em OK, surgiro os resultados das principais estatsticas descritivas

Temos interesse nas seguintes estatsticas:


Mdia
Mediana
Moda
Desvio padro
Varincia
Mnimo
Mximo

EXERCCIO 5
VARIVEL QUANTITATIVA X VARIVEL CATEGRICA
O EXERCCIO 5.1 consiste na construo de uma tabela de com estatsticas descritivas de acordo com
cada uma das categorias de uma VARIVEL CATEGRICA.
Para melhor organizao dos dados interessante separar uma planilha para cada anlise. Sero
exploradas simultaneamente as variveis TEMPO DE ATENDIMENTO e GRAVIDADE. Ser que esto
associadas?

Para organizar as categorias da varivel GRAVIDADE, temos que utilizar a funo:


DADOS > CLASSIFICAR

RESULTADO:

O prximo passo obter as estatsticas descritivas da varivel TEMPO DE ATENDIMENTO para a


categoria ALTA:
ANLISE DE DADOS > ESTATSTICA DESCRITIVA > OK
Ao aparecer a janela, devemos escolher o INTERVALO DE ENTRADA (de onde esto vindo os dados)
e o INTERVALO DE SADA (onde ficaro as estatsticas descritivas).

O resultado consiste no conjunto de estatsticas descritivas dos acidentes de GRAVIDADE ALTA:

Repita os procedimentos para os acidentes de GRAVIDADE MDIA e GRAVIDADE BAIXA.

No temos interesse em todos os resultados. Apenas nas principais estatsticas, como na tabela
abaixo:
ESTATSTICAS
DESCRITIVAS
Mnimo
Mediana
Mdia
Mximo
Desvio padro
Coef. de Variao

ALTA
40,0
51,0
51,6
69,0
8,6
16,7%

GRAVIDADE
MDIA
19,0
38,0
39,6
74,0
13,9
35,2%

BAIXA
14,0
34,5
34,1
64,0
12,5
36,7%

EXERCCIO 6
VARIVEL QUANTITATIVA X VARIVEL QUANTITATIVA
O EXERCCIO 6.1 consiste na construo do diagrama de disperso e no clculo do COEFICIENTE DE
CORRELAO
Para melhor organizao dos dados interessante separar uma planilha para cada anlise. Sero
exploradas simultaneamente as variveis DISTNCIA e TEMPO DE ATENDIMETNO. Ser que esto
associadas?

Para construir o grfico de disperso, devemos clicar em:


INSERIR > DISPERSO

RESULTADO
60

50

40

30

Srie1

20

10

0
0,0

2,0

4,0

6,0

8,0

10,0

12,0

A olho nu, no possvel ver se existe relao entre as variveis.


Dessa forma, interessante adicionar uma linha de tendncia e ainda o R-quadrado.
LAYOUT > LINHA DE TENDNCIA > MAIS OPES DE LINHA DE TENDNCIA

Em seguida, clique em:


EXIBIR VALOR DO R2 NO GRFICO

Para saber o valor da correlao, basta tirar a raiz quadrada do R2.

CORRELAO = 0,30
Algumas vezes o valor da correlao pode aumentar se dividirmos o banco de dados em grupos de
acordo com as categorias de uma das variveis. Como?
No caso vamos refazer o processo correlacionando DISTNCIA e TEMPO DE ATENDIMENTO levando
em considerao o DIA.
O primeiro passo inserir a varivel DIA na terceira coluna e utilizar o comando:
DADOS > CLASSIFICAR (de acordo com o dia)
Depois refazemos o processo para as duas categorias (DIA DE SEMANA e FIM DE SEMANA).
DIA DE SEMANA
60

CORRELAO = 0,34
50
40
30
20
10
0
0,0

2,0

4,0

6,0

8,0

10,0

12,0

Para colocar linhas de grade no fundo do grfico, CLIQUE EM CIMA DELE. Em seguida, aperte:
LAYOUT > LINHA DE GRADE > VERTICAIS
FIM DE SEMANA
35

CORRELAO = 0,88

30
25
20
15
10
5
0

0,0

2,0

4,0

6,0

8,0

10,0

12,0

EXERCCIO 7
VARIVEL CATEGRICA X VARIVEL QUANTITATIVA
Ao trabalhar com variveis quantitativas e categricas, podemos comparar as medidas de posio
relativa (quartis) de acordo com cada categoria. O GRFICO DE CAIXA apresenta esse resumo.
PASSOS PARA A CONSTRUO DO GRFICO DE CAIXA
Primeiramente, devemos separar a varivel quantitativa de acordo com cada categoria.

Em seguida, calculamos as principais estatsticas de interesse:

ESTATSTICAS

BAIXA

MDIA

ALTA

MNIMO
QUARTIL 1
MEDIANA
MDIA
QUARTIL 3
MXIMO
DESVIO PADRO
COEF. DE VARIAO
TAMANHO DA AMOSTRA

14,0
23,0
34,5
34,1
44,0
64,0
12,4
36,4%
58

19,0
28,5
38,0
39,6
48,0
74,0
13,7
34,6%
33

40,0
43,0
51,0
51,6
59,0
69,0
8,4
16,3%
19

Os comandos utilizados foram:

ESTATSTICAS

BAIXA

MDIA

ALTA

=MENOR(D$2:D$128;1)
=MENOR(E$2:E$128;1)
MNIMO
=QUARTIL.EXC(D$2:D$128;1) =QUARTIL.EXC(E$2:E$128;1)
QUARTIL 1
=QUARTIL.EXC(D$2:D$128;2) =QUARTIL.EXC(E$2:E$128;2)
MEDIANA
=MDIA(D$2:D$128)
=MDIA(E$2:E$128)
MDIA
=QUARTIL.EXC(D$2:D$128;3) =QUARTIL.EXC(E$2:E$128;3)
QUARTIL 3
=MAIOR(D$2:D$128;1)
=MAIOR(E$2:E$128;1)
MXIMO
=DESVPAD.P(D$2:D$128)
=DESVPAD.P(E$2:E$128)
DESVIO PADRO
=I12/I9
=I12/I9
COEF. DE VARIAO
=CONT.NM(D$2:D$128)
=CONT.NM(E$2:E$128)
TAMANHO DA AMOSTRA

Abaixo da tabela com as estatsticas deve ser colocada outra tabela que servir de FONTE DE DADOS
para o grfico.

Observe as frmulas utilizadas na segunda tabela.


ESTATSTICAS
MNIMO
QUARTIL 1
MEDIANA
QUARTIL 3
MXIMO
MDIA

BAIXA
=I6
=I7-I6
=I8-I7
=I10-I8
=I11-I10
=I9

MDIA
=J6
=J7-J6
=J8-J7
=J10-J8
=J11-J10
=J9

ALTA
=K6
=K7-K6
=K8-K7
=K10-K8
=K11-K10
=K9

Para a construo do GRFICO DE CAIXA devemos destacar os dados da segunda tabela e em seguida
utilizar os comandos:
INSERIR > COLUNA > COLUNA 2D > COLUNAS EMPILHADAS (trata-se do segundo grfico de coluna)

Clique em:
ALTERAR LINHA/COLUNA

Clique com o boto direito na parte da barra relativa mdia:


Depois, clique em:
ALTERAR TIPO DE GRFICO DE SRIE

Coloque grfico de linha com pontos:

Elimine a linha e formate o ponto com o comando:


FORMATAR SRIE DE DADOS

O resultado deve ser um pingo preto:

Elimine a barra correspondente ao MNIMO


FORMATAR SRIE DE DADOS > PREENCHIMENTO > SEM PREENCHIMENTO

A barra correspondente ao QUARTIL 1 deve ser trocada por uma linha atravs de:
LAYOUT > BARRA DE ERROS > MAIS OPES DE BARRAS DE ERROS

Troque a barra por uma linha.


MENOS > PERSONALIZADO > ESPECIFICAR VALOR > VALOR DO ERRO NEGATIVO
Busque os dados no endereo do QUARTIL 1

Em seguida:
FORMATAR > SRIE DE DADOS > SEM PREENCHIMENTO

LAYOUT > BARRA DE ERROS > MAIS OPES DE BARRAS DE ERROS


MENOS > PERSONALIZADO > ESPECIFICAR VALOR > VALOR DO ERRO POSITIVO

Troque a primeira barra de cima por uma linha, clicando com o boto direito em cima da barra (azul)
e em seguida:
FORMATAR SRIE DE DADOS > PREENCHIMENTO > SEM PREENCHIMENTO

Aps formatao, o GRFICO DE CAIXA pode ficar assim:


80
70
60
50
40
30
20
10
0

BAIXA

MDIA

ALTA