Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Estatı́stica Descritiva
1.2 Tabelas
1.3 Gráficos
1 23
Banco de Dados (dados brutos)
Os dados obtidos por meio de amostragem, censo ou registros são armazenados em tabelas que chamamos
de banco de dados (ou dados brutos).
2 23
Banco de Dados (dados brutos)
Os dados obtidos por meio de amostragem, censo ou registros são armazenados em tabelas que chamamos
de banco de dados (ou dados brutos).
No banco de dados, as linhas correspondem as unidades amostrais, sendo uma linha para cada unidade
amostral, e cada coluna contém a informação de uma variável coletada.
2 23
Banco de Dados (dados brutos)
Os dados obtidos por meio de amostragem, censo ou registros são armazenados em tabelas que chamamos
de banco de dados (ou dados brutos).
No banco de dados, as linhas correspondem as unidades amostrais, sendo uma linha para cada unidade
amostral, e cada coluna contém a informação de uma variável coletada.
2 23
Classificação das Variáveis
3 23
Classificação das Variáveis
3 23
Classificação das Variáveis
3 23
Classificação das Variáveis
3 23
Classificação das Variáveis
X : idade;
1. quantitativa discreta (quando definida como anos completos)
2. quantitativa contı́nua (quando definida como tempo de vida)
3 23
Classificação das Variáveis
X : idade;
1. quantitativa discreta (quando definida como anos completos)
2. quantitativa contı́nua (quando definida como tempo de vida)
3 23
Classificação das Variáveis
X : idade;
1. quantitativa discreta (quando definida como anos completos)
2. quantitativa contı́nua (quando definida como tempo de vida)
3 23
Classificação das Variáveis
X : idade;
1. quantitativa discreta (quando definida como anos completos)
2. quantitativa contı́nua (quando definida como tempo de vida)
3 23
Pré-processamento dos dados
Após definir e classificar as variáveis, as vezes precisamos fazer um pré-processamento nos dados para: eliminar
erros de digitação, verificar inconsistências, padronizar nomenclatura de categorias de variáveis qualitativas para
que fiquem todas iguais, etc. Por exemplo, o servidor de e-mail do discente pode-se ser uma informação relevante
para algum tipo especı́fico de estudo, e se for o caso, pode-se criar uma nova variável com o servidor de e-mail
do discente.
4 23
Tabelas de Frequências Simples - f
Nas tabelas de frequência, os dados brutos de uma variável são agrupados de acordo com a frequência de sua
ocorrência (contagem), denotada por f . Vejamos o exemplo com a variável sexo.
5 23
Tabelas de Frequências Simples do curso
6 23
Tabelas de Frequências Simples do nı́vel do curso
Quando a variável é qualitativa ordinal, suas categorias devem ser apresentada de forma ordenada (crescente ou
decrescente) na tabela.
Neste exemplo temos apenas duas categorias, de modo que sempre cai em uma das ordenações, mas se tivesse
Fundamental, médio, graduação e pós-graduação, estas teriam que estar ordenas na tabela.
7 23
Tabelas de Frequências Simples do servidor de e-mail
8 23
Tabelas de Dupla Entrada
As tabelas de dupla entrada possuem as frequências de duas variáveis, como mostra o exemplo abaixo.
9 23
Tabelas de Tripla Entrada
Da mesma forma que fizemos o cruzamento de duas variáveis, podemos fazer com três ou mais. No entanto,
quanto mais variável agrega, mais confuso fica.
10 23
Variável Quantitativa
Um dos principais objetivos da Estatı́stica Descritiva é reduzir informações e uma das formas de fazer isso é
criando tabelas menores e mais informativas. Mas quando temos uma variável quantitativa, principalmente as
contı́nuas, nem sempre há uma redução significativa no número de linhas da tabela ao criar uma tabela de
frequência simples.
Censo de 2010
Um exemplo disso são as faixas Faixa etária Masculino Feminino
etárias estabelecidas pelo IBGE, Mais de 100 anos 7.247 0,0% 16.989 0,0%
95 a 99 anos 31.529 0,0% 66.806 0,0%
cuja as classe de idades tem 90 a 94 anos 114.964 0,1% 211.595 0,1%
85 a 89 anos 310.759 0,2% 508.724 0,3%
intervalos de 5 anos. 80 a 84 anos 668.623 0,4% 998.349 0,5%
75 a 79 anos 1.090.518 0,6% 1.472.930 0,8%
70 a 74 anos 1.667.373 0,9% 2.074.264 1,1%
65 a 69 anos 2.224.065 1,2% 2.616.745 1,4%
60 a 64 anos 3.041.034 1,6% 3.468.085 1,8%
55 a 59 anos 3.902.344 2,0% 4.373.875 2,3%
50 a 54 anos 4.834.995 2,5% 5.305.407 2,8%
45 a 49 anos 5.692.013 3,0% 6.141.338 3,2%
40 a 44 anos 6.320.570 3,3% 6.688.797 3,5%
35 a 39 anos 6.766.665 3,5% 7.121.916 3,7%
30 a 34 anos 7.717.657 4,0% 8.026.855 4,2%
25 a 29 anos 8.460.995 4,4% 8.643.418 4,5%
20 a 24 anos 8.630.227 4,5% 8.614.963 4,5%
15 a 19 anos 8.558.868 4,5% 8.432.002 4,4%
10 a 14 anos 8.725.413 4,6% 8.441.348 4,4%
5 a 9 anos 7.624.144 4,0% 7.345.231 3,9%
0 a 4 anos 7.016.987 3,7% 6.779.172 3,6%
12 23
Criando Tabela de Intervalo por Classe
Rol
O rol é uma lista em que os valores de uma variável estão dispostos em uma determinada ordem, crescente
ou decrescente. O rol pode ser aplicado a variáveis ordinais, quantitativas discretas e contı́nuas.
13 23
Criando Tabela de Intervalo por Classe
Rol
O rol é uma lista em que os valores de uma variável estão dispostos em uma determinada ordem, crescente
ou decrescente. O rol pode ser aplicado a variáveis ordinais, quantitativas discretas e contı́nuas.
Exemplos:
Nı́vel: Graduação, Graduação, Graduação, Graduação, Nı́vel Idade Nº disciplinas Carga Horária
Semanal
Graduação, Pós-graduação, Pós-graduação,
Graduação 20 7 28
Pós-graduação; Pós-graduação 24 5 20
Graduação 20 7 28
Graduação 18 6 26
Graduação 19 7 26
Pós-graduação 26 4 20
Graduação 18 6 24
Pós-graduação 25 4 20
13 23
Criando Tabela de Intervalo por Classe
Rol
O rol é uma lista em que os valores de uma variável estão dispostos em uma determinada ordem, crescente
ou decrescente. O rol pode ser aplicado a variáveis ordinais, quantitativas discretas e contı́nuas.
Exemplos:
Nı́vel: Graduação, Graduação, Graduação, Graduação, Nı́vel Idade Nº disciplinas Carga Horária
Semanal
Graduação, Pós-graduação, Pós-graduação,
Graduação 20 7 28
Pós-graduação; Pós-graduação 24 5 20
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26; Graduação 20 7 28
Graduação 18 6 26
Graduação 19 7 26
Pós-graduação 26 4 20
Graduação 18 6 24
Pós-graduação 25 4 20
13 23
Criando Tabela de Intervalo por Classe
Rol
O rol é uma lista em que os valores de uma variável estão dispostos em uma determinada ordem, crescente
ou decrescente. O rol pode ser aplicado a variáveis ordinais, quantitativas discretas e contı́nuas.
Exemplos:
Nı́vel: Graduação, Graduação, Graduação, Graduação, Nı́vel Idade Nº disciplinas Carga Horária
Semanal
Graduação, Pós-graduação, Pós-graduação,
Graduação 20 7 28
Pós-graduação; Pós-graduação 24 5 20
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26; Graduação 20 7 28
Graduação 18 6 26
Rol de Nº disciplina (Y ): 4, 4, 5, 6, 6, 7, 7, 7;
Graduação 19 7 26
Pós-graduação 26 4 20
Graduação 18 6 24
Pós-graduação 25 4 20
13 23
Criando Tabela de Intervalo por Classe
Rol
O rol é uma lista em que os valores de uma variável estão dispostos em uma determinada ordem, crescente
ou decrescente. O rol pode ser aplicado a variáveis ordinais, quantitativas discretas e contı́nuas.
Exemplos:
Nı́vel: Graduação, Graduação, Graduação, Graduação, Nı́vel Idade Nº disciplinas Carga Horária
Semanal
Graduação, Pós-graduação, Pós-graduação,
Graduação 20 7 28
Pós-graduação; Pós-graduação 24 5 20
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26; Graduação 20 7 28
Graduação 18 6 26
Rol de Nº disciplina (Y ): 4, 4, 5, 6, 6, 7, 7, 7;
Graduação 19 7 26
Rol de CHS (Z): 20, 20, 20, 24, 26, 26, 28, 28; Pós-graduação 26 4 20
Graduação 18 6 24
Pós-graduação 25 4 20
13 23
Criando Tabela de Intervalo por Classe
14 23
Criando Tabela de Intervalo por Classe
Exemplos:
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26;
14 23
Criando Tabela de Intervalo por Classe
Exemplos:
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26;
14 23
Criando Tabela de Intervalo por Classe
Exemplos:
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26;
Rol de CHS (Z): 20, 20, 20, 24, 26, 26, 28, 28;
14 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
15 23
Criando Tabela de Intervalo por Classe
16 23
Criando Tabela de Intervalo por Classe
16 23
Criando Tabela de Intervalo por Classe
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26; AtpXq “ 8 e h “ Akt “ 84 “2.
Rol de Nº disciplina (Y ): 4, 4, 5, 6, 6, 7, 7, 7; AtpY q “ 3 e h “ Akt “ 34 “0,75.
16 23
Criando Tabela de Intervalo por Classe
Rol de idade (X): 18, 18, 19, 20, 20, 24, 25, 26; AtpXq “ 8 e h “ Akt “ 84 “2.
Rol de Nº disciplina (Y ): 4, 4, 5, 6, 6, 7, 7, 7; AtpY q “ 3 e h “ Akt “ 34 “0,75.
Rol de CHS (Z): 20, 20, 20, 24, 26, 26, 28, 28; AtpZq “ 8 e h “ Akt “ 84 “2.
16 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´
4. Repita o 20 como limite inferior da segunda classe;
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
5. Adicione h ao mı́nimo da segunda classe:
min `h “ 20 ` 2 “ 22;
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
6. Repita o 22 como limite inferior da terceira classe; 22 |´
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
7. Adicione h ao mı́nimo da terceira classe: 22 |´ 24
min `h “ 22 ` 2 “ 24;
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
8. Repita o 24 como limite inferior da quarta classe; 22 |´ 24
24 |´
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
9. Adicione h ao mı́nimo da quarta classe: 22 |´ 24
24 |´ 26
min `h “ 24 ` 2 “ 26;
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
10. Quase pronto, mas tem um problema. 26 é o valor máximo, 22 |´ 24
24 |´ 26
então se deixarmos 24 |´ 26, teremos 24 ď X ă 26,
e desta forma, o máximo não seria incluı́do.
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
11. Para resolver isso, usamos a representação: 24 |´| 26; 22 |´ 24
24 |´| 26
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20
20 |´ 22
12. Classes prontas, agora é só contar quantos 22 |´ 24
24 |´| 26
discentes tem cada classe;
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20 3
20 |´ 22
13. Temos 3 número entre 18 ď X ă 20: 18, 18, 19; 22 |´ 24
24 |´| 26
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20 3
20 |´ 22 2
14. Temos 2 número entre 20 ď X ă 22: 20, 20; 22 |´ 24
24 |´| 26
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20 3
20 |´ 22 2
15. Não temos nenhum número entre 22 ď X ă 24; 22 |´ 24 0
24 |´| 26
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20 3
20 |´ 22 2
16. Temos 3 número entre 24 ď X ď 26: 24, 25, 26. 22 |´ 24 0
24 |´| 26 3
17 23
Criando Tabela de Intervalo por Classe
Idade
Informações: n “ 8, At “ 8, h “ 2 e Rol de X: 18, 18, 19, 20, 20, 24, 25, 26
Classes f
18 |´ 20 3
20 |´ 22 2
Fim! 22 |´ 24 0
24 |´| 26 3
17 23
Criando Tabela de Intervalo por Classe
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
18 23
Criando Tabela de Intervalo por Classe
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
h “0,7
Classes f
4,0 |´ 4,7 2
4,7 |´ 5,4 1
5,4 |´ 6,1 2
6,1 |´| 6,8 0
Total 5
18 23
Criando Tabela de Intervalo por Classe
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
h “0,7
Classes f
4,0 |´ 4,7 2
4,7 |´ 5,4 1
5,4 |´ 6,1 2
6,1 |´| 6,8 0
Total 5
Errado!
18 23
Criando Tabela de Intervalo por Classe
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
h “0,7 h “0,75
Classes f Classes f
4,0 |´ 4,7 2 4,00 |´ 4,75 2
4,7 |´ 5,4 1 4,75 |´ 5,50 1
5,4 |´ 6,1 2 5,50 |´ 6,25 2
6,1 |´| 6,8 0 6,25 |´| 7,00 3
Total 5 Total 8
Errado!
18 23
Criando Tabela de Intervalo por Classe
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
h “0,7 h “0,75
Classes f Classes f
4,0 |´ 4,7 2 4,00 |´ 4,75 2
4,7 |´ 5,4 1 4,75 |´ 5,50 1
5,4 |´ 6,1 2 5,50 |´ 6,25 2
6,1 |´| 6,8 0 6,25 |´| 7,00 3
Total 5 Total 8
Errado! Correto!
18 23
Criando Tabela de Intervalo por Classe
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
Nº disciplina
Informações: n “ 8, At “ 3, h “0,75 e Rol de Y : 4, 4, 5, 6, 6, 7, 7, 7.
Neste exemplo veremos porque, se houver necessidade de arredondar o valor de h, então devemos sempre
arredondar para mais. Mesmo com h “0,71, para arredondar, você teria que usar h “0,8.
Classes f
20 |´ 22 3
22 |´ 24 0
24 |´ 26 1
26 |´| 28 4
Total 8
19 23
Tipos de frequências
Frequência Simples Relativa pf rj q: pode ser em termos percentuais multiplicando por 100:
fj
f rj “ , j “ 1, 2, . . . , k
n
Frequência Acumulada Absoluta pFj q: contagem dos f até o fj .
Fj “ f1 ` f2 ` ¨ ¨ ¨ ` fj , com j ď k.
Frequência Acumulada Relativa pF rj q: pode ser em termos percentuais multiplicando por 100:
Fj
F rj “ F1 ` F2 ` ¨ ¨ ¨ ` Fj ou F rj “ , j “ 1, 2, . . . , k
n
20 23
Tipos de frequências
Servidor de e-mail f f r%
5¨100
Gmail 5 8 “62,5%
2¨100
Hotmail 2 8 “25,0%
1¨100
Yahoo! 1 8 “12,5%
Total 8 100%
21 23
Tipos de frequências
21 23
Tipos de frequências
Servidor de e-mail f r% Fr %
Gmail 62,5% 62,5%
Hotmail 25,0% 62,5+25=87,5%
Yahoo! 12,5% 62,5+25+12,5=100%
Total 100%
21 23
Tipos de frequências
21 23
Tabelas de Frequências por Classes
Sexo f f r% F Fr % Curso f f r% F Fr %
Masculino 5 62,5% 5 62,5% Eng. Civil 4 50% 4 50%
Feminino 3 37,5% 8 100% Economia 4 50% 8 100%
Total 8 100% Total 8 100%
22 23
Referências Bibliográficas
Os livros BUSSAB e MORETTIN (2017), COSTA NETO (2002) estão disponı́vel na Minha Biblioteca, que é
uma base de livros eletrônicos, em português, que reúne milhares de tı́tulos acadêmicos das diversas áreas do
conhecimento. Para acessar a Biblioteca você deve fazer o login no SIGAA da UFPB e acessar seguindo esta
sequência no menu: Biblioteca ´ ą Pesquisar Livros Digitais ´ ą Minha Biblioteca.
BUSSAB, W. O.; MORETTIN, P. A. Estatı́stica Básica. 9ª. ed. São Paulo: Saraiva, 2017. Disponı́vel em:
xhttps://sigaa.ufpb.bry.
COSTA NETO, P. L. O. Estatı́stica. 2ª. ed. São Paulo: Edgard Blücher, 2002. Disponı́vel em:
xhttps://sigaa.ufpb.bry.
STURGES, H. The choice of a class-interval. J. Amer. Statist. Assoc., v. 21, p. 65–66, 1926.
23 / 23